Google запускает Gemma 4 12B для локального мультимодального ИИ на ноутбуках
Google представила Gemma 4 12B — открытую мультимодальную модель без энкодера, созданную для локальной работы на ноутбуках с 16 ГБ памяти.
Google представила Gemma 4 12B — открытую мультимодальную модель без энкодера, созданную для локальной работы на ноутбуках с 16 ГБ памяти.
Thinking Machines Lab Мира Мурати представила модели взаимодействия, предназначенные для непрерывного совместного взаимодействия с ИИ в реальном времени.
Uni-1 от Luma AI использует авторегрессивную архитектуру, чтобы превосходить Google Nano Banana 2 и OpenAI GPT Image 1.5 в бенчмарках по рассуждению, одновременно снижая стоимость для 2K-разрешения до 30%.
Xiaomi представила MiMo-V2-Pro, MiMo-V2-Omni и MiMo-V2-TTS — три модели ИИ с более чем 1 триллионом параметров, мультимодальным восприятием и эмоциональным синтезом речи, конкурирующие с Claude Opus 4.6 в бенчмарках для агентов.
Google представила Gemini Embedding 2, первую нативно мультимодальную модель эмбеддингов, способную совместно отображать текст, изображения и видео в единое векторное пространство для задач поиска и извлечения.
Китайская DeepSeek вскоре выпустит мультимодальную модель V4 — способную генерировать текст, изображения и видео — при этом, по сообщениям, она отказывает Nvidia и AMD в раннем доступе для оптимизации, предоставляя его исключительно отечественным производителям чипов Huawei и Cambricon перед ежегодными парламентскими сессиями Китая.
Вакансии DeepSeek раскрывают планы по созданию мультимодальной поисковой системы с ИИ, поддерживающей текст, изображения и аудио, напрямую нацеленной на долю Google на рынке поиска.
Пекинская Moonshot AI выпустила Kimi K2.5 — открытый мультимодальный ИИ‑модель, соперничающую с OpenAI и Anthropic и при этом в четыре раза дешевле в эксплуатации, что вызывает вопросы относительно эффективности экспортных ограничений США на полупроводники в сдерживании развития ИИ в Китае.