Мультимодальный ИИ

Google запускает Gemma 4 12B для локального мультимодального ИИ на ноутбуках

Google представила Gemma 4 12B — открытую мультимодальную модель без энкодера, созданную для локальной работы на ноутбуках с 16 ГБ памяти.



4 июня 2026 г.

Google

Thinking Machines представляет модели взаимодействия ИИ в реальном времени

Thinking Machines Lab Мира Мурати представила модели взаимодействия, предназначенные для непрерывного совместного взаимодействия с ИИ в реальном времени.



12 мая 2026 г.

Mira Murati

Luma AI запускает Uni-1: модель изображений, ориентированная на рассуждение, которая превосходит Google и OpenAI при цене на 30% ниже

Uni-1 от Luma AI использует авторегрессивную архитектуру, чтобы превосходить Google Nano Banana 2 и OpenAI GPT Image 1.5 в бенчмарках по рассуждению, одновременно снижая стоимость для 2K-разрешения до 30%.



24 марта 2026 г.

Мультимодальный ИИ

Xiaomi запускает три модели ИИ MiMo V2, ориентированные на агентов, робототехнику и синтез речи

Xiaomi представила MiMo-V2-Pro, MiMo-V2-Omni и MiMo-V2-TTS — три модели ИИ с более чем 1 триллионом параметров, мультимодальным восприятием и эмоциональным синтезом речи, конкурирующие с Claude Opus 4.6 в бенчмарках для агентов.



23 марта 2026 г.

агенты ИИ

Google выпустила Gemini Embedding 2: первая нативно мультимодальная модель эмбеддингов ИИ

Google представила Gemini Embedding 2, первую нативно мультимодальную модель эмбеддингов, способную совместно отображать текст, изображения и видео в единое векторное пространство для задач поиска и извлечения.



12 марта 2026 г.

Гемини

DeepSeek готов выпустить мультимодельную ИИ-модель V4, ограничив ранний доступ для Nvidia и AMD

Китайская DeepSeek вскоре выпустит мультимодальную модель V4 — способную генерировать текст, изображения и видео — при этом, по сообщениям, она отказывает Nvidia и AMD в раннем доступе для оптимизации, предоставляя его исключительно отечественным производителям чипов Huawei и Cambricon перед ежегодными парламентскими сессиями Китая.



2 марта 2026 г.

Конкурс ИИ

DeepSeek создает поисковую систему с ИИ, чтобы бросить вызов доминированию Google

Вакансии DeepSeek раскрывают планы по созданию мультимодальной поисковой системы с ИИ, поддерживающей текст, изображения и аудио, напрямую нацеленной на долю Google на рынке поиска.



1 февраля 2026 г.

агенты ИИ

Kimi K2.5 от Moonshot AI сокращает разрыв в развитии ИИ между США и Китаем до наименьшего уровня в истории

Пекинская Moonshot AI выпустила Kimi K2.5 — открытый мультимодальный ИИ‑модель, соперничающую с OpenAI и Anthropic и при этом в четыре раза дешевле в эксплуатации, что вызывает вопросы относительно эффективности экспортных ограничений США на полупроводники в сдерживании развития ИИ в Китае.



29 января 2026 г.

ИИ с открытым исходным кодом

Google запускает Gemma 4 12B для локального мультимодального ИИ на ноутбуках

Thinking Machines представляет модели взаимодействия ИИ в реальном времени

Luma AI запускает Uni-1: модель изображений, ориентированная на рассуждение, которая превосходит Google и OpenAI при цене на 30% ниже

Xiaomi запускает три модели ИИ MiMo V2, ориентированные на агентов, робототехнику и синтез речи

Google выпустила Gemini Embedding 2: первая нативно мультимодальная модель эмбеддингов ИИ

DeepSeek готов выпустить мультимодельную ИИ-модель V4, ограничив ранний доступ для Nvidia и AMD

DeepSeek создает поисковую систему с ИИ, чтобы бросить вызов доминированию Google

Kimi K2.5 от Moonshot AI сокращает разрыв в развитии ИИ между США и Китаем до наименьшего уровня в истории

Мультимодальный ИИ

Последние Новости и Анализ по Теме Мультимодальный ИИ