IA multimodal

Google lanza Gemma 4 12B para IA multimodal local en portátiles

Google presentó Gemma 4 12B, un modelo abierto multimodal sin codificador diseñado para ejecutarse localmente en portátiles con 16 GB de memoria.



4 de junio de 2026

Google

Thinking Machines presenta modelos de interacción de IA en tiempo real

Thinking Machines Lab de Mira Murati presentó modelos de interacción diseñados para una colaboración continua en tiempo real con IA.



12 de mayo de 2026

Mira Murati

Luma AI lanza Uni-1: un modelo de imagen centrado en el razonamiento que supera a Google y OpenAI con un 30% menos de coste

Uni-1 de Luma AI utiliza una arquitectura autorregresiva para superar a Google Nano Banana 2 y OpenAI GPT Image 1.5 en benchmarks de razonamiento, mientras reduce el precio para resolución 2K hasta en un 30%.



24 de marzo de 2026

IA multimodal

Xiaomi lanza tres modelos de IA MiMo V2 dirigidos a agentes, robótica y síntesis de voz

Xiaomi presentó MiMo-V2-Pro, MiMo-V2-Omni y MiMo-V2-TTS — un trío de modelos de IA con más de 1 billón de parámetros, percepción multimodal y síntesis de voz emocional, que rivalizan con Claude Opus 4.6 en benchmarks de agentes.



23 de marzo de 2026

Agentes de IA

Google lanza Gemini Embedding 2: el primer modelo de embeddings de IA nativamente multimodal

Google ha lanzado Gemini Embedding 2, el primer modelo de embeddings nativamente multimodal capaz de mapear conjuntamente texto, imágenes y vídeo en un espacio vectorial unificado para tareas de búsqueda y recuperación.



12 de marzo de 2026

Gemini

DeepSeek a punto de lanzar el modelo multimodal de IA V4, negando el acceso anticipado a Nvidia y AMD

La china DeepSeek está a punto de lanzar su modelo multimodal V4 —capaz de generar texto, imágenes y vídeo— y, según se informa, está denegando el acceso anticipado de optimización a Nvidia y AMD, otorgándolo en exclusiva a los fabricantes de chips nacionales Huawei y Cambricon antes de las sesiones anuales del parlamento chino.



2 de marzo de 2026

Competencia de IA

DeepSeek construye un motor de búsqueda con IA para desafiar el dominio de Google

Las ofertas de empleo de DeepSeek revelan planes para un motor de búsqueda multimodal con IA que admite texto, imágenes y audio, apuntando directamente a la cuota de mercado de búsquedas de Google.



1 de febrero de 2026

Agentes de IA

Kimi K2.5 de Moonshot AI reduce la brecha de desarrollo de IA entre EE. UU. y China al nivel más reducido de la historia

Moonshot AI, con sede en Pekín, lanza Kimi K2.5, un modelo multimodal de IA de código abierto que rivaliza con OpenAI y Anthropic y, además, cuesta cuatro veces menos operarlo, lo que plantea dudas sobre la eficacia de los controles de exportación de semiconductores de EE. UU. para frenar el desarrollo de IA en China.



29 de enero de 2026

IA de código abierto

Google lanza Gemma 4 12B para IA multimodal local en portátiles

Thinking Machines presenta modelos de interacción de IA en tiempo real

Luma AI lanza Uni-1: un modelo de imagen centrado en el razonamiento que supera a Google y OpenAI con un 30% menos de coste

Xiaomi lanza tres modelos de IA MiMo V2 dirigidos a agentes, robótica y síntesis de voz

Google lanza Gemini Embedding 2: el primer modelo de embeddings de IA nativamente multimodal

DeepSeek a punto de lanzar el modelo multimodal de IA V4, negando el acceso anticipado a Nvidia y AMD

DeepSeek construye un motor de búsqueda con IA para desafiar el dominio de Google

Kimi K2.5 de Moonshot AI reduce la brecha de desarrollo de IA entre EE. UU. y China al nivel más reducido de la historia

IA multimodal

Últimas Noticias y Análisis sobre IA multimodal