IA multimodal

Google lança Gemma 4 12B para IA multimodal local em laptops

O Google apresentou o Gemma 4 12B, um modelo aberto multimodal sem codificador, projetado para rodar localmente em laptops com 16 GB de memória.



4 de junho de 2026

Google

Thinking Machines apresenta modelos de interação de IA em tempo real

O Thinking Machines Lab de Mira Murati apresentou modelos de interação projetados para colaboração contínua em tempo real com IA.



12 de maio de 2026

Mira Murati

Luma AI lança Uni-1: um modelo de imagem focado em raciocínio que supera Google e OpenAI com 30% menos custo

O Uni-1 da Luma AI usa uma arquitetura autorregressiva para superar o Google Nano Banana 2 e o OpenAI GPT Image 1.5 em benchmarks de raciocínio, ao mesmo tempo que reduz o preço para resolução 2K em até 30%.



24 de março de 2026

IA multimodal

Xiaomi lança três modelos de IA MiMo V2 voltados para agentes, robótica e síntese de voz

A Xiaomi revelou MiMo-V2-Pro, MiMo-V2-Omni e MiMo-V2-TTS — um trio de modelos de IA com mais de 1 trilhão de parâmetros, percepção multimodal e síntese de voz emocional, rivalizando com o Claude Opus 4.6 em benchmarks de agentes.



23 de março de 2026

agentes de IA

Google lança Gemini Embedding 2: primeiro modelo de embeddings de IA nativamente multimodal

O Google lançou o Gemini Embedding 2, o primeiro modelo de embeddings nativamente multimodal capaz de mapear conjuntamente texto, imagens e vídeo em um espaço vetorial unificado para tarefas de busca e recuperação.



12 de março de 2026

Gemini

DeepSeek prestes a lançar o modelo multimodal de IA V4, negando acesso antecipado à Nvidia e AMD

A chinesa DeepSeek está prestes a lançar seu modelo multimodal V4 —capaz de gerar texto, imagens e vídeo— e, segundo relatos, está negando o acesso antecipado para otimização à Nvidia e AMD, concedendo-o exclusivamente a fabricantes de chips nacionais Huawei e Cambricon antes das sessões parlamentares anuais da China.



2 de março de 2026

Competição de IA

DeepSeek constrói mecanismo de busca com IA para desafiar o domínio do Google

Vagas de emprego da DeepSeek revelam planos para um mecanismo de busca multimodal com IA que suporta texto, imagens e áudio, visando diretamente a participação de mercado do Google na busca.



1 de fevereiro de 2026

agentes de IA

O Kimi K2.5 da Moonshot AI reduz a lacuna de desenvolvimento de IA entre EUA e China ao menor nível já registrado

A Moonshot AI, sediada em Pequim, lança o Kimi K2.5, um modelo multimodal de código aberto que rivaliza com OpenAI e Anthropic ao mesmo tempo que custa quatro vezes menos para operar, levantando questões sobre a eficácia dos controles de exportação de semicondutores dos EUA em limitar o desenvolvimento de IA da China.



29 de janeiro de 2026

IA de código aberto

Google lança Gemma 4 12B para IA multimodal local em laptops

Thinking Machines apresenta modelos de interação de IA em tempo real

Luma AI lança Uni-1: um modelo de imagem focado em raciocínio que supera Google e OpenAI com 30% menos custo

Xiaomi lança três modelos de IA MiMo V2 voltados para agentes, robótica e síntese de voz

Google lança Gemini Embedding 2: primeiro modelo de embeddings de IA nativamente multimodal

DeepSeek prestes a lançar o modelo multimodal de IA V4, negando acesso antecipado à Nvidia e AMD

DeepSeek constrói mecanismo de busca com IA para desafiar o domínio do Google

O Kimi K2.5 da Moonshot AI reduz a lacuna de desenvolvimento de IA entre EUA e China ao menor nível já registrado

IA multimodal

Últimas Notícias e Análises sobre IA multimodal