Google bringt Gemma 4 12B für lokale multimodale KI auf Laptops heraus
Google stellte Gemma 4 12B vor, ein encoderfreies multimodales Open-Model, das lokal auf Laptops mit 16 GB Arbeitsspeicher ausgeführt werden kann.
Google stellte Gemma 4 12B vor, ein encoderfreies multimodales Open-Model, das lokal auf Laptops mit 16 GB Arbeitsspeicher ausgeführt werden kann.
Mira Muratis Thinking Machines Lab stellte Interaktionsmodelle vor, die für die kontinuierliche Zusammenarbeit mit KI in Echtzeit entwickelt wurden.
Uni-1 von Luma AI nutzt eine autoregressive Architektur, um Google Nano Banana 2 und OpenAI GPT Image 1.5 bei Reasoning-Benchmarks zu schlagen und gleichzeitig die Preise für 2K-Auflösung um bis zu 30 % zu senken.
Xiaomi hat MiMo-V2-Pro, MiMo-V2-Omni und MiMo-V2-TTS vorgestellt — ein Trio von KI-Modellen mit über einer Billion Parametern, multimodaler Wahrnehmung und emotionaler Sprachsynthese, die in Agenten-Benchmarks mit Claude Opus 4.6 konkurrieren.
Google hat Gemini Embedding 2 vorgestellt, das erste nativ multimodale Embedding-Modell, das Text, Bilder und Video gemeinsam in einen einheitlichen Vektorraum für Retrieval- und Suchaufgaben abbilden kann.
Das chinesische Unternehmen DeepSeek steht kurz vor der Veröffentlichung seines multimodalen V4-Modells — in der Lage, Text, Bilder und Video zu erzeugen — und verweigert Berichten zufolge Nvidia und AMD den frühen Optimierungszugang, den es stattdessen exklusiv inländischen Chipherstellern wie Huawei und Cambricon vor den jährlichen Parlamentssitzungen Chinas gewährt.
Stellenanzeigen von DeepSeek zeigen Pläne für eine multimodale KI-Suchmaschine, die Text, Bilder und Audio unterstützt und direkt auf Googles Marktanteil im Bereich Suche abzielt.
Das in Peking ansässige Unternehmen Moonshot AI hat Kimi K2.5 veröffentlicht, ein Open-Source-multimodales KI-Modell, das mit OpenAI und Anthropic konkurriert und gleichzeitig viermal günstiger im Betrieb ist, was Fragen zur Wirksamkeit der US-Halbleiter-Exportkontrollen bei der Einschränkung der KI-Entwicklung Chinas aufwirft.