マルチモーダルAI

Google、ノートパソコン向けのローカル多モーダルAI「Gemma 4 12B」を公開

Googleは、16GBのメモリを搭載したノートパソコン上でローカルに動作するよう設計された、エンコーダー不要の多モーダルオープンモデル「Gemma 4 12B」を発表した。



2026年6月4日

Google

Thinking Machines、リアルタイムのAI対話モデルを公開

Mira MuratiのThinking Machines Labは、AIとの継続的なリアルタイム共同作業のために設計された対話モデルを公開した。



2026年5月12日

Mira Murati

Luma AI、Uni-1を発表：推論重視の画像モデルがGoogleとOpenAIを30%低コストで上回る

Luma AIのUni-1は自己回帰アーキテクチャを採用し、推論ベンチマークでGoogle Nano Banana 2とOpenAI GPT Image 1.5を上回ると同時に、2K解像度の価格を最大30%削減します。



2026年3月24日

マルチモーダルAI

Xiaomi、エージェント・ロボティクス・音声合成を対象とした3つのMiMo V2 AIモデルを発表

XiaomiはMiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTSを発表した — これら3つのAIモデルは1兆以上のパラメータ、マルチモーダル認識、感情的な音声合成を備え、エージェントベンチマークでClaude Opus 4.6と競合する。



2026年3月23日

AIエージェント

Google、Gemini Embedding 2を発表：初のネイティブなマルチモーダルAI埋め込みモデル

GoogleはGemini Embedding 2をリリースしました。これは、テキスト、画像、動画を統一されたベクトル空間に共にマッピングし、検索や情報検索のタスクに利用できる初のネイティブなマルチモーダル埋め込みモデルです。



2026年3月12日

ジェミニ

DeepSeek、V4マルチモーダルAIモデルを間もなく公開 — NvidiaとAMDへの早期アクセスを保留

中国のDeepSeekはテキスト、画像、動画を生成できるV4マルチモーダルモデルの公開を目前に控えており、報道によればNvidiaやAMDには早期の最適化アクセスを許可せず、中国の年次国会開催前に国内の半導体メーカーであるHuaweiとCambriconにのみ独占的に提供しているという。



2026年3月2日

AIコンペ

DeepSeekがGoogleの支配に挑むAI検索エンジンを構築

DeepSeekの求人情報は、テキスト、画像、音声をサポートするマルチモーダルなAI検索エンジンの計画を明らかにしており、Googleの検索市場シェアを直接的に狙っています。



2026年2月1日

AIエージェント

Moonshot AIのKimi K2.5が米中のAI開発格差を過去最小レベルまで縮める

北京に拠点を置くMoonshot AIは、OpenAIやAnthropicに匹敵しながら運用コストは4分の1のオープンソースのマルチモーダルAIモデルKimi K2.5を公開し、米国の半導体輸出規制が中国のAI開発を抑制する効果について疑問を投げかけている。



2026年1月29日

オープンソースのAI

Google、ノートパソコン向けのローカル多モーダルAI「Gemma 4 12B」を公開

Thinking Machines、リアルタイムのAI対話モデルを公開

Luma AI、Uni-1を発表：推論重視の画像モデルがGoogleとOpenAIを30%低コストで上回る

Xiaomi、エージェント・ロボティクス・音声合成を対象とした3つのMiMo V2 AIモデルを発表

Google、Gemini Embedding 2を発表：初のネイティブなマルチモーダルAI埋め込みモデル

DeepSeek、V4マルチモーダルAIモデルを間もなく公開 — NvidiaとAMDへの早期アクセスを保留

DeepSeekがGoogleの支配に挑むAI検索エンジンを構築

Moonshot AIのKimi K2.5が米中のAI開発格差を過去最小レベルまで縮める

マルチモーダルAI

マルチモーダルAIに関する最新ニュースと分析