AIブームをどう測る? METRのチャートが業界の熱狂の的に
非営利のAI組織であるMETRのチャートは、大規模AIシステムの急速な発展を追跡する中で、業界全体の熱狂の的となっている。
非営利のAI組織であるMETRのチャートは、大規模AIシステムの急速な発展を追跡する中で、業界全体の熱狂の的となっている。
Alibabaは、HappyHorse-1.0を秘密裏に開発していたことを認めた。このAI動画モデルは世界的なベンチマークで首位にデビューし、音声と映像の同期機能で競合を上回った。
APEX-Agentsという新しいベンチマークは、GPT-5.2やGemini 3 Flashのような最先端のAIモデルでさえ、法律や金融などの専門分野から抽出された、複雑で複数のドメインにまたがるほとんどのタスクで失敗することを示しており、職場での即時の実用性に疑問を投げかけています。