Как измерить бум ИИ? График METR становится навязчивой темой для отрасли
График METR, некоммерческой организации в сфере ИИ, стал одержимостью всей отрасли, поскольку он отслеживает стремительное развитие крупных систем ИИ.
График METR, некоммерческой организации в сфере ИИ, стал одержимостью всей отрасли, поскольку он отслеживает стремительное развитие крупных систем ИИ.
Alibaba подтвердила, что тайно разработала HappyHorse-1.0 — ИИ-модель для видео, которая сразу заняла первое место в мировых бенчмарках, опередив конкурентов благодаря возможностям синхронизации аудио и видео.
Новый бенчмарк под названием APEX-Agents показывает, что даже ведущие ИИ-модели, такие как GPT-5.2 и Gemini 3 Flash, не справляются с большинством сложных многодоменных задач из профессиональных областей, таких как право и финансы, что ставит под сомнение их готовность к непосредственному использованию на рабочем месте.