Wie misst man einen KI-Boom? METR-Diagramm wird zum Branchen-Hype
Ein Diagramm von METR, einer gemeinnützigen KI-Organisation, ist branchenweit zur Obsession geworden, da es die rasante Entwicklung großer KI-Systeme verfolgt.
Ein Diagramm von METR, einer gemeinnützigen KI-Organisation, ist branchenweit zur Obsession geworden, da es die rasante Entwicklung großer KI-Systeme verfolgt.
Alibaba bestätigte, dass es HappyHorse-1.0 heimlich entwickelt hat – ein KI-Videomodell, das bei globalen Benchmarks auf Platz eins debütierte und mit seiner Audio-Video-Synchronisation die Konkurrenz übertraf.
Ein neuer Benchmark namens APEX-Agents zeigt, dass selbst führende KI-Modelle wie GPT-5.2 und Gemini 3 Flash bei den meisten komplexen, domänenübergreifenden Aufgaben aus beruflichen Bereichen wie Recht und Finanzen versagen, was Zweifel an ihrer unmittelbaren Einsatzbereitschaft am Arbeitsplatz aufwirft.