Alibabas Qwen3.6-27B übertrifft auf Programmier-Benchmarks deutlich größere Modelle
Alibabas Open-Source-Modell Qwen3.6-27B übertrifft mit nur 27 Milliarden Parametern seinen 15-mal größeren Vorgänger in den meisten Programmier-Benchmarks.
Alibabas Open-Source-Modell Qwen3.6-27B übertrifft mit nur 27 Milliarden Parametern seinen 15-mal größeren Vorgänger in den meisten Programmier-Benchmarks.
Ein neuer Benchmark zeigt, dass selbst die besten KI-Modelle bei der Analyse komplizierter Diagramme etwa 50 % an Genauigkeit verlieren und damit eine zentrale Grenze des visuellen Denkens offenlegen.
Das chinesische KI-Startup DeepSeek verhandelt über die Aufnahme von mindestens 300 Millionen US-Dollar bei einer Bewertung von 10 Milliarden US-Dollar und signalisiert damit das wachsende Vertrauen der Investoren in Chinas KI-Sektor.
Z.AI veröffentlicht GLM-5.1, ein Open-Source-Modell mit 754 Milliarden Parametern, das für langfristige agentische Aufgaben entwickelt wurde, bis zu 8 Stunden autonom läuft und Claude Opus 4 in Benchmarks übertrifft.
Der annualisierte Umsatz von Anthropic hat 2026 30 Milliarden US-Dollar überschritten, nach zuvor 9 Milliarden US-Dollar, angetrieben durch die stark steigende Nachfrage nach seinem KI-Modell Claude.
Meta sagt, dass es irgendwann Open-Source-Versionen seiner neuen von Alexandr Wang geleiteten KI-Modelle veröffentlichen wird, plant jedoch, bestimmte Komponenten zunächst proprietär zu halten.
Arcee AI hat Trinity-Large-Thinking veröffentlicht, ein leistungsstarkes neues Open-Weights-Reasoning-Modell unter Apache 2.0, das Unternehmen herunterladen und anpassen können.
Forscher am MIT haben eine Gesamtunsicherheitsmetrik eingeführt, die die Ausgaben eines Modells über ein Ensemble von LLMs verschiedener Entwickler vergleicht und übermäßig selbstsichere sowie halluzinierte Vorhersagen genauer erkennt als bestehende Self-Consistency-Methoden.
Anthropic kündigte an, die Nutzungsgrenzen für Claude-AI-Abonnenten in Nebenzeiten zu verdoppeln – eine bedeutende Kapazitätserweiterung, die eintritt, während die täglich aktiven Nutzer von Claude seit Januar 2026 um über 140 % gestiegen sind.
Anthropic bringt Claude Sonnet 4.6 heraus, das mit einem Kontextfenster von 1 Million Token Spitzen-AI-Leistung beim Programmieren, in der Computeranwendung und bei Agenten bietet – nur 12 Tage nach Opus 4.6.
Claude Opus 4.6 führt bahnbrechende Funktionen ein, darunter ein Kontextfenster mit 1 Million Tokens, Agententeams für parallele Koordination und adaptives Denken für Unternehmens-Workflows.
Forschungen des Mount Sinai zeigen, dass KI-LLMs medizinische Fehlinformationen in 32–46 % der Fälle glauben, insbesondere wenn diese als Expertenrat präsentiert werden.
Der KI-Pionier Yann LeCun hat Meta verlassen und warnt, dass sich die KI-Branche zu sehr auf große Sprachmodelle (LLMs) konzentriert und in die falsche Richtung geht. Er plädiert für eine Verlagerung hin zu prädiktiven Weltmodellen.