Qwen3.6-27B da Alibaba supera modelos muito maiores em benchmarks de programação
O Qwen3.6-27B de código aberto da Alibaba supera seu predecessor 15 vezes maior na maioria dos benchmarks de programação, com apenas 27 bilhões de parâmetros.
O Qwen3.6-27B de código aberto da Alibaba supera seu predecessor 15 vezes maior na maioria dos benchmarks de programação, com apenas 27 bilhões de parâmetros.
Um novo benchmark revela que até os principais modelos de IA caem cerca de 50% em precisão ao analisar gráficos complicados, expondo uma limitação importante no raciocínio visual.
A startup chinesa de IA DeepSeek está em negociações para captar pelo menos US$ 300 milhões com uma avaliação de US$ 10 bilhões, sinalizando a crescente confiança dos investidores no setor de IA da China.
A Z.AI lança o GLM-5.1, um modelo de código aberto com 754 bilhões de parâmetros, projetado para tarefas agenticas de longo horizonte, operando autonomamente por até 8 horas e superando o Claude Opus 4 em benchmarks.
A receita anualizada da Anthropic ultrapassou US$ 30 bilhões em 2026, ante US$ 9 bilhões, impulsionada pela forte demanda por seu modelo de IA Claude.
A Meta diz que eventualmente lançará versões de código aberto de seus novos modelos de IA liderados por Alexandr Wang, mas planeja manter certos componentes proprietários inicialmente.
A Arcee AI lançou o Trinity-Large-Thinking, um novo e poderoso modelo de raciocínio de pesos abertos sob a licença Apache 2.0 que as empresas podem baixar e personalizar.
Pesquisadores do MIT introduziram uma métrica de incerteza total que compara as saídas de um modelo em um conjunto (ensemble) de LLMs de diferentes desenvolvedores, detectando com mais precisão previsões excessivamente autoconfiantes e alucinações do que os métodos de self-consistency existentes.
A Anthropic anunciou que está dobrando os limites de uso para assinantes do Claude AI durante os horários de menor movimento, uma expansão de capacidade significativa que ocorre enquanto os usuários ativos diários do Claude aumentaram mais de 140% desde janeiro de 2026.
Anthropic lança o Claude Sonnet 4.6, oferecendo desempenho de IA de ponta em programação, uso de computadores e agentes, com uma janela de contexto de 1 milhão de tokens, apenas 12 dias após o Opus 4.6.
O Claude Opus 4.6 introduz recursos inovadores, incluindo janela de contexto de 1 milhão de tokens, equipes de agentes para coordenação paralela e pensamento adaptativo para fluxos de trabalho empresariais.
Pesquisa do Mount Sinai mostra que LLMs de IA acreditam em desinformação médica em 32–46% das vezes, especialmente quando apresentada como conselho de especialista.
O pioneiro da IA Yann LeCun deixou o Meta, alertando que a indústria de IA está excessivamente focada em grandes modelos de linguagem (LLMs) e segue na direção errada. Ele defende uma mudança para modelos preditivos do mundo.