Um verificador de fatos da WIRED testa sistemas de IA e destaca problemas persistentes de confiabilidade nos fluxos de trabalho automatizados de verificação de fatos.
Um novo benchmark rigoroso testou os principais modelos de IA em tarefas de banco de investimento; nenhuma das saídas foi considerada pronta para o cliente, embora metade dos banqueiros tenha encontrado valor como ponto de partida.
Os Termos de Serviço da Microsoft para o Copilot afirmam explicitamente que a IA é apenas para entretenimento e pode cometer erros, levantando প্রশ্নões sobre a confiança corporativa em ferramentas de IA.