KPMG 在幻覺捏造客戶聲稱後撤下 AI 效益報告
KPMG 在 UBS、英國國民保健署(NHS)等表示其關於 AI 使用的說法並不屬實後,移除了其 agentic AI 報告,而 GPTZero 將這些錯誤歸因於 AI 幻覺。
KPMG 在 UBS、英國國民保健署(NHS)等表示其關於 AI 使用的說法並不屬實後,移除了其 agentic AI 報告,而 GPTZero 將這些錯誤歸因於 AI 幻覺。
一位 WIRED 事實查核員測試 AI 系統,並突顯自動化事實查核工作流程中持續存在的可靠性問題。
一項嚴格的新基準測試了頂尖AI模型在投資銀行任務上的表現;沒有任何輸出被認定為可直接交付客戶,不過有一半的銀行家認為它可作為起點。
Microsoft 針對 Copilot 的服務條款明確指出,這個 AI 僅供娛樂用途,且可能會出錯,這也引發了企業對 AI 工具信任度的疑問。