DeepSeek 在華為晶片上推出 1.6 兆參數 V4 模型
DeepSeek 預告其迄今最強大的模型 V4,擁有 1.6 兆參數,並在華為硬體上構建,正值美國對 AI 竊取的指控不斷升級之際。
DeepSeek 預告其迄今最強大的模型 V4,擁有 1.6 兆參數,並在華為硬體上構建,正值美國對 AI 竊取的指控不斷升級之際。
Meta 推出了其新的旗艦 AI 模型 Muse Spark,而 Anthropic 則發布了 Claude Mythos Preview,標誌著競爭激烈的 AI 模型發布重要一週。
阿里巴巴推出具有先進代理能力的 Qwen 3.5,採用 3970 億參數的 Mixture-of-Experts 架構,以在全球市場競爭。
OpenAI 宣布將於 2026 年 2 月 13 日退役深受喜愛的 GPT-4o 及舊有模型,因為每天只有 0.1% 的用戶仍然選擇這款溫暖的對話型模型。
中國科技巨頭字節跳動與阿里巴巴將發布新的生成式AI模型,包括字節跳動的Doubao 2.0大型語言模型,進一步加劇國內與全球在AI領域的競爭。
圖靈獎得主及前 Meta AI 主管 Yann LeCun 主張,科技產業對大型語言模型(LLM)的單一專注是一條有缺陷的道路,無法導向真正的通用人工智慧。