中國的 DeepSeek 與 Qwen 挑戰開源 AI 競賽
新的中國模型報告突顯 DeepSeek 和 Qwen 作為開源 AI 競爭中日益成長的力量。
新的中國模型報告突顯 DeepSeek 和 Qwen 作為開源 AI 競爭中日益成長的力量。
DeepSeek V4 以較低成本實現百萬級 token 推理,顯示 AI 競爭正從單純增加參數量,轉向更具成本效益的長上下文智慧。
DeepSeek 預告其迄今最強大的模型 V4,擁有 1.6 兆參數,並在華為硬體上構建,正值美國對 AI 竊取的指控不斷升級之際。
阿里巴巴開源的 Qwen3.6-27B 以僅 270 億參數,在大多數程式設計基準測試中優於其大 15 倍的前代模型。
DeepSeek 釋出了其 V4 模型的預覽版,並表示在開源 AI 競爭中,它可以與來自 Google、OpenAI 和 Anthropic 的領先 AI 一較高下。
Nvidia 已將其 Ising 系列 AI 模型開源,這些模型專為量子處理器校準和即時錯誤修正而設計,連接了 AI 與量子計算。
Meta 表示,最終將釋出由 Alexandr Wang 領導的新 AI 模型的開源版本,但最初計劃保留某些元件的專有性。
Arcee AI 發布了 Trinity-Large-Thinking,這是一款強大的全新開放權重推理模型,採用 Apache 2.0 授權,企業可下載並自訂。
Google DeepMind 推出了 Gemma 4,這是一系列針對代理式工作流程與程式設計最佳化的新型開放權重 AI 模型,目前採用寬鬆的 Apache 2.0 授權。
Nvidia 在 GTC 2026 宣布 Nemotron 聯盟,結合八個全球領先的 AI 研究實驗室,共同開發開源的前沿 AI 模型,挑戰封閉專有系統的主導地位。
llama.cpp 背後的 Georgi Gerganov 與 GGML 團隊加入 Hugging Face,確保對本地 AI 推理的長期開源支持,同時保持專案完全由社群驅動。
中國AI公司智譜AI在推出GLM-5後股價跳漲30%,該開源模型在程式碼能力上可與Claude Opus 4.5抗衡。
總部位於北京的 Moonshot AI 推出 Kimi K2.5,一款開源多模態 AI 模型,可與 OpenAI 和 Anthropic 媲美,且運行成本低四倍,這對美國的半導體出口管制在限制中國 AI 發展方面的有效性提出了質疑。
Mozilla投入14億美元,建立由致力於開放且值得信賴AI替代方案的AI新創與開發者組成的聯盟。
作者暨行動者 Cory Doctorow 認為,目前圍繞人工智慧的炒作是一個注定要破滅的泡沫,將導致大多數 AI 公司失敗。然而,他預測開源的 AI 模型會存活下來,並繼續提供有用的工具。