大型語言模型
「大型語言模型」相關新聞
共 5 篇
DeepSeek V4 發布:1兆參數但僅啟用320億,以極低成本挑戰西方頂尖模型
中國 DeepSeek 發布 V4,以混合專家架構達到1兆總參數,每次推理僅啟用320億,在多項基準超越規模更大的西方模型。
《自然》雜誌:AI 創新者直言「大型語言模型不過是高端計算機」,批評業界過度炒作
AI 先驅 Luc Julia 在《自然》雜誌直言批評:AI 模型被過度神化,缺乏真正的創意與理解能力,呼籲業界冷靜審視。
OpenAI GPT-5.4「思考」模型在 GDPVal 基準達83%,首度在經濟性任務超越人類專家
OpenAI GPT-5.4「思考」模型在衡量 AI 經濟價值任務表現的 GDPVal 測試中達83%,首次在多數專業工作上達到或超越人類專家水準。