DeepSeek V4 發布:1兆參數但僅啟用320億,以極低成本挑戰西方頂尖模型
中國 DeepSeek 發布 V4,以混合專家架構達到1兆總參數,每次推理僅啟用320億,在多項基準超越規模更大的西方模型。
共 3 篇
中國 DeepSeek 發布 V4,以混合專家架構達到1兆總參數,每次推理僅啟用320億,在多項基準超越規模更大的西方模型。
AI 先驅 Luc Julia 在《自然》雜誌直言批評:AI 模型被過度神化,缺乏真正的創意與理解能力,呼籲業界冷靜審視。
OpenAI GPT-5.4「思考」模型在衡量 AI 經濟價值任務表現的 GDPVal 測試中達83%,首次在多數專業工作上達到或超越人類專家水準。