Step 3.5 Flash：110億活躍參數的MoE模型比肩GPT-5.2，前沿AI加速民主化

小模型的「大模型」時刻

Step 3.5 Flash的發布標誌著AI效率革命的又一重要里程碑。這款模型建立在1960億總參數的混合專家（Mixture-of-Experts, MoE）架構之上，但推理時僅啟動110億參數——不到總參數的6%。儘管如此，它在多項基準測試中展現出與OpenAI的GPT-5.2 xHigh和Google的Gemini 3.0 Pro相當的智能水平。

這意味著什麼？一台配備中端GPU的工作站就能運行一個接近頂級的AI模型。企業不再需要昂貴的雲端API或海量GPU集群來獲得前沿級別的AI能力。

                    Step 3.5 Flash技術規格
                    總參數：1960億（196B）
活躍參數：僅110億（11B）
架構：混合專家模型（MoE）
性能對標：GPT-5.2 xHigh、Gemini 3.0 Pro
活躍比例：約5.6%

                

MoE架構的持續進化

Step 3.5 Flash與MiniMax M2.5（2300億參數/100億活躍）、DeepSeek的系列模型構成了2026年初的MoE模型浪潮。這一趨勢的核心邏輯是：與其讓所有參數同時參與每次推理，不如訓練專門的「專家」模組，每次推理只啟動最相關的少數專家。

這種設計的效率優勢是巨大的：計算成本和記憶體需求與活躍參數成比例（110億），而模型的知識容量卻與總參數成比例（1960億）。用戶付出110億參數的成本，獲得1960億參數的能力。

前沿AI的民主化浪潮

TechCrunch觀察到，2026年AI產業的焦點正從「建造更大的模型」轉向「讓AI變得更實用」。Step 3.5 Flash正是這一趨勢的產物——它證明前沿級別的AI智能可以在更低的硬件門檻下實現。

對開發者和企業而言，這意味著：本地部署成為可能、推理成本大幅降低、延遲顯著降低（無需網絡往返）、數據隱私得到更好保障（數據不離開本地）。前沿AI正在從「少數公司的奢侈品」變成「多數企業的日用品」。

對大模型公司的壓力

Step 3.5 Flash和MiniMax M2.5等高效模型的出現，正在對OpenAI和Anthropic等大模型公司構成定價壓力。當開源或低成本的小型MoE模型能提供90%以上的頂級性能時，願意為最後10%性能支付10-20倍溢價的客戶將越來越少。這可能加速AI產業的商業模式轉型——從「模型即產品」走向「平台即服務」，技術差異化逐漸讓位於生態系統和服務差異化。