AI學院每日AI新聞精選

AI基準測試

「AI基準測試」相關新聞

共 1 篇

OpenAI GPT-5.4 大型語言模型 AI基準測試

OpenAI GPT-5.4「思考」模型在 GDPVal 基準達83%，首度在經濟性任務超越人類專家

OpenAI GPT-5.4「思考」模型在衡量 AI 經濟價值任務表現的 GDPVal 測試中達83%，首次在多數專業工作上達到或超越人類專家水準。

2026年3月20日