OpenAI GPT-5.4 大型語言模型 AI基準測試 OpenAI GPT-5.4「思考」模型在 GDPVal 基準達83%,首度在經濟性任務超越人類專家 OpenAI GPT-5.4「思考」模型在衡量 AI 經濟價值任務表現的 GDPVal 測試中達83%,首次在多數專業工作上達到或超越人類專家水準。 2026年3月20日