
OpenAI 週四發布了 GPT-5.5,並將其定位為主要針對代理式電腦使用的模型。它能夠編寫和偵錯程式碼、瀏覽網路、填寫試算表,並持續執行多步驟任務,而無需人工全程監管。
OpenAI 表示,此版本已於今日向 ChatGPT 和 Codex 的 Plus、Pro、Business 和 Enterprise 訂閱者推出。
OpenAI 在一份公告中表示:「我們正在發布 GPT-5.5,這是我們迄今為止最智能、最直觀的模型,也是電腦工作新方式的下一步。在代理式編碼、電腦使用、知識工作和早期科學研究等領域,進展尤其顯著,這些領域的發展取決於跨上下文的推理和隨著時間推移採取行動。」
隆重推出 GPT-5.5
一種為實際工作和驅動代理而設計的新型智能,旨在理解複雜目標、使用工具、檢查其工作並完成更多任務。它標誌著電腦工作方式的新變革。
現已在 ChatGPT 和 Codex 中提供。 pic.twitter.com/rPLTk99ZH5
— OpenAI (@OpenAI) April 23, 2026
OpenAI 的主要重點:GPT-5.5 明顯比其前身 GPT-5.4 更智能,而且速度不減。在實際服務中保持與 GPT-5.4 相同的每代幣延遲,同時在各項基準測試中獲得更高分數,這種效率提升通常不常見。通常來說,較大的模型在相同硬體條件下執行時會較慢。
在 Terminal-Bench 2.0 測試中,該模型在處理需要規劃和疊代工具使用的複雜命令列工作流程方面的表現,GPT-5.5 獲得 82.7% 的分數。Claude Opus 4.7 獲得 69.4%,而 Gemini 3.1 Pro 則為 68.5%。這並非微小的領先。
在 GDPval 測試中,這是一個評估 44 種實際職業(從金融到法律研究再到產品管理)知識工作的基準,GPT-5.5 在 84.9% 的比較中達到或超越了行業專業人士。
一如預期,它也是一位相當出色的編碼員。在 Expert-SWE(一個針對預計人類平均完成時間為 20 小時的長週期編碼任務的內部基準測試)中,GPT-5.5 超越了 GPT-5.4。在評估實際 GitHub 問題解決能力的 SWE-Bench Pro 上,它達到 58.6%。Claude Opus 4.7 獲得更高的 64.3%,但 OpenAI 聲稱這可能是因為「Anthropic 報告在部分問題上出現了記憶化跡象」。
這次發布進入了一個自代理式 AI 蓬勃發展以來快速變化的市場。GPT-5.4 在 GPT-5.3 推出僅兩天後問世,而小米則在大約五週內從 MiMo-V2-Pro 進化到具備完整多模態能力的 MiMo 2.5 Pro。GPT-5.4 和 GPT-5.5 之間的間隔約為七週。這就是目前的步調。
但這個模型對於不總是編寫下一個大創新的普通用戶來說會有所不同嗎?如果你是免費層級用戶,答案是否定的:GPT-5.5 不會向免費用戶開放。如果你每月支付 20 美元訂閱 Plus,它將於今天推出。我們嘗試在我們的 Pro 帳戶下進行測試,但該模型尚未立即可用。
更大的重點可能在於 GPT-5.5 在 Codex(OpenAI 的代理式編碼環境)中的表現,在那裡它被證明更為強大。「我真的感覺自己在與一種更高的智能合作,幾乎帶有一種敬意。」MagicPath 執行長 Pietro Schirano 在 OpenAI 分享的引述中說道。
專為更困難、更高準確度工作設計的 GPT-5.5 Pro,正在 ChatGPT 中單獨向 Pro、Business 和 Enterprise 用戶推出。在 BrowseComp(一項測試模型在網路上追蹤難以找到的資訊能力的基準測試)中,GPT-5.5 Pro 獲得 90.1% 的分數,領先 Gemini 3.1 Pro 的 85.9%。
根據人工分析指數,該模型在平均水準上也是最智能的。GPT 5.5 報告稱,其代幣使用更有效率且更有用,整體上產生了更好的結果。
然而,其定價可能會讓一些用戶感到震驚。OpenAI 表示,API 推出後,輸入代幣每百萬將收費 5 美元,輸出代幣每百萬將收費 30 美元,而且將「很快」推出。API 中的 GPT-5.5 Pro 將收取每百萬輸入代幣 30 美元和每百萬輸出代幣 180 美元。
這些數字高於 GPT-5.4(每百萬輸入代幣 2.50 美元,每百萬輸出代幣 15.00 美元),而 GPT-5.5 Pro 的定價則與 GPT-5.4 Pro 保持不變。
儘管如此,OpenAI 執行長 Sam Altman 在 X 上表示,代幣效率的提升抵消了成本——GPT-5.5 以更少的代幣完成相同的 Codex 任務,這意味著即使每代幣費率更高,運作成本也更低。
僅供比較,小米 MiMo v2.5 Pro 的輸入和輸出代幣分別每百萬收費 1 美元和 3 美元,Minimax M2.7 分別為 0.30 美元和 1.20 美元,而 Kimi K2.5 則需要每百萬代幣 0.44 美元和 2.00 美元。