加密新聞標籤聚合與專題資訊

OpenAI 的 GPT-5.5 在網路攻擊能力上匹敵 Claude Mythos：AI 安全研究院

OpenAI 的 GPT-5.5 是第二個完成模擬企業網路入侵全過程的人工智慧系統，引發警鐘。

2026-05-01 來源:decrypt.co

英國政府機構發現，OpenAI 最新的 AI 模型能夠自主執行複雜的網路攻擊，並且僅用10多分鐘就破解了一個逆向工程挑戰，而這項挑戰通常需要人類安全專家花費大約12小時。

英國科學、創新與技術部下屬的研究機構——AI安全研究所（AISI）週四發布研究結果，顯示GPT-5.5是其評估過的最強大的攻擊性網路能力模型之一，與Anthropic備受讚譽的Claude Mythos大致相當。

報告發現，GPT-5.5是第二個完成AISI最嚴苛測試的模型——一項名為「最後的考驗」（The Last Ones）的32步模擬企業網路攻擊——在10次嘗試中有兩次自主完成。第一個達到這一里程碑的模型是Anthropic的Claude Mythos Preview，它在10次嘗試中完成了3次模擬。

這項與網路安全公司SpecterOps合作建立的企業網路模擬，要求代理執行偵察、憑證竊取、跨多個Active Directory森林的橫向移動、透過CI/CD管道進行供應鏈樞紐，最終滲透受保護的內部資料庫——AISI估計這些步驟需要人類專家大約20小時。

或許最引人注目的結果涉及一個極其困難的逆向工程難題。GPT-5.5在10分鐘22秒內解決了該挑戰——這需要重建客製化虛擬機器的指令集、從頭編寫反彙編器，並透過約束求解恢復加密密碼——API使用成本為1.73美元。而一名使用專業工具的人類專家則需要大約12小時。

在AISI一系列進階網路安全任務中，GPT-5.5在最困難的「專家」層級中取得了71.4%的平均通過率，略高於Mythos Preview的68.6%，並顯著超越GPT-5.4的52.4%。

這些發現對AI發展的廣泛軌跡具有深遠的影響。AISI總結指出，GPT-5.5的表現表明，網路能力的快速提升可能是一個普遍趨勢的一部分，而非單一的突破——並警告說，如果攻擊性網路技能是推理、編碼和自主任務完成方面更廣泛進步的副產品，那麼未來的進展可能接踵而至。

報告還指出，對該模型的安全防護措施存在重大擔憂。研究人員發現一個通用越獄漏洞，能夠在所有測試的惡意網路查詢中，包括多輪代理設置下，引發有害內容。這次攻擊花了六個小時的專家紅隊測試才開發出來。OpenAI隨後更新了其安全防護堆疊，但由於配置問題，AISI無法驗證最終版本是否有效。

AISI警告稱，其能力評估是在受控的研究環境中進行的，並不一定反映普通用戶所能接觸到的內容，並指出公開部署包含額外的安全防護和存取控制。

這份報告發布之際，英國網路安全面臨著令人擔憂的局面。英國政府年度《網路安全漏洞調查報告》也於週四發布，發現過去12個月內有43%的企業遭受網路洩漏或攻擊。

作為回應，政府宣布提供9000萬英鎊的新資金以增強網路韌性，並表示正在推進《網路安全與韌性法案》以保護基本服務。官員們還發布了指導意見，敦促各組織為潛在的大量新發現軟體漏洞做好準備，因為AI將加速發現和武器化安全漏洞的速度。

熱門閱讀

其它文章

熱門幣種

立即註冊，不錯過任何更新！