
英國政府機構發現,OpenAI 最新的 AI 模型能夠自主執行複雜的網路攻擊,並且僅用10多分鐘就破解了一個逆向工程挑戰,而這項挑戰通常需要人類安全專家花費大約12小時。
英國科學、創新與技術部下屬的研究機構——AI安全研究所(AISI)週四發布研究結果,顯示GPT-5.5是其評估過的最強大的攻擊性網路能力模型之一,與Anthropic備受讚譽的Claude Mythos大致相當。
報告發現,GPT-5.5是第二個完成AISI最嚴苛測試的模型——一項名為「最後的考驗」(The Last Ones)的32步模擬企業網路攻擊——在10次嘗試中有兩次自主完成。第一個達到這一里程碑的模型是Anthropic的Claude Mythos Preview,它在10次嘗試中完成了3次模擬。
這項與網路安全公司SpecterOps合作建立的企業網路模擬,要求代理執行偵察、憑證竊取、跨多個Active Directory森林的橫向移動、透過CI/CD管道進行供應鏈樞紐,最終滲透受保護的內部資料庫——AISI估計這些步驟需要人類專家大約20小時。
或許最引人注目的結果涉及一個極其困難的逆向工程難題。GPT-5.5在10分鐘22秒內解決了該挑戰——這需要重建客製化虛擬機器的指令集、從頭編寫反彙編器,並透過約束求解恢復加密密碼——API使用成本為1.73美元。而一名使用專業工具的人類專家則需要大約12小時。
在AISI一系列進階網路安全任務中,GPT-5.5在最困難的「專家」層級中取得了71.4%的平均通過率,略高於Mythos Preview的68.6%,並顯著超越GPT-5.4的52.4%。
這些發現對AI發展的廣泛軌跡具有深遠的影響。AISI總結指出,GPT-5.5的表現表明,網路能力的快速提升可能是一個普遍趨勢的一部分,而非單一的突破——並警告說,如果攻擊性網路技能是推理、編碼和自主任務完成方面更廣泛進步的副產品,那麼未來的進展可能接踵而至。
報告還指出,對該模型的安全防護措施存在重大擔憂。研究人員發現一個通用越獄漏洞,能夠在所有測試的惡意網路查詢中,包括多輪代理設置下,引發有害內容。這次攻擊花了六個小時的專家紅隊測試才開發出來。OpenAI隨後更新了其安全防護堆疊,但由於配置問題,AISI無法驗證最終版本是否有效。
AISI警告稱,其能力評估是在受控的研究環境中進行的,並不一定反映普通用戶所能接觸到的內容,並指出公開部署包含額外的安全防護和存取控制。
這份報告發布之際,英國網路安全面臨著令人擔憂的局面。英國政府年度《網路安全漏洞調查報告》也於週四發布,發現過去12個月內有43%的企業遭受網路洩漏或攻擊。
作為回應,政府宣布提供9000萬英鎊的新資金以增強網路韌性,並表示正在推進《網路安全與韌性法案》以保護基本服務。官員們還發布了指導意見,敦促各組織為潛在的大量新發現軟體漏洞做好準備,因為AI將加速發現和武器化安全漏洞的速度。