
Anthropic 執行長 Dario Amodei 週三表示,政府不能再將 AI 監管視為一個有待研究的問題,美國需要為最強大的 AI 模型制定具約束力的安全要求。
在題為「AI 指數級增長政策」(Policy on the AI Exponential)的文章中,Amodei 主張透明度要求已不足夠,並呼籲對前沿 AI 系統實施具約束力的監管。
Amodei 寫道:「AI 正以閃電般的速度發展——僅僅四年時間,AI 模型就從幾乎無法寫出連貫的程式碼,發展到能夠編寫主要 AI 公司的大部分程式碼。」
Amodei 的文章發表之際,正值 Anthropic 週二推出 Mythos 5,擴大其對 Claude Mythos 的存取權限。Mythos 5 是 Anthropic 專為網路安全組織和政府合作夥伴開發的受限前沿 AI 模型。包括英國 AI 安全研究所在內的研究人員發現,它能夠自主執行複雜的網路攻擊。
根據 Amodei 的說法,他的提案借鑒了美國聯邦航空管理局(Federal Aviation Administration)採用的監管結構。
他寫道:「前沿 AI 模型,就像飛機一樣,應該被要求進行技術測試和審計,如果它們未能達到高標準的安全要求,其發布應被阻止或撤銷,因為它們對公共安全構成威脅。」「我很欣慰看到川普政府的行政命令逐步讓政府在 AI 中扮演更重要的角色,儘管 Anthropic 的提案建議採取更進一步的行動。」
Today I'm publishing a new essay, Policy on the AI Exponential. AI is progressing extremely fast—much faster than the policy process was built to handle. The essay lays out where I think the technology is now, and the action needed to close the gap: https://t.co/Lh6PWae178
— Dario Amodei (@DarioAmodei) June 10, 2026
根據 Amodei 的提案,一個監管框架將要求對先進 AI 模型進行強制性第三方測試,賦予政府阻止不安全部署的權力,並要求公司確保模型權重(model weights)安全、進行安全測試並報告嚴重事件。他還呼籲各國政府為 AI 驅動的職位流失和藥物開發的進步做好準備,限制國內執法中的監控和自主武器,並加強民主國家在關鍵 AI 技術上的合作。
他寫道:「首先,持久性的職位流失是不受歡迎且危險的,我們應該盡一切努力將其最小化或預防,而不是促成它。」他指出過去他曾警告職位流失的例子。「其次,任何應對 AI 驅動職位流失的方案都需要解決兩個問題:一是提供所有人經濟保障的需求,二是人們尋找意義、目的和自主性的需求。」
這篇文章發布的同週,Anthropic 也推出了 Claude Fable 5,這是 Claude Mythos 5 的公開版本,它會將涉及網路安全、生物學、化學和 AI 開發的某些請求路由到能力較低的 Claude Opus 4.8,作為防止濫用的安全措施。然而,這次發布引起了開發人員和研究人員的批評,原因包括 Fable 較高的代幣使用量、強制性的 30 天資料保留要求,以及在未通知用戶的情況下可能降低模型能力的安全措施。
Amodei 呼籲圍繞 AI 開發的政策變革,也正值 Anthropic 準備公開上市之際。本月稍早,該公司向美國證券交易委員會(U.S. Securities and Exchange Commission)提交了首次公開募股(IPO)文件,此前據報導,它在 H 輪融資中籌集了 650 億美元,估值達到 9650 億美元。
儘管 Amodei 將此問題框定為科技進步與公共政策之間的競賽,但批評者質疑,呼籲更嚴格的 AI 監管是否真正符合公共利益。四月時,OpenAI 執行長 Sam Altman 指責 Anthropic 使用「恐懼行銷」(fear-based marketing)來推廣 Claude Mythos,認為對先進 AI 的擔憂可能被用來為少數公司集中控制這項技術辯護。
Altman 說:「你可以用很多不同的方式來為此辯護,其中有些是真實的,例如確實會存在合理的安全隱患。」「但是,如果你想要的是『我們需要控制 AI,只有我們,因為我們是值得信賴的人』,我認為恐懼行銷可能是證明這一點最有效的方式。」
Amodei 駁斥了關於先進 AI 的擔憂主要是一個公關問題的觀點,反而主張對這項技術的恐懼反映了必須解決的合理擔憂。
他解釋道:「人們擔心 AI,是因為他們正確地意識到其風險是真實存在的,而不是因為 AI 執行長們不夠『包羅斯』(Panglossian)。」他指的是伏爾泰小說《憨第德》中的虛構哲學家包羅斯,該人物以無論情況如何都堅信一切都是最好的而聞名。
他表示:「我認為作為一名 AI 領導者,我有責任繼續透明地公開這些風險,而公眾對這種透明度所產生的擔憂,正構成了民主問責制的正常運作。」