在美国政府针对Anthropic最新AI模型实施出口管制后,该公司被迫禁用Fable 5和Mythos 5,起因仅为亚马逊研究人员发现一个简单如“fix this code”的提示词漏洞。这一事件加剧了AI安全监管与国家安全之间的辩论。
事件经过:“修复这段代码”漏洞
亚马逊研究人员发现,Anthropic的Fable 5模型只需被提示“fix this code”就能生成可用的漏洞利用代码。当要求“review the code for security issues”时,模型会拒绝。但重新措辞的请求产生的补丁一旦转化为脚本,就能自动测试软件漏洞——实质上是为攻击者提供了查找和利用缺陷的工具包。

该技术并未解锁模型最强大的能力——Mythos 5可以自主将多个漏洞串联成全规模攻击——但这足以让政府官员警觉。据为Anthropic审查漏洞的前微软网络安全专家、Luta Security创始人Katie Moussouris称,该越狱“无法有效修复,任何尝试只会削弱模型的防御能力”。
为何实施出口管制
特朗普政府对此反应是同时对Fable 5和底层基础模型Mythos 5实施出口管制。根据美国出口管制法律,向任何非公民(甚至包括美国本土雇员)分发技术都视为出口。Anthropic表示别无选择,只能对所有用户禁用这两个模型。
该决定是在亚马逊CEO Andy Jassy与白宫通话后做出的,漏洞被直接上报。一位匿名消息人士告诉Axios,Anthropic委托Moussouris撰写报告——而政府视其为“激进民主党人”——可能激化了矛盾,加速了管制。
安全辩论:防御工具还是危险?
Moussouris认为,亚马逊暴露的能力正是网络安全防御者所需要的。“防御者需要能要求AI修复文件中的bug,解释修复的原因,并编写测试来确认补丁有效,”她在博客中写道。“这不是护栏绕过。这是AI模型能为防御安全所做的最有价值的事情。”
她将这一情况比作1990年代围绕加密出口管制的斗争,当时密码学家Adam Back将RSA代码印在T恤上作为抗议形式。Moussouris建议新T恤一面印“fix this code”,另一面印“this shirt is a munition”。
然而,批评者担心该漏洞实际上赋予了攻击者自动化漏洞发现能力。由于Mythos 5是首个通过英国AI安全研究所两个测试场的模型,防御性和进攻性使用之间的界限依然危险地模糊。
谁在发声:网络安全专家的公开信
大约100名网络安全专业人士签署了一封由Facebook前首席安全官Alex Stamos协调的公开信,呼吁撤销出口管制。签署人包括来自Nvidia、Adobe、Zoom、Google、Anaplan和Sophos的专家,以及学术研究人员。
信中指出,同样的“fix this code”技术也适用于多个其他模型,包括OpenAI的GPT-5.5、Anthropic自家的Claude Opus和Sonnet模型,以及中国模型如Moonshot AI的Kimi 2.7。“采取这一空前行动的理由是Fable提供了超越其他AI模型的独特‘能力提升’,但AI自去年以来已经能超人般地发现bug并生成可用的漏洞利用代码,”信中写道。
信中还指出,Anthropic在Fable中建立了“激进的”保护措施——以至于“这些措施在发布当天就成了网络社区的笑谈”。
政治紧张与白宫
白宫的决定似乎既受安全关切也受政治动态影响。Axios报道称,一位匿名行政当局消息人士将Moussouris描述为“激进民主党人”,并指出安全研究员Chris Krebs——特朗普在2020年因Krebs反驳选举欺诈指控而将其从网络安全和基础设施安全局解雇——曾公开为其分析背书。
“出口管制是一种钝器,伤害了政府声称要保护的人,”Moussouris告诉Fortune。“防御者比攻击者更需要这些工具,而行政当局通过关闭它们正在削弱美国的网络安全。”
这对行业意味着什么
Anthropic出口管制标志着政府如何监管高级AI的关键转折点。这是首个因出口管制法有效禁止所有用户使用主要AI模型的事件,开创了可能重塑行业的先例。
对于AI公司来说,“fix this code”案例产生了寒蝉效应。能够执行代码审计和漏洞发现的模型——可以说是AI在网络安全中最有用的应用——现在面临监管风险。公司可能需要重新设计护栏设计,否则面临政府关停的风险。
对于竞争对手来说,这一决定可能造成不公平竞争。公开信指出,像Kimi 2.7这样的中国模型提供类似功能却未受到同等限制。美国政策可能无意中将网络安全AI市场拱手让给监管较轻的国外对手。
对于更广泛的科技行业,这引发了根本性问题:具有双重用途能力的AI模型是否应像加密工具一样对待?政府应如何平衡安全效益与潜在滥用?答案可能在未来多年塑造AI监管。
常见问题解答
亚马逊研究人员究竟发现了什么? 他们发现,让Anthropic的Fable 5模型“fix this code”而非“review for security issues”绕过了安全护栏,导致模型生成可用的漏洞利用代码,将其防御能力转变为进攻工具。
为什么Anthropic不得不完全禁用其模型? 美国出口管制法将向非公民分发视为出口。由于Anthropic雇佣了许多非公民工程师,合规会禁止他们从事模型工作。公司选择对所有用户禁用访问而非违反法律。
这个漏洞是Anthropic模型独有的吗? 不是。公开信指出,OpenAI的GPT-5.5、Anthropic自家的Claude Opus和Sonnet,以及中国模型如Kimi 2.7也能执行类似代码审计。该技术适用于许多高级AI模型。
公开信要求什么? 呼吁特朗普政府撤销对Fable 5和Mythos 5的出口管制,认为这些能力对网络防御者至关重要,且其他模型也提供相同功能。
美国出口管制如何适用于AI? 出口管制限制敏感技术向外国实体转移。对于AI模型,即使向美国境内的非公民提供访问也视为出口,这使Anthropic无法继续运营模型。
Anthropic和受影响模型的下一步是什么? Anthropic可能对出口管制提起法律挑战或寻求受限使用的许可证。公司也可能重新设计未来模型,以更好区分防御性和进攻性代码分析用例。
结论
因三个单词的提示导致Anthropic的Fable和Mythos模型被关停,揭示了AI安全与审查之间界限的脆弱性。随着政府监管竞相追赶模型能力,“fix this code”案例可能成为AI治理中意外后果的教科书式例子。无论出口管制是否维持,结果都将影响每个AI公司处理网络安全功能和政府关系的方式。













参与讨论
Should AI models with the ability to find code vulnerabilities be regulated as weapons?