“修复这段代码”:三个单词的提示如何导致美国关闭Anthropic的AI模型

“修复这段代码”:三个单词的提示如何导致美国关闭Anthropic的AI模型

1 分钟阅读2026年6月16日
David Kim
David Kim

在美国政府针对Anthropic最新AI模型实施出口管制后,该公司被迫禁用Fable 5和Mythos 5,起因仅为亚马逊研究人员发现一个简单如“fix this code”的提示词漏洞。这一事件加剧了AI安全监管与国家安全之间的辩论。

事件经过:“修复这段代码”漏洞

亚马逊研究人员发现,Anthropic的Fable 5模型只需被提示“fix this code”就能生成可用的漏洞利用代码。当要求“review the code for security issues”时,模型会拒绝。但重新措辞的请求产生的补丁一旦转化为脚本,就能自动测试软件漏洞——实质上是为攻击者提供了查找和利用缺陷的工具包。

一名网络安全专家在多台显示器上分析代码

该技术并未解锁模型最强大的能力——Mythos 5可以自主将多个漏洞串联成全规模攻击——但这足以让政府官员警觉。据为Anthropic审查漏洞的前微软网络安全专家、Luta Security创始人Katie Moussouris称,该越狱“无法有效修复,任何尝试只会削弱模型的防御能力”。

为何实施出口管制

特朗普政府对此反应是同时对Fable 5和底层基础模型Mythos 5实施出口管制。根据美国出口管制法律,向任何非公民(甚至包括美国本土雇员)分发技术都视为出口。Anthropic表示别无选择,只能对所有用户禁用这两个模型。

该决定是在亚马逊CEO Andy Jassy与白宫通话后做出的,漏洞被直接上报。一位匿名消息人士告诉Axios,Anthropic委托Moussouris撰写报告——而政府视其为“激进民主党人”——可能激化了矛盾,加速了管制。

安全辩论:防御工具还是危险?

Moussouris认为,亚马逊暴露的能力正是网络安全防御者所需要的。“防御者需要能要求AI修复文件中的bug,解释修复的原因,并编写测试来确认补丁有效,”她在博客中写道。“这不是护栏绕过。这是AI模型能为防御安全所做的最有价值的事情。”

她将这一情况比作1990年代围绕加密出口管制的斗争,当时密码学家Adam Back将RSA代码印在T恤上作为抗议形式。Moussouris建议新T恤一面印“fix this code”,另一面印“this shirt is a munition”。

然而,批评者担心该漏洞实际上赋予了攻击者自动化漏洞发现能力。由于Mythos 5是首个通过英国AI安全研究所两个测试场的模型,防御性和进攻性使用之间的界限依然危险地模糊。

谁在发声:网络安全专家的公开信

大约100名网络安全专业人士签署了一封由Facebook前首席安全官Alex Stamos协调的公开信,呼吁撤销出口管制。签署人包括来自NvidiaAdobeZoomGoogleAnaplanSophos的专家,以及学术研究人员。

信中指出,同样的“fix this code”技术也适用于多个其他模型,包括OpenAI的GPT-5.5、Anthropic自家的Claude OpusSonnet模型,以及中国模型如Moonshot AI的Kimi 2.7。“采取这一空前行动的理由是Fable提供了超越其他AI模型的独特‘能力提升’,但AI自去年以来已经能超人般地发现bug并生成可用的漏洞利用代码,”信中写道。

信中还指出,Anthropic在Fable中建立了“激进的”保护措施——以至于“这些措施在发布当天就成了网络社区的笑谈”。

政治紧张与白宫

白宫的决定似乎既受安全关切也受政治动态影响。Axios报道称,一位匿名行政当局消息人士将Moussouris描述为“激进民主党人”,并指出安全研究员Chris Krebs——特朗普在2020年因Krebs反驳选举欺诈指控而将其从网络安全和基础设施安全局解雇——曾公开为其分析背书。

“出口管制是一种钝器,伤害了政府声称要保护的人,”Moussouris告诉Fortune。“防御者比攻击者更需要这些工具,而行政当局通过关闭它们正在削弱美国的网络安全。”

这对行业意味着什么

Anthropic出口管制标志着政府如何监管高级AI的关键转折点。这是首个因出口管制法有效禁止所有用户使用主要AI模型的事件,开创了可能重塑行业的先例。

对于AI公司来说,“fix this code”案例产生了寒蝉效应。能够执行代码审计和漏洞发现的模型——可以说是AI在网络安全中最有用的应用——现在面临监管风险。公司可能需要重新设计护栏设计,否则面临政府关停的风险。

对于竞争对手来说,这一决定可能造成不公平竞争。公开信指出,像Kimi 2.7这样的中国模型提供类似功能却未受到同等限制。美国政策可能无意中将网络安全AI市场拱手让给监管较轻的国外对手。

对于更广泛的科技行业,这引发了根本性问题:具有双重用途能力的AI模型是否应像加密工具一样对待?政府应如何平衡安全效益与潜在滥用?答案可能在未来多年塑造AI监管。

常见问题解答

亚马逊研究人员究竟发现了什么? 他们发现,让Anthropic的Fable 5模型“fix this code”而非“review for security issues”绕过了安全护栏,导致模型生成可用的漏洞利用代码,将其防御能力转变为进攻工具。

为什么Anthropic不得不完全禁用其模型? 美国出口管制法将向非公民分发视为出口。由于Anthropic雇佣了许多非公民工程师,合规会禁止他们从事模型工作。公司选择对所有用户禁用访问而非违反法律。

这个漏洞是Anthropic模型独有的吗? 不是。公开信指出,OpenAI的GPT-5.5、Anthropic自家的Claude Opus和Sonnet,以及中国模型如Kimi 2.7也能执行类似代码审计。该技术适用于许多高级AI模型。

公开信要求什么? 呼吁特朗普政府撤销对Fable 5和Mythos 5的出口管制,认为这些能力对网络防御者至关重要,且其他模型也提供相同功能。

美国出口管制如何适用于AI? 出口管制限制敏感技术向外国实体转移。对于AI模型,即使向美国境内的非公民提供访问也视为出口,这使Anthropic无法继续运营模型。

Anthropic和受影响模型的下一步是什么? Anthropic可能对出口管制提起法律挑战或寻求受限使用的许可证。公司也可能重新设计未来模型,以更好区分防御性和进攻性代码分析用例。

结论

因三个单词的提示导致Anthropic的Fable和Mythos模型被关停,揭示了AI安全与审查之间界限的脆弱性。随着政府监管竞相追赶模型能力,“fix this code”案例可能成为AI治理中意外后果的教科书式例子。无论出口管制是否维持,结果都将影响每个AI公司处理网络安全功能和政府关系的方式。

参与讨论

Should AI models with the ability to find code vulnerabilities be regulated as weapons?

更多文章

Anthropic的Fable与Mythos模型被禁:美国已有前沿AI许可制度,只是不愿承认

Anthropic的Fable与Mythos模型被禁:美国已有前沿AI许可制度,只是不愿承认

SpaceX 上市三天市值超越亚马逊

SpaceX 上市三天市值超越亚马逊

甲骨文与OpenAI在新墨西哥州干旱地区建造巨型AI数据中心

甲骨文与OpenAI在新墨西哥州干旱地区建造巨型AI数据中心

吉娜·莱因哈特在SpaceX里程碑式IPO后投资10亿美元

吉娜·莱因哈特在SpaceX里程碑式IPO后投资10亿美元

SpaceX 募资 750 亿美元创 IPO 历史纪录,代币化股票配额严重不足

SpaceX 募资 750 亿美元创 IPO 历史纪录,代币化股票配额严重不足

SpaceX IPO让马斯克成为全球首位万亿富翁——他仍住在德州5万美元的出租房

SpaceX IPO让马斯克成为全球首位万亿富翁——他仍住在德州5万美元的出租房

OpenAI 刚申请IPO,就被多州联合调查用户伤害问题

OpenAI 刚申请IPO,就被多州联合调查用户伤害问题

SpaceX 以1.77万亿美元估值创史上最大IPO纪录

SpaceX 以1.77万亿美元估值创史上最大IPO纪录

马斯克成首位万亿富翁:SpaceX IPO后身价破万亿美元,称货币将变成废纸

马斯克成首位万亿富翁:SpaceX IPO后身价破万亿美元,称货币将变成废纸

Anthropic Fable 5 发布,CEO 对 AI 治理疲劳达到新高

Anthropic Fable 5 发布,CEO 对 AI 治理疲劳达到新高

仓库迎来能像人一样卸货的机器人——联邦快递已率先使用

仓库迎来能像人一样卸货的机器人——联邦快递已率先使用

联想与谷歌为2026世界杯部署AI工具,赋能球队与球迷

联想与谷歌为2026世界杯部署AI工具,赋能球队与球迷

🍪 🍪 Cookie 偏好设置

我们使用 Cookie 来衡量性能。 隐私政策