Anthropic揭露了一起与阿里巴巴相关的大规模Claude模型蒸馏行动

先进AI模型开发商Anthropic发现了一起其历史上规模最大的模型蒸馏攻击,该攻击由与中国阿里巴巴及其Qwen实验室相关的运营者组织。据我评估,这一事件不仅是技术层面的违规行为,更是对美国AI领导地位整个生态系统的严峻挑战。
从4月22日至6月5日,攻击者利用近25000个虚假账户,向Claude模型生成了超过2880万次查询。此次行动的目标是提取AI系统的关键能力,特别是在代理任务、软件开发及长期规划领域。Anthropic强调,此类行为使得复制先进模型的行为成为可能,而无需承担其训练成本。
经济威胁与地缘政治背景
在致美国立法者的信中,该公司指出了此次攻击的“公然性质”,考虑到阿里巴巴在纽约证券交易所上市并在美国开展业务。Anthropic的分析师认为,此类事件“颠覆了经济逻辑”:美国数十亿美元的研究和计算资源投资实际上变成了对中国竞争对手的补贴。此外,蒸馏后的模型可能被用于网络行动和军事任务,存在风险。
行动呼吁与立法倡议
Anthropic向国会提出了一系列建议,包括扩大AI开发者与政府之间的技术指标共享、明确反垄断规则以安全共享攻击信息,以及加强对先进芯片和海外数据中心访问的出口管制。该公司还坚持对大规模蒸馏的组织者实施制裁。
问题背景与行业先例
这并非Anthropic首次遭遇此类事件:今年2月,该公司已指控DeepSeek、Moonshot AI和MiniMax存在类似行为,这些行为生成了超过1600万次交互。值得注意的是,蒸馏本身仍是普遍的行业做法——例如,埃隆·马斯克的xAI在训练Grok时“部分”使用了OpenAI的模型。在此背景下,国会议员比尔·休伊曾加提出了一项法案,规定对非法获取封闭AI模型的外国实体实施出口限制和制裁。
我的分析:这一事件凸显了美国AI公司基于开放API的商业模式的根本脆弱性。只要蒸馏仍然是技术上简单且经济上有利可图的“追赶”领先者的方式,市场就将面临此类攻击的升级。唯一的长期解决方案不仅在于加强控制,还在于开发全新的模型保护方法,以防止未经授权的复制。