Anthropic指控DeepSeek等中国AI企业利用2.4万个欺诈账户蒸馏Claude模型能力

图片来源：Solen Feyissa on Unsplash

AI初创公司Anthropic于本周一（2月23日）发布声明，指控DeepSeek、Moonshot与MiniMax三家中国AI企业，通过约2.4万个虚假账户和商业代理服务，大规模访问其模型Claude，累计产生超过1600万次对话，以提取模型能力并训练自家系统，违反了其服务条款与区域访问限制。

Anthropic表示，相关行为采用蒸馏（Distillation）技术，即利用性能更强的模型输出作为训练数据，构建更小或成本更低的模型。蒸馏在业界本是常见的模型压缩手段，但若未经许可，大量利用他人模型输出训练自身系统，则可能构成违规并带来安全风险。

根据Anthropic的调查，这三家公司的行为均通过虚假账户和代理架构规避检测，其提示语的数量、结构与焦点明显不同于正常用户行为，目标直指Claude在代理式推理、工具使用与编程能力等方面的差异化优势。

具体来看，DeepSeek与Claude的交互超过15万次，其中多次要求模型逐步输出内部推理过程，以生成思维链训练数据；Moonshot的交互超过340万次，涵盖代理式推理、工具使用、编程与数据分析、计算机操作代理及计算机视觉；MiniMax累计交互超过1300万次，主要聚焦于代理式编程与工具编排，且在Anthropic发布新模型后24小时内即调整了流量策略。

Anthropic将此类通过代理服务构建的大规模Hydra Cluster（九头蛇式账户集群）视为长期威胁，因其无单一故障点，账户被封禁后可迅速替补，并能将蒸馏流量混入正常请求中，大幅增加检测难度。

Anthropic表示，已强化行为分类与指纹识别系统，并与其他AI实验室、云服务商及监管机构共享技术指标，同时提升账户验证机制，并在产品与API层面部署反制措施，以降低蒸馏攻击的成功率。

数据窃取欺诈账户模型蒸馏 AI竞争

CB科技站

Anthropic指控DeepSeek等中国AI企业利用2.4万个欺诈账户蒸馏Claude模型能力

与本文相关的文章