图片来源:Solen Feyissa on Unsplash
AI初创公司Anthropic于本周一(2月23日)发布声明,指控DeepSeek、Moonshot与MiniMax三家中国AI企业,通过约2.4万个虚假账户和商业代理服务,大规模访问其模型Claude,累计产生超过1600万次对话,以提取模型能力并训练自家系统,违反了其服务条款与区域访问限制。
Anthropic表示,相关行为采用蒸馏(Distillation)技术,即利用性能更强的模型输出作为训练数据,构建更小或成本更低的模型。蒸馏在业界本是常见的模型压缩手段,但若未经许可,大量利用他人模型输出训练自身系统,则可能构成违规并带来安全风险。
根据Anthropic的调查,这三家公司的行为均通过虚假账户和代理架构规避检测,其提示语的数量、结构与焦点明显不同于正常用户行为,目标直指Claude在代理式推理、工具使用与编程能力等方面的差异化优势。
具体来看,DeepSeek与Claude的交互超过15万次,其中多次要求模型逐步输出内部推理过程,以生成思维链训练数据;Moonshot的交互超过340万次,涵盖代理式推理、工具使用、编程与数据分析、计算机操作代理及计算机视觉;MiniMax累计交互超过1300万次,主要聚焦于代理式编程与工具编排,且在Anthropic发布新模型后24小时内即调整了流量策略。
Anthropic将此类通过代理服务构建的大规模Hydra Cluster(九头蛇式账户集群)视为长期威胁,因其无单一故障点,账户被封禁后可迅速替补,并能将蒸馏流量混入正常请求中,大幅增加检测难度。
Anthropic表示,已强化行为分类与指纹识别系统,并与其他AI实验室、云服务商及监管机构共享技术指标,同时提升账户验证机制,并在产品与API层面部署反制措施,以降低蒸馏攻击的成功率。