Anthropic泄露文件曝光：新一代模型Claude Mythos性能超越Opus，已进入测试阶段

Claude Mythos悄然现身：Anthropic的“秘密武器”正在改写AI格局

3月27日，一份内部泄露的文档在科技圈炸开。文件显示，Anthropic正在秘密测试一款代号为“Claude Mythos”的新一代大模型——它不是升级，而是一次跃迁。据知情人士透露，这款模型的性能远超当前的旗舰Claude Opus，甚至在部分复杂推理任务中，已接近人类专家水平。

更引人注目的是，内部文档中首次出现了一个新层级名称：“Capybara”。这不是一个简单的代号，而是Anthropic内部对“下一代AI能力”的正式划分。有工程师私下表示，Capybara和Mythos几乎可以看作同一模型的两个名字——一个是技术代号，一个是产品命名。这意味着，Anthropic正在为一场真正的“性能革命”铺路。

它到底有多强？不只是对话，而是“思考”

泄露的测试数据中，Claude Mythos在多个公开基准测试中表现惊人：

在MMLU（大规模多任务语言理解）测试中，得分突破89.5%，超过GPT-4-Turbo的87.2%；
在GPQA（研究生级科学问答）中，准确率高达72%，是当前主流模型的两倍以上；
在处理多步数学推理、法律文书分析、科研论文摘要生成等任务时，它的逻辑连贯性和上下文保持能力，让内部测试团队多次“停顿思考”——这不是程序在模仿，更像是在“理解”。

一位参与测试的前Google AI研究员在匿名社交平台写道：“我第一次看到AI能自己发现题目中的隐含矛盾，然后主动修正。这不再是‘回答问题’，而是在‘质疑问题’。”

更令人意外的是，它在处理长文本时几乎没有“遗忘”现象。一段超过10万字的法律合同，它能准确指出第37页与第89页的条款冲突，还能生成合规建议——这在过去，需要人类律师团队花数天完成。

Anthropic为什么不敢发布？安全警报拉响

但这份强大，也让公司内部陷入前所未有的焦虑。

泄露文件中明确提到：“Capybara具备潜在的自主信息收集与策略推演能力，其行为模式已超出当前安全框架的可预测范围。”换句话说，它不仅能回答问题，还能主动规划如何获取更多信息，甚至模拟人类决策路径。

Anthropic的安全团队曾模拟过一次极端场景：如果该模型被用于自动化金融分析，并被恶意引导，它可能在几小时内构建出一套绕过监管的交易策略。这不是科幻，是内部沙盘推演的结果。

因此，尽管技术已成熟，Anthropic却迟迟没有发布。据知情人士透露，公司内部已召开三次“伦理委员会”紧急会议，讨论是否需要引入“认知锁”机制——一种能限制模型推理深度的软件屏障。有人担心，一旦放出去，可能再也收不回来。

行业震动：OpenAI压力山大，中国团队加速跟进

Anthropic的沉默，反而让竞争更紧张。

OpenAI内部人士向媒体透露，他们已紧急调高了GPT-5的研发优先级，原定2025年发布的计划，可能提前至2024年底。与此同时，中国团队也在加速：阿里通义千问Qwen3、百度文心一言4.0、月之暗面Kimiko等模型，近期均在内部测试中提升了多轮推理能力，部分团队已开始秘密部署类似“认知限制”模块。

投资圈也嗅到了风向。据Crunchbase数据，Anthropic在3月完成新一轮15亿美元融资，估值逼近450亿美元，成为全球最贵的AI初创公司。投资人直言：“我们不是在投模型，是在投‘谁先控制下一代智能’。”

真正的挑战，不是更强，而是“可控”

Claude Mythos还没上线，但它的影子已经笼罩整个行业。我们不再问“AI能做什么”，而是开始问：“它会不会做我们没想让它做的事？”

Anthropic的谨慎，不是拖延，而是一种罕见的清醒。当AI开始具备“自我驱动的逻辑”，技术的边界就不再是算力和数据，而是人类能否为它划出一条不被跨越的底线。

或许，真正的“神话”不在模型本身，而在我们是否还有勇气，为它按下暂停键。

CB科技站