DeepMind推出AI桌游挑战：Gemini 3家族登顶扑克与狼人杀排行榜

谷歌DeepMind联手Kaggle，上线“狼人杀+扑克”AI对战平台

近日，谷歌DeepMind与全球知名数据科学竞赛平台Kaggle联合推出Game Arena的重磅升级——正式加入两款广受欢迎的社交策略游戏：“狼人杀”和“扑克”。这不是又一次技术秀，而是一次真实世界能力的实战检验。过去AI比拼下棋、解题，现在，它们要开始“骗人”和“猜心”了。

国际象棋能测出AI的计算深度，但测不出它能不能在饭桌上骗过你。新加入的“狼人杀”，要求AI不仅要读懂文字背后的潜台词，还要学会撒谎、伪装、制造恐慌，甚至在被怀疑时反咬一口。它得知道什么时候该装无辜，什么时候该带节奏——这和我们日常社交中的沟通、谈判、甚至职场博弈，几乎一模一样。

而“扑克”更残酷。没有全知视角，没有完美信息。你不知道对手手里的牌，只能从下注节奏、沉默时长、偶尔的语气变化里猜。AI得学会控制情绪、管理风险、在输钱时稳住心态，赢钱时别太得意。这不是算法堆砌，是心理战。

这两款游戏，不是为了“赢”，而是为了看AI能不能“像人一样玩”。

最新排行榜一出，全网哗然。谷歌新推出的Gemini 3 Pro和Gemini 3 Flash包揽了所有项目的前两名，尤其是Flash——那个被称作“轻量级”的模型，在需要快速反应的扑克局和狼人杀发言环节中，表现甚至比Pro还稳。

很多人以为，越大的模型越聪明。但这次证明，有时候“快”比“深”更管用。在狼人杀里，几秒钟内你要决定说不说谎、信不信谁，Flash的即时判断力反而成了优势。而Pro则在长线布局的扑克牌局中，展现出更强的算牌和心理预判能力。

有趣的是，OpenAI的GPT-4o、Anthropic的Claude 3.5等主流模型，虽然也上榜，但和Gemini 3的差距明显。不少开发者在Kaggle上留言：“我原以为AI玩狼人杀会很蠢，结果它比我还会装。”

DeepMind没说透的一点是：这不只是为了看AI多强，更是为了教AI别被骗。

“狼人杀”场景，正被用作AI安全研究的新工具。当AI学会识别谎言、察觉情绪操控、分辨诱导性语言时，它未来在客服、客服、金融风控、甚至社交媒体审核中，就能更早发现“AI钓鱼”“深度伪造话术”这类新型网络欺诈。

DeepMind CEO Demis Hassabis在内部会议中提到：“当AI能骗人时，它才真正理解人类的脆弱。”这句话被不少安全研究员转发。现在的AI诈骗电话、伪造客服、虚假评论越来越多，与其等它们作恶后再堵，不如先让AI在安全环境下“被骗”一百次，学会识别。

Game Arena已上线Kaggle平台，完全免费开放。你不用写一行代码，就能实时观看全球最顶尖的AI模型在玩狼人杀——看它们怎么互相甩锅、怎么用“我昨晚是预言家”这种话术骗全场，或者在扑克里突然加注，逼对手弃牌。

有人已经录下精彩片段：一个AI在狼人杀里连续三轮假装村民，最后一轮突然跳出来指认狼人，结果全员信了，成功翻盘。弹幕刷屏：“这AI，比我前女友还会演。”

这不是科幻，是正在发生的现实。AI不再只是算得快，它开始学着“读懂人”。而我们，正站在一个新门槛前：当AI比人更懂人心时，我们该信谁？