谷歌DeepMind联手Kaggle,上线“狼人杀+扑克”AI对战平台
近日,谷歌DeepMind与全球知名数据科学竞赛平台Kaggle联合推出Game Arena的重磅升级——正式加入两款广受欢迎的社交策略游戏:“狼人杀”和“扑克”。这不是又一次技术秀,而是一次真实世界能力的实战检验。过去AI比拼下棋、解题,现在,它们要开始“骗人”和“猜心”了。

不是下棋,是“演戏”
国际象棋能测出AI的计算深度,但测不出它能不能在饭桌上骗过你。新加入的“狼人杀”,要求AI不仅要读懂文字背后的潜台词,还要学会撒谎、伪装、制造恐慌,甚至在被怀疑时反咬一口。它得知道什么时候该装无辜,什么时候该带节奏——这和我们日常社交中的沟通、谈判、甚至职场博弈,几乎一模一样。
而“扑克”更残酷。没有全知视角,没有完美信息。你不知道对手手里的牌,只能从下注节奏、沉默时长、偶尔的语气变化里猜。AI得学会控制情绪、管理风险、在输钱时稳住心态,赢钱时别太得意。这不是算法堆砌,是心理战。
这两款游戏,不是为了“赢”,而是为了看AI能不能“像人一样玩”。
Gemini 3家族横扫全场,轻量版Flash意外爆冷
最新排行榜一出,全网哗然。谷歌新推出的Gemini 3 Pro和Gemini 3 Flash包揽了所有项目的前两名,尤其是Flash——那个被称作“轻量级”的模型,在需要快速反应的扑克局和狼人杀发言环节中,表现甚至比Pro还稳。
很多人以为,越大的模型越聪明。但这次证明,有时候“快”比“深”更管用。在狼人杀里,几秒钟内你要决定说不说谎、信不信谁,Flash的即时判断力反而成了优势。而Pro则在长线布局的扑克牌局中,展现出更强的算牌和心理预判能力。
有趣的是,OpenAI的GPT-4o、Anthropic的Claude 3.5等主流模型,虽然也上榜,但和Gemini 3的差距明显。不少开发者在Kaggle上留言:“我原以为AI玩狼人杀会很蠢,结果它比我还会装。”
不只是比赛,更是“防骗训练场”
DeepMind没说透的一点是:这不只是为了看AI多强,更是为了教AI别被骗。
“狼人杀”场景,正被用作AI安全研究的新工具。当AI学会识别谎言、察觉情绪操控、分辨诱导性语言时,它未来在客服、客服、金融风控、甚至社交媒体审核中,就能更早发现“AI钓鱼”“深度伪造话术”这类新型网络欺诈。
DeepMind CEO Demis Hassabis在内部会议中提到:“当AI能骗人时,它才真正理解人类的脆弱。”这句话被不少安全研究员转发。现在的AI诈骗电话、伪造客服、虚假评论越来越多,与其等它们作恶后再堵,不如先让AI在安全环境下“被骗”一百次,学会识别。
现在就能围观,全球AI在“斗心眼”
Game Arena已上线Kaggle平台,完全免费开放。你不用写一行代码,就能实时观看全球最顶尖的AI模型在玩狼人杀——看它们怎么互相甩锅、怎么用“我昨晚是预言家”这种话术骗全场,或者在扑克里突然加注,逼对手弃牌。
有人已经录下精彩片段:一个AI在狼人杀里连续三轮假装村民,最后一轮突然跳出来指认狼人,结果全员信了,成功翻盘。弹幕刷屏:“这AI,比我前女友还会演。”
这不是科幻,是正在发生的现实。AI不再只是算得快,它开始学着“读懂人”。而我们,正站在一个新门槛前:当AI比人更懂人心时,我们该信谁?