百川智能发布Baichuan-M3:真正能帮医生看病的AI
今天,百川智能正式发布新一代医疗大模型Baichuan-M3,这是国内首个在真实医疗场景中全面超越人类医生表现的开源模型。在问诊准确率、医疗幻觉抑制、Healthbench和Healthbench Hard四大权威测试中,Baichuan-M3全部排名第一,性能超过OpenAI最新版本GPT-5.2,且在临床推理、用药建议、病史分析等关键环节,错误率比三甲医院主治医师低17%。
发布会上,创始人王小川没有讲太多技术术语,而是拿出了一组真实案例:一位58岁男性患者主诉胸闷,AI在12秒内识别出是不典型心绞痛,并提示“需排除主动脉夹层”,而三位资深心内科医生中,有两位最初误判为胃食管反流。这个结果,让现场多位三甲医院的主任医师沉默了许久。
“我们不是要取代医生,”王小川说,“而是帮医生少犯错,别漏诊。”他提到,去年团队和北京协和医院合作,在急诊科试运行了三个月,AI辅助诊断系统让误诊率下降了22%,医生每天节省近40分钟的文书时间。一位参与测试的护士说:“以前半夜急诊,翻病历翻到眼花,现在AI能直接把关键信息标出来,连药名都自动核对过配伍禁忌。”
王小川还透露,Baichuan-M3已通过国家药监局二类医疗器械认证,正在全国12家三甲医院部署。模型训练数据全部来自脱敏的真实病历和临床指南,不含任何网络爬取的非权威信息。模型不生成“建议服用某种网红保健品”这类内容——在医疗场景里,它连“可能有效”都不敢说,必须有循证依据才敢推荐。
过去一年,医生对AI的态度变了。王小川说:“2023年我们去医院推广,有人笑我们‘AI能看懂CT吗’;去年DeepSeek出来后,不少医生主动找我们要接口。他们说,‘至少这玩意儿不瞎推荐,比百度健康靠谱多了’。”
现在,AI医疗不再是概念。浙江某县级医院用Baichuan-M3辅助基层医生,高血压和糖尿病的规范管理率从51%提升到79%;上海某儿科门诊上线AI预问诊后,家长等待时间缩短了近一半。王小川说:“真正的AI落地,不是在PPT里,是在挂号窗口、在急诊室、在凌晨三点的值班医生手里。”
目前,Baichuan-M3已开源,医院和开发者可免费下载使用。百川智能同步开放了“医疗AI助手”API,支持对接电子病历系统,不收费、不卖数据、不搞订阅制——他们只做一件事:让AI真正为医疗减负,而不是添乱。