百川智能发布Baichuan-M3，性能超越GPT-5.2，强势切入医疗AI应用领域

百川智能发布Baichuan-M3：真正能帮医生看病的AI

今天，百川智能正式发布新一代医疗大模型Baichuan-M3，这是国内首个在真实医疗场景中全面超越人类医生表现的开源模型。在问诊准确率、医疗幻觉抑制、Healthbench和Healthbench Hard四大权威测试中，Baichuan-M3全部排名第一，性能超过OpenAI最新版本GPT-5.2，且在临床推理、用药建议、病史分析等关键环节，错误率比三甲医院主治医师低17%。

发布会上，创始人王小川没有讲太多技术术语，而是拿出了一组真实案例：一位58岁男性患者主诉胸闷，AI在12秒内识别出是不典型心绞痛，并提示“需排除主动脉夹层”，而三位资深心内科医生中，有两位最初误判为胃食管反流。这个结果，让现场多位三甲医院的主任医师沉默了许久。

“我们不是要取代医生，”王小川说，“而是帮医生少犯错，别漏诊。”他提到，去年团队和北京协和医院合作，在急诊科试运行了三个月，AI辅助诊断系统让误诊率下降了22%，医生每天节省近40分钟的文书时间。一位参与测试的护士说：“以前半夜急诊，翻病历翻到眼花，现在AI能直接把关键信息标出来，连药名都自动核对过配伍禁忌。”

王小川还透露，Baichuan-M3已通过国家药监局二类医疗器械认证，正在全国12家三甲医院部署。模型训练数据全部来自脱敏的真实病历和临床指南，不含任何网络爬取的非权威信息。模型不生成“建议服用某种网红保健品”这类内容——在医疗场景里，它连“可能有效”都不敢说，必须有循证依据才敢推荐。

过去一年，医生对AI的态度变了。王小川说：“2023年我们去医院推广，有人笑我们‘AI能看懂CT吗’；去年DeepSeek出来后，不少医生主动找我们要接口。他们说，‘至少这玩意儿不瞎推荐，比百度健康靠谱多了’。”

现在，AI医疗不再是概念。浙江某县级医院用Baichuan-M3辅助基层医生，高血压和糖尿病的规范管理率从51%提升到79%；上海某儿科门诊上线AI预问诊后，家长等待时间缩短了近一半。王小川说：“真正的AI落地，不是在PPT里，是在挂号窗口、在急诊室、在凌晨三点的值班医生手里。”

目前，Baichuan-M3已开源，医院和开发者可免费下载使用。百川智能同步开放了“医疗AI助手”API，支持对接电子病历系统，不收费、不卖数据、不搞订阅制——他们只做一件事：让AI真正为医疗减负，而不是添乱。

Baichuan-M3 医疗大语言模型问诊能力医疗幻觉控制

CB科技站

百川智能发布Baichuan-M3，性能超越GPT-5.2，强势切入医疗AI应用领域

百川智能发布Baichuan-M3：真正能帮医生看病的AI

与本文相关的文章