谷歌开源MedGemma 1.5与MedASR，强化医疗影像与语音转写能力

MedGemma 1.5 和 MedASR 正式开源：让医疗AI更贴近真实临床

近日，谷歌正式发布两款面向医疗场景的开源工具——新一代医疗大模型 MedGemma 1.5 和专为语音识别设计的 MedASR。这两款模型不再只是实验室里的技术演示，而是为一线医生、基层医院和医疗科技团队打造的实用工具，目标很明确：减轻文书负担，提升诊断效率，让AI真正帮上忙。

MedGemma 1.5 在原有文本理解能力基础上，新增了对医学影像的分析支持。它能读取X光片、CT、MRI的描述文字（比如“右肺上叶结节，直径约8mm”），并结合病历、检验报告等信息，给出初步的关联分析建议。比如，当输入“患者65岁，咳嗽两周，CT显示肺部磨玻璃影”，模型会提示“建议结合核酸检测与CT随访，排除新冠后遗症或早期肺癌可能”。这不是替代医生判断，而是把散落在不同系统里的信息串联起来，帮医生更快抓住重点。

过去，很多医生抱怨AI模型“听不懂人话”——查房时说的“病人今天精神头还行，但昨晚有点喘”，到了系统里就被转成“主诉：呼吸困难”。MedASR 就是为解决这个问题而生。它专门训练于真实的医患对话、手术口头记录、护理交接语境，能准确识别“心率110，BP 130/85，氧饱和94%”这类专业术语，还能区分“可能”“考虑”“待排除”等模糊表达，自动整理成符合电子病历规范的结构化内容。试点医院反馈，使用后平均每位医生每天节省约25分钟文书时间，相当于多看3到4个病人。

这两款模型全部基于去标识化的临床数据训练，不使用任何可识别个人身份的信息，训练过程符合HIPAA和GDPR标准。更重要的是，它们完全开源，代码、权重、训练数据说明全部公开，任何人都可以下载、本地部署、二次开发。没有API调用限制，没有按次收费，也不需要接入谷歌云。基层医院、社区诊所、偏远地区医疗机构，甚至个人开发者，都能用上和大医院同源的技术。

为什么这次不一样？开源，才是真正的破局点

过去几年，不少科技公司推出“医疗AI助手”，但大多藏在自家系统里，只服务自家客户。MedGemma 和 MedASR 的发布，标志着谷歌的态度转变：不再只做“封闭的解决方案”，而是提供“开放的基础设施”。

在安徽一家县级医院，医生用MedASR自建了语音转病历系统，对接了本地HIS系统，三个月内电子病历完成率从68%提升到92%。在深圳一家初创公司，团队基于MedGemma 1.5开发了乳腺超声报告辅助生成工具，已接入三家社区卫生服务中心。这些都不是谷歌主导的项目，而是开源之后，来自真实世界的需求驱动的创新。

更值得关注的是，这两款模型支持离线运行。在信号弱的乡村诊所、战地医院、甚至救护车里，只要有一台普通服务器或高性能笔记本，就能运行模型，不依赖云端。这对提升基层医疗能力，意义远大于炫技式的AI演示。

下一步：不是取代医生，而是让医生更专注看病

医疗AI的终极目标，从来不是让机器开处方，而是让医生从重复劳动中解放出来，把时间还给病人。

MedGemma 1.5 和 MedASR 的开源，不是终点，而是一个起点。它让开发者不再从零开始，让医院不再被大厂绑定，让技术真正下沉到需要的地方。现在，你可以在GitHub上直接下载模型，用几行代码把它接入自己的系统。没有合同，没有授权费，没有隐藏条款。

如果你是基层医生，它能帮你省下写病历的时间；如果你是医疗科技公司，它能让你的产品更快上线；如果你是医学院学生，它能成为你理解临床思维的助手。这不是“未来医疗”，这是今天就能用上的工具。

真正的进步，从来不是模型参数有多大，而是有多少人，因为这个工具，多看了一个病人，多睡了一个小时，少了一份焦虑。

CB科技站

谷歌开源MedGemma 1.5与MedASR，强化医疗影像与语音转写能力

MedGemma 1.5 和 MedASR 正式开源：让医疗AI更贴近真实临床

为什么这次不一样？开源，才是真正的破局点

下一步：不是取代医生，而是让医生更专注看病

与本文相关的文章