有道开源“子曰4”：27B数理SOTA模型 + 3秒情感克隆TTS引擎

“子曰4”全面升级：更懂中国学生，也更贴近真实使用

近日，网易有道正式发布“子曰”大模型4.0版本，这次更新不只是参数变大、术语变多，而是实实在在地让模型更“能用”、更“好用”。无论是学生做数学题时对着一张带图表的物理题发愁，还是家长想用语音给孩子讲英文故事，又或是老师需要快速翻译一份外文教材——“子曰4”都试着把这些问题，一个个解决掉。

这次最大的变化，是它终于能“看图说话”了。过去的大模型只能读文字，现在它可以看懂一张包含函数图像、几何图形、实验数据表的题目，然后一步步推理出答案。在多个权威的视觉数理测试中，270亿参数规模的“子曰4”表现超过同级别模型，准确率高达81.4%，尤其在中文数学题和物理题上，几乎能跟优秀中学生媲美。

文章配图-1

▲ 子曰4在多个视觉数理基准上达到同规模模型中最佳水平

图片来源: https://huggingface.co/netease-youdao/Confucius4

更让人意外的是，它不光答得准，还答得“省”。过去AI回答一个问题要写一大段推理过程，占用大量计算资源。这次团队用真实学生解题的思路重新训练模型，把输出长度压缩了43%。这意味着手机上也能流畅运行，企业用它做客服或作业批改，成本直接降了一半。

文章配图-1

▲ 子曰4在多个视觉数理基准上大幅降低了输出token的数量

图片来源: https://huggingface.co/netease-youdao/Confucius4

这次同步开源的，还有一个藏得挺深的“黑科技”——语音合成引擎。你只需要上传一段3秒的语音，它就能模仿出你的声音，用英语、日语、法语……说同样的话，还不带口音。

不是“AI配音”，是真·像你本人在说话。无论是妈妈想给孩子录一段睡前故事，还是老师需要为不同语言的学生制作听力材料，甚至小企业想用自家员工的声音做宣传视频，都不用再花钱请专业配音员。

实测中，系统对原声的还原度超过85%，准确识别说话人特征的能力达到97%以上。更重要的是，它支持中英日韩德法等14种语言，同一个声音在不同语言间切换，不会变成“外国腔中文”或“中国味英语”。我们试过用一段普通话录音，让它用德语讲“今天天气真好”，结果听起来就像一个会说德语的中国人，自然得不像AI。

这个TTS引擎完全开源，开发者可以免费下载，接入自己的App或教育工具。没有隐藏收费，没有API调用限制，只要你有需要，就能用。

有道的翻译一直是中国用户最常用的工具之一。这次升级，不是简单换个模型，而是从源头重做。

团队收集了上亿条真实语料，包括教材、考试真题、海外论坛帖子、企业合同，再请上百名专八水平的译者逐条校对。不是“机器学语料”，而是“人教机器怎么说话”。

新模型能自动识别文档结构：表格怎么排、公式怎么保留、英文标题该不该加粗。它不会再把“Please see Figure 1”翻成“请看图1。”——句号都给你漏掉。现在，它连标点、空格、换行都处理得跟人工翻译一样。

速度上，翻译效率提升80%。一份20页的PDF文档，过去要等10秒，现在3秒内就能返回。这对老师、留学生、跨境电商从业者来说，意味着效率的质变。

回看有道这几年，从“Hi Echo”虚拟口语教练，到“有道宝库”“有道同传Agent”，每一步都不是为了发新闻稿，而是真的在解决教育场景里的痛点。

“子曰4”不是要取代老师，而是帮老师省下重复劳动的时间。一个初中数学老师，不用再熬夜批改几百张带图的作业，模型先筛一遍，挑出错得离谱的，老师再重点看——这才是AI该干的事。

家长也不用再为孩子问“这道题怎么解”而翻遍全网。孩子拍张照，模型能一步步讲明白，而不是甩个答案。

这次，有道把核心模型全量开源，不是作秀，是想让更多人参与进来。中小学老师可以把它装进自己的教学系统，开发者可以把它做成自习室App，甚至乡村学校也能免费用上高质量的AI辅导。

我们见过太多“AI大模型”只在PPT里炫技，但“子曰4”不一样——它不追求参数第一，只追求：你用起来，真的顺手。

所有模型均已开源，无需申请，直接下载：

没有注册门槛，没有调用次数限制，没有商业授权费。如果你是教师、开发者、家长，或者只是个爱折腾的普通用户——现在，你可以真正开始用它了。