“子曰4”全面升级:更懂中国学生,也更贴近真实使用
近日,网易有道正式发布“子曰”大模型4.0版本,这次更新不只是参数变大、术语变多,而是实实在在地让模型更“能用”、更“好用”。无论是学生做数学题时对着一张带图表的物理题发愁,还是家长想用语音给孩子讲英文故事,又或是老师需要快速翻译一份外文教材——“子曰4”都试着把这些问题,一个个解决掉。
这次最大的变化,是它终于能“看图说话”了。过去的大模型只能读文字,现在它可以看懂一张包含函数图像、几何图形、实验数据表的题目,然后一步步推理出答案。在多个权威的视觉数理测试中,270亿参数规模的“子曰4”表现超过同级别模型,准确率高达81.4%,尤其在中文数学题和物理题上,几乎能跟优秀中学生媲美。

▲ 子曰4在多个视觉数理基准上达到同规模模型中最佳水平
图片来源: https://huggingface.co/netease-youdao/Confucius4
更让人意外的是,它不光答得准,还答得“省”。过去AI回答一个问题要写一大段推理过程,占用大量计算资源。这次团队用真实学生解题的思路重新训练模型,把输出长度压缩了43%。这意味着手机上也能流畅运行,企业用它做客服或作业批改,成本直接降了一半。

▲ 子曰4在多个视觉数理基准上大幅降低了输出token的数量
图片来源: https://huggingface.co/netease-youdao/Confucius4
三秒克隆声音,14种语言无缝切换
这次同步开源的,还有一个藏得挺深的“黑科技”——语音合成引擎。你只需要上传一段3秒的语音,它就能模仿出你的声音,用英语、日语、法语……说同样的话,还不带口音。
不是“AI配音”,是真·像你本人在说话。无论是妈妈想给孩子录一段睡前故事,还是老师需要为不同语言的学生制作听力材料,甚至小企业想用自家员工的声音做宣传视频,都不用再花钱请专业配音员。
实测中,系统对原声的还原度超过85%,准确识别说话人特征的能力达到97%以上。更重要的是,它支持中英日韩德法等14种语言,同一个声音在不同语言间切换,不会变成“外国腔中文”或“中国味英语”。我们试过用一段普通话录音,让它用德语讲“今天天气真好”,结果听起来就像一个会说德语的中国人,自然得不像AI。
这个TTS引擎完全开源,开发者可以免费下载,接入自己的App或教育工具。没有隐藏收费,没有API调用限制,只要你有需要,就能用。
翻译快得像人,还知道什么时候该加标点
有道的翻译一直是中国用户最常用的工具之一。这次升级,不是简单换个模型,而是从源头重做。
团队收集了上亿条真实语料,包括教材、考试真题、海外论坛帖子、企业合同,再请上百名专八水平的译者逐条校对。不是“机器学语料”,而是“人教机器怎么说话”。
新模型能自动识别文档结构:表格怎么排、公式怎么保留、英文标题该不该加粗。它不会再把“Please see Figure 1”翻成“请看图1。”——句号都给你漏掉。现在,它连标点、空格、换行都处理得跟人工翻译一样。
速度上,翻译效率提升80%。一份20页的PDF文档,过去要等10秒,现在3秒内就能返回。这对老师、留学生、跨境电商从业者来说,意味着效率的质变。
为什么这次不一样?因为它从“能用”走向“常用”
回看有道这几年,从“Hi Echo”虚拟口语教练,到“有道宝库”“有道同传Agent”,每一步都不是为了发新闻稿,而是真的在解决教育场景里的痛点。
“子曰4”不是要取代老师,而是帮老师省下重复劳动的时间。一个初中数学老师,不用再熬夜批改几百张带图的作业,模型先筛一遍,挑出错得离谱的,老师再重点看——这才是AI该干的事。
家长也不用再为孩子问“这道题怎么解”而翻遍全网。孩子拍张照,模型能一步步讲明白,而不是甩个答案。
这次,有道把核心模型全量开源,不是作秀,是想让更多人参与进来。中小学老师可以把它装进自己的教学系统,开发者可以把它做成自习室App,甚至乡村学校也能免费用上高质量的AI辅导。
我们见过太多“AI大模型”只在PPT里炫技,但“子曰4”不一样——它不追求参数第一,只追求:你用起来,真的顺手。
现在就能用
所有模型均已开源,无需申请,直接下载:
没有注册门槛,没有调用次数限制,没有商业授权费。如果你是教师、开发者、家长,或者只是个爱折腾的普通用户——现在,你可以真正开始用它了。