最新消息:关注人工智能 AI赋能新媒体运营

腾讯开源两个支援33种语言的翻译模型

科技智能 admin 浏览 评论
图片来源:

Hugging Face

腾讯周一(9/1)开源了两个基础翻译模型,分别是基础翻译模型Hunyuan-MT-7B,以及集成模型Hunyuan-MT-Chimera,它们皆支援33种语言之间的相互翻译,如中文、英文、日文、捷克文、冰岛语,以及哈萨克语、维吾尔语、蒙语与藏语等5种少数民族语言。

Hunyuan-MT-7B可将来源语言文本翻译成目标语言,Hunyuan-MT-Chimera则可整合多个翻译输出以产生更高品质的结果,这两个模型在少数民族语言的互译上明显优于其它模型。

此外,腾讯也公布了它们在FLORES-200及WMT24pp基準测试上的表现,显示它们相较于GPT-4.1、Claude 4 Sonnet及Gemini 2.5 Pro等知名模型并不逊色,而且大幅优于Google翻译(Google Translate)。

腾讯表示,Hunyuan-MT模型在WMT25竞争中参加了31个语言类别,并于其中30个获得第一名;在同规模的模型中领先业界;且Hunyuan-MT-Chimera是业界首个开源的集成模型,将翻译品质提升到新的水平;此外,它採用了全新的翻译模型训练框架,从预训练、继续预训练、监督式微调、翻译强化学习,以及集成强化学习,确保模型的高品质输出。

这是因为大多数的翻译模型通常止步于监督式微调,而Hunyuan-MT进一步纳入了优化品质与集成强化,让小模型也能产出优秀的翻译品质。

发表我的评论
取消评论

表情

您的回复是我们的动力!

  • 昵称 (必填)
  • 验证码 点击我更换图片

网友最新评论