腾讯开源两个支援33种语言的翻译模型

图片来源:

Hugging Face

腾讯周一（9/1）开源了两个基础翻译模型，分别是基础翻译模型Hunyuan-MT-7B，以及集成模型Hunyuan-MT-Chimera，它们皆支援33种语言之间的相互翻译，如中文、英文、日文、捷克文、冰岛语，以及哈萨克语、维吾尔语、蒙语与藏语等5种少数民族语言。

Hunyuan-MT-7B可将来源语言文本翻译成目标语言，Hunyuan-MT-Chimera则可整合多个翻译输出以产生更高品质的结果，这两个模型在少数民族语言的互译上明显优于其它模型。

此外，腾讯也公布了它们在FLORES-200及WMT24pp基準测试上的表现，显示它们相较于GPT-4.1、Claude 4 Sonnet及Gemini 2.5 Pro等知名模型并不逊色，而且大幅优于Google翻译（Google Translate）。

腾讯表示，Hunyuan-MT模型在WMT25竞争中参加了31个语言类别，并于其中30个获得第一名；在同规模的模型中领先业界；且Hunyuan-MT-Chimera是业界首个开源的集成模型，将翻译品质提升到新的水平；此外，它採用了全新的翻译模型训练框架，从预训练、继续预训练、监督式微调、翻译强化学习，以及集成强化学习，确保模型的高品质输出。

这是因为大多数的翻译模型通常止步于监督式微调，而Hunyuan-MT进一步纳入了优化品质与集成强化，让小模型也能产出优秀的翻译品质。

CB科技站

腾讯开源两个支援33种语言的翻译模型

与本文相关的文章