谷歌开源TranslateGemma翻译模型，支持55种语言

谷歌于1月15日开源了TranslateGemma翻译模型，该模型支持55种语言，提供三种规模版本，分别为40亿、120亿和270亿参数，适用于手机、笔记本电脑和云端部署。

TranslateGemma基于谷歌的开源AI模型Gemma 3打造，是专为翻译任务深度优化的版本。Gemma是谷歌推出的轻量级开源大语言模型系列，旨在让开发者能够在各类设备上运行高性能AI应用。TranslateGemma通过从更大规模的Gemini模型中学习翻译知识，显著提升了翻译质量。

该模型采用两阶段训练方法：首先使用人工翻译和Gemini模型生成的高质量合成数据进行微调，随后通过强化学习使翻译结果更加自然流畅。这一方法成功将大型Gemini模型的翻译能力浓缩到更精简的开源架构中。

在WMT24++基准测试中，120亿参数版本的表现超越了270亿参数的基线模型。WMT24++是由谷歌与Unbabel共同开发的翻译评估标准，涵盖55种语言，包含文学、新闻、社交媒体和语音四大领域的高质量人工翻译参考数据，是当前业界广泛认可的代表性翻译评估标准之一。

这意味着开发者可以使用更小的模型获得更优的翻译效果，同时实现更快的推理速度和更低的运行成本。40亿参数版本的性能也与120亿参数的基线模型相当，使翻译功能可直接在手机端高效运行。

此前，谷歌曾推出MADLAD-400等开源翻译模型，Meta也发布了支持语音与文本的SeamlessM4T模型。相比之下，TranslateGemma专注于文本翻译，在翻译质量和效率上均有显著提升。除55种核心语言外，研究团队还扩展训练至近500种语言对。值得注意的是，该模型保留了图像文字翻译能力，可直接识别并翻译照片中的文字，例如路牌、菜单等。

TranslateGemma已在Kaggle和Hugging Face开放下载，开发者也可通过Vertex AI进行部署。

AI Google TranslateGemma Language Translation

CB科技站

谷歌开源TranslateGemma翻译模型，支持55种语言

与本文相关的文章