最新消息:关注人工智能 AI赋能新媒体运营

谷歌开源TranslateGemma翻译模型,支持55种语言

科技资讯 admin 浏览

谷歌于1月15日开源了TranslateGemma翻译模型,该模型支持55种语言,提供三种规模版本,分别为40亿、120亿和270亿参数,适用于手机、笔记本电脑和云端部署。

TranslateGemma基于谷歌的开源AI模型Gemma 3打造,是专为翻译任务深度优化的版本。Gemma是谷歌推出的轻量级开源大语言模型系列,旨在让开发者能够在各类设备上运行高性能AI应用。TranslateGemma通过从更大规模的Gemini模型中学习翻译知识,显著提升了翻译质量。

该模型采用两阶段训练方法:首先使用人工翻译和Gemini模型生成的高质量合成数据进行微调,随后通过强化学习使翻译结果更加自然流畅。这一方法成功将大型Gemini模型的翻译能力浓缩到更精简的开源架构中。

在WMT24++基准测试中,120亿参数版本的表现超越了270亿参数的基线模型。WMT24++是由谷歌与Unbabel共同开发的翻译评估标准,涵盖55种语言,包含文学、新闻、社交媒体和语音四大领域的高质量人工翻译参考数据,是当前业界广泛认可的代表性翻译评估标准之一。

这意味着开发者可以使用更小的模型获得更优的翻译效果,同时实现更快的推理速度和更低的运行成本。40亿参数版本的性能也与120亿参数的基线模型相当,使翻译功能可直接在手机端高效运行。

此前,谷歌曾推出MADLAD-400等开源翻译模型,Meta也发布了支持语音与文本的SeamlessM4T模型。相比之下,TranslateGemma专注于文本翻译,在翻译质量和效率上均有显著提升。除55种核心语言外,研究团队还扩展训练至近500种语言对。值得注意的是,该模型保留了图像文字翻译能力,可直接识别并翻译照片中的文字,例如路牌、菜单等。

TranslateGemma已在Kaggle和Hugging Face开放下载,开发者也可通过Vertex AI进行部署。