Google释出Gemma 2，提供9B及27B两种版本

图片来源:

Google

Google本周释出了Gemma 2，相较于第一代仅提供20亿（2B）及70亿（7B）参数的版本，第二代提供了9B及27B两种版本，除了具备更高的性能之外，也能在单个Nvidia H100 Tensor Core GPU或TPU上实现，大幅降低部署成本，开发人员现在已可透过Google AI Studio、Kaggle及Hugging Face Models存取Gemma 2，下个月便会现身于Google云端机器学习平台Vertex AI上。

Gemma是个开源且轻量版的AI模型，採用与Gemini同样的研究及技术而打造，Gemma 2不仅在所有基準测试上都超越Gemma 1，9B版本的Gemma 2在MMLU、BBH及GSM8K测试，也都超越8B版本的Llama 3；27B版本的Gemma 2在MMLU、GSM8K、MATH等测试，则超越拥有314B参数的Grok-1。

图片来源／Google

此外，Google表示，27B版本的Gemma 2其设计就是为了要让它能够在单个Google Cloud TPU主机，或是单个Nvidia A100 80GB Tensor Core GPU，以及单个Nvidia H100 Tensor Core GPU执行全精度的高效推论，在维持高性能的同时大幅降低成本，让开发者更容易部署AI。

因此，Gemma 2可在高阶游戏笔电、高阶桌上型电脑，以及云端上执行。Google建议使用者可于Google AI Studio上以最高精度执行，在CPU上透过Gemma.cpp 使用量化版本来解锁本地端性能；也能透过Hugging Face Transformers，于具备Nvidia RTX或GeForce RTX的家中电脑使用。

相较于第一代，Gemma 2不仅有更高的性能、推论效率，并强化了安全，也更容易整合到使用者的工作流程中，它支援Hugging Face Transformers、JAX、PyTorch及TensorFlow等AI框架，并针对Nvidia的加速基础设施进行优化，也能作为Nvidia NIM推论服务，之后也会针对Nvidia的自然语言处理解决方案NeMo展开最佳化。

为了打造更安全的AI应用，即日起开发者已可利用Python函式库对模型及资料进行比较评估，于程序中产生视觉化的结果，此外，Google也正準备替Gemma模型开源文字浮水印技术SynthID。

自Google于今年初开源第一代Gemma后，该模型已被下载超过1,000万次，其中一个Navarasa专案即利用Gemma来建立一个支援多元化印度语言的微调模型。

CB科技站

Google释出Gemma 2，提供9B及27B两种版本

与本文相关的文章

您的回复是我们的动力！

网友最新评论