最新消息:关注人工智能 AI赋能新媒体运营

Google释出Gemma 2,提供9B及27B两种版本

科技智能 admin 浏览 评论
图片来源:

Google

Google本周释出了Gemma 2,相较于第一代仅提供20亿(2B)及70亿(7B)参数的版本,第二代提供了9B及27B两种版本,除了具备更高的性能之外,也能在单个Nvidia H100 Tensor Core GPU或TPU上实现,大幅降低部署成本,开发人员现在已可透过Google AI Studio、Kaggle及Hugging Face Models存取Gemma 2,下个月便会现身于Google云端机器学习平台Vertex AI上。

Gemma是个开源且轻量版的AI模型,採用与Gemini同样的研究及技术而打造,Gemma 2不仅在所有基準测试上都超越Gemma 1,9B版本的Gemma 2在MMLU、BBH及GSM8K测试,也都超越8B版本的Llama 3;27B版本的Gemma 2在MMLU、GSM8K、MATH等测试,则超越拥有314B参数的Grok-1。

图片来源/Google

此外,Google表示,27B版本的Gemma 2其设计就是为了要让它能够在单个Google Cloud TPU主机,或是单个Nvidia A100 80GB Tensor Core GPU,以及单个Nvidia H100 Tensor Core GPU执行全精度的高效推论,在维持高性能的同时大幅降低成本,让开发者更容易部署AI。

因此,Gemma 2可在高阶游戏笔电、高阶桌上型电脑,以及云端上执行。Google建议使用者可于Google AI Studio上以最高精度执行,在CPU上透过Gemma.cpp 使用量化版本来解锁本地端性能;也能透过Hugging Face Transformers,于具备Nvidia RTX或GeForce RTX的家中电脑使用。

相较于第一代,Gemma 2不仅有更高的性能、推论效率,并强化了安全,也更容易整合到使用者的工作流程中,它支援Hugging Face Transformers、JAX、PyTorch及TensorFlow等AI框架,并针对Nvidia的加速基础设施进行优化,也能作为Nvidia NIM推论服务,之后也会针对Nvidia的自然语言处理解决方案NeMo展开最佳化。

为了打造更安全的AI应用,即日起开发者已可利用Python函式库对模型及资料进行比较评估,于程序中产生视觉化的结果,此外,Google也正準备替Gemma模型开源文字浮水印技术SynthID。

自Google于今年初开源第一代Gemma后,该模型已被下载超过1,000万次,其中一个Navarasa专案即利用Gemma来建立一个支援多元化印度语言的微调模型。

发表我的评论
取消评论

表情

您的回复是我们的动力!

  • 昵称 (必填)
  • 验证码 点击我更换图片

网友最新评论