
Google周二(9/24)更新Gemini 1.5 Flash与Gemini 1.5 Pro,释出Gemini-1.5-Pro-002与Gemini-1.5-Flash-002,主要提高了这两款模型的输出速度,调高其速率限制,以及调降Gemini 1.5 Pro的价格。
Gemini 1.5是个多模态模型,支援200万个Token的脉络长度,它能处理长达1,000页的PDF文件,从超过1万行程序码的储存库中回答问题,也可自1小时的影片中撷取重要资讯。相较于今年5月的Gemini 1.5 Flash/Pro版本,新版不管是在 MMLU-Pro、MATH或HiddenMath等基準测试上都有明显的长进,在视觉理解或生成Python程序码也表现得更好。
此外,Gemini 1.5 Flash/Pro拥有一个更简洁的表达方式,不管是在回答问题、进行摘要或汲取内容上,新模型的预设输出长度都比前一版短了5~20%,以方便使用并降低成本。
本周Google亦宣布调降Gemini 1.5 Pro价格,前提是提示少于12.8万个Token,那么其输入Token价格调降了64%,输出Token则调降52%,新增快取Token价格亦降低了64%,且自今年的10月1日起生效,届时每100万个输入Token的价格为1.25美元,每100万个Token的输出价格为2.5美元,可望降低使用Gemini 1.5 Pro的成本。
而所谓的速率限制指的是开发人员每分钟可发送请求的次数(Requests Per Minute,RPM),其中,Gemini 1.5 Flash的速率限制从1000 RPM提高到2000 RPM,Gemini 1.5 Pro则从360 RPM提高到1000 RPM,且Google预计未来几周将持续提高Gemini API的速率限制。
Gemini 1.5 Flash在速度上的改善则较为明显,它的输出速度是最初版本的2倍,延迟则只有原来的1/3。
图片来源/Google