最新消息:关注人工智能 AI赋能新媒体运营

Google Gemini新增可客製化的个人助理Gem、全面部署Imagen 3图片生成模型

科技智能 admin 浏览 评论
图片来源:

Google

Google昨(28)日宣布Gemini AI服务改版,加入可客製的个人AI助理Gem,以及高品质图片生成模型Imagen 3全面部署到免费及付费版服务。此外,生成人物图片的功能也重新上线。

Gem是Google I/O曾预览过的功能,是可客製化版本的Gemini。用户可针对特定主题或目的客製化成特殊主题专家。用户可自建一个专家团队协助完成重大专案、为大型活动脑力激荡,或为社群平台贴文撰写标题。Google说,只要撰写指令、给个名字就完成了,它还会记得用户输入的详细指令,可节省重複性或困难任务的AI助理的开发时间。

过几天,这项功能会推向有150多国家地区的Gemini Advanced、或是Business及Enterprise版本订阅用户。Gem共支援30多种语言,但Gemini应用程序必须同样支援使用者所在的国家/地区和语言,才能在该程序中使用这项功能。

为协助用户入手,Google已预建了一些用于困难任务的Gems。像是引导学习的学习教练、帮忙想点子的脑力激荡者、可制订自我提升计画的生涯规划顾问、改善文法到文章结构的撰文编辑,以及撰写程序的小帮手等。

另外,本月稍早只提供美国市场的图像生成模型Imagen 3,未来几天内将全面部署到Gemini AI助理。

Imagen 3为一潜在扩散模型(latent diffusion model),能根据用户输入的文字提示产生高品质图片。Google说,DeepMind团队大幅提升Imagen 3提示理解能力,使模型能了解并遵循落落长、充满形容词和複杂的提示,并生成细节繁複、色彩鲜豔、以及视觉设计更丰富的图片。

Imagen 3在多项测试中,超越竞争者如DALL-E 3、Midjourney v6、Stable Diffusion(SD)3 Large、SD XL 1.0等模型。

由于Imagen刚上线时曾让Gemini闹出生成黑人美国开国元勛、或是女性教宗图片的错误,让Google延后Gemini人物图片生成的服务上线。和Gem一样,这项功能目前仅开放给Gemini Advanced、Business、和Enterprise方案用户,仅提供英文版。Google说会持续改进其技术能力,以及安全与品质监控工具,也会提供清楚的产品原则。

Google说,Imagen 3内建安全护栏并遵循产品设计伦理原则。此外,一如Imagen 2,新版本也使用了Google自有开发的浮水印技术SynthID防範冒充真人创作。用户握有控制权,若生成的图不满意也可令Gemini重新生成图片。图片来源/Google

发表我的评论
取消评论

表情

您的回复是我们的动力!

  • 昵称 (必填)
  • 验证码 点击我更换图片

网友最新评论