
Midjourney
美国AI新创Midjourney继推出图像生成服务之后,今日(6/19)发表首个影片模型V1,利用图像来生成影片,费用约是生成图像的8倍,一上线就颇获好评。
2022年创立的Midjourney表示,该公司的目标是建置一个可即时模拟开放世界的模型,想像一个可即时生成影像的AI系统,允许使用者命令它在3D空间移动,环境及角色也会跟着移动并彼此互动。为了达到该目标,Midjourney需要建立各种模组,像是图像模型,可让图像动作的影片模型,以及可于空间中移动的3D模型,以及能够快速完成所有的即时模型。
明年起Midjourney将分别建置并发表这些元件,再将它们整合成一个统一的系统,并解释一开始可能比较贵,但很快地就可经济实惠到每个人都能使用。
V1即是Midjourney所推出的第一个影片模型,它的工作流程基本上为图像转影片(Image-to-Video),一开始还是製作或上传图像,成为影像的第一帧图,再按下「Animate」让它动起来。使用者可以选择自动或是手动,前者是由系统决定动作,后者允许使用者描述物体的移动方式与场景的变化。
使用者亦可选择低速(low motion)或高速(high motion)运动,前者代表主体的行动是缓慢的,后者则会让所有物件都动起来,虽然有趣,但也会出现奇怪的错误。
根据Midjourney的影片模型说明文件,V1基本会生成一个5秒、解析度为480p的影片,之后可以选择延长影片,每次延长时间为4秒,最多可延长4次,代表可建立最长21秒的影片。
现阶段Midjourney并未提供免费额度,目前提供4种订阅方案,都可生成图像或影片,每个方案的额度计算方式为快速GPU时间(Fast GPU Time),最便宜的是每月10美元的基本方案(Basic Plan),Fast GPU Time额度为每月200分钟。除了基本方案之外的3种相对高阶方案,都有提供放鬆GPU时间(Relax GPU Time),它的生成速度较慢,可能需要排队,但不消耗额度,还可无限使用。
Midjourney表示,用户生成一个影片的成本约是图像的8倍,但这已是市场上其它影片生成服务的1/25。
Midjourney是市场最热门的图像生成服务之一,目前正面临迪士尼跟环球影业的联手控告,这两家动画界的IP大厂指控Midjourney不仅利用其动画角色来训练模型,允许使用者生成基于相同角色的图像,还拿这些生成作品来行销,严重且故意侵害其着作权。