马斯克正式发布Grok Imagine 1.0,10秒高清视频一键生成
就在今天,埃隆·马斯克在X平台(原Twitter)上直接贴出一段由Grok Imagine生成的短视频——一只机械猫在火星基地旁打哈欠,背景是缓缓升起的地球。配文只有一句:“这玩意儿,现在人人能用。”
Grok Imagine 1.0正式向所有Grok用户开放,无需排队,无需邀请码。它能生成最长10秒、720p分辨率的视频,画面流畅,音画同步,连风吹动头发的细节都自然得不像AI做的。更让人意外的是,过去一个月内,测试用户已经生成了超过12.45亿个视频——平均每人每天生成近30个。有人用它做短视频爆款,有人用来给宠物“演电影”,还有程序员用它把代码报错信息拍成了科幻短片。

背后是“偷来”的技术,但这次他们真做成了
Grok Imagine不是凭空蹦出来的。2025年3月,xAI悄悄收购了硅谷一家名不见经传的视频生成公司Hotshot。这家公司虽然规模小,但团队里有前Google DeepMind和Runway的骨干,他们早在2024年就做出了Hotshot-XL,能在3秒内生成带物理引擎的动态画面,被业内称为“最像真人拍摄的AI视频”。
收购后,Hotshot团队整体并入xAI,没换名字,没发公告,也没开发布会。但半年后,Grok Imagine的测试版悄悄上线,效果直接甩开同期多数竞品。有人对比发现,Grok生成的水流、烟雾、布料运动,物理模拟精度比Sora还高一截,关键是——它不卡、不崩、不重复。
马斯克的算盘:让Grok不只是聊天机器人
过去一年,ChatGPT、Claude、Gemini都在拼对话能力,而马斯克早就看透:未来AI的竞争,不在文字,而在视觉。
他不满足于Grok只是个“能回答问题的聊天机器人”。现在,用户只要在Grok里输入:“生成一段我骑着火箭去上班的视频,背景是旧金山早高峰”,几秒后,一个带着黑色墨镜、穿着西装的虚拟自己就从发射台升空了。没人教它怎么拍,它自己就知道该给镜头加点晃动,让画面更真实。
更狠的是,Grok Imagine和Grok的对话系统深度打通。你问它:“我昨天说想开个面包店,能帮我做个宣传视频吗?”它不仅能写文案,还能直接生成一段热气腾腾的面包出炉、顾客排队、店员微笑的短视频,配上你指定的BGM——全自动化,不带一句废话。
普通人能用它干什么?
别以为这玩意儿只适合大厂搞营销。普通用户已经在玩出花来了:
- 宝妈用它把孩子的涂鸦变成动画短片,发到朋友圈收获3000+点赞;
- 独立音乐人用它为新歌配MV,成本不到100块;
- 留学生用它生成“和家人视频通话”的假画面,缓解思乡情绪;
- 甚至有人用它复刻了已故亲人的声音和表情,做成一段“对话”——有人哭了,也有人骂它太危险。
马斯克没回应争议。他在X上只发了一条更新日志:“我们不阻止任何人使用它。但请记住:真实的情感,不能被生成。”
现在,Grok Imagine已经上线。你只需要登录Grok,点击“Imaginate”按钮,就能开始创作。没有门槛,没有付费墙,甚至不需要订阅。马斯克说:“如果AI能让人更自由地表达,那它就该免费。”
问题是——你准备用它,生成点什么?