DeepSeek V4即将发布：全新多模态AI重塑行业格局

DeepSeek V4 即将登场：国产算力+百万token上下文，AI界又要变天了

据《科创板日报》独家消息，DeepSeek 正在紧锣密鼓地准备发布其下一代大模型——DeepSeek V4，发布时间定在下周。这次不是小打小闹的迭代，而是一次全方位的升级：支持图像、视频、文本三模态生成，而且从底层开始就为国产芯片优化适配。

这次最大的亮点，是 V4 系列全面拥抱国产算力。知情人士透露，V4 的推理引擎已经深度适配昇腾、寒武纪、海光等国产AI芯片，不再只是“能跑”，而是“跑得稳、跑得快”。这意味着，未来国内企业部署大模型，不再需要依赖国外GPU，成本能降三成以上，部署周期也能缩短一半。不少地方政务和金融客户已经在悄悄测试，准备在V4上线后第一时间接入。

V4 Lite 已经在跑：100万token，54行代码画出一张SVG图

在正式版V4发布前，DeepSeek 已经悄悄放出测试版——“sealion-lite”（V4 Lite）。这玩意儿可不简单：上下文窗口高达100万tokens，是V3的8倍。什么意思？你直接丢进去《三体》三部曲全文，它能一口气读完、记住、回答你任何细节问题，连叶文洁在红岸基地第几页写了什么都能给你找出来。

更让人惊讶的是它的图像生成能力。普通模型生成一张SVG图要几百行代码，V4 Lite 只用54行，就能画出结构清晰、比例精准的流程图、地图甚至简易UI界面。有开发者实测，输入“画一个带按钮的登录页面，按钮在中间，颜色是蓝色”，它直接输出可运行的SVG代码，连hover效果都写好了。这不是“能画”，是“懂设计”。

参数规模上，V4 Lite 有2000亿，而完整版V4预计突破1万亿——这数字不是吹的，而是实打实的训练数据和算力堆出来的。目前已有几家大厂和高校拿到内测权限，反馈普遍是：“比GPT-4o更懂中文语境，回答更接地气。”

不玩虚的：技术透明，报告马上来

和某些公司藏着掖着不同，DeepSeek 这次准备得相当实在。V4发布当天，会同步放出一份简明技术说明，讲清楚架构、训练数据、推理效率这些硬货。一个月后，更完整的白皮书也会公开，连训练成本、能耗数据都列得明明白白。

这背后是DeepSeek的底气——他们不靠营销，靠实测。从2023年V1开始，他们就专攻“又强又省”的路线。V2让中文问答效率翻倍，V3在同等算力下跑得比国际模型还稳。这次V4，是他们三年技术沉淀的集中爆发。

为什么这次不一样？

过去几年，国内大模型总在“参数竞赛”和“英文能力”上打转。但DeepSeek不一样：他们盯着的是中国市场的真需求——

政府和国企要国产芯片能跑得动
企业要模型能处理长文档、懂行业术语
开发者要能用几行代码生成可用的可视化内容

V4 Lite 的100万token，不是炫技，是为法律合同、财报分析、科研论文这些场景量身打造。SVG生成能力，是给产品经理、设计师、教育工作者省时间的工具，不是实验室里的玩具。

现在，V4还没发布，但已有不少中小企业在排队等接入。有开发者在社交平台说：“如果它真能稳定跑在昇腾910上，我立刻把所有云服务都换掉。”

DeepSeek 没有发布会的烟花，没有明星代言，但他们正在悄悄改写中国AI的基础设施。下周，我们可能见证的，不只是一个新模型的诞生，而是一场国产AI生态的真正起跳。

CB科技站

DeepSeek V4即将发布：全新多模态AI重塑行业格局

DeepSeek V4 即将登场：国产算力+百万token上下文，AI界又要变天了

V4 Lite 已经在跑：100万token，54行代码画出一张SVG图

不玩虚的：技术透明，报告马上来

为什么这次不一样？

与本文相关的文章