最新消息:关注人工智能 AI赋能新媒体运营

DeepSeek启动500亿融资,V4.1定档6月

科技资讯 admin 浏览

DeepSeek豪掷500亿:一场由创始人亲自押注的AI豪赌

国内大模型圈最近炸了。一家曾公开宣称“不融资、不商业化、不路演”的公司——DeepSeek(深度求索),突然宣布启动一轮高达500亿元人民币的融资。这不是普通融资,这是中国AI史上最大手笔的一次资本集结。更让人意外的是,领投人不是红杉、高瓴,也不是腾讯阿里,而是它的创始人梁文锋本人。据知情人士透露,他个人掏了至少200亿,占本轮总盘子的四成。

这背后是怎样的决心?梁文锋不是在“投钱”,是在用真金白银赌一个未来。过去三年,DeepSeek几乎没在公开场合露过面,没有PPT路演,没有发布会,连官网都简陋得像实验室主页。可就在最近三周,它的估值从100亿美元一路飙到500亿,翻了五倍。这速度,连华尔街的对冲基金都看傻了眼。

从“技术宅”到“重资产玩家”:DeepSeek的转身

DeepSeek最早是靠量化基金孵化起来的团队,一群程序员和数学博士,埋头在代码里写模型,不谈钱,不谈客户,只拼参数、跑数据。可到了2024年底,他们发现不对劲了:

  • 训练一个千亿级模型,单次成本已超3000万,算力卡抢得像春运火车票;
  • 顶尖AI研究员年薪突破200万,华为、字节、百度都在疯狂挖人;
  • 客户不再满足于“模型开源”,他们要的是能直接接入ERP、客服系统、法律文书的稳定产品。

于是,那个曾经拒绝商业化的人,开始主动建机房、签IDC协议、招销售团队。据内部消息,DeepSeek已在贵州、宁夏两地签约超10万张H100算力卡,预计今年底将建成国内规模最大的私有AI算力集群之一。这不是“搞研究”了,这是在建“AI电厂”。

V4.1来了:不只是更强,是更“有用”

技术上,DeepSeek也没闲着。上个月刚发布的V4模型,已经能一口气处理100万字的长文本——相当于一本《战争与和平》全文直接喂给它分析。企业用户反馈,现在用它处理一份300页的合同、梳理一个上万行的代码库,效率直接翻了十倍。

而6月即将上线的V4.1,才是真正让行业屏住呼吸的版本:

  • 首次支持多模态:不仅能读文字,还能看图、听音频,比如你上传一段会议录音,它能自动整理要点、识别情绪、生成摘要;
  • 内置金融、医疗、法律三大行业协议接口,对接银行风控系统、医院病历库、律所案卷系统,不再需要二次开发;
  • 推理速度提升40%,同等算力下,响应时间比GPT-4o还快。

这不是实验室里的“玩具”,这是能直接放进企业生产流程的工具。

谁在背后支持?不只是钱,还有资源

虽然官方没公布全部投资方,但多个信源指出,本轮除了梁文锋自投200亿外,还有至少三家产业资本悄然入场:

  • 一家头部国有银行旗下的金融科技子公司,正与DeepSeek合作试点信贷风控模型;
  • 华东某省属国资平台,已签约采购5000张A100芯片,专供DeepSeek本地化部署;
  • 一家香港私募基金,带着东南亚市场资源入局,计划把DeepSeek模型打包推向印尼、越南的政府和银行客户。

这意味着,DeepSeek不再只是“技术明星”,它正在变成一个有政府背书、有产业落地、有出海路径的实体企业。

未来半年,决定谁是真正的中国AI龙头

现在,OpenAI还在等GPT-5,Claude 3.5刚发布,国内百度、阿里、讯飞都在加速追赶。但DeepSeek的节奏不一样——它不追“最先进”,它追“最能用”。

如果V4.1在6月如期上线,且能稳定服务百万级企业用户,那它将成为第一个真正“跑通”商业闭环的国产大模型。届时,它不再是“技术黑马”,而是“基础设施级玩家”。

梁文锋曾说:“我们不做PPT上的AI,要做车间里的AI。”

现在,500亿砸下去,他真的在把这句话变成现实。