最新消息:关注人工智能 AI赋能新媒体运营

阶跃星辰发布Step-DeepResearch:低成本原子能力深度研究AI智能体

科技资讯 admin 浏览

阶跃星辰推出Step-DeepResearch:让AI真正像研究员一样工作

近日,国内AI公司阶跃星辰(StepFun)发布了一款名为Step-DeepResearch的新型智能体模型。它不是又一个能回答“什么是量子计算”的聊天机器人,而是一个能帮你读完几十篇论文、比对数据、找出矛盾点,最后写出一份有参考文献、有逻辑结构的研究报告的“数字研究员”。

image.png

不是搜索,是深度挖掘

市面上大多数AI助手,输入一个问题,它就去网上找几条相关结果,拼一拼给你答案。Step-DeepResearch不一样——它面对的是“分析新能源电池技术的专利趋势”“对比三家光伏企业的财报风险”这类复杂任务。

它会先拆解问题:哪些数据是关键?哪些来源最权威?哪些观点存在冲突?然后主动去查论文、财报、专利库,甚至交叉验证不同来源的信息。如果发现某篇论文的数据与其他研究矛盾,它不会直接采信,而是标记疑点,继续找佐证。

整个过程,像极了一个资深分析师在图书馆里翻资料、做笔记、写草稿的样子——只不过它不睡觉,也不疲劳。

一个模型,干完所有活

过去,要完成这样的研究任务,往往需要多个工具配合:一个做搜索,一个做摘要,一个做引用管理,一个写报告。Step-DeepResearch把这一切都“装”进了一个320亿参数的模型里。

它不需要调用外部插件,也不依赖多个AI系统协作。所有规划、检索、验证、写作,都在同一个模型内部完成。这不仅减少了系统延迟,也让输出更连贯——没有“A系统说这个,B系统说那个”的混乱感。

阶跃星辰团队透露,模型基于Qwen2.5-32B进行深度优化,训练数据来自真实的技术报告、上市公司财报、学术论文库和知识图谱,总量超过2000万条高质量文本。不是靠“编”出来的数据,而是用真实世界的信息喂出来的。

实战表现:小体量,大能力

在Scale AI的深度研究评测中,Step-DeepResearch的“任务依从率”达到61.42%,这个数字意味着它能准确理解并完成复杂研究指令的比例,已经和OpenAI、Google的同类系统不相上下。

更让人意外的是,在阶跃星辰自建的中文研究基准测试ADR-Bench中,这个320亿参数的模型,甚至超过了部分1000亿+参数的开源模型。换句话说,它用更小的体积,做出了不输“巨无霸”的效果。

这对企业和研究者意味着什么?成本更低,响应更快,部署更容易。不需要买下整个GPT-4级别的算力,也能获得接近专业研究团队的分析能力。

能做什么?真实场景举例

  • 你是一名行业分析师,想了解“中国储能政策对锂电回收企业的影响”,它能帮你梳理近五年政策文件、整理15家上市公司的财报数据、对比技术路线变化,并输出带引用的PDF报告。
  • 你是研究生,导师让你“综述近三年AI在医疗影像中的临床验证研究”,它能自动筛选PubMed和CNKI中的核心论文,剔除低质量研究,归纳出主流方法与未解难题。
  • 你是投资人,想评估一家初创公司的技术壁垒,它能抓取其专利布局、核心团队背景、竞品对比,甚至指出其技术描述中模糊或夸大的部分。

这些不是想象,而是团队内部已经跑通的用例。

论文与开源:透明,才值得信任

阶跃星辰同步发布了完整技术论文:https://arxiv.org/pdf/2512.20491,详细说明了模型架构、训练方法和评测结果。这不是“黑箱”产品,而是愿意让你看懂它为什么能做的系统。

目前,模型已开放部分API接入,企业用户可申请测试。团队也表示,未来将推出面向科研团队的协作版本,支持多人标注、版本追踪和报告共享。

AI不是要取代人,而是要帮人把时间从重复劳动中解放出来。Step-DeepResearch的目标,就是让每一个需要深度信息的人——无论是学者、分析师、创业者,还是普通研究者——都能拥有一位24小时在线、不收加班费的“数字研究助理”。