
微软近日于自家云端AI开发平台Azure AI Foundry推出Deep Research SDK与API,以支援开发人员打造具备多步骤推理与分析能力的AI代理应用。
利用此SDK,开发人员可以快速将微软企业级深度研究功能,整合到AI代理应用中。Azure的Deep Research功能,以Open AI的o3-deep-research模型为核心,由此模型调度不同模型和应用程序,来自动化完成多阶段研究流程。
Deep Research研究流程第一阶段是定义研究範围。o3-deep-research模型会呼叫GPT-4.1与GPT-4o等模型,来分析使用者提示内容,以釐清查询意图、补充上下文,并划定研究範围。定义研究範围
第二步是即时资料基础蒐集,Deep Research会呼叫Bing Search等工具,从网路上搜寻各式资料,作为知识基础(Grounding knowledge),以避免产生幻觉。第三步,o3-deep-research模型会综合这些资料,来整合、分析与推论。微软强调,推论过程中,模型会情境改变或获得新洞察,来动态调整研究方向。推论结果,还会考虑到资料中的各种细节、趋势、或潜在冲突情况。
第四步,模型会将推论结果输出为结构化报告,记录模型得出的答案,同时详载模型推理过程、引用来源,以及研究过程中对使用者提出澄清请求。微软希望,这能使企业更容易验证AI研究结果,使Deep Research功能可用于关键任务场景,或高度监管产业。
开发者能透过API串接Deep Research到自建商业应用、内部入口网站、RPA工具,或其他AI代理。例如,将Deep Research代理串接到简报製作代理,再串接到Email代理,就能自动化完成从研究、报告製作到通知主管的不同任务环节。
Deep Research採按Token计价模式。o3-deep-research模型每百万次Token输入为10美元、快取输入(Cached Input)每百万Token2.5美元、每百万Token输出则为40美元。呼叫Bing搜寻与用来进行较简单任务的其他GPT模型呼叫费用另计。
目前,Deep Research处于公开预览阶段,开发者可至Azure AI Foundry平台申请早鸟体验。