微软推出Critique功能，实现GPT与Claude协同科研

微软推出新工具，让GPT和Claude联手写论文

微软最近为Microsoft 365 Copilot中的“Researcher”功能上线了一个叫“Critique”的新模块，首次让GPT和Claude两个主流AI模型在同一个研究流程中协同工作。这不是简单的“AI辅助写作”，而是让它们分工合作：GPT负责起草初稿，Claude则像一位经验丰富的学术编辑，逐字逐句检查逻辑漏洞、数据引用是否准确、结论是否站得住脚。

这套流程已经在内部测试中被用于社会科学、医学文献综述和工程报告撰写。一位参与测试的研究员表示：“以前AI写的东西，我得花一半时间去查证；现在，它自己先挑出问题，我只需要确认关键点。”

“学术理事会”：让AI互相挑错，减少瞎编

除了GPT和Claude的“一对一对话”，微软还设计了一个更复杂的机制——他们称之为“理事会”（Council）。在这个系统里，不止两个模型参与，而是多个AI模型独立开展研究，各自形成报告，再由一个专门的“裁判模型”比对它们的结论、数据来源和推理路径。

这套机制的测试数据来自DRACO（一个专为评估AI学术能力设计的基准集），结果显示，多模型协作的准确率比单模型高出37%，错误引用率下降近50%。换句话说，AI不再只是“一本正经地胡说八道”，而是开始学会“互相监督”。

这一设计背后，是微软对“AI幻觉”问题的务实回应。过去几年，不少用户抱怨AI生成的论文引用了不存在的期刊、捏造了实验数据。现在，系统不再依赖一个模型的“自信”，而是通过多方验证，把最可疑的部分提前筛掉。

从“写稿助手”到“研究搭档”，AI正在变专业

这个功能的真正意义，不在于它用了多少参数，而在于它改变了AI的角色——从“能写点东西的工具”，变成了“能跟你一起做研究的搭档”。

GPT擅长快速组织语言、生成结构清晰的段落；Claude则更谨慎，对术语使用、文献时效性、统计方法的合理性格外敏感。这种分工，恰恰对应了真实学术团队中“创意型写作者”和“严谨型审校者”的角色。

微软没有孤军奋战。它与Anthropic（Claude的开发者）和NVIDIA（提供算力支持）深度合作，把模型能力、硬件性能和工作流设计打包成一套完整的科研辅助系统。这不是炫技，而是为高校、智库、企业研发部门提供真正能用、敢用的工具。

未来，科研人员的“AI助手”会像Excel一样普及

不少高校实验室已经开始试用这套工具。一位哈佛公共卫生学院的博士生说：“我用它整理了200篇新冠相关论文的结论，它自动标出了哪些研究样本量不足，哪些结论被过度解读——这相当于请了三个研究生帮我做文献综述。”

业内观察者指出，未来的AI竞争，不再是谁家模型参数更大、跑分更高，而是谁能构建出更稳定、更可信赖的协作生态。就像Word让文字处理变得简单，Excel让数据分析普及一样，微软正在尝试让AI成为科研人员日常工作中“看不见但离不开”的基础设施。

如果你是学生、研究员、政策分析师，或者任何需要处理大量文献和数据的人，这个功能可能比你想象的更快进入你的工作流。它不追求“取代人类”，而是让人类少干重复、枯燥、容易出错的活儿，把精力留给真正需要判断力和创造力的部分。

CB科技站

微软推出Critique功能，实现GPT与Claude协同科研

微软推出新工具，让GPT和Claude联手写论文

“学术理事会”：让AI互相挑错，减少瞎编

从“写稿助手”到“研究搭档”，AI正在变专业

未来，科研人员的“AI助手”会像Excel一样普及

与本文相关的文章