公文写作迎“国标”时代:信通院启动首批可信AI智能体评估
近年来,AI辅助写公文在政府机关和央企单位悄然普及。从起草通知、整理会议纪要,到润色报告、校对格式,越来越多办公场景开始依赖智能工具。但随之而来的问题也日益突出:语句花哨但政策表述不准、格式合规但逻辑漏洞百出、甚至出现“引用过时文件”“错用文种”等低级错误。这些问题一旦出现在正式公文中,轻则影响工作效率,重则引发责任纠纷。
为解决这一痛点,中国信息通信研究院(以下简称“中国信通院”)近日正式宣布,启动全国首个“可信AI公文写作智能体”评估工作。这不是一次技术展示,而是一场面向政企实际使用场景的“大考”。评估标准由信通院牵头,联合科大讯飞、中移互联网、国家信息中心等十余家权威机构共同制定,目标直指——让AI写的公文,真正能用、敢用、经得起审计。

不看花架子,只看真本事:评估覆盖公文全链条
此次评估依据的是《智能体技术要求与评估方法 场景应用 公文写作》行业标准,不是泛泛而谈的“智能程度”,而是细到每一处细节的实战检验。评估内容涵盖两大能力域、17项具体指标,包括:
- 基础能力:能否准确识别会议录音中的发言人、时间、决议事项,并自动归类为规范的会议纪要格式;
- 文书处理:能否根据《党政机关公文处理工作条例》自动判断“请示”“报告”“函”的适用场景,避免文种错用;
- 政策匹配:能否实时校验引用的文件是否现行有效,是否与最新政策口径一致;
- 排版规范:是否符合GB/T 9704-2012《党政机关公文格式》国家标准,包括字号、行距、签发人位置等细节;
- 安全可控:是否支持本地化部署、数据不出内网、操作全程留痕、修改可追溯。
特别值得注意的是,评估中专门设置了“错误容忍测试”环节:故意输入模糊指令、错误政策编号、矛盾逻辑,观察系统能否识别风险并提示,而不是盲目生成。一些市面上标榜“全能”的产品,在这一关直接露馅——写得快,但错得也快。
选型不再靠“听宣传”,6月起有了官方“红黑榜”
对机关单位和国企来说,采购AI工具最大的困扰不是价格,而是“不知道哪个真靠谱”。过去,厂商拿着演示PPT就能拿订单,实际部署后才发现:生成的红头文件格式乱套、引用的政策早已废止、甚至把“保密文件”上传到云端服务器。
这次信通院的评估,将采取“封闭测试+真实公文模拟”方式,参评产品需在完全隔离的政务环境中,完成不少于200份不同类型的公文任务,包括请示、批复、通报、函件等。所有结果由第三方专家团队打分,不接受厂商自评。
预计2026年6月,首批评估结果将正式对外公布。届时,信通院将发布《可信AI公文写作智能体推荐名录》,明确哪些产品通过评估、哪些存在重大风险。这份名单,将成为各级单位采购时的“硬指标”——没有上榜的产品,连招标文件都可能被拒。
背后是真实需求:公文不能“试错”
一位省级政府办公厅的工作人员坦言:“我们不是怕用AI,是怕用错了。一份发错的红头文件,可能要追责三个人,整改一个月。AI能帮我们节省时间,但绝不能替我们担责。”
这正是信通院此次行动的核心逻辑:AI不是取代人,而是辅助人。真正的智能,不是写得漂亮,而是写得对、写得稳、写得有据可查。未来,公文写作的AI工具,必须像打印机、OA系统一样,成为可管理、可审计、可追责的基础设施。
6月,当第一批“通过评估”的产品名单公布时,市场将迎来一次真正的洗牌。那些靠营销包装取胜的“AI噱头”,将被逐出政企核心办公场景。而真正懂政策、守规矩、能落地的产品,才配得上机关单位的办公桌面。