职务层级散点图比较Claude.ai数据中的任务覆盖率,与纳入成功率并以工时占比及发生频率加权的有效AI覆盖率,虚线表示两者相等,落在虚线下方则代表仅看任务覆盖率可能高估AI影响
Anthropic发布第四份经济指数报告,分析共200万条匿名化记录,其中包含Claude.ai对话100万条,以及第一方API流量逐字稿100万条,试图将外界讨论的AI影响转化为可量化的指标。Anthropic主张,若仅使用任务覆盖率来判断哪些职业受影响,容易高估或低估实际变化,应将任务成功率、该任务在一天工作中的时间占比以及发生频率综合加权,才能更贴近AI在职业层级的实际渗透程度。
报告提出“有效AI覆盖率”概念,用于衡量AI对单一职业的实际影响。其计算方式是:将各项任务的成功率加总,并以任务在工作时间中的占比乘以任务发生频率作为权重。也就是说,即使某职业仅有少数任务被AI覆盖,但若这些任务恰好是最耗时或最常进行的核心工作,整体有效覆盖率仍可能较高。
报告以数据录入员为例指出,该职业虽有九项工作任务,但在样本中仅覆盖其中两项。由于这两项正是读取源文件并录入数据的核心工作,成功率高且占用大量工时,因此在有效AI覆盖率评估中反而位居前列。
医疗逐字稿处理人员与放射科医师也出现类似情况,因为AI能处理的多是高频且耗时的关键任务,因此整体影响程度被上调。相比之下,微生物学家虽然有大量任务出现在数据中,但大量工时仍集中在实验室仪器操作等AI难以直接介入的环节,导致仅看任务出现比例时容易高估,改用有效AI覆盖率后则更贴近实际。
该研究也揭示了效率与可靠性之间的差距。报告以理解输入内容所需的受教育年限作为任务复杂度的近似指标,发现Claude.ai在处理较复杂任务时的速度提升更显著:高中水平任务约提升9倍,大学水平任务约提升12倍。不过,成功率随复杂度上升略有下降,若以低于高中水平任务约70%的成功率为基准,大学水平任务成功率约为66%。
纳入成功率后,宏观层面的生产率估算明显下调。报告沿用此前以任务速度提升估算的框架,原推算未来十年美国劳动生产率年增长率可额外增加1.8个百分点,但若进一步将节省的时间乘以成功率,Claude.ai情境下的估算降至1.2个百分点,第一方API使用情境的估算则降至1.0个百分点。