最新消息:关注人工智能 AI赋能新媒体运营

国家数据局确认:Token官方中文名为“词元”

科技资讯 admin 浏览

“词元”成官方定名,AI行业迎来统一术语

今天,中国政府网转发《人民日报》文章,正式宣布将人工智能大模型中的基础计量单位“Token”中文名称定为“词元”。这一决定终结了多年来学术界与产业界关于该术语中文译法的长期争议,标志着我国在AI基础设施标准化进程中迈出关键一步。

据国家数据局披露,目前我国人工智能大模型的日均“词元”调用量已突破140万亿次。这一数字不仅反映国内AI应用的爆发式增长,也意味着从搜索引擎、智能客服到内容生成、代码辅助,几乎每一个日常数字交互背后,都有成千上万的“词元”在默默运转。

QQ20260324-135141.jpg

从“模元”“智元”到“词元”,命名之争尘埃落定

过去一年,“Token”该叫什么,曾是业内热议话题。腾讯研究院曾提出“模元”,强调其作为模型内部处理单元的属性;百川智能创始人王小川、潞晨科技尤洋等人则力推“智元”,试图突出其承载智能行为的特性,一度在微博、知乎等平台引发大量讨论,甚至被部分自媒体称为“中国AI的下一个符号”。

但官方最终选择“词元”,并非出于营销或口号,而是基于技术本质。国家数据局解释称:“词元”是AI处理自然语言时最小的语义切片,它不是字,也不完全是词——比如“人工智能”可能被切分为“人工”+“智能”两个词元,而“跑步”可能就是一个词元。这种切分方式,更贴近中文语言的实际结构,也更利于模型理解语义。

统一术语,背后是千亿级产业的基建需求

在AI应用快速渗透各行各业的今天,缺乏统一术语带来的困扰早已不是“叫法不同”那么简单。企业之间对接系统、政府统计算力资源、高校撰写技术报告、甚至银行评估AI采购成本,都因术语混乱而增加沟通成本。

此次“词元”成为官方标准,意味着未来所有涉及AI算力的报告、招标、补贴、能耗评估都将使用同一套语言。例如,某地政府若要评估一个AI项目消耗了多少“词元”,就能与全国其他地区直接对比;云服务商也能更清晰地按“词元”定价,避免过去“每千次请求”“每秒并发”等模糊计费方式带来的争议。

据第三方机构测算,仅2025年,国内AI相关算力服务市场规模已超800亿元,而“词元”作为核心计量单位,将成为未来AI经济核算的“新人民币”。不少企业已开始更新内部系统,将原先的“Token”字段统一替换为“词元”。

普通人每天都在用“词元”,只是没察觉

你今天用AI写了一封邮件,问了Chatbot一个问题,刷到一条由AI生成的短视频推荐,甚至在手机输入法里自动补全了一句话——这些看似微小的动作,背后都消耗了数以百计甚至上千的“词元”。

它不像“芯片”“算力”那样有实物感,却实实在在构成了AI服务的底层燃料。当140万亿这个数字被官方公布,它不再只是技术圈的术语,而成为衡量中国AI普及程度的新标尺。

从今天起,“词元”不再只是工程师的行话。它,已经走进了我们的数字生活。