交汇点讯 近日,国家数据局为大模型核心计量单位Token定下官方中文名“词元”,这个此前只在技术圈流传的概念,瞬间成为AI产业最火的热词。数据显示,截至2026年3月,我国日均词元调用量已突破140万亿,较2024年初的1000亿增长超千倍,词元经济正以爆发之势重塑AI产业格局。词元的本质、定价逻辑与未来趋势是什么?记者采访到百度千帆平台产品负责人张婷,揭示词元经济爆火背后的产业新信号。
“词元是大模型处理语言时最小的‘处理单位’,它既不是一个字,也不是一个词,而是介于两者之间的‘语言碎片’。比如‘我’是一个词元,‘今天’可能是一个词元,‘国际化’则可能被拆成‘国际’和‘化’两个词元。”张婷表示,之所以不用“字”或“词”,是因为大模型要处理全球多种语言、代码、公式等,词元是通用的“最大公约数”,能让模型用统一方式处理所有语言和符号。
她打比方说,词元更像乐高积木,单个积木无意义,但按顺序拼接就能搭出复杂场景,大模型训练本质就是学习词元序列的“拼法”,这和快递包裹只强调运输计费不同,更能体现词元的组合性核心特性。
很多人疑惑为何要拆词元,直接处理句子不行吗?张婷解释,计算机只能处理数字,不认识字和句子,必须通过分词把语言转换成数字序列。若用一个字对应一个数字,中文几万汉字会让词汇表爆炸,模型训练极难;若用句子作单位,排列组合是天文数字无法穷举。词元的粒度是工程验证的“最优解”,既不粗也不细,还能灵活处理行业术语、专有名词,在工业、金融、医疗等垂直领域尤为重要。
词元经济的爆火,直观体现在用量与价格的双重变化上。张婷给记者算了一笔账:问AI“今天北京天气怎么样”,加上回答约消耗50—100个词元;写一篇800字作文,算上提示词和输出约1000—1500个词元;分析10页合同,成本仅几毛钱,一块钱能让AI写约1000篇800字作文。而三年前,词元价格是现在的几十倍甚至上百倍。
词元定价背后是多元成本核算。张婷透露,核心是硬件成本,高端GPU动辄几十万,运行大模型需几十上百张GPU,大型推理集群一年电费是天文数字;还有研发摊销、运维与安全成本。百度千帆的优势在于技术实力,推理引擎极致优化、自研昆仑芯片、文心大模型持续优化,让推理效率业内领先,同样成本能跑更多词元,效率优势最终让利给客户。
对词元价格最敏感的是高频调用的To C产品团队,比如AI写作工具、智能客服、教育辅导App的创业公司,他们靠低价或免费获客,词元成本直接决定生死,日活增长会让词元消耗指数级放大,价格差一点,月成本差距可达几十万。
而大企业更关注稳定性、安全性和合规性。张婷举例,一家法律科技公司早期使用海外API,每月词元费用是主要成本,切换到千帆后,价格更低,长文本推理专项优化让处理效率提升30%以上,产品体验和成本结构同步改善。
词元经济爆火,释放出AI产业三大关键信号。首先,AI应用从“能用”走向“好用”,从云端走向终端,智能体爆发式增长是核心推手,OpenClaw等智能体单周词元消耗量相当于2025年四季度全平台周均的60%,带动词元需求非线性增长。
其次,产业竞争从模型参数比拼转向词元效率之争,算力评价标准从看峰值、芯片数量,变为看单位投入的词元产出与服务稳定性,词元成为衡量算力价值的核心标尺。
最后,AI商业化逻辑重构,词元具备可计量、可定价、可交易属性,成为AI时代的“算力货币”,按词元计费的新型商业逻辑,正颠覆传统互联网流量变现模式。对于词元价格走势,张婷判断还会继续下降,三到五年内有望达到“白菜价”,即普通个人开发者不用在意词元成本,就像没人心疼微信流量消耗。但她强调,便宜的词元不等于好用的AI,未来竞争焦点会转向模型能力、响应速度、定制化程度和行业理解深度,这也是百度千帆持续发力的方向。
展望五年后,张婷认为词元可能从普通用户视野消失,但价值会以新形式存在。一方面,计费方式从“按词元数”变为“按任务结果”,就像打滴滴不用关心汽油消耗,用AI写报告只需为成果付费;另一方面,多模态AI发展会扩展词元定义,图像、音频、视频词元会出现,计量单位更复杂,但用户体验更简单。百度千帆已布局该方向,MaaS(模型即服务)只是起点,最终要提供端到端AI能力,让企业不用关心底层模型和词元消耗,只关注AI解决的问题与创造的价值,这才是AI商业化的终局形态。
新华日报·交汇点记者 张宣
图:视觉中国

新华报业网
Android版
iPhone版