“每期切开一个热门赛道”,今天我们聊:Token工厂。
新华日报财经讯 如果说2025年,大家还在争“谁家AI更强”,那么2026年,科技界最性感的词必然是“Token工厂”。
2026年Token领域的大事件
今年发生了好几件Token领域标志性的事情。
第一,官方定名。3月,中国发展高层论坛正式将Token的中文名定为“词元”,定位为智能时代的价值锚点,以及产业供需两端的统一结算单位。
第二,英伟达预言。黄仁勋在GTC大会上指出:未来的数据中心不再是存储文件的仓库,而是生产Token的工厂。
第三,头部下场。3月16日,阿里巴巴成立AlibabaTokenHub事业群,由CEO吴泳铭直接负责,目标是创造Token、输送Token、应用Token。5月,字节跳动申请注册“火山词元”“arktoken”商标。
第四,运营商推套餐。国内三大运营商陆续推出Token套餐,标准化Token运营开始走向千家万户。
第五,江苏率先行动。3月24日,江苏省通信管理局联合多部门出台方案,推动信息通信网络升级为智能物流中枢,目标是2026年底建成“城域1毫秒、省内3毫秒、长三角5毫秒”算力时延圈。5月15日,无锡落地华为昇腾384超节点算力集群,首批4台每台384张GPU,定位为“国芯国模”标杆级Token工厂,聚焦AI大模型推理与Token工业化量产。
Token是什么?
Token是大模型理解与生成世界的最小单位。你每次问DeepSeek或豆包“帮我写个方案”,大模型都会把你的指令拆成一个个Token,再一个Token一个Token地回复,生成你看到的文字。根据阿里云开发者社区的数据:1个Token≈0.75个英文单词≈1.5个汉字。
“Token工厂”就是专门生产Token的地方。东方证券打了个比方:算力等于产能,Token等于产成品。工厂比拼的不是单纯的算力规模,而是Token生产的速度、质量和成本。在固定电力功率下,每瓦对应的高性能Token吞吐量越高,竞争力越强。也因此,如果传统的算力租赁公司想转型为“Token工厂”,必须强化推理与模型优化能力。近期算力服务公司Nebius以6.4亿美元收购AI推理优化公司EigenAI,就是例证。
此外,很多人分不清Token工厂和Token运营商。实际上,Token工厂是生产者,拥有算力,直接生成Token,赚钱靠高毛利。Token运营商是中间层平台,连接工厂与用户,它们聚合多个模型的Token,通过统一API提供给下游,帮助用户低成本、灵活地调用。东方证券表示,运营商的核心竞争力在于聚合能力、智能调度和平台稳定性,自身算力资产较少。
目前,国内三大运营商以及润建股份、范式智能等国内企业均已开启“Token工厂”业务模式落地。
Token卖给谁?
首先是大模型公司。招商证券表示,大模型公司生产了大量Token,但用户免费习惯导致现金流紧张。Token运营商的批量采购,能显著改善大模型的现金流。
其次是代理平台。华源证券表示,代理平台承接上游模型资源并分销给终端用户,是Token分销中转与统一服务的中间枢纽。
然后是终端用户。招商证券表示,自己单独购买和使用Token,现在的价格还是非常昂贵。如果Token服务商能够提供各个大模型平台的打包Token,类似于一张卡就可以看各家视频网站的优质内容,这对于用户来说,是非常划算方便的。
Token到底有多大的空间?
券商研报给出了两组数据。
第一组是调用量爆炸。2024年年初,中国日均Token调用量为1000亿;至2025年底,跃升至100万亿;今年3月,已突破140万亿,两年增长超千倍。
第二组是跨场景价值差。中泰证券表示,Token跨场景价值差达十万倍,药物研发类Token均价达1000美元/百万、闲聊类仅0.01美元/百万,Token价值不仅取决于生产成本,也取决于用途。
在2026年3月的GTC大会上,英伟达CEO黄仁勋正式提出了“Token工厂经济学”。他表示,未来的数据中心将成为生产Token的工厂,每瓦性能则成为商业变现的核心竞争力。Token将是新的大宗商品,一旦成熟将根据速度和智能程度分层定价,从免费层到超高速层(约150美元/百万Token),为推理场景打开商业化空间。他甚至预言:未来工程师薪酬也将包含Token配额,有望帮助其产出扩大10倍。
本期研报来源:东方证券、中泰证券、招商证券、华源证券、开源证券、中国银河证券
新华日报·财经记者 陈娴

新华报业网
Android版
iPhone版