“词元崛起”系列报道
日均140万亿次的Token调用量,见证AI应用的井喷式爆发,也勾勒出中国词元经济的强劲脉动。什么是“词元”?词元经济是什么?它正如何改变我们的工作和生活?南都大数据研究院推出“词元崛起”系列报道,从科普解码到趋势剖析,从落地实践到风险预警,更聚焦广东如何凭算力底座与生态优势抢占先机,拆解词元经济的底层逻辑,探寻其发展中的机遇与挑战,与您一同读懂这一重塑未来的新经济力量。
第二期,看词元调用量爆发的当下,谁在赚钱,谁在买单。
开源智能体项目OpenClaw“龙虾”爆火以来,全社会掀起一股“养虾”热潮。当AI逐步迈向自主化“数字员工”并规模化部署,深层次的挑战也随之浮现——这些需要持续在线、高并发处理复杂任务的智能体,正将“词元”(Token)用量从“百万”量级推升至“亿”级,悄然成为贯穿产业上下游的“硬通货”。从阿里巴巴成立ATH(Alibaba Token Hub)事业群,到腾讯升级MaaS(模型即服务)平台为Token Hub,再到英伟达CEO黄仁勋在GTC大会上提出“Token工厂经济学”,一个以词元为核心要素的“词元经济”时代已然来临。
![]()
规模凸显:中国大模型词元调用量两年增超千倍
所谓词元,是大模型处理信息的最小信息单元,日常工作生活中每一次向AI提问、使用AI生成内容,都是在调用词元。今年以来OpenClaw、Hermes Agent等智能体的爆发,带动词元消耗量显著增长。
词元经济的崛起,信号藏在一组震撼的产业数据中。据中国发展高层论坛2026年年会披露,今年3月,中国日均词元调用量突破140万亿,对比2024年初的1000亿,两年时间增长超千倍。
单个企业的词元消耗规模,更能直观体现这一爆发式增长。字节跳动旗下火山引擎于4月初公布的数据显示,豆包大模型日均词元调用量已突破120万亿,三个月前这一数字还是60万亿,而2024年5月豆包大模型刚发布时,仅为现在的千分之一。按3月国内主流大模型约2-4元/百万词元的输入价格粗算,这意味着每天有3到5亿元在GPU上消耗,一年下来即为千亿元级支出,而这仅仅是一家公司、一个模型平台的消耗量。
同时,OpenRouter数据显示,近一个月以来,全球AI大模型周调用量前20名中,半数大模型来自中国,且包揽前三名。来自小米的MiMo-V2-Pro以9.43 Trillion(10的12次方)Tokens的调用量高居榜首。
![]()
增长逻辑:三重力量撑起万亿词元市场
140万亿日均词元调用量的背后,是产业需求、智能体爆发、算力底座三重力量的深度共振,三者相互支撑、协同发力,推动词元经济进入高速增长通道。
第一股力量,是千行百业的需求井喷,让词元从“实验室”走进“生产车间”。随着AI应用场景的不断深化,词元已成为连接技术供给与商业需求的“结算单位”,其可计量、可定价、可交易的特征,推动形成了以词元计费为基础的新型商业逻辑。国家数据局局长刘烈宏在中国发展高层论坛2026年年会上表示,今年1月底以来,有的模型企业创下“20天收入超越2025年全年收入”的业绩纪录,背后正是这一商业逻辑的推动。刘烈宏表示,围绕词元的调用、分发与结算,一套新的价值体系正在加速演进,成为人工智能产业重要的变现路径。
国内三大电信运营商的布局,也是行业需求井喷的生动体现。“在智能时代,打造智能经济新形态,必须加快从‘流量经营’向‘词元经营’的转型升级。”中国电信总经理刘桂清在2025年度业绩说明会上介绍,中国电信词元经营已有初步实践,某企业在中国电信息壤平台AI私有化部署中,定制开发73个智能体,带动年消耗1.2万亿词元。此外,中国移动表示将把算力服务作为高质量发展的重要增长极,加强词元运营;中国联通则计划加快构建“智能体+词元+AI云”的算力经营模式。三家运营商不约而同地将算力视为2026年的投资主线,算力投入占比均提升至30%以上。
第二股力量,是智能体的爆发式增长,成为词元消耗的“超级引擎”。今年以来,“养龙虾”热潮席卷全网,以OpenClaw、Hermes Agent等为代表的智能体,其词元消耗逻辑与传统AI对话完全不同。据了解,传统大模型对话就像两人简单对话,用户提问-模型回答,词元消耗离散且短暂,一次顶多几千、上万个;而自主智能体则像全天候在岗的数字员工,需自主拆解目标、规划步骤、调用工具、检查结果,甚至回退重试、自动循环,每一步都在消耗词元,一次流淌百万、千万个词元都不在话下。
IDC(国际数据公司)的数据预测更显示,到2030年,全球活跃AI智能体将达22.16亿,年度词元消耗量将从2025年的0.0005 Peta(10的15次方)Tokens飙升至152667 Peta Tokens,年复合增长率高达3418%,未来智能体对词元的消耗将持续爆发。
![]()
(数据来源:IDC)
第三股力量,是算力底座的坚实支撑,为词元增长“保驾护航”。词元调用的背后,是海量的算力消耗——就像工厂生产需要电力,AI处理词元需要算力。词元调用的激增对算力的计算密度、访存带宽、通信效率等提出更高要求。而我国的“东数西算”工程,正为词元经济提供低成本、高能效的坚实支撑。
据国家数据局统计,“东数西算”工程在“十四五”期间全面启动,已形成8个枢纽节点和10个数据中心集群,覆盖东、中、西部14个省份,为全国提供了约八成的智算算力。8个枢纽节点中有5个位于西部,实现了东部业务向西部风光水电丰富区域的迁移,带动甘肃庆阳、内蒙古乌兰察布等算力新城崛起。
以乌兰察布为例,其依托充足的绿电供应、全年低温的气候条件,成为算力部署的优选之地,更吸引DeepSeek等企业布局:该公司近期公开招聘数据中心高级运维工程师、高级交付经理等岗位,工作地点正是乌兰察布,打破了以往招聘集中于北京、杭州的格局,凸显出西部算力基地的吸引力。
竞争重塑:从“拼模型”转向“拼效率”
词元调用量的爆发,不仅体现了AI应用的深化,更重塑了全球AI产业的竞争逻辑——以前行业竞争聚焦于模型性能,如今则转向词元的“性价比”和“应用落地能力”。
企业层面的布局调整,直观体现了这种竞争逻辑的转变。今年3月,阿里巴巴成立由CEO吴泳铭负责的Alibaba Token Hub(ATH)事业群,整合了通义实验室、MaaS(模型即服务)业务线、千问事业部、悟空事业部及AI创新事业部五大业务线,核心目标被明确为“创造词元、输送词元、应用词元”。
腾讯方面则在近期撤销了TEG(技术工程事业群)成立了十年的AI Lab;官宣升级其MaaS平台为Token Hub,用户可通过API统一调用混元、DeepSeek、MiniMax等主流大模型,配合Token Plan统一计费,实现多模型间的极低切换成本。腾讯集团高级执行副总裁汤道生坦言,这一变化的逻辑在于强化其全栈工程能力,“主流大模型能力差距正逐步缩小,企业比拼的不再是谁的模型更强,而是谁能通过工程化手段把模型用好”。
在英伟达GTC大会上,英伟达CEO黄仁勋还描绘了一个未来图景:未来的数据中心将不再是存储文件的仓库,而是生产词元的“工厂”。他甚至预测,未来硅谷公司的招聘筹码中可能将“年度词元预算”纳入薪酬体系,其价值可能相当于基础薪资的一半,用以支持工程师实现10倍效率提升。
产业链博弈:清晰的利益格局,谁在赚钱?谁在买单?
词元经济的崛起,催生了一条清晰的产业链,供需两端的博弈背后,是词元价值的不断凸显,也重构了产业链的利益分配格局。
谁在赚钱?在这一轮词元热潮中,提供MaaS业务的云厂商、模型厂商无疑将成为最大受益者,并有信心在未来继续追高。在2026财年第三季度财报电话会上,吴泳铭立下目标——未来五年,包含MaaS在内的云和AI商业化年收入突破1000亿美元。他表示,今年一季度,百炼MaaS平台上公共模型服务市场的词元消耗规模提升了6倍,预计商业化MaaS收入将会成为阿里云最大收入产品。
同期,国产云厂商、模型厂商一改去年的价格战、补贴叙事,选择集体涨价。3月,腾讯云、阿里云、百度智能云三大头部厂商在一周内相继发布调价公告,上调AI算力服务及大模型相关产品价格。更有厂商选择一涨再涨:智谱在今年已经涨价三轮,调价后,该公司旗下模型GLM-5.1在Coding场景的缓存命中词元价格已接近Anthropic旗下Claude Sonnet 4.6水平,这是国产大模型首次在核心场景实现与海外头部厂商的“价格对齐”。
再看“买单的人”,覆盖了企业、创业者和普通开发者。火山引擎平台上,截至2026年4月初,累计词元使用量超一万亿的企业客户,已从2025年底的约100家增至140家,短短3个月新增了40家。国研新经济研究院创始院长、智能经济首席专家朱克力在接受媒体采访时表示,当前大量非AI原生行业,都已在日常运营中深度接入AI工具。从金融研报、电商文案到制造业故障诊断、律所合同审核,各类业务场景均以Token计量算力消耗与服务成本。
与此同时,普通开发者在“养龙虾”“写代码”的过程中,也会消耗词元,词元已深度融入AI应用的各个环节。“我们的资源需要支撑起这个快速增长的时代,现在的Token用量就像当年100兆手机流量的时代。我们需要更好地优化和整合,让每一个鲜活的人都能用起来。”无问芯穹联合创始人兼CEO夏立雪在一场圆桌对话中说。
探迹科技创始人兼CTO陈开冉早前接受南都采访时也表示,“词元经济账”是关乎B端服务商和客户双方的核心命题。“对客户而言,Token是成本,必须追求每一分投入的业务产出。对服务商而言,Token经济账直接决定了商业模式的可持续性,国家数据局已将其定位为“智能时代的结算单位”。算好Token账的本质,是让AI服务从‘成本项’转变为可量化、可优化的‘生产力投资’。”
出品:南都大数据研究院
文字:南都研究员 李伟锋
设计:原毅
资料来源:国家数据局、公开媒体报道等