4月15日,国家数据局发布《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》,其中首次在国家政策层面提出“探索词元交易”这一新型数据交易模式。这一政策信号标志着中国人工智能的发展重点正在从“模型好不好”,转向智能服务如何计量、如何定价、如何交易的深层突破。词元到底是什么?词元大模型生态的全面崛起对我国推动新质生产力发展有怎样的作用呢?认识理解上述问题,对于发展智能经济新形态具有重要作用。
词元:正在从技术基石转变为经济新单元
国家“十五五”规划纲要明确提出,坚持把发展经济的着力点放在实体经济上,坚持智能化、绿色化、融合化方向,加快数智技术创新,深化拓展“人工智能+”,这为中国数字经济的发展锚定了清晰航向。当我们再次审视人工智能技术的演进脉络时,会发现词元大模型生态的崛起,正成为落实“十五五”规划、推动数据要素市场化的关键一步,它将为中国数字经济和新质生产力的发展注入强劲动力。
客观来说,词元是大模型处理信息的最小单元,其内涵与意义远超技术范畴。从技术层面说,它是人工智能理解世界、组织语言、生成结果的底层模块。面对纷繁复杂的文本、音频、视频等数据,人工智能无法像人类一样直接感知,必须将这些原始数据转化为自身能识别的语言,词元便是这套语言中最基础的单元。文字词元如同乐高积木,一个单词或汉字可能被拆分成若干个词元;音频词元恰似乐谱上的音符,一段声音被切割成包含音调、音量的极短片段;视频词元就像拼图碎片,每一帧画面被划分成一个个小方格,还要兼顾时间上的连续性。在大模型的运算逻辑里,这些不同模态的词元并无本质差别,都只是一串复杂的数字序列。
而当人工智能走出实验室,融入产业与市场后,词元被赋予了更深刻的经济内涵。它成为连接技术供给与商业需求的结算单位,如同计算用电量的度、用水量的吨,词元是衡量人工智能服务用量的标准计量单位。每一次向AI提问、借助AI生成内容,本质上都是在调用词元。词元调用量的多寡,直接反映了人工智能应用的广泛程度与频繁程度,也标志着人工智能技术正加速渗透到千行百业,从一项前沿技术转变为实实在在的生产力工具。
词元从技术参数向经济基本单元的转变,完成了信息价值可度量性与可交易性的转变,为数据要素市场化奠定了基本前提。在传统信息处理模式下,大量非结构化数据需要经过复杂的人工处理与解读才能转化为有价值的信息,这一过程不仅效率低下,也难以实现标准化的价值衡量。而词元的出现,将各种非结构化的信息转化为可计量、可交换的标准化单元,使得智能服务如同自来水一样,具备了可计量、可定价、可交易的属性。这一转变,打破了技术创新与商业落地之间的壁垒,让人工智能的价值能够以清晰、直观的方式呈现出来,为数据要素在市场中的流通与配置提供了可能。
词元大模型生态:新质生产力加速发展的重要引擎
词元作为大模型处理信息的最小语义单元,它是连接数据、算法与算力的核心枢纽,其标准化计量属性为数据价值的量化与交易提供了可靠依据。从这个意义上讲,词元大模型生态就是立足“词元”这一核心计量单位,由技术、产业、经济、政策等多方力量共同构建的动态协作系统。现实中,词元大模型生态不是单一环节,而是一个从底层支撑到上层应用、从企业实践到国家布局的完整闭环,是智能时代新质生产力形成的关键基础设施和价值循环引擎。这意味着,词元大模型生态的崛起,不仅是新质生产力在人工智能领域的具体体现,更为新质生产力的快速发展开辟了新空间。
第一,词元大模型生态的崛起为数据要素的价值释放提供了标准化的计量与交易体系,破解了长期以来数据价值难以量化的难题。在智能时代,数据是关键的生产要素,其价值并非天然存在,而是需要通过有效的加工、处理与利用才能得以体现。词元的出现,恰好对应了数据从静态资源向动态生产力转化的过程,它既度量了数据被活化的程度,也度量了智能服务被投入和消耗的规模。词元的标准化计量属性,为数据价值的量化提供了可靠依据,使得数据能够像其他生产要素一样,在市场中进行公平、高效的交易。企业可以根据自身对词元的调用量,精准评估人工智能服务的投入产出比,合理配置数据资源。数据提供商也能够依据词元的计量标准,为不同类型、不同质量的数据制定合理的价格,从而激发数据要素的活力,推动数据要素市场繁荣发展。
第二,词元大模型生态的崛起催生了全新的产业形态与商业模式,重构了智能时代的资源配置方式和经济组织逻辑。随着词元调用量爆发式增长,围绕词元生产、分发、调用、计价、交易和治理,正在形成一套全新的经济运行体系。在生产环节,企业开始将词元消耗与产出榜单作为衡量员工效率的新标准,人工智能嵌入劳动过程更深入,不断推动生产方式向智能化、高效化转变。一些企业借助AI辅助编程工具,消耗数亿词元,将软件开发周期大幅压短,大大降低了开发成本,为小微企业的发展创造了更多可能。在交换环节,词元定价的普及标志着人工智能能力已转化为标准化的可交易商品,一个打破地域限制的全球化词元交易市场正在形成。在分配环节,词元配额开始被部分科技公司作为新型福利发放,未来甚至可能被嵌入薪酬体系,这预示着分配方式的演变。在消费环节,词元消耗已深度嵌入研发、制造、金融等核心生产活动,乃至个人日常的人工智能应用之中,智能体等新业态的涌现,更掀起了全社会的词元消费热潮,进一步拓展了数字经济的应用场景与市场空间。
第三,词元大模型生态的发展推动了生产要素的深度融合与优化配置,为新质生产力的形成提供了坚实基础。在智能时代,芯片、算力、电力、数据等生产资料的结合方式发生了深刻转变,其目标不再是简单的存储或计算,而是规模化、高效率地生产高质量词元。提升每单位时间、每单位能耗的有效词元产出,正日益成为生产资料重新组合的目标和衡量智能生产力的指标。这种生产要素的新组合方式,打破了传统生产要素的边界,实现了数据、技术、资本、劳动力等要素的深度融合。
第四,词元大模型生态的崛起加速产业结构转型升级,推动传统产业向数字化、智能化方向发展。人工智能作为新质生产力的重要代表,正在深刻改变传统产业的生产模式、管理模式与商业模式。词元大模型的广泛应用,使得智能化生产替代基础性的人类智力劳动成为可能,尤其是在人类的脑手联动领域,机器替代人力的空间得到了极大拓展。如果说蒸汽机替代了简单体力劳动,催生了机械装备制造产业,那么人工智能替代复杂劳动,则催生了人工智能模型制造产业,以及与之相关的智能硬件、数据服务、算法研发等一系列新兴产业。这些新兴产业的发展,不仅创造了大量的就业机会,也推动了传统产业的数字化、智能化转型,促进了产业结构的优化升级,为经济高质量发展注入了新的动力。
第五,词元大模型生态的发展促进了技术创新的持续迭代,形成了模型能力提升与词元调用量增长的良性循环。词元调用量的增长与模型能力的提升相互促进,每一次模型能力的提升,都会解锁更多的应用场景,从而推动词元调用量的进一步激增。而词元调用量的增加,又会为模型的训练与优化提供更多的数据支撑,促使企业加大在算法、算力等方面的研发投入,不断提升模型的性能。更为重要的是,词元大模型生态的发展吸引了大量的人才和耐心资本涌入人工智能领域,进一步推动了技术创新。随着技术的不断进步,人工智能模型的性能将不断提升,应用场景将不断拓展,词元的市场需求也将持续增长,从而形成一个良性循环,为新质生产力的发展提供源源不断的动力。
来源:上观新闻,2026-04-30
作者:胡晓鹏,上海社会科学院世界经济研究所副所长、研究员
