过去两年,Token的价格一路下跌,因为算力成本下降很快。但进入2026年,情况变了:Token价格不再下降,甚至开始小幅回升,而算力成本仍在快速下降——这一升一降之间,打开了行业盈利的“剪刀差”。
高盛在2026年5月的一份报告中将这一变化称为“AI利润拐点”。其核心逻辑是:Token用得越多,利润越高。据预测,到2030年,全球Token消耗量将是2026年的24倍;到2040年,更可能扩大至55倍。摩根士丹利也指出,顶尖大语言模型正经历“非线性能力跃升”,算力需求的增速将是供给增速的3倍,供需缺口将持续扩大。
美银数据显示,2026年全球几大云厂商的总资本支出将首次突破8000亿美元,同比增长67%,2027年更将突破1万亿美元。
在这种背景下,算力租赁——即企业向云厂商租用AI芯片进行模型训练和推理——成为一门“卖方市场”的生意。高端算力供不应求,二线云计算公司甚至“一卡难求”。算力产业链正在从单纯的硬件租赁,向“模型服务+Token分成”的商业模式演进。各大模型公司近期密集涨价、限购,也从侧面印证了供需缺口的刚性。