过去因为相信所以看见的那个 token,现在不用相信就能看见。它是瓦特、安培、比特之后的下一个。

2009年1月,一个匿名者发明了一种叫“token”的东西,你投入算力,获得 token,token 在一个共识网络里流通、定价、交易。整个加密经济由此而生。十几年过去了,人们还在争论这种 token 到底有没有价值。

2025年3月,一个穿皮衣的男人重新定义了另一种叫 token 的东西。你投入算力,产出 token,token 在一个 AI 推理过程中被立刻消费掉:思考、推理、写代码、做决策。整个 AI 经济由此加速。没有人争论这种 token 有没有价值,因为你今天早上刚用掉了几百万个。

两种 token,同一个名字,同一个底层结构:算力进去,有价值的东西出来。

2026年3月,我坐在 NVIDIA GTC 会场里,听了黄仁勋一场几乎没有带货的主题演讲。他发布了一款 CPU 与 GPU 结合的产品 Vera Rubin,但这次,他没有讲芯片参数或制程工艺,而是讲了一套关于 token 生产、定价和消费的完整经济学。他展示了不同模型对应的不同 token 速度,不同 token 速度对应的定价区间,以及这些定价区间需要什么级别的硬件来支撑。他还帮台下的 CEO 和企业决策者们做好了数据中心的算力分配方案:25% 给免费层,25% 给中端,25% 给高端,25% 给高溢价层。