SemiAnalysis：从基础设施到模型层，AI价值链上的财富迁移正在提速

AI产业的价值重心正在发生结构性转移。

过去两年间，英伟达、内存厂商及能源供应商主导了AI投资回报的分配，但随着智能体AI（Agentic AI）商业化加速，模型层的利润空间正以前所未有的速度扩张，而掌控算力供应端的英伟达与台积电，却尚未将这一趋势充分反映于定价之中。

Anthropic是这一转变的最直接注脚。据SemiAnalysis最新研究，Anthropic的年化营收（ARR）已从年初的90亿美元飙升至440亿美元以上，其推理基础设施的毛利率同期从38%跃升至逾70%。与此同时，代币（token）生产成本因硬件迭代和软件优化大幅压缩，价值与成本之间的剪刀差持续扩大，推动模型厂商进入利润率快速抬升的新阶段。

在供应端，英伟达和台积电坐拥最稀缺的资源，却尚未对当前的需求盛况作出充分的价格响应。SemiAnalysis认为，这一定价滞后构成了一个重要的市场错位：以Vera Rubin（VR NVL72）为代表的下一代系统具备显著的价格上调空间，而谁能在这场价值重新分配中抢占先机，将深刻影响AI产业链各环节的投资逻辑。

AI价值池的三年迁移路径

2023年至2025年间，AI投资的超额回报主要集中在基础设施层。

英伟达于2023年5月首次发布爆款财报，单日盘后大涨25%，正式开启AI投资浪潮。2024年，Vistra和GE Vernova分别上涨265%和146%，跻身标普500表现最强个股，能源瓶颈成为市场焦点。2025年，内存板块接棒领涨，SanDisk、Western Digital、Seagate和Micron等均录得全年逾200%的涨幅，存储供需失衡成为驱动定价的核心变量。

与此同时，模型厂商和推理服务商的毛利率长期承压。彼时AI的实际效用被批评者认为不过是"更好的谷歌搜索"加上聊天界面，与数万亿美元的预期资本开支严重背离。

这一格局在2025年底出现了根本性的转变。

智能体AI：重塑代币经济学的拐点

SemiAnalysis将2025年12月视为AI商业化的真正拐点——智能体AI开始稳定运行，并在企业工作流中大规模落地。这一变化的核心意义，在于它从根本上改变了代币的经济价值。

以SemiAnalysis自身为例，其年化代币支出已相当于员工薪酬总额的约30%，每名员工每月消耗代币量超过50亿个，是Meta内部人均水平的5倍以上。研究团队列举了多个真实案例：原本需要初级分析师数小时完成的财务建模、图表制作和盈利分析等工作，现在通过智能体以极低的代币成本即可完成，而同等人力成本曾高达数百至数千美元。

与此同时，代币的生产成本正在急剧下降。SemiAnalysis估算，在智能体任务场景下，运行Opus 4.7的实际混合价格约为每百万代币0.99美元，远低于5美元/25美元的官方标价——原因在于智能体工作负载具有极高的输入输出比（约300:1）和超过90%的缓存命中率，大量代币落入最低价格档位。

硬件层面的加速同样显著。相较于一年前的H100，Blackwell系列在前沿工作负载下每秒可生成的代币数量提升约30倍。进一步对比显示，最优化配置下的GB300 NVL72相较最优化H100在FP8精度下吞吐量提升约17倍，切换至FP4后这一差距扩大至32倍，而总拥有成本（TCO）仅高出约70%。

价值与成本的双向剪刀差，正是Anthropic毛利率从38%跃升至70%以上的核心驱动力。

模型层定价权：为何不会被竞争蚕食

面对模型厂商利润率的快速扩张，市场最常见的质疑是：竞争最终会压低价格。SemiAnalysis对此持保留意见，并给出两点支撑。

其一，前沿闭源模型的定价权依然稳固。尽管开源模型的基准测试成绩不断刷新，但在真实的知识工作场景中，其表现仍明显弱于闭源前沿模型。以Kimi K2.6（定价0.95美元/4美元）为例，其对Anthropic Opus定价的下行压力十分有限。

其二，算力约束意味着没有任何一家前沿实验室能够独自满足整个市场的需求。Anthropic已开始通过将Claude Code锁定在每月100美元以上订阅门槛背后、限制第三方接入等方式主动管理需求，代币需求在可预见的未来将持续超过供给。这一结构性稀缺赋予了前沿模型厂商按价值而非成本定价的底气。

Anthropic已通过产品线策略兑现这一逻辑：Opus fast定价是普通Opus的6倍，即将推出的Mythos定价为25美元/125美元，是普通Opus的5倍，而头部企业客户仍愿意为这些高价SKU买单。SemiAnalysis表示，若Anthropic将Mythos fast定价至150美元/750美元，其本身也会是付费用户。

英伟达与台积电：稀缺资源的定价滞后

然而，掌握最核心稀缺资源的两家公司——英伟达与台积电——却并未充分跟上这一波价值重估。

台积电的N3先进制程产能已成为整个AI算力扩张最紧张的瓶颈。英伟达、博通、Annapurna、联发科和AMD均在争夺有限的N3晶圆配额，而N3产能利用率预计将在2026年下半年突破100%。DRAM晶圆厂利用率已超过90%，内存整体供应偏紧，但定价却相对保守。

SemiAnalysis认为，台积电完全有条件大幅提价，且客户不仅会接受，部分客户甚至会欢迎——英伟达就是典型案例：若TSMC提价意味着竞争对手获得更少产能配额，英伟达支付更高晶圆价格反而有利于巩固其市场地位。英伟达CEO黄仁勋2024年曾公开表示台积电应该提高晶圆价格，其背后逻辑正在于此。

英伟达自身的定价策略也呈现出类似的保守倾向。SemiAnalysis指出，英伟达的定价框架仍锚定于此前"单位算力愿付价格随时间下降"的假设，但这一假设已不再成立。随着智能体工作负载爆发，算力需求不再是线性增长，而是呈现复合加速态势。

Rubin系统：量化Nvidia的定价空间

以即将于2026年下半年发布的Vera Rubin（VR NVL72）为参照，SemiAnalysis构建了一套"一图定乾坤"（One Chart to Rule Them All）的定价分析框架，从成本端与价值端分别锚定租金定价的地板与天花板。

成本端（地板）：基于Neocloud（新兴云服务商）项目内部收益率（IRR）不低于15.6%的部署门槛，VR NVL72每小时每GPU的最低租金需达约4.92美元，方可维持Neocloud的部署意愿。

价值端（天花板）：以GB300当前5年期合约租金约每PFLOP 0.70美元为锚点，VR NVL72对应的租金上限约为每GPU每小时12.25美元。

目前，VR NVL72系统定价仅使每PFLOP成本降至约0.28美元，相比GB300 NVL72降幅达60%，远超历史趋势线的改善幅度。这意味着Nvidia的服务器价格存在约40%的上调空间，即便调价后仍可为Neocloud留下足够利润空间，且整体成本改善幅度依然低于历史趋势。

SOCAMM内存定价是另一个关键变量。VR NVL72采用插槽式LPDDR5X内存模组（SOCAMM），可与计算单元独立定价。SemiAnalysis估算，英伟达在2026年一季度支付的SOCAMM合同价约为每GB 8美元，较上季度有显著跳升；预计至2026年底，SOCAMM价格可能超过每GB 13美元。在此背景下，英伟达若在SOCAMM上实现60%的毛利率，逻辑上具备合理性：一方面内存供应受限、英伟达掌握最大份额优势；另一方面，VR NVL72在TCO层面的性能领先地位使客户缺乏替代选择。

价值归宿：谁在赢，谁在等

SemiAnalysis的框架揭示出当前AI价值分配的核心矛盾：代币经济学的改善正在迅速推高模型厂商、推理服务商及Neocloud的利润，但作为算力供给端最稀缺资源的掌控者，英伟达和台积电的定价行为与其供给稀缺性之间存在明显错位。

这一错位的持续，本质上是一种主动选择——英伟达正在扮演类似"AI中央银行"的角色，通过软件效率提升向下游输送价值，以维持生态系统的长期扩张动力，同时规避反垄断监管压力。台积电则延续了历史上"稳定生态、不吃尽上行红利"的定价哲学。

然而随着推理ROI日益清晰、价值定价逻辑在市场中普及，这两家公司向价值定价框架切换的压力将持续上升。一旦切换发生，AI产业链的价值分配格局将再度重塑——届时，算力供给端的议价权将在更大程度上向硬件层回归。