近年来,人工智能领域迎来重大突破,前沿模型在商业化应用上取得显著进展。据权威机构METR评估,Opus 4.6、Gemini 3.1等模型已具备持续独立工作超过1小时的能力,在保持80%任务完成率的前提下无需人工干预。即将发布的Claude Mythos更将这一时长延长至3小时以上,标志着AI模型从"辅助回答"向"自主完成任务"的转型。
任务执行时间的延长直接导致Token消耗量激增。企业衡量AI应用规模的核心指标已转向Token使用量,算力资源随之成为创造价值的关键生产要素。以海外厂商Anthropic为例,其预计2026年第二季度将实现单季度营业利润转正,经营利润达5.6亿美元,年化营业收入(ARR)突破470亿美元。这种变化使算力采购决策从"成本投入"转变为基于投资回报率(ROI)的理性决策。
算力需求结构的转变正在重塑云服务市场格局。此前以模型训练为主的阶段,英伟达GPU凭借绝对性能优势占据主导地位。但随着推理场景成为主流,云厂商开始将关注点转向单Token成本优化。专用集成电路(ASIC)芯片在推理任务中展现出显著优势,其单位计算成本较GPU降低30%以上,促使云厂商加速采购布局。行业预测显示,2027年ASIC芯片出货量将达1590万片,市场份额超越GPU成为主流硬件类型。
台积电先进封装产能的调整印证了这一趋势。其CoWoS封装工艺作为ASIC芯片的核心配套技术,2027年产能预计同比增长87%至266.4万片晶圆。其中,meta、谷歌、亚马逊等云厂商自研芯片占用的产能份额将从2026年的28%提升至32%。这种转变使云厂商在芯片租赁业务中获得更高毛利率,亚马逊Trainium 2和谷歌TPU v6的租赁毛利率均优于同代GPU产品。
芯片设计市场正经历多元化变革。博通虽仍保持高端ASIC设计市场80%以上份额,但谷歌已通过拆分产品线降低依赖度——将第八代TPU分为训练专用的v8t和推理专用的v8i,后者交由联发科设计。亚马逊则通过世芯电子主导Trainium 3物理设计,并增加直接采购芯片组件的流片项目。这种策略调整使云厂商在供应链中掌握更多主动权,2026年第一季度谷歌云和亚马逊AWS的业绩增长即印证了这一转型成效。
当AI集群规模扩展至数万乃至百万级芯片时,芯片间通信效率成为制约计算效能的关键因素。谷歌在TPU v8i中引入的Boardfly拓扑结构,通过板组间直接光纤链路将1024颗芯片集群的网络直径压缩56%,有效解决通信密集型任务的尾部延迟问题。这种架构创新使TPU与光路交换机(OCS)的配比从192:1提升至58:1,推动光学互联方案成为产业标配。
产业链相关企业正迎来发展机遇。AI ASIC设计领域,寒武纪、海光信息等企业加速技术迭代;先进封装环节,通富微电、长电科技等厂商扩大CoWoS产能;高速互联领域,中际旭创、新易盛的光模块产品需求持续增长。这些企业的技术突破与产能扩张,共同支撑着AI算力基础设施的升级转型。