ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

AI拐点浪潮下,亚马逊云科技:以自研野心筑基,用务实策略破局

时间:2026-01-11 06:02:49来源:快讯编辑:快讯

“为何不共同探索一个充满希望的未来?为何不在创新、想象与治愈的道路上走得更远?”在亚马逊云科技(AWS)第14届re:Invent全球大会上,一连串发人深省的问题拉开了这场科技盛宴的序幕。作为全球云计算领域的领军者,AWS在2025年交出了一份令人瞩目的成绩单:第三季度营收同比增长超20%,全年营收有望突破1320亿美元,资本支出预计达1250亿美元,创下历史新高。

在生成式人工智能(AI)浪潮的推动下,AWS正加速前行。其Amazon Bedrock平台服务的客户数量在一年内实现翻倍,其中处理超万亿规模tokens的客户已超过50家。这一数据背后,是AWS对AI基础设施的深度布局与持续创新。面对全球AI产业处于关键转折点的现状,AWS提出一个大胆的设想:为何不重构整个社会创新的基石?

在AI基础设施领域,AWS展现出全栈自研的雄心。亚马逊云科技大中华区产品部总经理陈晓建指出,要打造一个具备强大扩展性、最佳性能与最低成本的基础设施,必须从软件到硬件进行全栈优化,而AWS正是唯一具备这种能力的企业。在re:Invent大会上,AWS展示了从基础芯片、计算实例、模型平台到应用工具的完整技术栈,其中芯片无疑是核心环节。

陈晓建透露了自研训推芯片Amazon Trainium 3的最新进展。作为AWS首款基于3nm工艺的芯片,Trainium 3在计算性能、能效、内存容量与带宽等方面均实现显著提升。其计算性能是Trainium2的4.4倍,能效提高40%,内存容量增至144GB HBM3e,带宽提升1.7倍。更引人注目的是,Trainium 3支持大规模Ultra Servers与Ultra Clusters部署,单个服务器最多可集成144个芯片,集群规模可扩展至数十万甚至上百万芯片。

自研芯片的优势在于成本与性能的双重优化。相较于通用架构的英伟达GPU,ASIC架构的Trainium 3专为AI训练设计,去除了不必要的图形渲染、游戏优化等模块,从而在固定AI任务上实现更高的性能密度与能效。据透露,Anthropic、Karakuri等客户已通过Trainium将训练与推理成本降低至原来的50%。目前,AWS已部署超过100万颗Trainium芯片,业务规模达数十亿美元,尤其在Amazon Bedrock平台上,绝大部分推理服务已通过Trainium实现。

AWS的自研野心不止于算力芯片。自2017年投入自研芯片以来,AWS已形成三条产品线:基于Arm架构的Graviton系列负责通用计算,Trainium和Inferentia专攻AI训练与推理,Nitro系统芯片则负责网络、存储与安全功能的卸载。AWS还在构建一个闭环的AI基础设施生态,从芯片到实例计算,从存储到数据库,从训练到推理,形成全方位覆盖。

在本次re:Invent大会上,AWS推出了一项创新产品——Amazon AI Factory。这是一个私有的AWS区域,允许客户利用自身数据中心与电力容量,由AWS协助建设最先进的AI基础设施。该方案整合了最新的英伟达GPU、Amazon Trainium芯片以及Amazon SageMaker和Bedrock平台,为每个客户独立运营,确保资源与业务的完全隔离,同时保持与AWS相同的安全性与可靠性。这一模式为因数据主权、监管合规等因素无法采用公有云的客户提供了新的选择。

如果说基础设施是土壤,那么Agent(智能体)则是这片土地上结出的果实。2025年被称为Agent元年,AWS正以务实的方法论推动Agent的落地应用。亚马逊云科技大中华区解决方案架构总经理代闻指出,企业逐渐意识到,不存在一个“万能”的大模型,企业的知识与流程才是核心资产,而Agent则是将这些资产转化为生产力的工程化手段。

在亚马逊内部,Agent的应用已超过4万个。代闻发现,Agent的普及不仅带来工具的更新,更推动生产关系的重构。首先是组织形态的重塑,人机协作成为常态,传统的线性管理模式逐渐失效,企业需要建立新的协作范式与组织方法论。其次是角色边界的重塑,个体职能向“AI指挥官”转变,配套工具的重要性日益凸显。

代闻以销售与开发场景为例,说明Agent如何提升效率。在销售场景中,经理可利用Amazon Quick Suite生成详尽的客户报告,自动整合客户最新上市信息、舆情与内网历史交易数据,大幅提升拜访前的准备效率。在开发场景中,产品经理(PM)可借助AI“召唤”工程师协助制作原型,实现想法的快速验证,无需依赖研发排期。

企业拥抱AI的模式主要有两种:一种是成立小规模新团队,充分拥抱AI原生工作状态;另一种是对原有开发团队进行转型,这需要强有力的制度指引与工具支持。代闻认为,真正的变革需要“推”“拉”结合:“推”是设计新的KPI考核方式,“拉”是提供好用的工具。他引用一句名言:“工作属于你,而不是工具。”在AI时代,这种对技术的“自驱力”将变得更加重要。

更多热门内容