大模型时代：算力浪费竟超50%！百度AI计算部负责人揭秘算力成本之谜-企业动态-贝尔财经

【ITBEAR】9月15日消息，在AI大模型时代，算力成本已成为业界关注的焦点。百度系统架构师、百度智能云AI计算部负责人王雁鹏近日分享了关于如何有效降低万卡集群算力开支的见解，提出了五大解决方案。

王雁鹏指出，随着深度学习技术的不断发展，GPU集群规模已达万卡级别，这使得大模型时代的算力成本远超人力成本。为了应对这一挑战，他提出了包括搭载RDMA网络、采用自动并行策略、确保训练稳定性、动态分配算力以及实现多芯异构混训在内的五大策略。

据ITBEAR了解，RDMA网络的应用在AI集群中显得尤为重要。与传统的IB网络相比，RDMA网络更适合AI集群的需求，它优先考虑吞吐量而非延迟，从而有效提升了AI集群的带宽有效率和模型性能。

此外，王雁鹏还强调了自动并行策略在AI集群演进中的重要性。通过采用“边计算边通信”的方式和显存优化的切分策略，百度成功提高了模型性能，甚至超越了开源模型和人工调优模型的效果。

在谈到训练稳定性时，王雁鹏表示，稳定不间断的任务运行对于AI训练至关重要。百度通过一系列技术手段，如Hang检测、慢节点检测等，确保了文心一言大模型的有效训练时长比例超过99%。

针对资源利用率问题，王雁鹏提出了训练一体的解决方案。通过动态分配算力流量和资源，百度百舸异构计算平台成功将资源利用率从50%提升至90%，从而有效应对了主流模型训练中的劣势。

最后，王雁鹏探讨了多芯异构混训在解决算力卡脖子问题中的关键作用。他提出，通过搭建跨芯沟通库和采用Accelerator抽象设计方法，百度实现了在千卡和万卡规模下性能损失的最小化。

展望未来，王雁鹏透露百度将继续在三个核心技术上寻求突破：实现更高效的拓扑和拥塞控制、扩大跨地域RDMA网络范围以及进一步提升训练故障恢复速度。这些技术突破将为百度在未来十万卡级别的AI集群竞争中占据有利地位提供有力支持。

关键词：#百度# #AI大模型# #算力成本# #RDMA网络# #多芯异构混训#

3年亏损8亿。作者|苏洁编辑|刘钦文戴上智能眼镜走进厨房，当你看向橱柜或冰箱时，智能眼镜会直接在物品上方显示其保质期、热量、营养成分;在办公室，有了智能眼镜，你可以将视频或文档放在你想要放置的任何位置……目之所及，既是现实世界，也伴随着一个孪生的数字世界

2025-07-17

作者：爱旭研发中心上期文章笔者已经对激子倍增技术原理进行了浅析，本期将从激子倍增技术的优势与挑战出发，着重介绍激子倍增技术的应用，尤其是在光伏领域中的应用。自从20世纪50年代在半导体材料中发现载流子倍增现象[1]，激子倍增(MEG)技术得到快速发展，为突破传统

2025-07-11

作者：爱旭研发中心一、引言：传统理论的突破者——激子倍增光伏技术作为可再生能源的核心方向，其能量转换效率始终是研究重点。在早期科学家的认知中，一个光子通常只能激发单个电子-空穴对(激子)，对应单结硅基太阳电池的理论效率上限为33%[1]。然而，激子倍增(multi

2025-07-11

“开业当月现金流回正，平均18个月回本”的财富密码正在席卷投资圈【2025年7月1日，福建泉州】当电竞产业年产值突破1.5万亿元大关，一个颠覆传统的投资机会正引发市场震动。国内直营电竞连锁龙头品牌——艾尔文电竞正式宣布启动《百城合伙人计划》，以独创的“品牌方全

2025-07-11

7月8日，被誉为 “消费品质量奥斯卡大奖”、代表家居生活消费品质量性能风向标的沸腾质量奖，在中国建博会(广州)这一舞台上，见证了众多优秀企业凭借卓越品质与创新实力斩获殊荣，为行业树立全新的质量标杆，推动家居建装行业迈向高质量发展的新征程。箭牌瓷砖参评的摩

2025-07-11

7月2日，2025年泰国可再生能源展(ASENA)在曼谷诗丽吉王后国家会议中心盛大举行。在这一泰国最具影响力的行业展会上，爱旭携ABC全系组件惊艳亮相，以极致创新引领零碳新时代。在爱旭的展台现场，光伏的前沿创新触手可及。适配地面场景的“北极星”、水面场景的“天狼星”

2025-07-09

随着136号文正式落地，近十年来借着行业成长趋势“策马狂奔”的众多光伏企业不得不考虑握紧缰绳：新能源发电全面入市，宣告着光伏行业正式告别“扶一把，送一程”的成长阶段。在供应端，随着快速增长的潮水逐渐褪去，以往不重视技术积累、产品质量的“裸泳者”将很快被

2025-07-02

在四川大学城区的商业街上，于海波的张亮麻辣烫门店几乎天天排队。这位黑龙江汉子用五年时间，从餐饮门外汉成长为管理8家门店的连锁经营者。他的回答总是干脆利落，不加修饰——82年的，2018年来的四川，8家店——这种不浮夸的务实态度，恰恰是他成功的密码。没有麻辣烫

2025-06-30

2025年6月于上海SNEC光伏展会期间，爱旭股份宣布与中国科学技术大学光电子实验室、济南圣泉集团达成两项战略合作。此次合作旨在推进ABC技术在农业与建筑领域的场景化应用，通过产学研协同创新构建零碳技术解决方案。针对农光互补项目中的作物光照难题，爱旭与中科大光电

2025-06-27

2014年，国家统计局数据显示黑龙江农村居民人均可支配收入仅为10453元。同年，黑龙江尚志市开道村的段连君惊奇地发现：在北京，一家60平米的张亮麻辣烫门店日营业额就能突破万元。从那一年开始，段连君的人生轨迹与这家源自东北的餐饮品牌融汇在一起，共同经历了中国餐

2025-06-27