在人工智能(AI)领域,训练与推理两大环节各司其职,犹如学习与考试的双重阶段。训练过程如同学生汲取知识,依赖海量数据与强大算力;而推理则仿佛学生应对考试,要求迅速且准确地解答实际问题。随着AI应用场景日益广泛,推理算力的需求不断攀升。据国际数据公司(IDC)数据显示,2022年,云端推理算力占比已达58.5%,预计到2026年,这一比例将上升至62.2%。
近期,一家在端侧AI芯片研发领域深耕11年的上市公司,宣布将重心转向大模型推理算力。7月25日,在2025年世界人工智能大会(WAIC)前夕,云天励飞(688343.SH)推出了深穹Edge200芯片以及深穹X6000 Mesh推理计算卡等新品。
深穹X6000 Mesh推理加速卡具备256Tops的算力,专为AI推理计算设计,支持30fps的1080p视频解码,能够处理千亿参数的大模型推理应用。基于这款加速卡,云天励飞还推出了深目6203视频高密2U推理一体机、天舟6408大模型4U推理一体机,以及天舟680G大模型满血版8U推理一体机等产品,最高可提供4PFlops的推理算力,助力AI模型的商业化应用。
云天励飞董事长兼CEO陈宁表示,公司正全面聚焦于AI推理芯片。他认为,2025年是AI发展的重要转折点,大模型技术日趋成熟,模型调用成本大幅降低。同时,当前AI推理芯片市场仍处于蓝海阶段,市场规模相对较小,但预计未来三至五年内,其增长速度将远超训练芯片。这不仅标志着AI从训练时代迈入推理时代,也预示着推理算力需求将迎来爆发式增长。
在技术方面,云天励飞自研了“算力积木”架构,以及神经网络处理器核心IP和芯片,专注于大模型的高效推理,为AI的普惠应用提供算力支持。自2020年起,云天励飞全面转向国产工艺,成为首家采用国产Chiplet工艺的AI芯片公司。
经过11年的发展,云天励飞已推出五代NPU(神经网络芯片),并形成了一系列产品矩阵。其DeepEdge10芯片平台已成功适配DeepSeek系列模型、QwQ-32B模型及国产鸿蒙操作系统,为客户提供全国产的软硬一体化解决方案。基于自研AI推理芯片,云天励飞与生态合作伙伴共同推出了面向云、边、端的AI推理产品系列,包括模组、边缘智能盒子、AI推理加速卡、大模型推理一体机,以及智算服务器等。
随着AI热潮的兴起,云天励飞的业绩持续增长。财报显示,2024年,公司营业收入超过9亿元,同比增长81.3%。截至2025年第一季度,公司营收达到2.64亿元,同比大增168.23%,创下历史同期新高。在消费级业务方面,云天励飞通过岍丞技术的智能穿戴设备和噜咔博士的AI硬件产品线,预计2025年上半年将保持50%以上的增速。
如今,云天励飞在研发11年NPU的基础上,进一步发力大模型推理算力,发布了针对推理算力的AI芯片及算力卡,并布局了一体机、智算中心等方案。这些产品将广泛应用于智算中心、智慧城市和具身智能等领域。
对于为何从边缘AI计算战略转变为AI模型推理算力,陈宁表示,在中国,AI推理芯片是推动AI产业大规模落地的关键领域和关键技术。未来五年,大模型、算法和推理芯片为核心的AI技术将重新定义人类所有的电子产品;未来五到十年,以推理芯片为核心的AI算力网络将无处不在。
云天励飞深穹X6000 Mesh加速卡具有多项核心技术特点,包括采用自研第四代神经网络处理器(NPU),高效支持Transformer架构;Edge芯片采用国产工艺制造,并通过自主可控国产化C级认证;这是国内首颗量产的基于国产先进工艺的“算力积木”架构的AI芯片,实现了片间算力扩展,满足千亿级大模型部署需求。
陈宁透露,基于深穹X6000 Mesh推理加速卡的推理一体机正在逐步量产落地。同时,云天励飞在智算中心领域也有所布局,服务于城市级智算中心建设、科研院所、运营商以及互联网大厂等客户。
在AI算力需求方面,随着开源模型降低企业使用门槛、推理算力成本不断降低,以及AI应用的快速扩展,推理算力需求持续增长。AMD CEO苏姿丰表示,未来几年,AI推理算力需求预计将每年增长超过80%,有望超过训练成为数据中心计算的主要驱动力。
云天励飞CTO李爱军透露,公司下一代AI推理芯片将采用新型计算、近存计算、NB-Mesh新型互联、新型封装以及NB-Link通用扩展性等五项重要升级,预计将于2026年底陆续推出。
面对国产芯片发展的挑战与机遇,陈宁表示,云天励飞一直专注于基于矩阵类的并行计算芯片,团队拥有克服挑战的决心和信念。同时,公司持续拥抱国产工艺,拥有市场差异化竞争优势。