ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

AI推理成本骤降,免费时代即将到来?姚欣详解PPIO派欧云实践

时间:2024-12-26 06:16:23来源:甲小姐甲子光年编辑:快讯团队

在科技行业的瞩目下,一场关于人工智能未来的深度探讨在北京中关村国家自主创新示范区展示中心举行。2024年12月10日至12月11日,“万千流变,一如既往”甲子引力年终盛典汇聚了70余位科技领域的重量级嘉宾,他们分享了人工智能、机器人、科学智能以及新质生产力等领域的最新进展与独到见解。

在这场盛会中,PPIO派欧云的联合创始人兼CEO、前PPTV创始人姚欣带来了题为《PPIO派欧云实践与洞察:从算力过剩到推理制胜》的精彩演讲。姚欣指出,尽管大型模型推动了智算中心的建设热潮,但当前面临的使用率低下问题不容忽视。同时,从2023年上半年大模型创业训练的热潮到后来的降温,算力结构正经历显著变化。

姚欣强调,AI应用的需求正在发生深刻变革。大型模型正从面向VC的泡沫炒作阶段逐步走向To B落地阶段,并有望未来进入To C阶段。然而,当前制约AI应用广泛普及的关键因素在于推理成本。一旦成本降低,AI应用将迎来爆发式增长。企业可以通过多种途径进行推理成本优化,包括硬件降本(如硬件梯次利用)、算力调度(根据需求波峰波谷合理配置资源)以及推理加速。

姚欣进一步预测,2025至2026年将成为AI的转折之年。随着AI推理成本每年近十倍的下降,大量AI应用的收入将足以覆盖全部推理成本,AI应用有望迎来免费时代。这一预测基于对当前算力市场及AI技术发展趋势的深入分析。

姚欣回顾了自己从PPTV创业到蓝驰创投的投资经历,并指出在新基建推进过程中,大量数字基础设施的建设同样面临挑战。他分享了一组数据,自2015年以来,数字新基建持续发展,互联网数据中心的年增速保持在30%至50%之间,机架上架数量在300万至1000万之间。然而,机房利用率在不同地区存在显著差异,全国平均利用率不到50%,出现了“IDC过剩”现象。这一现象在智算中心建设中同样可能出现。

在需求侧方面,姚欣指出,2023年上半年大模型迎来爆发,但进入2024年后,大模型热度明显降温。参与大模型预训练的企业数量显著下降,部分公司放弃了预训练方向。同时,新的Scaling Law正在从预训练转向后训练,包括微调和推理环节。这一变化使得模型在处理复杂问题时的逻辑性更强,成为当前行业发展的显著趋势。

姚欣还提到了OpenAI发布会引发的关注,特别是音视频生成领域的进展。他强调,新一代多模态大模型将带来更大的推理消耗,对算力需求提出了更高的要求。

姚欣表示,AI应用的发展将经历与移动互联网类似的过程。在移动互联网应用落地的早期,生产力类工具占主导,随着发展逐渐转向更多娱乐、休闲、消费等应用。AI应用也将从生产力工具开始,逐步扩展到更多场景。当前,AI成本正在快速下降,但尚未足够低廉以覆盖所有应用场景。只有商业模式明确的To B应用或具备生产力功能的To C工具才能承受当前成本。

然而,姚欣相信,随着技术的进一步发展,AI应用将迎来一个关键的交叉点。就像移动互联网在2014至2015年间依靠免费广告模式覆盖视频成本,迎来爆发式增长一样,AI应用也将迎来类似的时刻。

在探讨推理成本优化方面,姚欣指出,PPIO派欧云作为一家分布式云计算企业,从最底层的IaaS基础设施到PaaS平台服务,再到上面的大模型应用服务,进行了全程观察。推理成本的下降主要源自硬件降本、算力调度和推理加速三大方面的优化。

硬件降本方面,PPIO派欧云通过寻找更便宜的电力资源、充分利用硬件资源以及硬件梯次利用等措施降低成本。算力调度方面,PPIO派欧云通过智能调度和提前部署数据与计算任务,实现资源高效利用和全局负载平衡。推理加速方面,PPIO派欧云结合产学研最新成果,通过一系列技术手段提升推理效率。

姚欣还分享了PPIO派欧云的具体实践。PPIO派欧云在全国乃至亚洲范围内与本地合作伙伴建立合作,整合各类算力资源,加入算力共享平台。通过优化硬件配置、实现硬件成本的最大化利用和摊销,PPIO派欧云成功降低了推理成本。

以一个典型的8B模型为例,该模型在PPIO平台上发布时的百万token费用为0.1美元,而几个月后已降至4分钱。姚欣预计,到明年4月,成本还将进一步下降至当时的十分之一。这一降本成果并非通过补贴实现,而是通过高效的资源整合和调度、优化硬件利用率以及提升模型性能和推理加速来达到的。

PPIO派欧云的成功实践不仅为客户提供了更高的性价比,还助推了客户的发展。例如,一家知名的小说推文APP采用PPIO派欧云的模型能力替代自有模型架构,推理成本降低了70%,生图速度提升了5倍,业务用量和营收在短短一个月内实现了3倍多的增长。同样,PPIO派欧云也将业务扩展到海外市场,帮助全球Top10招聘网站通过大语言模型进行简历筛选和优化,显著减少了人工需求。

姚欣表示,中国企业在AI云计算领域取得的技术积累和资源优势,使得我们具备了与全球一流云计算公司和硅谷创新公司竞争的实力。通过合理的成本控制和高效的性能优化,PPIO派欧云的技术和服务在全球市场上表现出强大的竞争优势。

更多热门内容