ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

Grok 3大战绩背后:马斯克豪掷20万GPU,DeepSeek低成本路线更胜一筹?

时间:2025-02-23 19:46:28来源:钛媒体APP编辑:快讯团队

马斯克的人工智能公司xAI近日震撼发布了其最新的Grok 3大模型,这款模型被马斯克亲自誉为“地球上最聪明的人工智能”。

据悉,Grok 3是在20万块英伟达芯片的庞大算力支持下训练而成,其运算能力相较于上一代模型提升了整整十倍。在xAI的直播演示中,马斯克与三位工程师共同见证了Grok 3在数学、科学和编程等多个基准测试中的卓越表现,成功击败了包括谷歌Gemini、DeepSeek的V3模型、Anthropic的Claude以及OpenAI的GPT-4在内的众多强劲对手。

马斯克透露,Grok 3的训练过程基于大量的合成数据,模型会不断检查数据的逻辑一致性,并自动删除错误数据。在AIME'24数学能力测试、GPQA科学知识评估以及LCB Oct - Feb编程能力测试等多项测试中,Grok 3均取得了优于DeepSeek的成绩,展现了其强大的“思维链”推理机制,能够像人类一样逐步拆解并解决复杂任务。其参数量更是达到了惊人的1万亿级别。

然而,尽管Grok 3在多项测试中表现出色,但其高昂的成本也不容忽视。据透露,Grok 3的训练成本高达30亿美元,这主要得益于其庞大的算力需求。xAI为了在四个月内迅速推出Grok 3,不惜投入巨资建设数据中心,最终在122天内成功启动了第一批10万个GPU。而为了实现更理想的AI性能,团队更是仅用92天就将超算集群的算力翻倍,GPU数量达到了20万块。

以英伟达H100为例,单卡价格约为2.5万至3万美元,这意味着20万块GPU的硬件采购成本就高达60亿美元。再加上配套服务器、网络设备、电力和冷却设施等额外成本,Grok 3的总成本可能高达百亿美元量级。相比之下,DeepSeek的训练成本仅为600万美元,远低于GPT-4的7800万美元。尽管DeepSeek在中文理解和多模态交互方面表现出色,但其低成本模式同样令人瞩目。

Grok 3的发布不仅彰显了马斯克在人工智能领域的雄心壮志,也引发了业界对于算力与成本之间平衡的深刻思考。在AI大模型发展日新月异的今天,如何在保持模型性能的同时降低成本,成为了摆在所有从业者面前的一道难题。而DeepSeek的成功经验无疑为这一难题提供了一个值得借鉴的解决方案。

更多热门内容