马斯克Grok3问鼎AI榜首，20万GPU加持下能否经受住市场考验？-财经人物-小熊财经

近期，科技界迎来了一场震撼发布——马斯克麾下的xAI公司推出了备受瞩目的Grok 3人工智能模型。这款被誉为“地球上最聪明的人工智能”的新品，在直播发布会上吸引了超过百万观众的瞩目，马斯克亲自站台，展示了其无与伦比的实力。

Grok 3背后的超级计算机集群Colossus，拥有惊人的20万块GPU，为其提供了强大的算力支持。在多项AI基准测试中，Grok 3展现出了卓越的能力，尤其是在数学、科学和编程领域，其表现更是令人瞠目结舌。例如，在美国数学邀请赛(AIME)的模拟测试中，Grok 3取得了52分的高分，远超ChatGPT的20分。在GPQA测试中，Grok 3更是以满分75分的成绩傲视群雄，而ChatGPT仅得57分。在编程能力的比拼中，Grok 3同样以57分大幅领先ChatGPT的28分。

发布会上，马斯克还展示了Grok 3的另一项绝技——生成复杂动画和游戏。这一能力在其他AI模型中极为罕见，无疑为Grok 3增添了更多的神秘色彩。然而，尽管在基准测试中表现出色，Grok 3在实际应用中却遭遇了一些挑战。部分用户反馈称，在处理特定问题时，Grok 3的回答会出现错误，这引发了对其稳定性的质疑。对于经济学和社会学等领域的问题，Grok 3的回答也显得不够精准，这或许是因为模型训练时未能全面覆盖这些领域。

尽管Grok 3在多项测试中取得了优异成绩，但它仍未能解决“表情符号之谜”这一困扰AI模型多年的难题。这一挑战仍然摆在Grok 3面前，等待其去攻克。

事实上，Grok 3已经成为第一个在AI基准测试平台lmarena.ai上得分超过1400分的模型，这一成绩在该平台上堪称天花板级别。相比之下，其他模型如ChatGPT的得分仅在1000分左右。然而，尽管Grok 3在理论上取得了如此辉煌的成就，但在实际应用中仍需面对诸多挑战。用户对其稳定性和特定领域知识覆盖面的质疑，将成为其未来能否在市场上站稳脚跟的关键。