ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

Grok 4发布:马斯克口中的“全球最强AI”究竟实力几何?

时间:2025-07-10 21:53:13来源:雷科技编辑:快讯团队

在科技界万众瞩目的期待中,xAI公司的创始人马斯克于北京时间9月10日中午,通过一场略显波折的直播发布会,揭开了新一代人工智能大模型Grok 4的神秘面纱。尽管发布会比预定时间推迟了近一个小时,但马斯克依然自信满满地向世界介绍了这款据称超越所有现有竞争对手的AI产品。

Grok 4在各项测试中展现出了惊人的实力,无论是传统的基准测试,还是难度更高的SAT考试以及各学科GRE水平测试,都取得了令人瞩目的成绩。然而,真正让业界震撼的是,Grok 4在被誉为“人类最后一场闭卷考试”的HLE测试中,实现了44.4%的准确率,远超此前所有模型的表现。

马斯克在直播中毫不吝啬地赞誉Grok 4,称其智慧程度已超过几乎所有学科的研究生,甚至在学术问题上超越了所有学科的博士水平,且毫无例外。他进一步透露,Grok 4的基础模型第七版即将在本月完成,未来还将通过强化学习等后训练手段,进一步提升其视频理解能力和工具调用能力。xAI的未来规划还包括推出代码模型、多模型智能体以及视频生成模型。

Grok 4的技术突破不仅体现在纸面上的数据,更在于其广泛的应用潜力。在AIME25、HMMT25、GPQA等主流基准测试中,Grok 4再次刷新了大模型的极限成绩,其中Grok 4 Heavy甚至在AIME25上取得了满分。而在HLE测试中,Grok 4以25.4%的准确率领先,借助工具后更是提升至44.4%,展现了其在解决复杂专业问题上的卓越能力。

然而,就在发布会前夕,xAI首席科学家Igor Babuschkin的突然离职,为这场盛宴蒙上了一层阴影。尽管如此,马斯克依然信心满满地展示了Grok 4在商业场景模拟、实时信息抓取、库存管理、供应商联系等方面的强大能力,甚至预测Grok 4未来或许能发现新的物理定律。

在直播现场,Grok 4展示了其对HLE测试中专家级题目的准确解答,以及高效管理自动售货机库存、设定价格等商业运营能力。Grok 4还能实时抓取社交平台上的信息,整理出时间线,甚至能识别出团队中头像最古怪的人,展现了其强大的信息处理和整合能力。

尽管Grok 4在发布会上展现了惊人的实力,但并非没有瑕疵。在语音能力的演示中,Grok 4在被要求“唱一首歌”时,却以朗读的语气念出了歌词,暴露了其在多模态理解上的不足。发布会整体的仓促节奏和高管离职的消息,也让人们不禁对xAI的内部稳定性和产品节奏产生质疑。

面对全球最强的两大竞争对手——OpenAI的ChatGPT和Google的Gemini,Grok 4的技术实力虽然不容忽视,但真正的挑战在于平台、生态和用户。马斯克为Grok 4设计的有性格、敢说话、更自由的人设,虽然让其更具吸引力,但也增加了翻车的风险。因此,Grok 4的未来表现,还需经过市场的检验和用户的认可。

更多热门内容