ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

Grok 3发布引热议,竟在数学基础问题上栽跟头?

时间:2025-02-19 14:22:59来源:IT之家编辑:快讯团队

近日,科技界巨头埃隆·马斯克携其xAI团队,在一场备受瞩目的直播活动中,正式揭晓了备受期待的Grok 3。此前,马斯克通过一系列预热宣传,已将公众对Grok 3的期望推向巅峰。然而,这款被马斯克寄予厚望的人工智能模型,在实际表现上却未能如其宣传般惊艳。

直播现场,马斯克宣称Grok 3在数学、科学与编程领域的基准测试中,已超越当前所有主流模型,并计划将其应用于SpaceX的火星任务计算。他甚至大胆预测,未来三年内,Grok 3有望实现诺贝尔奖级别的科学突破。然而,现实却给这份豪情泼了一盆冷水。

发布后不久,一些媒体即对Grok 3的Beta版进行了测试,并提出了一个看似简单实则刁钻的问题:“9.11与9.9哪个大?”令人惊讶的是,被誉为“最聪明”的Grok 3,竟未能正确回答这个问题,引发了网友的一片嘲讽,戏称其为“天才不屑回答简单问题”。

不仅如此,在xAI发布会直播中,当Grok 3被要求对游戏《流放之路 2》的职业与升华效果进行分析时,也给出了大量错误答案。更令人意外的是,即便是马斯克本人,也未能察觉这些显而易见的错误。

尽管在官方PPT中,Grok 3在大模型竞技场Chatbot Arena中的表现看似遥遥领先,但实际上,其与DeepSeek R1和GPT4.0的差距仅有1%到2%。这一数据无疑给Grok 3的“领先”地位打上了一个大大的问号。

在发布会上,马斯克透露,为了打造Grok 3,他们使用了超过20万张H100芯片,总训练小时数更是达到了惊人的两亿小时。然而,与之形成鲜明对比的是,DeepSeek V3仅使用了2000张H800芯片,训练时间也仅有两个月,但其性能却与Grok 3相差无几。这一现象表明,随着模型规模的不断扩大,性能提升的边际效应已经越来越明显。

面对外界的质疑,马斯克在社交媒体上表示,当前的Grok 3仅为测试版,完整版将在未来几个月内推出,并诚邀用户反馈使用中的问题。这一表态,无疑为Grok 3的未来留下了一丝悬念。

更多热门内容
《封神2》口碑票房双挑战,乌尔善如何应对?系列未来何在?
这部备受期待的电影在春节档的表现却并不尽如人意。值得注意的是,《封神2》背后的出品方北京文化近年来经历了诸多风波。这对于当前处境艰难的北京文化而言无疑是一项艰巨的任务。 总而言之,《封神2》虽然遭遇了一些挫…

2025-02-19

华为Mate XT三折叠屏新机发布,2.6万高价你会入手吗?
毕竟Mate XT的独特折叠设计和顶级配置加上华为这个品牌的影响力,让这款产品依然吸引到了一批忠实粉丝。 同时,华为的品牌影响力也不容小觑,在全球市场的努力让消费者对品牌的认同感与日俱增,毕竟谁不想用上“高端…

2025-02-19

京东新福利!外卖骑手将享五险一金,行业标杆立起来!
首先,为外卖骑手缴纳五险一金不仅是对劳动者基本权益的尊重,更是对劳动法的落实。通过为骑手提供五险一金,京东无疑在向社会传递着一个积极信号:劳动者的付出应该得到应有的保障。 展望未来,期待更多的企业能响应京东…

2025-02-19