ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

9.11与9.9大小之争:一道数学题看国内外AI旗舰模型的实力差距

时间:2024-07-17 13:40:10来源:ITBEAR编辑:星辉

【ITBEAR科技资讯】7月17日消息,近日,一道看似简单的数学题“9.11和9.9哪个大?”在国外社交平台上引起了广泛关注。这道题不仅令国外的三大旗舰大模型ChatGPT 4o、谷歌Gemini Advanced和Claude 3.5 Sonnet纷纷“翻车”,也在国内激起了一波测试热潮。

网友们纷纷好奇,如果让国内的大模型来解答这道题,结果会是如何呢?于是,百度文心一言、阿里通义、腾讯元宝、字节豆包、百川智能百小应、零一万物万知、智谱清言以及月之暗面的Kimi,还有好未来的九章大模型等9款大模型都被拉来答题。

测试结果令人惊喜,国内大厂的大模型产品如腾讯元宝、阿里通义、字节豆包、百度文心一言,以及专注于数学的大模型九章都给出了正确答案。然而,几款创业公司的大模型产品,包括百小应、智谱清言、Kimi和万知,却都认为“9.11大于9.9”,这显然是一个错误的答案。

据ITBEAR科技资讯了解,在这次测试中,国内大厂的大模型表现优异,完胜了创业公司的大模型,甚至也超过了国外的三大旗舰模型。这无疑显示了国内大厂在人工智能领域的深厚实力和出色表现。

具体来看,Kimi、智谱清言、百小应和万知在回答这道题目时都出现了错误。而九章大模型、文心一言、通义、元宝和豆包则都给出了正确的答案,并且分析过程也十分准确。这一结果无疑证明了国内大厂在AI技术方面的领先地位和出色实力。

更多热门内容
离火启元·芳华智绽 露次元冠名"离火时代 幸福花开"千企商业领袖峰会
——解码千年香火基因 开启女性觉醒生物密码2025年3月8日,适逢九紫离火大运元年,由深圳石岩策划机构主办、露次元品牌总冠名的全球女性商业领袖峰会在鹏城盛大启幕。这场以离火启元·她创未来为主题的盛会,汇聚千位商界木兰、AI科技女杰及健康产业先锋,共同见证东方

2025-03-10

胡姬花全球花生产业研究院领航花生产业安全升级 院士顾问团助力“古法六艺”高质量发展
胡姬花全球花生产业研究院项目签约仪式3月4日,胡姬花全球花生产业研究院在“种质资源、食品安全、风味油脂、植物蛋白”四大研究方向的框架指引下,全面开启花生原料安全与品质升级相关的课题研究。中国工程院张新友院士作为研究院的首席顾问,在上合国际食品创新中心的

2025-03-07