阿里Qwen2.5逆袭登顶！全球开源大模型新霸主诞生，Meta也败下阵来？-信息流-小熊财经

在9月19日的云栖大会上，阿里云CTO周靖人重磅发布了通义千问的新一代开源模型Qwen2.5。这款旗舰模型Qwen2.5-72B在性能上成功超越了拥有4050亿参数的Llama 405B，再次登顶全球开源大模型的宝座。

Qwen2.5-72B在MMLU-redux等十多个基准测评中表现超越Llama3.1-405B

据ITBEAR了解，Qwen2.5全系列涵盖了多种尺寸的大语言模型、多模态模型、数学模型以及代码模型，且每个尺寸都提供了基础版本、指令跟随版本及量化版本，总计推出了100多个模型，这一数字刷新了业界的纪录。这些模型在18T tokens的数据上进行了预训练，相较于Qwen2，Qwen2.5的整体性能有了18%以上的显著提升。

在具体能力方面，Qwen2.5-72B模型在MMLU-rudex基准、MBPP基准以及MATH基准上的得分分别高达86.8、88.2和83.1，展示了其在通用知识、代码能力和数学能力方面的强劲实力。此外，该模型还支持高达128K的上下文长度，并能生成最多8K的内容。值得一提的是，Qwen2.5还具备强大的多语言能力，支持包括中文、英文、法文等在内的29种以上语言。

在模型尺寸方面，Qwen2.5开源了7个不同尺寸的模型，从0.5B到72B，这些模型在同等参数规模下都创造了业界的最佳成绩。特别地，3B尺寸的模型被视为适配手机等端侧设备的理想选择；而32B尺寸的模型则因其出色的性价比而备受开发者期待，它在性能和功耗之间达到了优异的平衡。

HuggingFace数据显示，截至9月中旬Qwen系列原生模型和衍生模型总数超过5万个

在专项模型领域，Qwen2.5也取得了显著进展。用于编程的Qwen2.5-Coder和用于数学的Qwen2.5-Math相较于前代模型都有了实质性的提升。特别是Qwen2.5-Math，它支持使用中英双语的思维链和工具集成推理来解决数学问题，被誉为迄今为止最先进的开源数学模型系列。

此外，在多模态模型方面，备受瞩目的视觉语言模型Qwen2-VL-72B也正式开源。这款模型能够识别不同分辨率和长宽比的图片，理解超过20分钟的长视频内容，并具备了操作手机和机器人的视觉智能体能力。在最近的权威测评中，Qwen2-VL-72B成功摘得了全球得分最高的开源视觉理解模型的桂冠。

自2023年8月开源以来，通义千问在全球开源大模型领域的地位日益凸显，已逐渐成为开发者们的首选模型。其卓越的性能和不断丰富的生态网络为其赢得了广泛的赞誉和关注。

关键词：#通义千问# #Qwen2.5# #开源模型# #全球领先# #多模态能力#

阿里CEO吴泳铭放言：AI的新战场在物理世界，手机屏已不是边界？

他强调，尽管过去22个月AI发展迅猛，但仍处于AGI变革初期。吴泳铭表示，AI计算正迅速成为计算体系的核心，推动数字与物理世界的深刻变革，并引发计算架构的根本性转型。他进一步指出，新增算力市场中，AI驱动的需…

2024-09-19

阿里云CTO周靖人放大招：AI大基建全面升级，未来已来？
2024-09-19

iPhone16销量惨淡，苹果市值暴跌近5000亿，果粉都去哪了？
2024-09-19

曾志伟与小杨哥对峙，究竟谁才是“撒谎大王”？
2024-09-19

小鹏P7+惊艳亮相：C级AI汽车颜值巅峰，你心动了吗？

悬浮式的双层尾翼：尾部创新性采⽤悬浮式双层尾翼设计，不仅有强烈的视觉冲击⼒，更是将空⽓动⼒学发挥到极致，配合尾部扩散器，有效降低⻛阻。全新智驾方案，不受城市、路线、路况的限制，具备“门到门”以及“车位到车位”…

2024-09-19

蔚来或接手奥迪比利时工厂，传统巨头与新能源新贵的交锋？

自那以后，蔚来当地车型的名称以“EL”和“ET”（IT之家注：分别对应SUV及轿车）开头。尽管工人对工厂未来的不确定性持续存在，奥迪布鲁塞尔工厂在停产两个月后，于上周二恢复了两班生产。今年7月初，奥迪宣布将对…

2024-09-19

比亚迪股价震荡，主力资金大撤离！市场风向变了？

9月19日，比亚迪今日主力资金净流出1.12亿元，近3日获主力资金累计流出1.78亿元。截至收盘，比亚迪报255.36元/股，下跌1.19%。来源：金融界…

2024-09-19