ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

阿里开源Qwen3:混合思考模式,多语言支持,强化Agent调用能力!

时间:2025-04-29 06:51:19来源:华尔街见闻编辑:快讯团队

阿里巴巴在周一正式推出了通义千问3.0(Qwen3)系列模型,并将其全面开源。据阿里介绍,Qwen3在数学、编程等多个领域的性能表现,已经可以媲美DeepSeek等业界顶尖模型,并且在部署成本上具有显著优势。

Qwen3系列涵盖了两个专家混合(MoE)模型和六个其他类型的模型。阿里表示,旗舰型号Qwen3-235B-A22B在代码、数学和通用能力等方面的基准测试中,与DeepSeek-R1、OpenAI的o1等顶级模型相比,表现毫不逊色。Qwen3-30B-A3B这款MoE模型,其激活参数数量仅为QwQ-32B的十分之一,但性能却更为出色,甚至Qwen3-4B这样的小模型,其性能也能与Qwen2.5-72B-Instruct相媲美。

阿里巴巴此次还开源了两个MoE模型的权重,包括拥有超过2350亿总参数和220多亿激活参数的Qwen3-235B-A22B,以及总参数约300亿、激活参数30亿的Qwen3-30B-A3B。同时,六个Dense模型也已全面开源,包括Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B,所有模型均在Apache 2.0许可下开放。

阿里表示,Qwen3系列支持119种语言,基于近36万亿个token进行训练,数据量是Qwen2.5的两倍。Qwen3的训练数据涵盖了教材、问答对、代码片段等多种内容,通过三个阶段的预训练,模型能够处理更长的输入,具备更强的语言技能和通用知识。

Qwen3不仅在性能上有所提升,还在调用工具、执行指令以及复制特定数据格式等方面表现出色。阿里推荐使用Qwen-Agent来充分发挥Qwen3的Agent能力,Qwen-Agent通过封装工具调用模板和解析器,降低了代码复杂性。

Qwen3的发布也引起了开源社区的热烈反响。有网友表示,Qwen3-235B在高维张量运算方面的表现令人惊艳,甚至可以与Sonnet相媲美。还有网友对Qwen3的基准测试结果表示难以置信,称赞其性能如同魔法一般。开源AI的支持者更是激动不已,认为Qwen3的开源将极大地推动AI领域的发展。

不少网友对阿里积极推动开源表示感谢,认为Qwen3的开源将为AI社区带来更多的可能性和机遇。阿里表示,Qwen3是其在通用人工智能(AGI)和超级人工智能(ASI)道路上迈出的重要一步,未来将继续优化模型架构和训练方法,推动AI领域的持续发展。

更多热门内容