阿里开源Qwen3：混合思考模式，多语言支持，强化Agent调用能力！-信息流-小熊财经

阿里巴巴在周一正式推出了通义千问3.0（Qwen3）系列模型，并将其全面开源。据阿里介绍，Qwen3在数学、编程等多个领域的性能表现，已经可以媲美DeepSeek等业界顶尖模型，并且在部署成本上具有显著优势。

Qwen3系列涵盖了两个专家混合（MoE）模型和六个其他类型的模型。阿里表示，旗舰型号Qwen3-235B-A22B在代码、数学和通用能力等方面的基准测试中，与DeepSeek-R1、OpenAI的o1等顶级模型相比，表现毫不逊色。Qwen3-30B-A3B这款MoE模型，其激活参数数量仅为QwQ-32B的十分之一，但性能却更为出色，甚至Qwen3-4B这样的小模型，其性能也能与Qwen2.5-72B-Instruct相媲美。

阿里巴巴此次还开源了两个MoE模型的权重，包括拥有超过2350亿总参数和220多亿激活参数的Qwen3-235B-A22B，以及总参数约300亿、激活参数30亿的Qwen3-30B-A3B。同时，六个Dense模型也已全面开源，包括Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B，所有模型均在Apache 2.0许可下开放。

阿里表示，Qwen3系列支持119种语言，基于近36万亿个token进行训练，数据量是Qwen2.5的两倍。Qwen3的训练数据涵盖了教材、问答对、代码片段等多种内容，通过三个阶段的预训练，模型能够处理更长的输入，具备更强的语言技能和通用知识。

Qwen3不仅在性能上有所提升，还在调用工具、执行指令以及复制特定数据格式等方面表现出色。阿里推荐使用Qwen-Agent来充分发挥Qwen3的Agent能力，Qwen-Agent通过封装工具调用模板和解析器，降低了代码复杂性。

Qwen3的发布也引起了开源社区的热烈反响。有网友表示，Qwen3-235B在高维张量运算方面的表现令人惊艳，甚至可以与Sonnet相媲美。还有网友对Qwen3的基准测试结果表示难以置信，称赞其性能如同魔法一般。开源AI的支持者更是激动不已，认为Qwen3的开源将极大地推动AI领域的发展。

不少网友对阿里积极推动开源表示感谢，认为Qwen3的开源将为AI社区带来更多的可能性和机遇。阿里表示，Qwen3是其在通用人工智能（AGI）和超级人工智能（ASI）道路上迈出的重要一步，未来将继续优化模型架构和训练方法，推动AI领域的持续发展。