一场聚焦AI大模型投资能力的全球顶级赛事“Alpha Arena”近日落下帷幕,阿里旗下千问Qwen凭借出色表现摘得桂冠。这场由第三方机构Nof1主办的竞赛,自启动以来便吸引全球目光,其创新性在于让AI模型直接参与真实市场交易,通过自主决策与实战检验模型实力。
竞赛于10月中旬启动,持续17天,六大顶尖AI模型同台竞技。参赛阵容包括阿里千问Qwen3-Max、DeepSeek v3.1两款中国模型,以及GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4四款美国模型。所有模型均以一万美元初始资金入场,在完全无人工干预的条件下,根据实时市场数据自主制定投资策略并执行交易,最终以收益率高低决出胜负。
比赛结果引发行业震动:阿里千问Qwen以22.32%的收益率稳居榜首,DeepSeek v3.1同样实现盈利,成为仅有的两款盈利模型。反观美国阵营,四大模型集体折戟,其中GPT-5亏损幅度超过62%,在所有参赛模型中排名垫底。这一结果不仅打破“美国AI技术全面领先”的固有认知,更证明中国模型在复杂金融场景中的决策能力已具备国际竞争力。
据技术分析,Qwen的胜利得益于其多维度优势:在市场趋势判断环节,模型展现出对短期波动的精准捕捉能力;风险控制方面,通过动态调整仓位比例有效降低回撤;交易执行层面,高频操作与低延迟响应形成技术壁垒。相比之下,部分美国模型因过度依赖历史数据回归分析,在突发市场变化中表现乏力,暴露出算法适应性不足的缺陷。
这场竞赛为AI大模型的应用边界提供了新注解。当行业仍在争论模型规模与性能关系时,真实场景的实战数据已给出答案:技术落地能力正成为衡量AI价值的核心指标。随着金融领域对智能化决策需求持续增长,具备实战经验的AI模型或将重塑行业生态,而中国科技企业的此次突破,无疑为全球AI竞赛注入新的变量。