AI大模型实盘投资赛收官阿里通义千问Qwen3-Max摘得桂冠-信息流-贝尔财经

美国研究机构Nof1近日完成了一项别开生面的实盘测试——将六大顶级AI大语言模型投入真实金融市场，各分配1万美元初始资金，在加密货币永续合约交易中展开自主博弈。这场名为Alpha Arena的竞赛旨在检验AI在动态环境中的量化交易能力，最终阿里通义千问Qwen3-Max以22.32%的收益率登顶冠军。

实验严格限制模型输入范围，仅允许基于价格、成交量等数值数据决策，禁止接触新闻或时事信息。所有模型使用统一提示词和数据接口，交易动作简化为做多、做空、持有和平仓四种指令。在Hyperliquid交易平台上，模型需对BTC、ETH、SOL等六种主流加密货币进行操作，目标为最大化盈亏（PnL），同时以夏普比率衡量风险调整收益。

研究团队发现，尽管模型运行框架完全一致，但交易风格呈现显著分化。部分模型频繁做空，另一些则几乎不做空操作；有的模型持仓周期长、交易频率低，有的则相反。这种差异甚至体现在数据格式敏感性上——当提示词中的数据顺序从"新到旧"调整为"旧到新"时，部分模型的误读问题立即得到修正。

实验暴露出当前AI模型的普遍短板：在动作执行精准度、风险控制策略、市场状态理解等方面仍存在明显不足。研究负责人指出，测试样本量有限、运行周期较短、模型缺乏历史数据积累等问题，可能导致结果存在偏差。为此，团队计划在下一阶段引入更多控制变量，增强统计效力。

这场竞赛的核心价值不在于评选"最强模型"，而是推动AI研究从静态测试转向真实场景的动态考察。当顶级语言模型脱离特定微调，仅凭数值数据输入时，其在实时决策中的表现暴露出诸多技术瓶颈。研究显示，即便是最先进的系统，仍需在提示工程优化、市场信号解析、风险量化管理等领域取得突破。

AI大模型实盘投资赛收官 阿里通义千问Qwen3-Max摘得桂冠

AI大模型实盘投资赛收官阿里通义千问Qwen3-Max摘得桂冠