ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

AI大模型实盘投资赛收官 阿里通义千问Qwen3-Max摘得桂冠

时间:2025-11-04 12:10:22来源:快讯编辑:快讯

美国研究机构Nof1近日完成了一项别开生面的实盘测试——将六大顶级AI大语言模型投入真实金融市场,各分配1万美元初始资金,在加密货币永续合约交易中展开自主博弈。这场名为Alpha Arena的竞赛旨在检验AI在动态环境中的量化交易能力,最终阿里通义千问Qwen3-Max以22.32%的收益率登顶冠军。

实验严格限制模型输入范围,仅允许基于价格、成交量等数值数据决策,禁止接触新闻或时事信息。所有模型使用统一提示词和数据接口,交易动作简化为做多、做空、持有和平仓四种指令。在Hyperliquid交易平台上,模型需对BTC、ETH、SOL等六种主流加密货币进行操作,目标为最大化盈亏(PnL),同时以夏普比率衡量风险调整收益。

研究团队发现,尽管模型运行框架完全一致,但交易风格呈现显著分化。部分模型频繁做空,另一些则几乎不做空操作;有的模型持仓周期长、交易频率低,有的则相反。这种差异甚至体现在数据格式敏感性上——当提示词中的数据顺序从"新到旧"调整为"旧到新"时,部分模型的误读问题立即得到修正。

实验暴露出当前AI模型的普遍短板:在动作执行精准度、风险控制策略、市场状态理解等方面仍存在明显不足。研究负责人指出,测试样本量有限、运行周期较短、模型缺乏历史数据积累等问题,可能导致结果存在偏差。为此,团队计划在下一阶段引入更多控制变量,增强统计效力。

这场竞赛的核心价值不在于评选"最强模型",而是推动AI研究从静态测试转向真实场景的动态考察。当顶级语言模型脱离特定微调,仅凭数值数据输入时,其在实时决策中的表现暴露出诸多技术瓶颈。研究显示,即便是最先进的系统,仍需在提示工程优化、市场信号解析、风险量化管理等领域取得突破。

更多热门内容