ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

李飞飞团队50美元训练AI模型真相:基于阿里云通义千问微调?

时间:2025-02-06 21:44:29来源:金融界编辑:快讯团队

近期,人工智能领域的一则新闻激起了广泛讨论。据透露,斯坦福大学与华盛顿大学的科研团队,在李飞飞的带领下,仅凭不到50美元的云计算成本,就成功研发出了一款名为s1的人工智能推理模型。该模型在数学与编程能力测试中的成绩,据传与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。

这一消息在AI界犹如一颗震撼弹,引发了诸多疑问与好奇。为了探究真相,《科创板日报》记者深入调查并采访了多位业内人士。调查结果显示,s1模型的训练并非完全从零开始,而是基于阿里云的通义千问(Qwen)模型进行了监督微调。这意味着,s1模型之所以能以如此低的成本实现卓越性能,是因为它站在了一个已经具备强大能力的开源基础模型之上。

根据李飞飞团队的研究论文,s1模型的训练仅使用了1000个样本数据。在AI训练领域,这一数据量可以说是微不足道,通常不足以训练出一个具备推理能力的模型。上海交通大学人工智能学院的谢伟迪副教授表示,仔细研读斯坦福s1的论文后不难发现,s1模型的神奇之处在于它是以通义千问模型为基座进行微调,那1000个样本数据更像是对整体性能的一种“润色”,而非模型训练的全部。

国内一家知名大模型公司的CEO也向《科创板日报》记者透露:“从论文原文来看,所谓用50美元训练出具有推理能力的新模型,实际上只是用从谷歌模型中提炼的1000个样本对通义千问模型进行了监督微调。这种微调的成本确实很低,但明显是站在了既有领先模型的肩膀上。”

斯坦福s1论文原文中明确注明,模型是以阿里通义千问模型为基础进行了微调。谢伟迪指出,国内外还有其他团队也声称以极低的成本训练出了具备推理能力的新模型,但深入阅读其论文原文后,会发现它们都是基于通义模型作为基座进行的。

国外多位人工智能研究者也指出,许多所谓的“新”模型实际上都是建立在通义模型的基础之上的。谢伟迪强调:“以通义千问模型作为基座,确实可以用很少的样本数据就达到产生新的推理模型的效果,但如果换成其他基座模型,新模型的能力却不会有任何提升。所以,真正神奇的是Qwen模型,而不是s1。”

尽管s1模型的低成本训练在一定程度上展示了AI训练的潜力,但其局限性同样不容忽视。首先,这种低成本训练方法依赖于已有的强大基座模型,如阿里通义千问模型。如果没有这样的基座模型,低成本训练的效果将大打折扣。其次,1000个样本数据的训练量在大多数情况下是远远不够的,尤其是在处理复杂任务时。低成本训练的成功也引发了关于AI模型知识产权和伦理问题的广泛讨论。

如果越来越多的研究依赖于已有的基座模型进行微调,那么这些基座模型的开发者是否应该获得相应的回报?如何确保AI技术的公平使用和共享?这些问题都需要业界进行深入探讨和解决。尽管s1模型的低成本训练方法引发了诸多争议,但其背后的研究思路无疑为AI领域带来了新的启示和思考。

更多热门内容
春华秋实保丰收 中国人寿财险护航春耕备耕
犁开希望千重浪,险筑金仓万户安。今年中央一号文件指出,要持续增强粮食等重要农产品供给保障能力。一直以来,中国人寿财险高度重视粮食安全问题,坚持聚焦主责主业,推进农险扩面提质,做好三大主粮保险、制种保险、地方特色农险等保险保障工作。数据显示,2024年,中

2025-03-17

泓基集团上市一周年:正式开通股票市场交易,开启财富共享新篇章
今日,香港泓基集团(控股)有限公司隆重举行上市一周年庆典,作为此次庆典活动的重要时刻,同时推出备受瞩目的原始股权置换计划。此次与香港交易所(港交所)的深度合作,将进一步推动公司国际化发展进程,为更多追梦人和广大投资者提供参与机会。自2024年3月8日成功上市以

2025-03-10

泓基集团上市周年庆典:紧跟国家政策指引,以市场为导向,携手港交所共筑“中国梦”,推进全民持股新时代
2025年3月8日,泓基集团迎来了上市一周年的周年庆,经香港泓基集团(控股)有限公司董事会决定,为加快推动全民持股政策稳步发展,并进一步强化与香港港交所(以下简称“港交所”)的战略伙伴关系,泓基控股集团正式宣布持有原始股权股东可将账户原始股兑换股票进行市场交易

2025-03-10

人才培养结硕果 向新出发展新颜 ——三峡人寿精算师考试再传捷报
近日,中国精算师职业道德教育培训暨颁证仪式在北京举行,在2024年度下半年中国精算师职业资格考试中,三峡人寿再传捷报,三峡人寿精算团队三名骨干成员获得中国精算师资格证书,团队持证人数比例再创新高。公司产品精算部蒋倩作为优秀考生代表在颁证仪式上发言,展现了

2025-03-09

“离火灼灼耀鹏城 香露润泽绽芳华”——露次元启幕九紫大运时代东方康养智慧新纪元
2025年3月8日,值此三八女神节之际,由中国深圳石岩策划机构主办、露次元品牌总冠名的离火时代 幸福花开企业家千人峰会于深圳启幕。这场恰逢九紫离火大运元年与女神节双重时空坐标的盛会,汇聚千余名商界领袖(其中女性企业家占比达68%)、AI科技先锋及健康产业专家,共同

2025-03-08

盈利再上新阶,易鑫去年收入达98.88亿元,经调整净利达10.79亿
2月27日,汽车金融科技平台易鑫集团(02858,HK,以下简称“易鑫”)2024年度业绩公告出炉。信息显示,去年易鑫业绩全面增长,融资交易量、交易额均实现同比上升。财务数据更是实现历史性突破,2024年收入98.88亿元(人民币,下同),同比增长48%,经调整净利润首次超过10亿元

2025-03-05

搜了APP助农发展推动者-农业发展新活力
在助力农产品销售、促进农业发展的道路上,搜了APP正以其创新的模式和不懈的努力,成为广大农村地区与市场紧密相连的重要纽带,为农业发展带来了新的活力与希望。搜了APP深知农产品销售的痛点所在,传统的销售渠道往往环节过多、信息不畅,导致农产品难以实现优质优价。

2025-03-05

春天花会开,认知启未来:爱采购助力中国企业开年破局
春潮涌动,商机焕新。2月27日,“春天花会开,认知启未来爱采购开工季系列活动在初春的北京正式拉开帷幕。这场为期两天的思想盛宴,以认知升级为桨,以生态链接为帆,通过“开年一课”与“财富游学团”两大主题篇章,为B2B行业开启了一场破局未来的深度探索,在人工智能浪潮中为

2025-02-28