ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

低成本高效率!斯坦福团队打造媲美OpenAI推理模型s1

时间:2025-02-06 12:48:39来源:砍柴网编辑:快讯团队

近期,人工智能领域迎来了一项引人注目的新突破。一份最新发布的研究报告显示,斯坦福大学与华盛顿大学的科研团队,仅花费了不到50美元(当前汇率下约为364元人民币)的云计算成本,便成功打造出一个具备卓越“推理”能力的人工智能模型——s1。

这款名为s1的模型,在数学与编程能力测试中,展现出了与OpenAI的o1及DeepSeek的r1等业界顶尖推理模型相当的水平。尤为s1模型及其训练所用的全部数据与代码,均已在GitHub平台上开源,供全球开发者共享与学习。

s1团队透露,他们采用了“蒸馏”技术来构建这一模型。该技术通过训练模型去模仿并学习另一个模型的答案,从而提炼出其“推理”能力。具体而言,s1是从谷歌的推理模型Gemini 2.0 Flash Thinking Experimental中蒸馏而来。有趣的是,上个月,加州大学伯克利分校的研究人员也运用了相同的蒸馏方法,但成本高达约450美元,创建了一个人工智能推理模型。

s1模型的问世,引发了业界对于人工智能模型商品化的深刻思考。若能够以相对低廉的成本复制出价值数百万美元的模型,那么大型科技公司的竞争优势何在?这一疑问无疑给行业带来了新的挑战与反思。

面对这一新情况,大型人工智能实验室表现出了明显的不悦。例如,OpenAI此前就曾指责DeepSeek不当获取其API数据用于模型蒸馏。而此次s1的推出,无疑加剧了这一领域的竞争与争议。

s1团队的研究人员表示,他们致力于寻找实现强大推理性能和“测试时扩展”的最简洁途径。这些正是OpenAI的o1模型所取得的一些突破性进展。s1的论文指出,通过一种称为监督微调(SFT)的方法,可以利用较小的数据集来蒸馏推理模型。在SFT中,模型被明确指示在数据集中模仿特定行为,这比DeepSeek用于训练R1模型的大规模强化学习方法更具成本效益。

谷歌通过其Google AI Studio平台免费提供了Gemini 2.0 Flash Thinking Experimental模型的访问权限,但设有每日使用限制。然而,其使用条款明确禁止对模型进行逆向工程,以开发与谷歌自身人工智能产品竞争的服务。尽管如此,s1团队仍巧妙地利用了这一资源。

s1基于阿里巴巴旗下中国人工智能实验室Qwen提供的一款小型、现成的免费模型。为了训练s1,研究人员精心策划了一个包含1000个问题及其答案的数据集,并收集了谷歌Gemini 2.0 Flash Thinking Experimental为每个答案提供的“思考”过程。在16个Nvidia H100 GPU的支持下,s1的训练耗时不到30分钟,成本仅为约20美元。

更为巧妙的是,研究人员还为s1设计了一个独特的技巧,让其能够在工作过程中进行自我检查并延长“思考”时间——他们让s1在推理过程中“等待”。论文显示,这一简单的添加,有助于模型获得更为准确的答案。

更多热门内容
人才培养结硕果 向新出发展新颜 ——三峡人寿精算师考试再传捷报
近日,中国精算师职业道德教育培训暨颁证仪式在北京举行,在2024年度下半年中国精算师职业资格考试中,三峡人寿再传捷报,三峡人寿精算团队三名骨干成员获得中国精算师资格证书,团队持证人数比例再创新高。公司产品精算部蒋倩作为优秀考生代表在颁证仪式上发言,展现了

2025-03-09

“离火灼灼耀鹏城 香露润泽绽芳华”——露次元启幕九紫大运时代东方康养智慧新纪元
2025年3月8日,值此三八女神节之际,由中国深圳石岩策划机构主办、露次元品牌总冠名的离火时代 幸福花开企业家千人峰会于深圳启幕。这场恰逢九紫离火大运元年与女神节双重时空坐标的盛会,汇聚千余名商界领袖(其中女性企业家占比达68%)、AI科技先锋及健康产业专家,共同

2025-03-08

盈利再上新阶,易鑫去年收入达98.88亿元,经调整净利达10.79亿
2月27日,汽车金融科技平台易鑫集团(02858,HK,以下简称“易鑫”)2024年度业绩公告出炉。信息显示,去年易鑫业绩全面增长,融资交易量、交易额均实现同比上升。财务数据更是实现历史性突破,2024年收入98.88亿元(人民币,下同),同比增长48%,经调整净利润首次超过10亿元

2025-03-05

搜了APP助农发展推动者-农业发展新活力
在助力农产品销售、促进农业发展的道路上,搜了APP正以其创新的模式和不懈的努力,成为广大农村地区与市场紧密相连的重要纽带,为农业发展带来了新的活力与希望。搜了APP深知农产品销售的痛点所在,传统的销售渠道往往环节过多、信息不畅,导致农产品难以实现优质优价。

2025-03-05

春天花会开,认知启未来:爱采购助力中国企业开年破局
春潮涌动,商机焕新。2月27日,“春天花会开,认知启未来爱采购开工季系列活动在初春的北京正式拉开帷幕。这场为期两天的思想盛宴,以认知升级为桨,以生态链接为帆,通过“开年一课”与“财富游学团”两大主题篇章,为B2B行业开启了一场破局未来的深度探索,在人工智能浪潮中为

2025-02-28