ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

DeepSeek火爆背后:开源社区,国产大模型的强大支撑?

时间:2025-02-05 06:04:23来源:南方都市报编辑:快讯团队

在刚刚过去的春节假期,一款名为DeepSeek的中国国产大模型意外走红,成为了科技领域的话题焦点。这款大模型不仅引起了业界的广泛关注,还深入到了普通人的生活与工作中。

DeepSeek的发布可以追溯到1月20日,由中国大模型公司深度求索推出其推理大模型DeepSeek-R1。该模型的发布迅速在业界引起了轰动,仅仅一周后的1月27日,DeepSeek应用便成功登顶苹果中国区和美国区应用商店的免费App下载排行榜。紧接着,在1月31日,美国科技巨头英伟达、亚马逊和微软在同一天宣布接入DeepSeek-R1,进一步彰显了其影响力。

DeepSeek的成功不仅仅是AI领域的一次突破,更是一次破圈现象。它不仅在技术上达到了国际先进水平,更重要的是,其可用程度和完成度极高,引发了广泛的讨论,从而吸引了众多普通人的关注。这款大模型的出现,让AI技术更加贴近人们的生活,成为了他们日常工作和生活的一部分。

DeepSeek的成功也体现了国产大模型的能力。它不仅展示了中国AI技术的实力,还有望追赶甚至反超世界先进水平。DeepSeek还大幅降低了AI模型的训练成本。据悉,其R1模型的训练成本仅为557.6万美元,相比之下,OpenAI的GPT模型训练成本则高达1亿美元。

面对DeepSeek所取得的成就和业界的广泛赞誉,深度求索(DeepSeek)的创始人梁文锋却表现得十分谦逊。他表示:“我们不过是站在开源社区巨人们的肩膀上,给国产大模型这栋大厦多拧了几颗螺丝。”梁文锋所提到的“巨人”——开源社区,即开放源代码,它允许用户利用源代码进行修改和学习,为技术的发展提供了巨大的推动力。

开源策略不仅具有世界大同的美好愿景,同时也承载着利益动机。通过开源,可以吸引全球开发者和研究者的关注,形成一个强大的技术社区。这个社区具备敏捷性和协作优势,能够形成“技术共享-生态繁荣-反哺创新”的正向循环。因此,在竞争中处于弱势的一方往往会选择开源策略来扭转局势。在计算机行业中,一个封闭的生态往往对应着一个开放的、开源的生态。

如今,开源已经成为AI迅猛发展的助推剂。meta首席人工智能科学家、2018年图灵奖得主杨立昆在评价DeepSeek时指出:“与其说是中国在人工智能上超越美国,不如说是开源代码正在超越私有模式。DeepSeek从开放研究和开放源码中受益良多,例如meta的PyTorch和LLaMA等项目。”

实际上,meta在推动AI大模型开源方面发挥了重要作用。从LLaMA大模型到图像分割模型Segment-Anything,meta开源的项目覆盖了各种模态和场景。其中,LLaMA是最强大的开源大模型之一。2023年7月,meta发布的LLaMA2更是将开源协议从“仅研究可用”转向“免费可商用”,虽然催生了一大批“套壳大模型”,但也改变了大模型竞争中OpenAI独占鳌头的格局。在这些开源大模型中,DeepSeek无疑是最强大的之一。

DeepSeek的成功验证了开源模型可以接近甚至达到闭源性能的水平,这反过来将促使meta等巨头加大对开源AI的投入。最近,meta又开源了多个AI项目,包括图像分割模型SAM 2.1、多模态语言模型Spirit LM等,进一步提升了AI在图像处理和语音识别领域的能力。

然而,尽管开源促进了AI的迅猛发展,但我们也应该看到其中的隐忧。开源的本质是用开放促效率,但在当今世界,效率在很多时候已经不再是第一位的考虑。AI技术是由软硬件两方面构成的,在硬件逐渐走向封闭的同时,软件的开源是否也会走向封闭?这是一个值得中国AI界深思的问题。因此,我们需要提前做好应对之策,用创新和开放来回应封闭的挑战,正如DeepSeek所做的那样。

更多热门内容
逆势扩张150㎡,用“大店思维”让张亮麻辣烫在县域称王
从71㎡小店到150㎡大店,张建军用7年时间完成了县城里从生存到引领的蜕变。他的经历验证了县域经济的一个道理:真正的下沉不仅是模式降维,更是门店空间和服务内容的重构。在张建军看来,餐饮从业者的护城河,从来不在那多收的“三五斗”,而在于持续进化的勇气。当绝大

2025-04-08

解锁音频分离新技能!三款神器助你轻松搞定
在音视频创作领域,分离人声是一项关键技能。无论是制作伴奏、提取台词还是进行二次创作,掌握高效的音频分离方法都能显著提升工作效率。本文将为你介绍三款实用工具,并重点解析制片帮音分轨的功能优势,助你轻松提取纯净人声。一、音频分离的核心技术音频分离主要依赖

2025-04-01

为都市生活注入无限生命力 上海时装周GORE-TEX品牌空间限时开启
接棒巴黎时装周,GORE-TEX品牌在上海时装周期间又有大动作——2025年3月27日~30日,于洛克外滩源UNiTN空间打造“LIVE新生—GORE-TEX品牌空间”城中热事,精妙创意装置与各路高奢、时尚、户外品牌热门单品融合,吸引众多行业合作伙伴、潮流 ICON 齐聚,共同探索 GORE-TEX

2025-04-01

中建携手泓基支持全民持股协调项目股权加快落地见效,全民持股项目股权即将发放超百亿元!
截至3月底,中建集团与香港泓基集团控股有限公司携手推进的全民持股项目股权政策现如今已进入了全面完工阶段,据悉其中有着些许插曲,双方秉持着保障参与者的切身利益,展开了多次讨论协商,终于在三月底确定了解决方案。受制于专款专用相关法律条例的工程款已移交至泓

2025-03-31

开启全民智驾时代!台铃定义电动两轮出行新格局
行业首发智驾大模型Tai-Link,台铃开启电动两轮车全民智驾时代!3月24日,以“开眼”为主题的台铃2025眼说者大会暨赤兔25新品发布会在北京新华网媒体创意工场举办。台铃发布Tai-Link智驾系统,并携革命性技术台铃V6扁线轮毂电机及新品火眼机甲·赤兔2025重磅亮相。行业首

2025-03-26

模型SOTA、开放API与微调、首次引入CoT,Mureka完成全球首秀,拿下AI音乐的顶流宝座
3月26日,昆仑万维正式发布Mureka O1模型与Mureka V6模型。Mureka O1作为全球首款音乐推理大模型,性能超越Suno、模型登顶SOTA,中国科技创新再次在AI音乐领域领跑全球。2024年4月,昆仑万维发布了第一代音乐生成模型:Mureka V1(SkyMusic),获得了非常好的市场反响。在

2025-03-26

泰国政要与皇家乐团见证JAECOO 7曼谷车展上市,ARDIS赋能越野新篇章
3月25日,在泰国曼谷车展上,奇瑞子品牌OMODAJAECOO旗下精致越野车型JAECOO 7正式上市,曼谷市长与财政副部长等多位政要莅临,曼谷皇家交响乐团现场表演,共同见证这一重要时刻。当天,JAECOO 5、OMODA C7等全新车型同步亮相车展,进一步展现品牌丰富的产品矩阵。2025年

2025-03-25

春华秋实保丰收 中国人寿财险护航春耕备耕
犁开希望千重浪,险筑金仓万户安。今年中央一号文件指出,要持续增强粮食等重要农产品供给保障能力。一直以来,中国人寿财险高度重视粮食安全问题,坚持聚焦主责主业,推进农险扩面提质,做好三大主粮保险、制种保险、地方特色农险等保险保障工作。数据显示,2024年,中

2025-03-17

泓基集团上市一周年:正式开通股票市场交易,开启财富共享新篇章
今日,香港泓基集团(控股)有限公司隆重举行上市一周年庆典,作为此次庆典活动的重要时刻,同时推出备受瞩目的原始股权置换计划。此次与香港交易所(港交所)的深度合作,将进一步推动公司国际化发展进程,为更多追梦人和广大投资者提供参与机会。自2024年3月8日成功上市以

2025-03-10