在AI大模型领域,一场由中国科技公司DeepSeek掀起的变革正在全球范围内引发轰动。这家成立仅一年多的初创公司,以其独特的推理模型DeepSeek-R1,向行业巨头发出了挑战。
DeepSeek-R1以不到GPT二十分之一的成本,实现了与OpenAI顶尖推理模型相当的能力。这一消息迅速传开,不仅在中国科技界引起轰动,更让大洋彼岸的美国科技股市场遭遇了“黑色风暴”。1月27日,费城半导体指数狂泻9.2%,创下近年来最大单日跌幅,英伟达股价重挫近17%,市值一夜之间蒸发近6000亿美元。博通、台积电、ASML、Google和微软等科技巨头也未能幸免,股价纷纷下跌。
DeepSeek的创始人梁文锋,是量化基金幻方量化的创始人。他早年便涉足AI领域,早在算力紧缺的2023年,幻方量化便是国内拥有万块规模显卡的五家公司之一。DeepSeek的崛起,无疑为梁文锋在AI领域的深耕细作增添了浓墨重彩的一笔。
DeepSeek的成功,打破了AI大模型领域“拼投入”的惯常逻辑。以往,人们普遍认为只有砸钱、砸算力才能做出好的大模型。然而,DeepSeek却以极低的成本和高效的模型性能,向这一观念发起了挑战。其研究员提出的新MLA架构与DeepSeek MoESparse结合,显存占用仅为常用MHA架构的5%-13%,同时通过“数据蒸馏”降低了数据计算程度,实现了降本。
DeepSeek的开源策略更是对全球AI行业产生了深远影响。与OpenAI和谷歌等旗下的AI产品闭源不同,DeepSeek选择公开模型的代码和架构,允许公众查看、使用和修改。这一策略极大降低了中小企业的研发成本,推动了AI技术的普及。
在全球开源浪潮的背景下,DeepSeek的开源策略无疑为AI行业的发展注入了新的活力。meta的LLaMA、阿里的通义千问等开源AI产品也在试图证明“开放才能赢未来”。开源不仅促进了技术的交流和迭代,更推动了AI技术的普及和应用。
DeepSeek的崛起,不仅引发了全球资本市场的震动,更让美国科技霸权感受到了前所未有的压力。在英伟达股价大幅下跌的背后,是其AI芯片霸权的逐渐被终结。随着DeepSeek等中国AI企业的崛起,全球AI产业的格局正在发生深刻变化。
DeepSeek带来的技术路径转变,不仅是对美国科技霸权的有力回击,更让全球开发者重新认识到中国AI的巨大潜力。在美国不断通过各种限令限制中国AI和芯片发展的背景下,DeepSeek等中国AI企业的崛起,无疑为全球AI产业的发展注入了新的动力。
DeepSeek的崛起也为中国国产芯片的发展带来了机遇。随着DeepSeek不断发展壮大,未来将逐步采用更多国产芯片,有效降低产业链风险。在DeepSeek的引领下,国产芯片有望逐步从中低端迈向高端,最终摆脱对美国芯片的依赖。
DeepSeek的成功,不仅是中国AI企业的胜利,更是全球AI行业发展的里程碑。它证明了通向AGI(通用人工智能)的道路并非只有硅谷这一种走法。DeepSeek以其实力和创新,为全球AI行业的长期发展探索出了新的模式。