在全球科技舞台的聚光灯下,DeepSeek已成为不容忽视的新星。自其发布以来,不仅在AI产业链上掀起波澜,还让科技巨头如OpenAI和英伟达都感到了前所未有的震撼。DeepSeek的迅速崛起,无疑标志着AI领域的一场奇袭战已经打响。
DeepSeek的初步成绩单令人瞩目。数据显示,仅仅上线5天,其日活跃用户就超越了ChatGPT,而在20天后,日活更是突破2000万人次大关,达到了ChatGPT日活的23%。这一增速,让DeepSeek迅速成为全球范围内增长最快的AI应用之一。
在国内AI领域,DeepSeek的出现更是引发了狂欢。阿里云、百度云、腾讯云以及字节火山引擎等巨头纷纷宣布支持DeepSeek,同时,百度昆仑芯、天数智芯、摩尔线程等芯片厂商也接连表态,将加入支持DeepSeek模型的行列。这一连串的动作,不仅彰显了DeepSeek的强大吸引力,也标志着国产AI厂商在全球竞赛中迈出了坚实的一步。
然而,DeepSeek的成功并非没有争议。关于其是否真正实现了大模型的技术突破,业界存在诸多质疑。有观点认为,DeepSeek之所以能够实现低成本高效能,是通过大幅缩减模型参数规模,或者依赖其母公司幻方早期囤积的廉价算力。这些质疑,无疑给DeepSeek的成功蒙上了一层阴影。
但不可否认的是,DeepSeek的“小力出奇迹”打法确实有其独到之处。DeepSeek-R1在参数量仅为1.5亿的情况下,就在数学基准测试中超越了GPT-4等大模型。同时,轻量化模型在推理能力与性能方面表现出色,训练和运行成本更低,这使得DeepSeek在中小型企业和个人开发者中迅速占据了市场地位。
幻方对DeepSeek的加成作用也不容忽视。作为国内最早一批闯入大模型赛道的企业,幻方在AI领域的布局早已开始。从2017年宣称要实现投资策略全面AI化,到成立AI公司并自研深度学习训练平台“萤火一号”、“萤火二号”,幻方在AI领域的投入可谓不遗余力。因此,DeepSeek的成功,可以说是国产AI厂商在大模型布局中水到渠成的结果。
当前,国内已具备培育“DeepSeek”的客观条件。人工智能相关企业数量超过4500家,核心产业规模接近6000亿元人民币。芯片、算法、数据、平台、应用等各个环节都在快速发展,以大模型为代表的人工智能普及率已达16.4%。然而,DeepSeek的技术路径依赖风险仍然存在,尤其是其“数据蒸馏技术”不断遭受质疑。过度依赖蒸馏可能导致基础研究停滞,降低模型多样性,这是DeepSeek乃至整个国产大模型赛道需要面对的挑战。
除了技术之争,DeepSeek还引发了全球科技圈对开源、闭源的激烈讨论。近年来,开源大模型如雨后春笋般涌现,2024年全年开源大模型品牌超过10个。DeepSeek的快速走红与其开源模式密不可分。然而,开源与否在大模型赛道上仍有待商榷。一方面,开源AI公司在融资方面相对劣势;另一方面,开源AI的定义愈发复杂,不少科技巨头宣称的开源模型实际上并不完全透明。
尽管DeepSeek在某些方面带来了新的突破,缓解了全球大模型赛道的部分焦虑,但算力需求依然不可忽视。DeepSeek目前仅支持文字问答、读图、读文档等功能,尚未涉及图片、音频和视频生成领域。一旦想要拓展这些功能,算力需求将呈爆炸式增长。因此,在AI需求鼎盛的当下,算力建设仍然至关重要。
同时,DeepSeek绕开了“芯片大关”的做法虽然引人称道,但优质的算力基础设施在相同投入下往往能提供更高的算力效率与商业回报。因此,大模型赛道的“追芯”游戏在算力角逐环节中并未结束。英伟达下一代GPU以及国内AI芯片国产化进程的加速,都预示着算力建设将更加激烈。