近期,一款名为Deepseek的AI聊天机器人在全球范围内引发了广泛关注。这款源自中国的产品,不仅在本土市场表现抢眼,还成功超越了谷歌的Gemini,跃居全球AI聊天机器人受欢迎程度排行榜的第二位。
特斯拉CEO埃隆·马斯克在最近的一次采访中,对中国工程师表示了高度赞赏。他指出,中国拥有众多才华横溢且充满进取心的工程师,因此中国能够创造出众多伟大的科技成果,Deepseek便是其中之一。马斯克认为,这充分展示了中国人才辈出的现状。
然而,尽管对Deepseek给予了一定的肯定,马斯克却并未将其视为AI领域的一次革命性突破。他相信,包括他旗下AI公司在内的众多AI企业,很快将推出比Deepseek更出色的模型。
谷歌DeepMind的首席执行官、2024年诺贝尔化学奖得主德米斯·哈萨比斯也对Deepseek发表了看法。他称赞Deepseek的AI模型可能是他所见过的中国最佳作品之一,但同时也指出,从技术层面来看,Deepseek并未带来重大的科学进展,而是利用了已知的人工智能技术。哈萨比斯还表示,谷歌最新发布的Gemini 2.0 Flash模型在效率上超过了Deepseek。
Deepseek自2023年5月成立以来,凭借其极低的成本和出色的性能,迅速吸引了市场的广泛关注。其背后的支持者是国内对冲基金巨头幻方量化。2024年5月,Deepseek发布了开源的第二代MoE大模型DeepSeek-V2,该模型在性能上与GPT-4 Turbo相当,但价格却仅为GPT-4的百分之一。因此,Deepseek被业界戏称为“价格屠夫”和“AI界的拼多多”。
2025年1月,Deepseek推出的R1模型在数学、代码、自然语言推理等任务上展现出了与OpenAI的o1-1217模型相当的实力,并在美国数学邀请赛、MATH-500以及软件开发领域测试集SWE-Bench Verified上取得了微弱优势。令人惊讶的是,这一切成就都是在不到600万美元的投入下实现的。
Deepseek的“四两拨千斤”模式颠覆了人们对大模型行业“大力出奇迹”的传统认知,为大模型产业的落地提供了新的可能。这一创新不仅有望降低大模型的应用门槛,还可能推动整个行业向更高效、更经济的方向发展。