AI大模型时代，六小虎如何跨越商业化“死亡谷”？-信息流-小熊财经

在人工智能领域的浩瀚星空中，一场关于大模型未来的深刻变革正在悄然上演。2025年初，业界目光聚焦于一家名为零一万物的创新企业，这家曾被誉为“AI大模型六小虎”之一的佼佼者，近期宣布了一项重大战略调整：放弃对超级大模型的盲目追求，转而携手阿里云，共同成立“产业大模型联合实验室”。此举标志着零一万物成为国内首家公开调整战略航向，直面大模型时代挑战的AI独角兽。

这一变动如同一石激起千层浪，引发了行业内外对于AI大模型发展路径的深刻反思。零一万物CEO李开复在接受采访时直言不讳：“传统Scaling Laws（规模定律）的边际效益正在迅速递减，对于初创公司而言，继续押注巨量资源训练超大参数模型，无异于一场性价比极低的赌博。”李开复的言论，无疑为已经沸腾的业界讨论再添一把火。

Scaling Laws，这一由OpenAI率先提出的理论，曾如同灯塔一般指引着AI大模型的发展方向。它简单而直接地阐述了一个观点：AI模型的性能随着参数规模、训练数据量及计算资源的增加而提升。在这一理论的驱动下，国内外大模型平台不惜重金，竞相堆砌GPU，将模型参数从数亿推向数千亿，乃至万亿级别。OpenAI的GPT-4，据传拥有惊人的1.8万亿参数，便是这一趋势的缩影。

然而，自去年以来，Scaling Laws的有效性开始受到前所未有的质疑。据外媒报道，OpenAI的下一代模型Orion在某些任务上的表现仅比GPT-4略有提升，远未达到前代之间的飞跃式进步。尽管OpenAI CEO坚决否认遭遇瓶颈，但GPT-5的迟迟未推出，以及Google Gemini 2.0、Anthropic Claude 3.5 Opus等项目的延期，无疑为这一理论蒙上了阴影。

不过，并非所有人都对Scaling Laws的失效持肯定态度。英伟达CEO黄仁勋在CES 2025上坚称，基础模型预训练的Scaling Laws依然有效，并指出新的后训练扩展定律和测试时间扩展定律正在涌现。这些新定律为扩展模型算力和提升性能开辟了新途径，如OpenAI的o3模型，能在推理过程中进行计算，通过“思考更长时间”解锁新能力。

尽管争议不断，但业界普遍认识到，单纯依靠堆砌算力和参数的粗放发展模式已难以为继。高昂的成本与日益递减的边际效益，成为了摆在所有AI企业面前的严峻挑战。据数据显示，大模型训练成本在过去几年间飙升了数十万倍，即便是字节跳动这样的巨头，也计划在未来几年内投入上千亿元用于AI算力采购。

面对如此巨大的投入，初创企业显然难以承受。李开复指出，未来只有大厂才有能力支撑起超大模型的研发。这一判断，无疑为AI创业公司的未来蒙上了一层阴影。在这样的背景下，六小虎中的其他成员也开始纷纷调整战略，寻找适合自己的生存之道。

月之暗面与MiniMax在C端市场展现出强劲势头，通过推出具有独特功能的大模型，吸引了大量用户。DeepSeek-V3则以亮眼的评测成绩和低廉的API调用价格，成为开源模型的新宠。智谱AI在紧盯OpenAI发展的同时，加大了对Agent技术的投入。阶跃星辰则继续强化多模态和复杂推理能力，拓展C端应用场景。而百川智能则独辟蹊径，将AGI与医疗领域相结合，推出了系列医疗产品。

这些不同的技术路线和商业化路径，不仅展现了AI大模型领域的多元化发展趋势，也预示着未来竞争的激烈与残酷。如同新能源汽车领域的淘汰赛一般，AI大模型领域也将迎来一场决定生死存亡的较量。在这场较量中，谁能脱颖而出，谁又将黯然离场，一切尚未可知。但无论如何，这场变革都将深刻影响人工智能的未来走向。