在AI Agent领域,一场关于模型选择的变革正在悄然发生。过去,企业选择大模型时往往更关注参数规模、推理能力等性能指标,但随着AI技术深入生产环境,成本因素正成为影响决策的关键力量。近期,AI Agent创业公司Lindy的一项重大决定引发行业关注——该公司将生产环境中的全部模型流量从Anthropic切换至DeepSeek V4,这一调整不仅显著降低了运营成本,更在部分核心业务场景中实现了性能提升。
Lindy的转型并非偶然。作为一家专注于AI办公助手的平台,其核心业务包括自动处理邮件、安排会议、录入CRM数据等高频任务。创始人Flo Crivello透露,模型推理成本已成为公司最大的支出项目,甚至超过了员工薪资总额。今年4月,他曾在社交平台公开表示,推理成本的高企迫使公司必须寻找替代方案。经过6-9个月的评估,团队最终将目光投向了开源模型领域。
开源模型的崛起为行业带来了新选择。回顾2024年,多数企业仍认为开源模型与闭源模型存在明显差距;但到2025年底至2026年,情况发生显著变化。DeepSeek、Kimi、GLM等中国模型不仅持续刷新性能纪录,其推理成本更远低于OpenAI和Anthropic等闭源模型。以DeepSeek V4为例,该模型在通用能力和Agent任务表现上进一步提升,同时保持了极具竞争力的价格优势。
模型切换的实际效果超出预期。Lindy在完成内部测试后发现,DeepSeek V4不仅成本更低,在邮件处理等核心业务场景中的表现甚至优于Anthropic。Crivello解释道,系统需要阅读用户收件箱内容、理解上下文关系,并按照用户习惯生成回复草稿,这些高频任务对模型性能要求极高。DeepSeek在这些场景中的出色表现,成为公司决定全面迁移的关键因素。
然而,模型迁移并非简单的API替换。Crivello坦言,整个过程的工作量比最初预想多出100倍。企业生产环境中的AI系统是一套高度耦合的工程体系,涉及Prompt工程、自动化评测、用户反馈机制、监控平台等多个环节。更换模型后,这些组件都需要重新适配。Lindy团队进行了大量线上和线下评测,甚至引入真人主观判断输出结果是否符合预期,最终通过逐步放量上线的方式确保迁移平稳进行。
在技术实现上,Lindy选择了美国推理服务商Atlas Cloud提供的DeepSeek V4服务,而非自行部署。这种模式既保留了成本优势,又避免了自建推理基础设施带来的复杂性。Crivello强调,这次迁移本质上是一次底层AI基础设施的升级,涉及从模型选择到系统架构的全面调整。
尽管全面转向DeepSeek,但Anthropic并未完全退出Lindy的技术栈。在复杂工作流自动化任务上,Anthropic旗下Claude Sonnet仍表现更优。因此,Lindy将Anthropic作为备用模型,当系统检测到任务失败时,会升级调用更强大的模型。不过,Crivello透露,这种情况仅占极小比例,未来若Anthropic推出更具竞争力的新模型并大幅降价,公司仍可能重新成为其客户。
Lindy的决策反映了行业趋势的变化。过去,大模型市场由OpenAI和Anthropic主导,企业更关注模型的能力上限;但随着模型性能差距缩小,成本成为新的决策因素。来自Vercel AI Gateway的数据显示,2026年5月,DeepSeek在平台Token调用量中的占比从不足1%飙升至17%,但其收入占比仅约1%,原因正是其极低的成本。这种趋势下,市场正形成新的结构:一边是提供最强性能但价格高昂的旗舰模型,另一边是性能接近但价格低得多的开放权重模型。
对于每天消耗海量Token的公司而言,成本与效果的权衡变得尤为现实。Crivello直言,对于像Lindy这样消耗大量Token的企业,选择低成本模型是必然选择,否则就是对股东和用户的不负责。他认为,许多企业尚未行动只是因为习惯依赖知名品牌,但未来几年,模型的实际效果和成本将成为更重要的考量因素。