AI公司“精打细算”：耗时9个月换模型，成本降数百万美元，迁移值了-企业动态-贝尔财经

在AI Agent领域，一场关于模型选择的变革正在悄然发生。过去，企业选择大模型时往往更关注参数规模、推理能力等性能指标，但随着AI技术深入生产环境，成本因素正成为影响决策的关键力量。近期，AI Agent创业公司Lindy的一项重大决定引发行业关注——该公司将生产环境中的全部模型流量从Anthropic切换至DeepSeek V4，这一调整不仅显著降低了运营成本，更在部分核心业务场景中实现了性能提升。

Lindy的转型并非偶然。作为一家专注于AI办公助手的平台，其核心业务包括自动处理邮件、安排会议、录入CRM数据等高频任务。创始人Flo Crivello透露，模型推理成本已成为公司最大的支出项目，甚至超过了员工薪资总额。今年4月，他曾在社交平台公开表示，推理成本的高企迫使公司必须寻找替代方案。经过6-9个月的评估，团队最终将目光投向了开源模型领域。

开源模型的崛起为行业带来了新选择。回顾2024年，多数企业仍认为开源模型与闭源模型存在明显差距；但到2025年底至2026年，情况发生显著变化。DeepSeek、Kimi、GLM等中国模型不仅持续刷新性能纪录，其推理成本更远低于OpenAI和Anthropic等闭源模型。以DeepSeek V4为例，该模型在通用能力和Agent任务表现上进一步提升，同时保持了极具竞争力的价格优势。

模型切换的实际效果超出预期。Lindy在完成内部测试后发现，DeepSeek V4不仅成本更低，在邮件处理等核心业务场景中的表现甚至优于Anthropic。Crivello解释道，系统需要阅读用户收件箱内容、理解上下文关系，并按照用户习惯生成回复草稿，这些高频任务对模型性能要求极高。DeepSeek在这些场景中的出色表现，成为公司决定全面迁移的关键因素。

然而，模型迁移并非简单的API替换。Crivello坦言，整个过程的工作量比最初预想多出100倍。企业生产环境中的AI系统是一套高度耦合的工程体系，涉及Prompt工程、自动化评测、用户反馈机制、监控平台等多个环节。更换模型后，这些组件都需要重新适配。Lindy团队进行了大量线上和线下评测，甚至引入真人主观判断输出结果是否符合预期，最终通过逐步放量上线的方式确保迁移平稳进行。

在技术实现上，Lindy选择了美国推理服务商Atlas Cloud提供的DeepSeek V4服务，而非自行部署。这种模式既保留了成本优势，又避免了自建推理基础设施带来的复杂性。Crivello强调，这次迁移本质上是一次底层AI基础设施的升级，涉及从模型选择到系统架构的全面调整。

尽管全面转向DeepSeek，但Anthropic并未完全退出Lindy的技术栈。在复杂工作流自动化任务上，Anthropic旗下Claude Sonnet仍表现更优。因此，Lindy将Anthropic作为备用模型，当系统检测到任务失败时，会升级调用更强大的模型。不过，Crivello透露，这种情况仅占极小比例，未来若Anthropic推出更具竞争力的新模型并大幅降价，公司仍可能重新成为其客户。

Lindy的决策反映了行业趋势的变化。过去，大模型市场由OpenAI和Anthropic主导，企业更关注模型的能力上限；但随着模型性能差距缩小，成本成为新的决策因素。来自Vercel AI Gateway的数据显示，2026年5月，DeepSeek在平台Token调用量中的占比从不足1%飙升至17%，但其收入占比仅约1%，原因正是其极低的成本。这种趋势下，市场正形成新的结构：一边是提供最强性能但价格高昂的旗舰模型，另一边是性能接近但价格低得多的开放权重模型。

对于每天消耗海量Token的公司而言，成本与效果的权衡变得尤为现实。Crivello直言，对于像Lindy这样消耗大量Token的企业，选择低成本模型是必然选择，否则就是对股东和用户的不负责。他认为，许多企业尚未行动只是因为习惯依赖知名品牌，但未来几年，模型的实际效果和成本将成为更重要的考量因素。