字节跳动估值超4000亿，AI业务“豆包”成新引擎-信息流-小熊财经

近期，中国人工智能领域的新热潮，特别是DeepSeek等企业的崛起，显著提升了TikTok母公司字节跳动（ByteDance）的市场估值。据彭博社报道，至少有三大投资机构对字节跳动的估值超过了4000亿美元。

其中，富达投资（Fidelity Investments）和T. Rowe Price Group Inc.根据去年11月向美国证券交易委员会（SEC）提交的文件，分别将字节跳动的估值上调至4100亿美元和4500亿美元以上。另一投资机构软银集团的愿景基金（Vision Fund）也在去年12月重新评估了字节跳动的价值，认为其超过4000亿美元，这主要得益于字节跳动去年强劲的营收增长及其AI业务“豆包”的潜力，据知情人士透露。

值得注意的是，彭博社的报道还提到，软银可能会进一步提高对字节跳动的估值。据悉，该日本公司在评估TikTok美国业务时，将其视为零价值资产，因为该短视频应用曾面临在美国被关停的风险。

字节跳动的估值从2022年7月的2750亿美元低点急剧上升，这一增幅显著。与去年字节跳动年度销售回购设定的3000亿美元估值相比，也有大幅提升。字节跳动的旗舰AI模型“豆包”在1月22日进行了升级，这一动作紧随DeepSeek发布其开源推理模型DeepSeek-R1之后两天。DeepSeek声称，其模型性能可与OpenAI的GPT-4等领先产品相媲美，但成本却低得多。

字节跳动强调，“豆包”1.5 Pro版采用闭源方式，并通过“资源高效”的训练方法，在不牺牲性能的前提下实现了优化。该模型从预训练阶段就采用了集成训练-推理设计，以平衡最佳性能和最优推理成本。据字节跳动介绍，“豆包”1.5 Pro在AIME基准测试中表现优于OpenAI GPT-4预览版和正式版，同时在其他流行基准测试中也超过了DeepSeek-V3、GPT-4o和Llama 3.0-405B等模型。

“豆包”1.5 Pro采用了新的稀疏混合专家（MoE）架构，其激活参数远少于上述模型。具体而言，该模型仅需2000万激活参数，即可达到拥有1400亿参数的密集模型的性能。这一突破显著超过了行业中传统MoE架构的效率，实现了7倍的性能杠杆提升。“豆包”1.5 Pro还集成了异构系统设计，用于预填充-解码和注意力-前馈神经网络（FFN）任务，优化了吞吐量并最小化了延迟。

在2月13日的一次全体会议上，字节跳动CEO梁汝波表示，公司在大型语言模型（LLMs）方面反应较慢，未能迅速抓住新机遇，落后于人工智能初创企业。梁汝波告诉员工，这些领先的AI初创企业在2018年至2021年间成立并开始工作，而字节跳动直到2023年的半年度技术评审中才开始讨论OpenAI GPT等前沿模型。他指出，字节跳动已经认识到向长链思维模型的重大技术转变，这是DeepSeek推理模型R1的特征之一，但反应不够迅速。

梁汝波表示，字节跳动今年将专注于追求“智能”的上限，而不是追求任何特定产品（如豆包AI助手）的日活跃用户数量。他希望通过将智能放在首位，激发更多实验，并确保不会忽视关键的技术里程碑。这将包括探索新的交互方式并增强规模经济效应。