近期,中国人工智能领域的新热潮,特别是DeepSeek等企业的崛起,显著提升了TikTok母公司字节跳动(ByteDance)的市场估值。据彭博社报道,至少有三大投资机构对字节跳动的估值超过了4000亿美元。
其中,富达投资(Fidelity Investments)和T. Rowe Price Group Inc.根据去年11月向美国证券交易委员会(SEC)提交的文件,分别将字节跳动的估值上调至4100亿美元和4500亿美元以上。另一投资机构软银集团的愿景基金(Vision Fund)也在去年12月重新评估了字节跳动的价值,认为其超过4000亿美元,这主要得益于字节跳动去年强劲的营收增长及其AI业务“豆包”的潜力,据知情人士透露。
值得注意的是,彭博社的报道还提到,软银可能会进一步提高对字节跳动的估值。据悉,该日本公司在评估TikTok美国业务时,将其视为零价值资产,因为该短视频应用曾面临在美国被关停的风险。
字节跳动的估值从2022年7月的2750亿美元低点急剧上升,这一增幅显著。与去年字节跳动年度销售回购设定的3000亿美元估值相比,也有大幅提升。字节跳动的旗舰AI模型“豆包”在1月22日进行了升级,这一动作紧随DeepSeek发布其开源推理模型DeepSeek-R1之后两天。DeepSeek声称,其模型性能可与OpenAI的GPT-4等领先产品相媲美,但成本却低得多。
字节跳动强调,“豆包”1.5 Pro版采用闭源方式,并通过“资源高效”的训练方法,在不牺牲性能的前提下实现了优化。该模型从预训练阶段就采用了集成训练-推理设计,以平衡最佳性能和最优推理成本。据字节跳动介绍,“豆包”1.5 Pro在AIME基准测试中表现优于OpenAI GPT-4预览版和正式版,同时在其他流行基准测试中也超过了DeepSeek-V3、GPT-4o和Llama 3.0-405B等模型。
“豆包”1.5 Pro采用了新的稀疏混合专家(MoE)架构,其激活参数远少于上述模型。具体而言,该模型仅需2000万激活参数,即可达到拥有1400亿参数的密集模型的性能。这一突破显著超过了行业中传统MoE架构的效率,实现了7倍的性能杠杆提升。“豆包”1.5 Pro还集成了异构系统设计,用于预填充-解码和注意力-前馈神经网络(FFN)任务,优化了吞吐量并最小化了延迟。
在2月13日的一次全体会议上,字节跳动CEO梁汝波表示,公司在大型语言模型(LLMs)方面反应较慢,未能迅速抓住新机遇,落后于人工智能初创企业。梁汝波告诉员工,这些领先的AI初创企业在2018年至2021年间成立并开始工作,而字节跳动直到2023年的半年度技术评审中才开始讨论OpenAI GPT等前沿模型。他指出,字节跳动已经认识到向长链思维模型的重大技术转变,这是DeepSeek推理模型R1的特征之一,但反应不够迅速。
梁汝波表示,字节跳动今年将专注于追求“智能”的上限,而不是追求任何特定产品(如豆包AI助手)的日活跃用户数量。他希望通过将智能放在首位,激发更多实验,并确保不会忽视关键的技术里程碑。这将包括探索新的交互方式并增强规模经济效应。