近期,一位95后的AI“天才少女”罗福莉成为了科技界的焦点人物,其背后不仅是因为她在AI领域的卓越成就,更因小米创始人雷军亲自出手,以千万年薪将其招入麾下,领导小米AI大模型团队。
罗福莉的学术背景令人瞩目。她本科毕业于北京师范大学计算机专业,随后在北京大学攻读计算语言学硕士学位。在读硕士期间,她就在人工智能领域的顶级国际会议ACL上发表了8篇论文,其中2篇为一作,这一成就让她在学术界声名鹊起。罗福莉在知乎上回应这一成就时,谦逊地表示这是自己近一年的努力成果,同时也承认有运气的成分。
毕业后,罗福莉的职业生涯同样精彩纷呈。她先在阿里达摩院从事人工智能研究,负责预训练语言模型相关的工作,并主导开发了多语言预训练模型VECO。随后,她加入幻方量化,从事深度学习相关策略建模和算法研究。最终,她跳槽到DeepSeek,担任深度学习研究员,参与研发了MoE大模型DeepSeek-V2。
DeepSeek-V2的发布让罗福莉再次受到关注。她在知乎上发表了对该模型的看法,认为其中文水平处于国内外闭源模型的第一梯队,且性价比极高。这一观点得到了业界的广泛认可,也为她赢得了小米的青睐。
小米在AI领域的发力并非偶然。自2023年4月正式组建AI实验室大模型团队以来,小米就不断挖掘AI相关的用户场景,发挥自身技术优势,并以开放的态度与合作伙伴开拓更多机会。今年11月,小米更是成立了专门的AI平台部,由小米的元老级技术大牛张铎负责。张铎在清华计算机系本硕毕业,曾被雷军公开称赞为“小米的大神”,并送以“铎神”的称号。
除了招募人才,小米还在加大AI与算力的投入。近期,小米正在搭建GPU万卡集群,规模较其大模型团队成立时的约6500张GPU大幅增加。这一计划由集团董事长雷军亲自领导,旨在提升小米在AI领域的竞争力。同时,小米集团总裁卢伟冰透露,预计2024年小米研发费用将达到240亿元,2025年更是将攀升至300亿元。自2022年至2026年的五年内,小米的研发投入将超过1000亿元,主要聚焦于AI、OS、芯片三大底层技术的研发。
在二级市场上,加码AI算力是小米近期上涨的主要驱动因素之一。小米汽车也宣布其SU7全年交付量已超过13万辆,提前完成全年所有目标。这一消息进一步提振了小米的股价。2024年12月27日,小米股价创下2022年以来新高,盘中触及34.95港元/股。
雷军在公开演讲时曾表示,小米做大模型的思路和很多公司不太一样,选择主力突破的是轻量化和本地部署。对于小米这样在手机和造车上都讲究“性价比”的公司而言,如何在烧钱的大模型业务中平衡成本,无疑是雷军考虑的核心问题。而罗福莉拥有DeepSeek-V2的研发背景,或许正是雷军看中她的原因。