ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

Soul App开源实时数字人生成模型SoulX-FlashHead,轻量化模型支持“消费级”实时高保真直播

时间:2026-02-24 12:16:01来源:互联网编辑:茹茹

在实时数字人赛道,开发者们曾长期面临一个困扰:追求高画质就需要具备昂贵的 H800 集群,追求低成本就得忍受“面瘫”和画面崩坏。

为解决这一问题,继开源 14B 的实时数字人生成模型SoulX-FlashTalk 之后,近日,Soul App AI团队(Soul AI Lab)推出了SoulX-FlashHead。这款1.3B参数的轻量化模型,能够在单张消费级显卡( RTX 4090 )上跑出96FPS的工业级速度,同时实现高质量画质,为行业提供新的实时数字人方案。

目前,SoulX-FlashHead 的权重与代码已全面开放:

论文:https://www.arxiv.org/pdf/2602.07449

项目:https://soul-ailab.github.io/soulx-flashhead/

代码:https://github.com/Soul-AILab/SoulX-FlashHead

模型:https://huggingface.co/Soul-AILab/SoulX-FlashHead-1_3B

数据集:https://huggingface.co/datasets/Soul-AILab/VividHead

SoulX-FlashHead核心亮点:

不仅是实时,更是“算力自由”


在消费级显卡上,SoulX-FlashHead 的表现:

·Lite版本(高速率):单卡4090推理帧率可达96FPS,仅需6.4G显存,最高支持3路并发,让实时数字人模型真正走到了消费级终端上。

·Pro版本(高画质):单卡5090推理帧率16.8FPS,双卡可实时(25fps+),FID(视觉质量指标)和Lip-sync(唇形一致指标)在benchmark上达到了SOTA,甚至超过了更大参数量的模型,解决了“小模型没好画质”的行业痛点。

原理介绍


如何让 1.3B 模型“以小博大”?SoulX-FlashHead创新引入了:

训练“先知”:双向蒸馏机制 (Oracle-Guided Distillation)

长视频生成的“身份漂移”一直是行业痛点。SoulX-FlashHead引入了“上帝视角”教师模型,利用 Ground Truth 作为先知锚点进行强约束。

效果: 像给模型装了校准器,无论视频多长,人物特征始终稳定。

8秒记忆:时序音频上下文缓存 (TACC)

流式生成中,音频切片太短会导致口型抖动。

创新: 强制模型缓存 8秒 历史音频特征,补偿上下文缺失。

体验: 解决“嘴瓢”和“对不上号”问题,开播即进入理想状态。

高质量数据底座:自研 VividHead 数据集

从 10,000+ 小时素材中精炼出 782 小时高质量音画数据:

严苛筛选: 经过切分、DWpose 关键点、唇形一致分数过滤等多个处理步骤,为模型提供了最纯净的“养料”。

客观表现

在 HDTF 与 VFHQ 两大权威数据集的实测中,SoulX-FlashHead 展现了出色的表现:

画质新标杆:在高清视频(HDTF)评测中,Pro 版本以 8.31 (FID) 和 103.14 (FVD) 的成绩刷新纪录,视觉细腻度超过 一些“大参数”模型。

口型精准捕捉:面对野外复杂场景(VFHQ),凭借独创的“时序音频上下文缓存”策略,其 Sync-C 得分高达 5.60,大幅领先此前相关工作,解决对不上口型的尴尬。

速度“快”:仅凭 1.3B 的轻量化体量,Lite 版本在单张 RTX 4090 上跑出了 96 FPS 的吞吐量。这不仅是实时基准(25 FPS)的 近4倍,推理效率更是行业同类主流模型的 100倍以上。

应用场景:

“人人可用”的数字人技术

今年1月,Soul AI Lab开源了实时数字人生成模型SoulX-FlashTalk,能够实现0.87s亚秒级超低延时、32FPS高帧率,并支持超长视频稳定生成。

对比SoulX-FlashTalk,SoulX-FlashHead的价值在于,将高保真技术进一步从“算力机房”解放到了“个人工作站”,让更广泛的场景应用成为可能:

·7x24h矩阵直播:个人主播用一台游戏 PC,即可搭建高保真电商直播间。

·游戏NPC引擎:1.3B 体积极易集成,NPC 毫秒级响应,且不抢占核心渲染资源。

·AI一对一外教:支持 15 种语言,实时将音频转化为生动的教学画面。

更多热门内容
京东PLUS会员限时开通得翻倍积分 0元兑家政保洁、洗衣洗鞋等服务
又好又便宜的京东618将于5月30日晚8点正式开启,为消费者带来“官方直降、低至5折”的优惠福利,京东PLUS会员还可以享受更多权益、更大优惠,即日起至6月18日,PLUS会员人人可领超5000元超级补贴,能叠万券使用。京东618期间开卡还可享PLUS会员积分翻倍,24积分0元兑换

2026-05-30

宇树科技IPO6月1日上会:2025年扣非净利迅速增长,人形机器人出货量全球第一
据上交所官网5月25日消息,上海证券交易所上市审核委员会定于2026年6月1日召开2026年第31次上市审核委员会审议会议,审议宇树科技股份有限公司。根据公司招股书上会稿,宇树科技最近几年经营业绩稳步增长,2025年在扣非后净利润迅速增长的同时,实现了人形机器人出货量

2026-05-26

港科大MBA与韩礼士基金会联手推出环球贸易领域重磅奖学金,每年3名各获35万港元
香港科技大学工商管理学院(港科大商学院)与韩礼士基金会宣布开展为期三年的人才培养战略合作,联手推出旨在培育全球贸易领导者的全新奖学金。由两机构合作设立的韩礼士基金会 × 港科大工商管理硕士国际贸易奖学金,总额达 315 万港元,用以资助有志于推动可持续、互惠

2026-05-25

重新定义2B应用的交付深度:百型背调智能体席卷广交会
摘要:百型智能以AI重构全球贸易B2B新秩序今年4月的广交会上,一款无推广、纯自然传播的 AI 工具 ——百型智能背调专家,一举斩获了1万+用户。这远远超出了一款新产品冷启动的预期。百型智能做的,不是又一个营销工具,而是用AI重新定义B2B出海获客的交付深度——从“给

2026-05-25

央视新闻探访君乐宝奶粉:全链透明铸就中国奶粉底气
5月23日,央视新闻携君乐宝奶粉品牌代言人杨幂、总台主持人尼格买提,走进君乐宝奶粉工厂、优致牧场和科学营养研究院,以真实溯源与敢问敢答的形式,全过程展现国产奶粉的品质自信与产业底气。中国奶粉凭何赢得世界信任?答案,正是这份敢于把全产业链摊在阳光下、接受无

2026-05-25

259MW!爱旭再获埃及集中式大单,加速深耕中东非高端光伏市场
近日,爱旭与埃及领先的独立可再生能源生产商Infinity Power正式达成合作,将为位于埃及阿斯旺省著名的贝纳布太阳能园区中总容量259MW的大型集中式光伏地面电站项目提供高效ABC组件。作为非洲最大的独立可再生能源生产商之一,Infinity Power致力于在非洲大陆开发、建设

2026-05-22

东风汽金:冯长军做客央视《对话》 畅谈激发消费新潜力“国家队”担当
1月10日晚,在央视财经频道《对话》栏目播出的《消费增长新潜力》中,东风汽车总经理、党委副书记冯长军受邀与跨领域专家学者、企业代表同台交流,立足国家战略导向,围绕汽车央企的责任担当,分享东风汽车在扩大内需、提振消费过程中的思考与实践,展现东风汽车在高质

2026-05-21

中微赛尔在Micro LED量产关键工艺获重大突破:独创“S-W”量产工艺-实现全色域12英寸晶圆重构
【北京·海淀】成本高昂、效率低下、性能受限——这些长期困扰Micro LED芯片行业的普遍性难题,正被北京中微赛尔科技有限公司(以下简称“中微赛尔”)逐步攻克。近期,中微赛尔凭借独创的“S-W”工艺完成关键突破,成功实现红光、绿光、蓝光三基色(RGB)全色域12英寸晶

2026-05-21

跨境电商收款优选:iPayLinks艾贝盈零成本全平台打通
序言全球跨境电商行业正处于高速扩容与精细化发展的关键阶段,中国跨境电商出口规模连续多年保持稳健增长,Amazon、TikTok、Shopee、Wayfair等主流平台聚集了海量中国卖家,中小卖家占比偏高。对于跨境电商卖家而言,收款环节是贯穿运营全链路的核心命脉,直接影响资金

2026-05-21

【征信护航】买车贷款怕 “踩坑”?这份汽车金融征信保护指南请收好!
在汽车金融的世界里,征信不仅仅是一串数字和记录,它是您贷款购车的“通行证”。良好的征信记录能够帮助您获得更优惠的贷款利率,而不良记录则可能让您与心仪的座驾失之交臂。今天,我们就来聊聊如何保护您的征信,让您的购车之路更加顺畅。01为什么说 “征信” 是买车

2026-05-20