ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

字节Seedance 2.0论文亮相:170人团队署名,多模态生成能力全面升级

时间:2026-04-17 15:19:54来源:快讯编辑:快讯

字节跳动旗下的AI视频生成技术Seedance 2.0近日在学术平台arXiv发布技术论文,详细阐述了其多模态生成能力与核心技术创新。该论文不仅公开了26页的基准测试数据,还首次完整披露了170人的研发团队名单,引发行业对技术突破与团队架构的双重关注。

此次升级的Seedance 2.0通过原生统一模型架构,实现了视频与音频的同步生成能力。技术团队突破了传统工具依赖单文本输入的局限,支持文本、图像、视频、音频四种模态的混合输入与融合处理。例如在人物动作生成方面,系统可精准模拟跑步、舞蹈等复杂运动轨迹,确保多人互动场景中的物理合理性;音频模块则能自动生成双耳立体声,实现口型同步与背景音效的精准匹配。更引人注目的是其"导演模式",用户输入剧情脚本后,系统可自动完成分镜设计、运镜切换与剪辑节奏控制。

在基准测试环节,Seedance 2.0在VBench等主流评测体系中全面领先。论文数据显示,其在运动质量、语义一致性等核心指标上较同期竞品提升显著,特别是在长视频生成稳定性与多模态交互精度方面表现突出。目前该技术已通过Byteplus平台向全球100余个国家的企业客户开放,提供4-15秒、最高720p分辨率的视频生成服务,但美国市场暂未纳入首批开放名单。

团队架构方面,论文披露的170人名单显示,与前代197人团队相比,核心成员经历近半数更替。其中基础研究负责人吴永辉持续担任技术决策者,直接向CEO汇报;预训练模块负责人曾妍驻扎美国帕洛阿尔托,主导核心技术路线执行。值得注意的是,团队在薪资结构上采用"现金+字节期权+豆包期权"的复合模式,期权四年全部归属。针对近期传闻的"亿元年薪挖角"事件,抖音副总裁李亮回应称薪资体系统一,但承认优秀技术人员若业务达标,四年后期权收益可能达数亿元级别。

此次技术发布与商业化落地同步推进,显示出字节跳动在AI视频生成领域的双重布局。论文中展示的26页测试数据与实际应用案例,既是对技术实力的证明,也为行业提供了多模态生成的新参考标准。随着团队架构的持续优化与薪酬激励机制的公开,这场AI技术竞赛正从单纯的产品比拼,延伸至人才储备与生态建设的深层较量。

更多热门内容
王腾深圳成立新公司
4月16日,天眼查App显示,深圳今日宜休科技有限责任公司正式成立,法定代表人为王腾,注册资本100万人民币。该公司经营范围涵盖智能家庭消费设备销售、家用电器研发、家用电器零配件销售、家用电器销售等。股东信息显示,该公司由北京今日宜休科技有限责任公司全资持股

2026-04-17

2999元起! 大疆 Pocket 4 开售即秒空
4月16日,大疆全新口袋云台相机Osmo Pocket 4正式发售。此次共推出两个版本,标准套装定价2999元,全能套装定价3799元。产品发售后瞬间引爆市场,大疆官方商城及各大电商平台的库存均迅速售罄,页面全线显示缺货状态。线下方面,上海等多地大疆门店提前排起长队,大量已

2026-04-17