ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

讯飞星火大模型上线:多模态交互,数字人“活”了!

时间:2024-11-14 20:00:36来源:IT之家编辑:瑞雪

近日,“讯飞开放平台”官方公众号宣布,讯飞星火多模态交互大模型已正式上线,这一突破性的技术革新,标志着讯飞在人机交互领域迈出了重要一步。该模型不仅实现了从语音交互到音视频流实时多模交互的跨越,还新增了“多模态、超拟人和个性化”三大核心能力,将语音、视觉和数字人交互完美融合,用户只需一键调用,即可享受便捷的智能交互体验。

讯飞星火多模态交互大模型首次引入了超拟人数字人技术,其数字人的动作与语音内容精准同步,表情和动作生成迅速,让AI更加生动逼真。通过整合文本、语音和表情,该模型实现了跨模态的语义一致性,确保了情感表达的连贯性和真实性。

在交互速度方面,讯飞星火大模型同样表现出色。它采用统一的神经网络,实现了语音到语音的端到端建模,响应迅速且流畅。同时,该模型能够敏锐感知情绪变化,并根据指令自由调整声音的节奏、大小和角色设定,为用户带来更加个性化的交互体验。

讯飞星火多模态交互大模型还支持多模态视觉交互,能够全面感知具体背景场景和物流状态等信息,对任务的理解更加精准。通过综合判断语音、手势、行为和情绪等因素,该模型能够作出合适的回复,实现更加自然和智能的交互。

用户现在可以与数字人进行语音和视频通话,享受自然流畅的对话体验。数字人的表情和动作与说话内容完美匹配,使得交流更加生动有趣。星火超拟人数字人还支持识别摄像头中的内容,如识别不同角色的组合、产品的品牌和作用以及花的品类等,进一步拓展了其应用场景。

更多热门内容