国产成人在线观看免费网站-国产成人在线电影-国产成人在线播放-国产成人愉拍精品久久-日韩一区二区三-日韩一区二区免费在线观看

信息資源管理

中國移動聯合研發 2D 數字人說話驅動系統:可生成 7 種情緒,用于 5G 新通話、AI 客服等

發布于:2024-12-13 點擊量:613 來源:物聯網世界

中國移動 12 月 8 日宣布聯合南京大學團隊研發高保真 2D 數字人說話驅動系統。

作為擁有世界規模第一用戶數的通信運營商,中國移動每年的客戶服務運營成本巨大?,F已廣泛普及的智能語音客服雖能完成一定的業務自動應答任務,但依然不及人工客服面對面,一對一的星級服務體驗。

針對實際業務存在的痛點,中國移動九天視覺團隊聯合南京大學邰穎團隊,研發高保真 2D 數字人說話驅動系統,旨在為用戶提供表情自然、唇音同步和頭部姿態和諧的數字人播報對話服務,可應用于智能客服、教育培訓、廣告營銷等場景。

▲情感控制的高保真 2D 數字人說話驅動方法

據中國移動官方介紹,2D 數字人說話驅動系統實現根據給定目標人物的照片或視頻和任意一段音頻,生成與音頻同步的目標人物說話視頻流。要求生成視頻里的人物逼真度高,表情姿態自然,同時需要具有較高的實時性,能做到與語言大模型、音頻合成能力有機整合,構建起人物數字替身。

中國移動九天視覺團隊聯合南京大學研發的高保真 2D 數字人說話驅動系統,在以下三方面開展了技術攻堅和方案創新:

第一,性能實時:相比以往數字人方法,在實時播報的口型生成技術上達到了學術界領先水平,支持中英文數字人口型驅動,在保持效果的情況下達到實時性能 30ms / 幀。

第二,效果領先:研發二階段學習框架,將數字人說話驅動拆解成:從音頻到口型系數和從口型系數到生成人像兩部分,降低學習難度,實現更好的生成效果。

第三,情緒控制:引入情緒引導學習模塊,支持正常、微笑、驚訝、憤怒、恐懼、悲傷等 7 種主流情緒控制生成能力,賦予生成的播報人人文情感表達能力。

▲高興、悲傷情緒下的數字人說話生成效果

從中國移動官方獲悉,數字人生成技術上實現了端到端的二階段 30 FPS 實時生成性能,并支持 512*512 人臉區域生成,同時具備高興、悲傷等 7 種主流情緒控制生成能力。

在評測集 VoxCeleb 指標方面,該技術的口型準確性 LMD(LandMark Distance)達到 4.3,生成自然度 FID 達到 11.1。

中國移動官方表示,該研發成果應用前景廣闊,有效降低了創作門檻,提升了生成人物的視覺質量,已為 5G 新通話、和留言小秘書品牌業務的拓展賦能升級。

【版權聲明】:本站內容來自于與互聯網(注明原創稿件除外),如文章或圖像侵犯到您的權益,請及時告知,我們第一時間刪除處理!
主站蜘蛛池模板: 一句话让男生硬邦邦的句子| 杨贵妃黄色片| cctv体育频道5| 任港秀| 羞羞的铁拳演员表| juliet stevenson| 行尸走肉电影| 黄雀电视剧高清完整版| 豆包简历个人资料| 淮剧赵五娘| 少年智力开发报| 秀人网 官网门户| 速度与激情15| 电影《瞬间》| 阿斯美治疗咳嗽效果服法用量| 圣洁四人行| 美娜个人资料简介| 美女mm| 无人区在线| 侠侣探案| 我的电影在线观看| 福利视频观看| 乔军| 花非花电视剧演员表| 庞敏| 企鹅头像| 湖南卫视直播| 大森元贵| 恐龙图片大全大图| 我们的快乐人生 电视剧| 中医基础理论试题题库及答案| 小学生抽烟| 赵汉善| 死角| 绝顶五秒前| 王李| 校园大片ppt| 辩论稿| 河南卫视直播| 风间由美的作品| 春心荡漾第一季电视剧免费完整播放|