环球快消息！西交大开源SadTalker模型图片+音频秒变视频！

您当前的位置：首页 >> 财经 > >>

来源：站长之家时间：2023-04-19 15:13:37

(相关资料图)

站长之家（ChinaZ.com）4月19日消息:最近，西安交通大学的研究人员提出了SadTalker模型，通过从音频中学习生成3D运动系数，使用全新的3D面部渲染器来生成头部运动，可以实现图片+音频就能生成高质量的视频。

为了实现音频驱动的真实头像视频生成，研究人员将3DMM的运动系数视为中间表征，并将任务分为两个主要部分（表情和姿势），旨在从音频中生成更真实的运动系数(如头部姿势、嘴唇运动和眼睛眨动)，并单独学习每个运动以减少不确定性。最后通过一个受face-vid2vid启发设计的3D感知的面部渲染来驱动源图像。

论文链接:https://arxiv.org/pdf/2211.12194.pdf

项目主页:https://sadtalker.github.io/

研究人员使用SadTalker模型从音频中学习生成3D运动系数，使用全新的3D面部渲染器来生成头部运动。该技术可以控制眨眼频率，音频可以是英文、中文、歌曲。

这项技术在数字人创作、视频会议等多个领域都有应用，能够让静态照片动起来，但目前仍然是一项非常有挑战性的任务。SadTalker模型的出现解决了生成视频的质量不自然、面部表情扭曲等问题。该技术可以应用于数字人创作、视频会议等多个领域。

（举报）

标签：

上一篇：画家周平的国画艺术_周平中国美协会员|环球观速讯

下一篇：最后一页

猜你喜欢

心灵美炸酱面_当前焦点

1、心灵美炸酱面是一道面食，主料是面条、鸡胸肉，配料是黄瓜、小番茄等，调料为盐、料酒等。2、该面食主要

来源：互联网时间：2023-04-19
足金回收多少钱一克(2023年4月19日）

足金回收多少钱一克(2023年4月19日）

来源：金投网时间：2023-04-19
当前信息：专家预测澳元表现将优于纽元，背后都有哪些原因？

新西兰正处于经济衰退的边缘，因为其激进的加息对经济造成了损害。在塔斯曼海(Tasman Sea)对岸

来源：英为财情时间：2023-04-19
定增方案获股东大会高票通过飞鹿股份发力高分子材料产业-世界速递

“我们将继续专注和拓展防腐防水材料等高分子材料产业，大力发展光伏、储能、风电为主的新能源产业，同时有

来源：上海证券报时间：2023-04-19