(相关资料图)
站长之家(ChinaZ.com)4月19日 消息:最近,西安交通大学的研究人员提出了SadTalker模型,通过从音频中学习生成3D运动系数,使用全新的3D面部渲染器来生成头部运动,可以实现图片+音频就能生成高质量的视频。
为了实现音频驱动的真实头像视频生成,研究人员将3DMM的运动系数视为中间表征,并将任务分为两个主要部分(表情和姿势),旨在从音频中生成更真实的运动系数(如头部姿势、嘴唇运动和眼睛眨动),并单独学习每个运动以减少不确定性。最后通过一个受face-vid2vid启发设计的3D感知的面部渲染来驱动源图像。
论文链接:https://arxiv.org/pdf/2211.12194.pdf
项目主页:https://sadtalker.github.io/
研究人员使用SadTalker模型从音频中学习生成3D运动系数,使用全新的3D面部渲染器来生成头部运动。该技术可以控制眨眼频率,音频可以是英文、中文、歌曲。
这项技术在数字人创作、视频会议等多个领域都有应用,能够让静态照片动起来,但目前仍然是一项非常有挑战性的任务。SadTalker模型的出现解决了生成视频的质量不自然、面部表情扭曲等问题。该技术可以应用于数字人创作、视频会议等多个领域。
(举报)
下一篇:最后一页
1、心灵美炸酱面是一道面食,主料是面条、鸡胸肉,配料是黄瓜、小番茄等,调料为盐、料酒等。2、该面食主要
足金回收多少钱一克(2023年4月19日)
新西兰正处于经济衰退的边缘,因为其激进的加息对经济造成了损害。在塔斯曼海(Tasman Sea)对岸
“我们将继续专注和拓展防腐防水材料等高分子材料产业,大力发展光伏、储能、风电为主的新能源产业,同时有
X 关闭
环球快消息!西交大开源SadTalker模型 图片+音频秒变视频!
画家周平的国画艺术_周平 中国美协会员|环球观速讯
全球焦点!中注协约谈大信 提示频繁“换所”上市公司年报审计风险
报道:有关雨的谚语精选_关于雨的优秀谚语
环球今亮点!主播说联播丨4.5%背后,是活力满满
X 关闭
上海嘉定体育馆隔离救治点首批新冠病毒感染者顺利“出院”
千里支援显真情 安徽六安捐赠的100余吨新鲜蔬菜抵沪
缉毒英雄蔡晓东烈士安葬仪式在云南西双版纳举行
多方合作推动青海建设国际生态文明高地
海口新增1例确诊病例和2例无症状感染者