微软推出 VASA-1 AI 框架,可即时生成逼真对口型

2024-04-21 19:04:25

  据微软官方新闻稿,微软今天公布了一项图生的VASA-1框架,该AI框架只需使用一张真人肖像照片和一段个人语音音频,就能够生成精确逼真的对口型,据称在表情和头部动作方面特别自然。

  获悉,目前业界相关许多研究都集中在对口型上,而面部动态行为及头部运动情况通常被忽视,因此生成的面部也会显得僵硬、缺乏说服力且存在恐怖谷现象。

  而微软的VASA-1框架克服了以往面部生成技术的限制,研究人员利用了扩散Transformer模型,在整体面部动态和头部运动方面进行训练,该模型将所有可能的面部动态,包括嘴唇动作、表情、眼睛注视和眨眼等行为均视为单一潜在变量,号称能够即时生成512×512分辨率40 FPS的。

  同时微软还利用了3D技术辅助标记人脸面部特征,并额外设计了损失函数,号称能够让 VASA-1不仅能够生成高品质的面部,还能够有效地捕捉和重现面部3D结构。

下一篇:跑分信息显示 HMD 正为诺基亚 X1020 两款手机测试
上一篇:EA《F1 24》官方授权赛车游戏 5 月 31 日发售,St
返回顶部小火箭