Компания Microsoft
представила новую программу под названием VASA, которая создает “реалистичные говорящие лица виртуальных персонажей с привлекательными визуальными эффектными навыками (VAS) на основе всего лишь одного статического изображения и аудиоклипа речи”.
“Наша премьерная модель VASA-1 способна не только воспроизводить движения губ, которые точно синхронизированы со звуком, но и улавливать широкий спектр нюансов лица и естественных движений головы, которые способствуют восприятию подлинности и живости”, — написала команда в документе об этих последних разработках.
«Основные инновации включают целостную модель формирования динамики лица и движений головы, которая работает в скрытом пространстве лица, и разработку такого выразительного и расчлененного скрытого пространства лица с использованием видео. Благодаря обширным экспериментам, включая оценку по набору новых показателей, мы показываем, что наш метод значительно превосходит предыдущие методы по различным параметрам».
(
Читать дальше
)