Появился алгоритм, который меняет речь людей на видео, заставляя их говорить что угодно

Тебе наверняка далеко не всегда нравилось, как ты на видео произнесла речь или текст. Так вот, теперь придумана программа, которая изменяет слова в ролике максимально реалистично. Исследователи из Стэнфордского и Принстонского университетов создали алгоритм, который искажает речь человека на видео. Для убедительности программа не только подстраивает голос, но и изменяет мимику и даже длину ролика.

Как это работает? Программа находит висемы – звуки, которые выглядят одинаково при движении губ – и использует их для создания мимики под новые фразы. Грубо говоря, по движению губ заменяет звуки на другие, наиболее похожие. Чтобы отредактированный голос больше походил на нужную речь, исследователи пользуются программой VoCo, которую они представили в 2016 году. Проанализировав небольшой монолог человека, она способна спародировать его голос.

В ознакомительном ролике исследователи показали демоверсию разработки. Например, одного диктора они «заставили» говорить French toast вместо Napalm в предложении I love the smell of napalm in the morning. Другого диктора и вовсе лишили одного слова – программа также умеет удалять речь из ролика.

Надеемся, в будущем из-за этой программы не будет еще больше фейковых новостей и подставных видеообращений. Иначе исследователям придется придумывать еще и контрпрограмму :)