Искусственный интеллект может воспроизводить голос человека, послушав всего три секунды его речь.
Корпорация Microsoft разработала искусственный интеллект VALL-E, умеющий делать имитацию любого человеческого голоса после прослушивания всего лишь трех секунд. Получается в итоге очень достоверно, с сохранением тембра и эмоциональной выраженности.
В самой компании VALL-E называют «языковой моделью нейронного кодека». В ее основе содержится технология EnCodec, а обучением нейросети занимались с помощью библиотеки LibriLight, имеющей 60 000 часов англоязычной речи от более чем 7000 человек.
В 2018 году Google также подремонтировала свой голосовой ИИ Duplex, умеющий тоже говорить неотличимо от человека.
Сейчас же на сайте Microsoft опубликовал для всех желающих разные примеры работ с ИИ, где можно послушать его голос.