Технологии10.01.2023 - 14:56

Microsoft разработала нейросеть VALL-E для имитации любого человеческого голоса

Искусственный интеллект может воспроизводить голос человека, послушав всего три секунды его речь.

Фото: rawpixel.com / Freepik

Корпорация Microsoft разработала искусственный интеллект VALL-E, умеющий делать имитацию любого человеческого голоса после прослушивания всего лишь трех секунд. Получается в итоге очень достоверно, с сохранением тембра и эмоциональной выраженности.

В самой компании VALL-E называют «языковой моделью нейронного кодека». В ее основе содержится технология EnCodec, а обучением нейросети занимались с помощью библиотеки LibriLight, имеющей 60 000 часов англоязычной речи от более чем 7000 человек.

В 2018 году Google также подремонтировала свой голосовой ИИ Duplex, умеющий тоже говорить неотличимо от человека.

Сейчас же на сайте Microsoft опубликовал для всех желающих разные примеры работ с ИИ, где можно послушать его голос.