В Facebook «клонировали» голос Билла Гейтса с помощью нейросетей
Аудиоролики длительностью до трех секунд разработчики опубликовали на сайте, посвященном исследованию, в разделе «Выбранные ораторы» (Selected Speakers).
Гейтс стал объектом тестирования возможностей MelNet благодаря образовательному проекту TED: он дал инженерам платформу для продвижения проекта и предоставил выступления американского бизнесмена, которые понадобились для обучения нейросетей. Анализируя большие объемы аудиоданных, алгоритмы имитировали человеческую речь, создав, по сути, аудиоклоны.
«Клонированный» Гейтс произносит странное: «Судорога — это немаленькая опасность для плавания», «Свечение усилилось в глазах милой девушки». Фразы кажутся бессмысленными, поскольку составлены из содержимого сборника «Гарвардские предложения», к которому инженеры часто обращаются для тестирования систем связи или голосовых программ, уточняет CNBC.
Пост, в котором Билл Гейтс рассказывает о работе Фонда Билла и Мелинды Гейтс с детьми в Черной Африке.
Разработчики также сгенерировали голоса ученого Стивена Хокинга, профессора Дафни Коллер, актера Джорджа Такея и других.
MelNet — не первая программа, которая умеет синтезировать речь. В прошлом месяце команда стартапа AI Dessa представила ИИ-аудиоклип с голосом короля подкастов и популярного радиоведущего Джо Рогана.
Как отмечает журнал MIT Technology Review, попытки убедительно имитировать человеческую речь на протяжении длительного времени (например, дольше двух минут) — все еще слишком сложная задача для машинного обучения. Кроме того, развитие этого сегмента представляет опасность для людей, чьи голоса становятся объектами обработки системами ИИ. Технологию можно использовать злонамеренно, о чем свидетельствуют наводнившие интернет deepfake-видеоролики с политиками, которые произносят неподобающие речи.