Стиль
Репост В Facebook «клонировали» голос Билла Гейтса с помощью нейросетей
Стиль
Репост В Facebook «клонировали» голос Билла Гейтса с помощью нейросетей
Репост
В Facebook «клонировали» голос Билла Гейтса с помощью нейросетей
Билл Гейтс
© AP Photo/Ted S. Warren
Инженеры Facebook Шон Васкес и Майк Льюис использовали алгоритмы искусственного интеллекта для разработки «умного» синтезатора речи MelNet. Программа сгенерировала голос основателя Microsoft Билла Гейтса и других известных личностей.

Аудиоролики длительностью до трех секунд разработчики опубликовали на сайте, посвященном исследованию, в разделе «Выбранные ораторы» (Selected Speakers).

Гейтс стал объектом тестирования возможностей MelNet благодаря образовательному проекту TED: он дал инженерам платформу для продвижения проекта и предоставил выступления американского бизнесмена, которые понадобились для обучения нейросетей. Анализируя большие объемы аудиоданных, алгоритмы имитировали человеческую речь, создав, по сути, аудиоклоны.

«Клонированный» Гейтс произносит странное: «Судорога — это немаленькая опасность для плавания», «Свечение усилилось в глазах милой девушки». Фразы кажутся бессмысленными, поскольку составлены из содержимого сборника «Гарвардские предложения», к которому инженеры часто обращаются для тестирования систем связи или голосовых программ, уточняет CNBC.

Пост, в котором Билл Гейтс рассказывает о работе Фонда Билла и Мелинды Гейтс с детьми в Черной Африке.

Разработчики также сгенерировали голоса ученого Стивена Хокинга, профессора Дафни Коллер, актера Джорджа Такея и других.

MelNet — не первая программа, которая умеет синтезировать речь. В прошлом месяце команда стартапа AI Dessa представила ИИ-аудиоклип с голосом короля подкастов и популярного радиоведущего Джо Рогана.

Как отмечает журнал MIT Technology Review, попытки убедительно имитировать человеческую речь на протяжении длительного времени (например, дольше двух минут) — все еще слишком сложная задача для машинного обучения. Кроме того, развитие этого сегмента представляет опасность для людей, чьи голоса становятся объектами обработки системами ИИ. Технологию можно использовать злонамеренно, о чем свидетельствуют наводнившие интернет deepfake-видеоролики с политиками, которые произносят неподобающие речи.