Голосовой ИИ-стартап ElevenLabs представил функцию GenFM, которая позволяет генерировать подкасты с двумя ведущими на базе разных типов контента. Технология работает на 32 языках, включая русский. Доступна для всех пользователей бесплатно на iOS и Android.
Послушайте, как это звучит, здесь:
Чтобы сделать подкаст, была загружена в программу текстовая информация этой новости. Для записи 7-минутного аудио искусственному интеллекту понадобилось около 5 минут. В подкасте ведущие обсудили не только саму новость, но и замену живых людей на ИИ-аватаров, а также авторские права и будущее ИИ-индустрии, хоть запроса на это не было.
GenFM работает с PDF-файлами и другими документами, ссылками на внешние сайты и форматами электронных книг. Также можно просто написать текст в окне приложения или отсканировать физический документ.
После загрузки файла приложение само выбирает голоса для озвучки. Ведущих может быть максимум двое. Примечательно, что ИИ добавляет в речь персонажей междометия и «вдумчивые паузы», чтобы «очеловечить» запись.