Наверх

Эксперимент: озвучка в тестах

03.05.2023
Привет, дорогие пикукерсы!

Сегодня я хочу представить вам функционал, который у меня не получилось реализовать в том объеме, который был изначально запланирован. Речь пойдет об автоматической озвучке текстов в тестах.

Почему я это сделал? Проходя одно древо на 1288 вопросов, я задумался о том, что прочтение таких объемов текста может быть крайне утомительным занятием. Дальше я вспомнил, что сейчас существует куча нейросетей для озвучки, сложил 2 + 2 и загорелся идеей прикрутить такую нейросетку, чтобы она озвучивала нам тесты.

Интересно, правда?

Однако меня ждало большое разочарование: все нейросети для озвучки имеют жестко коммерческую природу и нужно платить немаленькие деньги за озвучку каждой тысячи символов. Нейросетей с открытым исходным кодом, которые можно просто развернуть на сервере и использовать пока не существует, а те что начинают свою разработку - не поддерживают русский язык.



Я уж было приуныл, но тут меня посетила одна мысль: сейчас на каждом устройстве, будь то компьютер или смартфон есть голосовые ассистенты, работающие в браузере. Значит есть вшитый в систему синтезатор речи, к которому можно подключиться и использовать его!

Получив список голосов для Windows, я был и обрадован и разочарован одновременно: в системе есть мужской и женский голоса, это хорошо. Но их качество на уровне 2015 года, что, конечно, плохо.

Ладно, выбирать не приходится, приступаем к реализации: добавляем авторам тестов возможность выбирать пол озвучки для каждого вопроса, а при помощи некоторых манипуляций можно изменить тон голоса и скорость чтения.

Казалось бы, что может пойти не так?

На андройде нет мужского голоса... Приложив ладонь к лицу, я осознал что мечтам о разнополой озвучке реплик пока не суждено сбыться, кроме того голоса в разных системах настолько различаются, что автор теста не сможет предусмотреть всё.

На этом я уже собирался похоронить идею, но мне пришла в голову мысль: мы просто отдадим выбор озвучки на откуп конечного пользователя! Так и появился этот патч:



В прохождении теста вас встретит новая кнопка, нажав ее вы сможете настроить озвучку текстов в соответствии со своими предпочтениями:



Надеюсь, это будет вам полезно. А еще надеюсь что со временем появятся нейросети, с помощью которых можно будет преобразовать этот патч в то, что изначально задумывалось.


Спасибо за внимание, держите руку на пульсе. До встречи!

Привет, дорогой посетитель сайта!

Я заметил, что ты здесь уже больше чем 5 минут и надеюсь, это время проведено интересно.

Наше сообщество живет за счет щепотки платных объявлений, поэтому я был бы очень благодарен за добавление Pikuco в исключения твоего блокировщика рекламы ;)

Надеюсь на тебя!

Создатель Pikuco и ваш admin