Привет, дорогие пикукерсы!
Сегодня я хочу представить вам функционал, который у меня не получилось реализовать в том объеме, который был изначально запланирован. Речь пойдет об автоматической озвучке текстов в тестах.
Почему я это сделал? Проходя одно древо на 1288 вопросов, я задумался о том, что прочтение таких объемов текста может быть крайне утомительным занятием. Дальше я вспомнил, что сейчас существует куча нейросетей для озвучки, сложил 2 + 2 и загорелся идеей прикрутить такую нейросетку, чтобы она озвучивала нам тесты.
Интересно, правда?
Однако меня ждало большое разочарование: все нейросети для озвучки имеют жестко коммерческую природу и нужно платить немаленькие деньги за озвучку каждой тысячи символов. Нейросетей с открытым исходным кодом, которые можно просто развернуть на сервере и использовать пока не существует, а те что начинают свою разработку - не поддерживают русский язык.
Я уж было приуныл, но тут меня посетила одна мысль: сейчас на каждом устройстве, будь то компьютер или смартфон есть голосовые ассистенты, работающие в браузере. Значит есть вшитый в систему синтезатор речи, к которому можно подключиться и использовать его!
Получив список голосов для Windows, я был и обрадован и разочарован одновременно: в системе есть мужской и женский голоса, это хорошо. Но их качество на уровне 2015 года, что, конечно, плохо.
Ладно, выбирать не приходится, приступаем к реализации: добавляем авторам тестов возможность выбирать пол озвучки для каждого вопроса, а при помощи некоторых манипуляций можно изменить тон голоса и скорость чтения.
Казалось бы, что может пойти не так?
На андройде нет мужского голоса... Приложив ладонь к лицу, я осознал что мечтам о разнополой озвучке реплик пока не суждено сбыться, кроме того голоса в разных системах настолько различаются, что автор теста не сможет предусмотреть всё.
На этом я уже собирался похоронить идею, но мне пришла в голову мысль: мы просто отдадим выбор озвучки на откуп конечного пользователя! Так и появился этот патч:
В прохождении теста вас встретит новая кнопка, нажав ее вы сможете настроить озвучку текстов в соответствии со своими предпочтениями:
Надеюсь, это будет вам полезно. А еще надеюсь что со временем появятся нейросети, с помощью которых можно будет преобразовать этот патч в то, что изначально задумывалось.
Спасибо за внимание, держите руку на пульсе. До встречи!