Тема 21: Взаимодействие речи и записи

Материалы темы 21: Аудиовзаимодействие и запись можно условно разделить на два направления. Первое - изучение возможностей преобразования печатного текста в речь (text-to-speech); второе - преобразование разговорной речи в текст (speech-to-text). Начнем с последнего, как наиболее мне известного и используемого.

Став счастливым обладателем смартфона, не могла не обратить внимание на функцию голосового набора текста в поисковых системах Яндекс и Google, установленных в мобильном. Функция довольно удобная, т.к. не всегда получается удачно попадать пальцами по маленьким кнопочкам телефонной клавиатуры. Не скажу, что распознавание в 100% случаев удовлетворительное, но если запрос произнесен четко и отсутствуют посторонние шумы и помехи, то результат вполне хорош.


Более того, особенно оценить эту функцию удалось в чатах типа Google Hangouts, когда нужно практически мгновенно реагировать на записи собеседника, и времени на исправление опечаток нет.

Особенно хотелось отметить приложение Google Now, которое "угадывает наши желания". На первой же неделе после покупки смартфона была искренне удивлена откуда он знает где я работаю, а где живу? Да еще и маршрут от работы до дома может простроить с учетом пробок и расчетом времени. Ну и много еще чего...
Есть, конечно, некоторый дискомфорт от осознания того, что постоянно находишься под контролем неизвестных тебе людей. Непонятно как сотрудники компании распоряжаются полученной обо мне информацией. С другой стороны, в любом случае, мои действия с появлением смартфона и Интернет много где фиксируются. Поэтому, выбор между "возвращением в каменный век" и "идти в ногу со временем", делаю в пользу последнего.

И еще один маленький нюанс. Считается, что точность прогнозов Google Now напрямую зависит от предсказуемости поведения его пользователей. Видимо, я слишком предсказуема, поскольку попадания почти 100-процентные.

Вторая часть темы 21 посвящена синтезаторам речи. Про такие слышала, но использовать ранее не приходилось. Звучит очень заманчиво! Читать книги - это, конечно, здорово! Но когда тебе их читают, это будоражит какие-то детские воспоминания о том как мама или папа читают сказку на ночь, а тебе тепло и уютно. Конечно, синтезированный голос сильно отличается от родных голосов. А вдруг? Стоит попробовать!

В статье приведены примеры различных программ для синтеза речи. Уверена, что список далеко не полный, однако, попробуем разобраться с тем что есть. Исключив платные, англоязычные и ныне не работающие версии программ, осталось не так уж много. 

Acapela-group имеет  он-лайн версию синтезатора, что с одной стороны, позволяет не занимать место на компьютере под установку программы. С другой стороны - обязательно наличие Интернет соединения. Еще большим недостатком данного сервиса является  ограничение на количество читаемых символов (до 300 знаков) и не внятные ударения. Возможно, для получения большего пакета услуг нужна регистрация.

CoolReader предназначена для синтеза текста, представленного в различных форматах, в том числе и популярных .doc, .fb2. Программа устанавливается на компьютер, и для распознавания можно загрузить целую книгу. При этом есть возможность сохранить получившуюся аудиокнигу в формате MP3 для ее дальнейшего прослушивания. Распознавание вполне сносное.

ToM Reader можно использовать и как просмотрщик текстов и как речевой синтезатор одновременно. Число распознаваемых форматов немного меньше, чем у CoolReader, однако возможность создания и сохранения MP3-файлов тоже есть. Одним из отрицательных моментов является ограничение на максимальный размер открываемого файла — 12 Мб.

Но, честно говоря, ощущения тепла и уюта, как в детстве, при прослушивании синтезаторов не возникало. А вот с аудиокнигами - совершенно иная картина. Слушаю с удовольствием! Все-таки не могут еще синтезаторы передавать интонации, эмоции. Или я просто пока таких не встречала? В связи с этим, хотелось бы отметить один весьма любопытный проект, включающий в себя подборку аудиозаписей по различным тематикам, начиная с 1900 года по настоящее время. Не совсем аудиокниги, но тоже интересно.

Также, в рамках темы взаимодействия речи и записи, авторами курса предложены к рассмотрению сервисы для создания аудиоподкастов. Аудиоподкасты - звуковые файлы, расположенные в интернете. Для создания таких файлов существуют различные программы, одна из которых Audioboo. Поборов свою природную застенчивость, все же решилась записать: listen to ‘Послушайте!’ on Audioboo. 

И здесь мне видится широкое поле деятельности для учителей иностранных языков: запись и прослушивание учащимися диалогов, текстов с последующим анализом речи. Также, сервис можно использовать и во внеурочной деятельности - для записи звуковых дорожек к видеороликам, школьных радиопередач, звукового сопровождения к театральным постановкам и т.п. Кстати, можно создать и свой радиоканал, ссылку на который разместить на личном сайте.

Для размещения подкастов есть сервисы Podcast.li.ru (загружаются только личные аудиозаписи) и Podfm.ru. На перечисленных сайтах также можно найти и любительские аудиокниги.

Сервис Playcast позволяет создавать виртуальные открытки, в которых в качестве звуковой заставки можно использовать собственную запись. В качестве примера приведу созданный ранее плейкаст:
В добрый путь!

Тема: Открытки
Автор плэйкаста:EPeshkova
Создан: 20 сентября 2013 года 21:20

и плейкаст - приветствие команды, с авторским музыкальным сопровождением (на гитаре играет ученик 8 класса).
Приветствие команды…

Тема: Поздравления
Автор плэйкаста:EPeshkova
Создан: 13 марта 18:50
То есть, спектр применения данного сервиса довольно широк: от создания авторской открытки до самопрезентации.

Можно долго рассуждать о достоинствах и недостатках цифрового мира, а можно просто использовать его возможности с пользой для дела. Слушаем, читаем, говорим - аудиовзаимодействуем!

Комментариев нет:

Отправить комментарий