Цены конечно впечатляют. Основные отличия тифлоплеера от обычного плеера это размер кнопок и наличие звукового сопровождения, как я и говорил. Конечно, стоимость готового изделия сильно зависит от его наворотов, поскольку навороты потребуют аппаратного обеспечения. Если исходить из того, что желательно, чтобы слабовидящие могли слушать любые файлы, а не специально подготовленные, то TTS очень желательно. Как минимум для произношения названия файлов и каталогов. И что-то очень сомнительно, что TTS на ресурсах дешевых мк способен на приемлемое качество.
В качестве информации.
Есть несколько технологий TTS
Одна из них -на основе Hidden Markov Model Toolkit (HTK) ,
на ней построены flite,festival,rhvoice.
В этой технологии используются голоса живых людей.
В итоге голос человеческий, а не металлический, как в технологиях с синтезом фонем.
--------------------------
Поэтому качество речи в таких TTS системах
определяется качеством (размером) базы голоса и скоростью поиска нужных отрезков синтеза речи на основе текста.
--------------------
Чтобы было понятно,
нормальный голос - это база 200Мбайт.
-------------------
Сейчас решений для микроконтроллеров с хорошим качеством фактически нет.
Решение на нейронной сети для русского языка - это либо CUDA, либо 6 ядер 3ГГц.
И разработчики визжат от восторга, что ресурсов у них потребляется не много.
----------------------------------
В моем варианте три ядра -микроконтроллеры и flite.
Это будут три ESP, база на SD карте с низкоуровневым обращением объем до 16ГБ.
По предварительным оценкам, это позволяет воспроизводить речь высокого качества с частотой дискретизации не менее 50 КГц.
проблема в адаптации голосовой базы и ускорении анализа дерева решения. Это пока в перспективе.