• Уважаемые посетители сайта esp8266.ru!
    Мы отказались от размещения рекламы на страницах форума для большего комфорта пользователей.
    Вы можете оказать посильную поддержку администрации форума. Данные средства пойдут на оплату услуг облачных провайдеров для сайта esp8266.ru
  • Система автоматизации с открытым исходным кодом на базе esp8266/esp32 микроконтроллеров и приложения IoT Manager. Наша группа в Telegram

JL SoC

pvvx

Активный участник сообщества
Кроме того, есть разработка устройства "говорящая трость" Теперь добавьте к нему Ваше решение в виде смартфона и попробуйте с ним походить держа его на вытянутой руке.
Зачем его носить? Оно что, на полку не влезет?
Слепые гуляют там, где нет покрытия 2/3/4/5G?
Т.е. вам таки не понятно, зачем нужно устройство с нормальной ОС (?) - для нормальной и стабильной работы по интернет протоколам и никакой JL или ESP с этим не справится.
Блок управления и коммутации умным домом вы тоже на вытянутой руке таскаете?
 

pvvx

Активный участник сообщества
Мы наверняка по-разному понимаем термин "стандарт" - но обычно само наличие стандарта на какой-либо класс устройств сильно сужает выбор чипов до сертифицированных на соответствие данному стандарту.
Не думаю, что эти копеечные чипы имеют вообще хоть какую-то сертификацию.
На "стандартных" вещах, не имея связей и проплат не заработать. Раз уже есть "стандарт", то это уже древняя работенка с мульоном "конкурентов" на место главного распределителя. Какой смысл в это вписываться, если там сама разработка электронной начинки вообще ничего не стоит и делается нищими студентами за похлебку. И как такое может понравиться или иметь что-то интересное и нужное?
Вот nikolz и воет, да лезет не туда и заходит не от туда :)
 

nikolz

Well-known member
На "стандартных" вещах, не имея связей и проплат не заработать. Раз уже есть "стандарт", то это уже древняя работенка с мульоном "конкурентов" на место главного распределителя. Какой смысл в это вписываться, если там сама разработка электронной начинки вообще ничего не стоит и делается нищими студентами за похлебку. И как такое может понравиться или иметь что-то интересное и нужное?
Вот nikolz и воет, да лезет не туда и заходит не от туда :)
Очевидно, что Вы не в теме, поэтому и гоните пургу.
 

nikolz

Well-known member
Чтобы пургу не гнали, выкладываю картинку с ценами современных плееров для незрячих
1657188248305.png

1657188333748.png
 

8465

Member
Цены конечно впечатляют. Основные отличия тифлоплеера от обычного плеера это размер кнопок и наличие звукового сопровождения, как я и говорил. Конечно, стоимость готового изделия сильно зависит от его наворотов, поскольку навороты потребуют аппаратного обеспечения. Если исходить из того, что желательно, чтобы слабовидящие могли слушать любые файлы, а не специально подготовленные, то TTS очень желательно. Как минимум для произношения названия файлов и каталогов. И что-то очень сомнительно, что TTS на ресурсах дешевых мк способен на приемлемое качество.
 

nikolz

Well-known member
Вопрос знатокам.
Взял для экспериментов вот такую плату.
1657251333083.png
чит AS21BP0A208. или AC (плохо видно надпись)
дайте ссылку на SDK, datasheet, протокол программирования .
если есть опыт работы, то - свое мнение.
Спасибо.
 

Apis

New member
Почти наверняка АС. А есть фирменный логотип ДжейЛи ( в виде греческой буквы "пи")? Если да, то самые важные последние три цифры и буквы через тире. Напишите их и можно будет двинуться дальше.
 

beacon

Member
Вопрос знатокам.
...
Выше правильно сказали: чтобы точнее идентифицировать чип, нужны буквоцифры после тире.

Но насколько мне не изменяет мой склероз, это AC4602, более старая версия.
Toolchain там тоже старый, gcc-шный (dv10 они его переобозвали); впрочем, проблема не в gcc, а в том, что в библиотеки запакован уже готовый код, а в новом (Clang/LLVM) - промежуточный байткод. Можно, наверное, либы и перепаковать - но вряд ли оно стоит трудозатрат. Впрочем, не исключено, что и не получится - ибо китайцы известны своим умением из спи3женного стандартного сделать абсолютно несовместимое.

Короче, toolchain 125MB и SDK к нему ещё 25MB, сюда на форум столько можно залить?

Даташиты на них вот здесь, например:

"Протокол программирования" производителем по какой-то одному ему ведомой причине держится в тайне.
Есть годовый донгл для прошивки (на али), есть его недоимитация от одного пресловутого персонажа, есть isd_download.exe для прошивки через этот донгл без какой-либо документации. Можно, конечно, этот isd_download отреверсить, чтобы посмотреть, что там унутре - но опять же, стоит ли оно тех трудозатрат.
 

beacon

Member
На "стандартных" вещах, не имея связей и проплат не заработать. Раз уже есть "стандарт", то это уже древняя работенка с мульоном "конкурентов" на место главного распределителя. Какой смысл в это вписываться, если там сама разработка электронной начинки вообще ничего не стоит и делается нищими студентами за похлебку. И как такое может понравиться или иметь что-то интересное и нужное?
Вот nikolz и воет, да лезет не туда и заходит не от туда :)
Я честно говоря не вполне понял, о чём вы.
А я говорил о стандартах типа ISO26262.
Да, соответствие подобным стандартам стоит каких-то денег - главным образом, на оборудование соответствующей тестовой лаборатории.
 

beacon

Member
что-то очень сомнительно, что TTS на ресурсах дешевых мк способен на приемлемое качество.
Тут более сомнительна сама возможность на этом что-либо "скроить".
Ну Ок, девборда стоит сотню недружественной валюты. Но вряд ли в результате к ней приложится "поддержка" чем-либо отличающаяся от всех этих недо-sdk и недокументированного toolchain.

Обычно-то ведь документация как раз доступна в первую очередь - чтобы потенциальный покупатель заранее оценил, какой прекрасный чип, и как легко и просто с ним работать.
 

nikolz

Well-known member
Цены конечно впечатляют. Основные отличия тифлоплеера от обычного плеера это размер кнопок и наличие звукового сопровождения, как я и говорил. Конечно, стоимость готового изделия сильно зависит от его наворотов, поскольку навороты потребуют аппаратного обеспечения. Если исходить из того, что желательно, чтобы слабовидящие могли слушать любые файлы, а не специально подготовленные, то TTS очень желательно. Как минимум для произношения названия файлов и каталогов. И что-то очень сомнительно, что TTS на ресурсах дешевых мк способен на приемлемое качество.
В качестве информации.
Есть несколько технологий TTS
Одна из них -на основе Hidden Markov Model Toolkit (HTK) ,
на ней построены flite,festival,rhvoice.
В этой технологии используются голоса живых людей.
В итоге голос человеческий, а не металлический, как в технологиях с синтезом фонем.
--------------------------
Поэтому качество речи в таких TTS системах
определяется качеством (размером) базы голоса и скоростью поиска нужных отрезков синтеза речи на основе текста.
--------------------
Чтобы было понятно,
нормальный голос - это база 200Мбайт.
-------------------
Сейчас решений для микроконтроллеров с хорошим качеством фактически нет.
Решение на нейронной сети для русского языка - это либо CUDA, либо 6 ядер 3ГГц.
И разработчики визжат от восторга, что ресурсов у них потребляется не много.
----------------------------------
В моем варианте три ядра -микроконтроллеры и flite.
Это будут три ESP, база на SD карте с низкоуровневым обращением объем до 16ГБ.
По предварительным оценкам, это позволяет воспроизводить речь высокого качества с частотой дискретизации не менее 50 КГц.
проблема в адаптации голосовой базы и ускорении анализа дерева решения. Это пока в перспективе.
 

Apis

New member
SDK брал на ресурсе под названием Mega (кажется так). Там примерно 800 Мбайт всякой всячины - от мусора до полезных вещей. Ссылку навскидку не найду. Есть и на Гитхабе что-то, там наверное проще копаться. Если не найдете - сообщите, буду специально искать. Среда программирования Code::Bloks, с ней все вроде понятно и красиво.
 

Apis

New member
Схему найдете по ссылке от Beacon-а выше. Но что бы работать в Кодеблоксе с этими процами надо пройти квест. А вот донгл для Вас может не понадобиться. Цифры 21 после АС говорят о годе выпуска, и они в новых чипах что то добавляют в прошивку, что он сразу видится в диспетчере задач и как дисковое устройчтво и как звуковуха и еще может несколько устройств.
 

nikolz

Well-known member
Чипcет с Android посаженный на плату с разъемами всевозможных интерфейсов, на китайском рынке стоит уже до 1 т.р.
Да, там будет не последний Android, но вам то зачем последний?
С Линух ещё дешевле, т.к. встроенные в чип 32..64 Мбайта RAM для ваших задач предостаточно...
можете дать ссылку на
Чипcет с Android посаженный на плату с разъемами всевозможных интерфейсов, на китайском рынке стоит уже до 1 т.р.
и
С Линух ещё дешевле, т.к. встроенные в чип 32..64 Мбайта RAM
 

pvvx

Активный участник сообщества
можете дать ссылку на
Чипcет с Android посаженный на плату с разъемами всевозможных интерфейсов, на китайском рынке стоит уже до 1 т.р.
и
С Линух ещё дешевле, т.к. встроенные в чип 32..64 Мбайта RAM
К примеру, посмотрите board-ы для записи видео с камер...
По поводу 32MiB - такое есть в древнем чипе МС200 в Eport-Pro, а так-же в аналогичных по старости китайских чипах для видеокамер...
 

pvvx

Активный участник сообщества
Поэтому качество речи в таких TTS системах
определяется качеством (размером) базы голоса и скоростью поиска нужных отрезков синтеза речи на основе текста.
Как раз это минимальная из проблем на нормальном MCU, но не для ESP. У ESP поток с Flash или SD сверх органичен из-за кривых контроллеров с узкими шинами и без DMA, да с одновременной подгрузкой кода и данных для двух CPU. В итоге предел обработки потока до десятка мегабайт в теоретическом максимуме при линейном переборе. А через внешние интерфейсы ещё в десятку менее и Франкенштейн из обрубков ESP только усугубит все задачи. Тем более студенты пишут код для таких задач с ужасающей рандомной выборкой и никакие кЭши не спасут, а усугубят.
При правильно писанном алгоритме и нормальном MCU рандом выборка с носителей Flash типов находится на уровне нескольких ГБайт в сек (пример - контроллер SSD) :p
Та блин ужасные для вас RTL87xx имеют полноценный встроенный SD контроллер, работа которого происходит независимо от CPU и имеет скорости обработки потока в десятки Мбайт/c.
И если алгоритм продумывался нормальными людьми, то для таких дел хватает и десяти МГц-ового CPU, что уже было проверено на практике 20 лет назад.

ESP32 в данных задачах имеет производительность не более чем STM32 на 8..16 МГц. Такова его архитектура.
 

pvvx

Активный участник сообщества
Это будут три ESP, база на SD карте с низкоуровневым обращением объем до 16ГБ.
По предварительным оценкам, это позволяет воспроизводить речь высокого качества с частотой дискретизации не менее 50 КГц.
проблема в адаптации голосовой базы и ускорении анализа дерева решения. Это пока в перспективе.
Мы использовали DSP а не MCU, т.к. у DSP несколько мат. операций за такт с выборкой по 3- шинам к ядру без всяких кЭшей. Просто потрудились с математикой и алгоритмами… Программа сборки итоговой базы работала часами на самом современном ПК того времени :p

И как пример – ваш текущий комп с дцать ядрами не может обеспечить прием с UART по байтно в пользовательское приложение уже на 115200 Baud :p Система будет загружена на 100% :p
 
Сверху Снизу