• Система автоматизации с открытым исходным кодом на базе esp8266/esp32 микроконтроллеров и приложения IoT Manager. Наша группа в Telegram

JL SoC

pvvx

Активный участник сообщества
Кроме того, есть разработка устройства "говорящая трость" Теперь добавьте к нему Ваше решение в виде смартфона и попробуйте с ним походить держа его на вытянутой руке.
Зачем его носить? Оно что, на полку не влезет?
Слепые гуляют там, где нет покрытия 2/3/4/5G?
Т.е. вам таки не понятно, зачем нужно устройство с нормальной ОС (?) - для нормальной и стабильной работы по интернет протоколам и никакой JL или ESP с этим не справится.
Блок управления и коммутации умным домом вы тоже на вытянутой руке таскаете?
 

pvvx

Активный участник сообщества
Мы наверняка по-разному понимаем термин "стандарт" - но обычно само наличие стандарта на какой-либо класс устройств сильно сужает выбор чипов до сертифицированных на соответствие данному стандарту.
Не думаю, что эти копеечные чипы имеют вообще хоть какую-то сертификацию.
На "стандартных" вещах, не имея связей и проплат не заработать. Раз уже есть "стандарт", то это уже древняя работенка с мульоном "конкурентов" на место главного распределителя. Какой смысл в это вписываться, если там сама разработка электронной начинки вообще ничего не стоит и делается нищими студентами за похлебку. И как такое может понравиться или иметь что-то интересное и нужное?
Вот nikolz и воет, да лезет не туда и заходит не от туда :)
 

nikolz

Well-known member
На "стандартных" вещах, не имея связей и проплат не заработать. Раз уже есть "стандарт", то это уже древняя работенка с мульоном "конкурентов" на место главного распределителя. Какой смысл в это вписываться, если там сама разработка электронной начинки вообще ничего не стоит и делается нищими студентами за похлебку. И как такое может понравиться или иметь что-то интересное и нужное?
Вот nikolz и воет, да лезет не туда и заходит не от туда :)
Очевидно, что Вы не в теме, поэтому и гоните пургу.
 

nikolz

Well-known member
Чтобы пургу не гнали, выкладываю картинку с ценами современных плееров для незрячих
1657188248305.png

1657188333748.png
 

8465

Member
Цены конечно впечатляют. Основные отличия тифлоплеера от обычного плеера это размер кнопок и наличие звукового сопровождения, как я и говорил. Конечно, стоимость готового изделия сильно зависит от его наворотов, поскольку навороты потребуют аппаратного обеспечения. Если исходить из того, что желательно, чтобы слабовидящие могли слушать любые файлы, а не специально подготовленные, то TTS очень желательно. Как минимум для произношения названия файлов и каталогов. И что-то очень сомнительно, что TTS на ресурсах дешевых мк способен на приемлемое качество.
 

nikolz

Well-known member
Вопрос знатокам.
Взял для экспериментов вот такую плату.
1657251333083.png
чит AS21BP0A208. или AC (плохо видно надпись)
дайте ссылку на SDK, datasheet, протокол программирования .
если есть опыт работы, то - свое мнение.
Спасибо.
 

Apis

New member
Почти наверняка АС. А есть фирменный логотип ДжейЛи ( в виде греческой буквы "пи")? Если да, то самые важные последние три цифры и буквы через тире. Напишите их и можно будет двинуться дальше.
 

beacon

Member
Вопрос знатокам.
...
Выше правильно сказали: чтобы точнее идентифицировать чип, нужны буквоцифры после тире.

Но насколько мне не изменяет мой склероз, это AC4602, более старая версия.
Toolchain там тоже старый, gcc-шный (dv10 они его переобозвали); впрочем, проблема не в gcc, а в том, что в библиотеки запакован уже готовый код, а в новом (Clang/LLVM) - промежуточный байткод. Можно, наверное, либы и перепаковать - но вряд ли оно стоит трудозатрат. Впрочем, не исключено, что и не получится - ибо китайцы известны своим умением из спи3женного стандартного сделать абсолютно несовместимое.

Короче, toolchain 125MB и SDK к нему ещё 25MB, сюда на форум столько можно залить?

Даташиты на них вот здесь, например:

"Протокол программирования" производителем по какой-то одному ему ведомой причине держится в тайне.
Есть годовый донгл для прошивки (на али), есть его недоимитация от одного пресловутого персонажа, есть isd_download.exe для прошивки через этот донгл без какой-либо документации. Можно, конечно, этот isd_download отреверсить, чтобы посмотреть, что там унутре - но опять же, стоит ли оно тех трудозатрат.
 

beacon

Member
На "стандартных" вещах, не имея связей и проплат не заработать. Раз уже есть "стандарт", то это уже древняя работенка с мульоном "конкурентов" на место главного распределителя. Какой смысл в это вписываться, если там сама разработка электронной начинки вообще ничего не стоит и делается нищими студентами за похлебку. И как такое может понравиться или иметь что-то интересное и нужное?
Вот nikolz и воет, да лезет не туда и заходит не от туда :)
Я честно говоря не вполне понял, о чём вы.
А я говорил о стандартах типа ISO26262.
Да, соответствие подобным стандартам стоит каких-то денег - главным образом, на оборудование соответствующей тестовой лаборатории.
 

beacon

Member
что-то очень сомнительно, что TTS на ресурсах дешевых мк способен на приемлемое качество.
Тут более сомнительна сама возможность на этом что-либо "скроить".
Ну Ок, девборда стоит сотню недружественной валюты. Но вряд ли в результате к ней приложится "поддержка" чем-либо отличающаяся от всех этих недо-sdk и недокументированного toolchain.

Обычно-то ведь документация как раз доступна в первую очередь - чтобы потенциальный покупатель заранее оценил, какой прекрасный чип, и как легко и просто с ним работать.
 

nikolz

Well-known member
Цены конечно впечатляют. Основные отличия тифлоплеера от обычного плеера это размер кнопок и наличие звукового сопровождения, как я и говорил. Конечно, стоимость готового изделия сильно зависит от его наворотов, поскольку навороты потребуют аппаратного обеспечения. Если исходить из того, что желательно, чтобы слабовидящие могли слушать любые файлы, а не специально подготовленные, то TTS очень желательно. Как минимум для произношения названия файлов и каталогов. И что-то очень сомнительно, что TTS на ресурсах дешевых мк способен на приемлемое качество.
В качестве информации.
Есть несколько технологий TTS
Одна из них -на основе Hidden Markov Model Toolkit (HTK) ,
на ней построены flite,festival,rhvoice.
В этой технологии используются голоса живых людей.
В итоге голос человеческий, а не металлический, как в технологиях с синтезом фонем.
--------------------------
Поэтому качество речи в таких TTS системах
определяется качеством (размером) базы голоса и скоростью поиска нужных отрезков синтеза речи на основе текста.
--------------------
Чтобы было понятно,
нормальный голос - это база 200Мбайт.
-------------------
Сейчас решений для микроконтроллеров с хорошим качеством фактически нет.
Решение на нейронной сети для русского языка - это либо CUDA, либо 6 ядер 3ГГц.
И разработчики визжат от восторга, что ресурсов у них потребляется не много.
----------------------------------
В моем варианте три ядра -микроконтроллеры и flite.
Это будут три ESP, база на SD карте с низкоуровневым обращением объем до 16ГБ.
По предварительным оценкам, это позволяет воспроизводить речь высокого качества с частотой дискретизации не менее 50 КГц.
проблема в адаптации голосовой базы и ускорении анализа дерева решения. Это пока в перспективе.
 

Apis

New member
SDK брал на ресурсе под названием Mega (кажется так). Там примерно 800 Мбайт всякой всячины - от мусора до полезных вещей. Ссылку навскидку не найду. Есть и на Гитхабе что-то, там наверное проще копаться. Если не найдете - сообщите, буду специально искать. Среда программирования Code::Bloks, с ней все вроде понятно и красиво.
 

Apis

New member
Схему найдете по ссылке от Beacon-а выше. Но что бы работать в Кодеблоксе с этими процами надо пройти квест. А вот донгл для Вас может не понадобиться. Цифры 21 после АС говорят о годе выпуска, и они в новых чипах что то добавляют в прошивку, что он сразу видится в диспетчере задач и как дисковое устройчтво и как звуковуха и еще может несколько устройств.
 

nikolz

Well-known member
Чипcет с Android посаженный на плату с разъемами всевозможных интерфейсов, на китайском рынке стоит уже до 1 т.р.
Да, там будет не последний Android, но вам то зачем последний?
С Линух ещё дешевле, т.к. встроенные в чип 32..64 Мбайта RAM для ваших задач предостаточно...
можете дать ссылку на
Чипcет с Android посаженный на плату с разъемами всевозможных интерфейсов, на китайском рынке стоит уже до 1 т.р.
и
С Линух ещё дешевле, т.к. встроенные в чип 32..64 Мбайта RAM
 

pvvx

Активный участник сообщества
можете дать ссылку на
Чипcет с Android посаженный на плату с разъемами всевозможных интерфейсов, на китайском рынке стоит уже до 1 т.р.
и
С Линух ещё дешевле, т.к. встроенные в чип 32..64 Мбайта RAM
К примеру, посмотрите board-ы для записи видео с камер...
По поводу 32MiB - такое есть в древнем чипе МС200 в Eport-Pro, а так-же в аналогичных по старости китайских чипах для видеокамер...
 

pvvx

Активный участник сообщества
Поэтому качество речи в таких TTS системах
определяется качеством (размером) базы голоса и скоростью поиска нужных отрезков синтеза речи на основе текста.
Как раз это минимальная из проблем на нормальном MCU, но не для ESP. У ESP поток с Flash или SD сверх органичен из-за кривых контроллеров с узкими шинами и без DMA, да с одновременной подгрузкой кода и данных для двух CPU. В итоге предел обработки потока до десятка мегабайт в теоретическом максимуме при линейном переборе. А через внешние интерфейсы ещё в десятку менее и Франкенштейн из обрубков ESP только усугубит все задачи. Тем более студенты пишут код для таких задач с ужасающей рандомной выборкой и никакие кЭши не спасут, а усугубят.
При правильно писанном алгоритме и нормальном MCU рандом выборка с носителей Flash типов находится на уровне нескольких ГБайт в сек (пример - контроллер SSD) :p
Та блин ужасные для вас RTL87xx имеют полноценный встроенный SD контроллер, работа которого происходит независимо от CPU и имеет скорости обработки потока в десятки Мбайт/c.
И если алгоритм продумывался нормальными людьми, то для таких дел хватает и десяти МГц-ового CPU, что уже было проверено на практике 20 лет назад.

ESP32 в данных задачах имеет производительность не более чем STM32 на 8..16 МГц. Такова его архитектура.
 

pvvx

Активный участник сообщества
Это будут три ESP, база на SD карте с низкоуровневым обращением объем до 16ГБ.
По предварительным оценкам, это позволяет воспроизводить речь высокого качества с частотой дискретизации не менее 50 КГц.
проблема в адаптации голосовой базы и ускорении анализа дерева решения. Это пока в перспективе.
Мы использовали DSP а не MCU, т.к. у DSP несколько мат. операций за такт с выборкой по 3- шинам к ядру без всяких кЭшей. Просто потрудились с математикой и алгоритмами… Программа сборки итоговой базы работала часами на самом современном ПК того времени :p

И как пример – ваш текущий комп с дцать ядрами не может обеспечить прием с UART по байтно в пользовательское приложение уже на 115200 Baud :p Система будет загружена на 100% :p
 
Сверху Снизу