Вот в моем случае STM32 как раз служит видео буфером с интерфейсом камеры DCMI, дополнительно получаем SDIO для записи видео на SD карту.
Идет распределение нагрузки, камера сама жмет картинку, контроллер ее буферирует, а Esp читает и передает по WiFi.
Я делал MJPEG stream, но с применением контроллера, иначе просто не хватает ног у ESP.
Связка:
ESP8266+STM32F407+OV2640.
Передача кадра от контроллера по SPI.
Поток до 1280х960 и кадровкой 8-10fps.
По затратам все укладывается до 1000р. при условии закупки в Китае.
Пробовал и MT9D111 она тоже...