Уже описано - главное не SIP. SIP - это подобие HTTP сервера и он всего распределяет (согласовывает с клиентом) на каком протоколе будут передаваться потоки и занимается конфигурацией форматов в этих потоках. У вас выбор протоколов передачи данных нулевой. Всего один вариант
RTP c кодеками, известными телефону.
Вот на него и пишется SIP. Т.е. выкидывается 99.9% его функций, т.к. они всё равно не обслуживаются. Вся работа заключается в описании драйверов передачи потоковых данных... Делать это никто не будет, т.к. выходит куцая реализация заточенная на конкретные устройства, а на такую оптимизацию (выкидывания кучи всего, оставив только необходимое) требуется дофига времени на изучение и отладку...
Так что сами пишите, отлаживаете и предоставляете сюда всем готовенькое - будем ругать и хаять