@nikolz - Вы читать умеете или только писать?
Если вы прочитали то, на что указываете ссылки, то разница составляет время загрузки 1 сектора на 80 MHz QIO (100мкс или 40MB в сек). Но, при условии, что ваш загрузчик 2-го этапа укладывается в пару секторов и инициализирует MMU быстрее, чем...