MERCURY127
Platinum Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Цитата: хаймем умеет по разному, обычно именно так и делает. | точнее, хаймем может и так делать, но обычно пользуется сделанной специально для него дырой LOADALL - так быстрее... Цитата: "то вот опкодов для трехрежимного исполнения" т. е. в эпоху х32 успели занять все свободные биты сетки микрокоманд мыслимых для x32? | да. для х64 задействовали часть опкодов, использовавшихся в 286. плюс убрали селекторы совсем, хотели ограничиться флагами разграничения доступа в таблицах страниц... но оказалось, что тогда невозможно сделать виртуализацию (я же говорил - рожали сразу две мамки? одна то вроде как сумела виртуализировать без сегментов, а вторая - нет). поэтому быстренько прикрутили селекторы обратно, но как они там работают - никто не знает. а самое смешное, что хотя 32 битный код и может работать в х64, но только в линейной форме, PE only. LE/LX с его call 1234:abcdef56 - никак. это я не говорю про эпопею с прикручиванием AVX, для которых префикс использует опкоды бывших LDS и LES. те в реальном режиме АВХ никак не пощупать... как там с этим разбирается 32хбитный LINPACK with AVX - хз... теоретически оно не должно работать.... плюс после них еще два три байта. зато теперь у х86 появилось еще одно пространство опкодов... интересно, что придумают, когда и его исчерпают... Цитата: вот а что им мешало сделать комманды больше 15 байт? | ну типа декодер надо переделывать... и наверняка пропадет реальный режим. туда ему и дорога... вот в арме один 4 байтовый опкод умудряются делать две операции над тремя регистрами... и там почти все опкоды 4 байтовые. это я к чему говорю. RISC ядро современных х86 чудовищно мощное (слышали небось про Эльбрус, какой он невъепенно мощный в нативном VLIW? вот и тут то же самое, только еще круче за счет частот и вылизанности ТП). но оно задавлено этой многослойной луковицей. а без этой луковицы - х86 никому и не нужен. скорость набора текста человеком что на Z80, что на 386, что на й7, что 1 мгц нокии, что на 2 ггц арме с 4 ядрами - одинакова. Добавлено: IFkO Цитата: она всегда была. Если мощь повышать набором частоты, не меняя архитектуру и элементную базу. До новой архитектуры ещё додуматься надо, чтобы она получилась лучше прежней. Ты же помнишь историю с пентиумом 4, где специально удлинили конвейер, чтобы он гнался хорошо? И помнишь, что из этого вышло? А вот переход на новые, более мелкие техпроцессы как раз рвет пропорциональность между мощностью вычислительной и потребляемой. И так давно говорят, что "это уже предел", и каждый раз всё-таки придумывают, как можно ещё уменьшить размеры. | тут немного другой предел... термодинамический, квантовый. представь, что у нас 1 бит, и нам нужно провести с ним простейшую операцию - НЕ. сколько энергии нужно затратить на это? пусть один такт, и один бит. сколько энергии надо, чтоб переключить бит? не меньше, чем квант теплового шума при данной температуре. это 0,02 эВ при комнатной температуре. в реальности, конечно, больше на порядки. но не менее 0,02 эВ на переключение одного бита. вот прям щас у меня ЛИНПАК выдает чуть больше 100 гфлопс. это с числами 64 бит с плавающей точкой. те 1 флопс - минимум 64 переключающихся бита в секунду. пусть 100. итого имеем 10 трлн битовых операций в секунду. это если все флопсы сводятся к одним только НЕ, тикающим один раз. в реальности, конечно, больше на порядки. но не менее ТэВ/с = 10^12*10^-20 Дж/c = 10^-8 Вт. меньше этого мой проц, выполняя эти вычисления, кушает не может даже теоретически. в реальности он ест чуть больше 100 Вт. что говоришь? есть запас в 10 млрд раз? нема у пана атамана запасу... 1 - на переключение одного бита вряд ли хватит и десятка тепловых квантов - нужно перезарядить емкости. множим на 100, 2 - логические операции не ограничиваются НЕ. значит, за такт выполняется намного больше переключений вентилей, возьмем 10 - и это на один бит результата, 3 - на один вентиль в АЛУ приходится минимум 10 транзисторов, 4 - у нас не один 64 битный регистр, дергающийся миллиарды раз в сек. их сотни 128-256 битных, плюс компараторы. множим на 1000, уже имеем запас всего в 1000... 5 - помимо этих 1 млн непосредственно считающих транзисторов, в процессоре есть декодер, планировщик, кеши, прочее. да, оно в основном спит, и тикает не на 4 ггц, но... их 2 млрд. и они все периодически хотят жрать! 6 - утечки... так что нема у пана атаману золотого запасу... |