VdV
Moderator-адвокат дьявола | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Интересные размышления мембера daMage с iXBT: Цитата: Мне кажется, что проблема вокруг FP16 и FP32 слишком раздута и возможно выгодна самой nVidia. Она отводит в сторону от основной проблемы FX архитектуры – низкой вычислительной производительности GPU на базе FX engine. Как уже было отмечено независимыми обозреватилями FX имеет 4 ALU против 8 ALU у R300 и никакая FP16 или новый драйвер релиз не сделает из четырех восемь. Вот поэтому если писать программы с расчетом на сложные вычисления скорость 5900Ultra будет приблежаться к скорости R9600Pro, у обоих 4 ALU и примерно равные clocks. Но это еще не все, по каким-то своим соображениям nVidia реализовала особый способ загрузки данных в ALU, который неоптимален во многих случаях. Это какие-то ограничения на временные регистры, это использовани 2 TMU, и еще всякие причуды понятные только nVidia. Мое объяснение этому очень простое. Большинство читателей IXBT форума не имеют малейшего представления, что значит работать над огроммными проэктами и какая оветственность лежит над людьми, которые должны принимать окончательные решения. Когда компания из маленькой превращается в большую, наступает момент, когда люди изначально работающие в компании, начинают бояться каких либо кардинальных перемен. Все может обойтись если ты монополист на рынке, но такое поведение черевато плохими последствиями, если ты в жесткой конкуренции. Надеюсь мне не надо объяснять, что процесс создания высоко-технолгического GPU очень сложен и простые фразы типа “А давайте мы все переделаем в новом чипе, потому что так лучше и потому, что мы самые умные” в больших компаниях так просто не проходят. На такое может даться добро только тогда, когда “петух кукарекнет”. В маленьких компаниях такое может пройти, поскольку терять нечего. Со времен GF1, nVidia из маленькой компании превратилась чуть ли не в монополиста. FX ахитектура это надстройка над GF4, в свое время как GF4 вылезаный GF3, а GF3 надстройка на GF2, который есть усовершенствованый GF. Люди создававшие GF не заметила момента, когда от мощи MTU и FF TCL перешли к мощи програмируемого ALU, а может просто у них нет больше идей(иссякли, разжирели) и компании нужна новая струя. Отсюда вытекает вся нелепость, громоскость и тормознутость FX серии. И Valve абсолютно правильно назвал ее DX8 архитектурой. Архитектурой TMU, а не ALU. Если в очень грубой форме подсчитать транзисторы для R300 8x24 = 192, GFFX 4*32 = 128, то станет немножко не понятным на что nVidia тратит большее по сравнению с R300 число транзисторов. Теоретически R300 должен быть на треть больше FX. Это может быть и FF TCL, который съедает до 15% FX, а может просто нелепость и громскость в реализации pipelinе для PS20, а может там внутри остался код который забыли выкинуть со времен GF . Скорей всего FP16 ускоряет загрузку данных в ALU, но на этом сильно не уедешь. Основной козырь nVidia может быть только замена кода shaders, с использованием аппроксимаций в вычислениях. Спаривание инструкций работающих с загрузкой тестурных данных, ухудшение качества текстур и фильтрации, которые позволят ускорить загрузку данных в ALU. Заметьте если игра сама будет использовать аппроксимации, то это будет быстрей работать и на Ati. Поэтому nVidia и не настаивает на этом, иначе “оптимизировать” нечего будет. Хочу также пояснить всем читателям этого форума, что если все начнут включать такие же “оптимизация” на основе application detection, то прирост будет не меньшей, но это путь в некуда. Все это усложняет разработку, а не упрощает ее. Когда Valve говорит о 5 кратном увеличение времени разработки для nVidia, это так и есть. Для тех кто это не совсем понял, поясняю, что в создание игры большая часть времени уходит на создание карт, разработки сценария, текстур, персонажей, анимация персонажей, физика игры, звук. Если посмотреть сколько людей работает над графическим еngine, то можно увидеть 2-4 человека. Поэтому 5 раз в терминах человеко-часов, то оно и есть. Хочу также ответить на безосновательные наезды на DX9 SHL2 shaders compiler, который якобы “оптимизирован” под Ati. Со слов Кармака, R300 в 2 раза быстрей FX в OGL2 path. Compiler OGL2 shaders для nVidia HW, делает сама nVidia, а не Microsoft или Ati. Так на кого теперь бочки катить будем? Я так понимаю на sombody else. Со слов того же Кармака ему значительно удобней было иметь один путь OGL2, но он должен тратить время на какой-то “специальный” путь для FX, в котром “магический” Кармак делает работу 4 конвееров быстрее 8 конвееров. В конечном итоге Doom3 превращается в долгострой. Конечно, может у ID достаточно средств для этого, но у других их может просто не быть. Об этом и говорит Valve. Хочу пояснить всем читателям этого форума, что линейка NV3x мертвая и Nvidia это понимает лучше, чем anybody else. Петух для nVidia уже кричит. С выходом NV40, “оптимизации” под NV3x, будут сварачиваться. Если вы действительно покупаете видео за 300-500 своих баксов, а не получаете ее бесплатно от somebody else, мой совет, хорошо все взвесить и решить для себя, что же все же больше 4 или 8. |
---------- Любовь к себе — это начало романа, который длится всю жизнь. Оскар Уайльд |
|