Экстремальный разгон NVIDIA GeForce3


"Когда тебе плохо, болит голова, — поди-ка, открой холодильник… "
(А. Пугачева)

Нет, это не переход из холодного лета 2001 года обратно в зиму :-). Это, так сказать, преамбула в виде иллюстрации. Уже многие любители — оверклокеры догадались, что речь пойдет об экстремальном разгоне видеокарты при искусственно созданных холодных, даже морозных условиях.

Вообще-то, это у нас традиция такая: при появлении нового видеочипсета после всевозможных обзоров и исследований работы карт на его основе, одну из них выставляем на мороз, чтобы выяснить, а каков потенциал у нового детища? Заодно и порадоваться немыслимыми значениями скоростей в 3D.

И было действительно так при появлении на свет и попадании к нам в лабораторию карт на базе GeForce2 GTS и GeForce2 Ultra. Нам хотелось знать, а какую производительность примерно можно получить от последующего детища NVIDIA. Разумеется, не зная точных спецификаций будущих продуктов, это представление было весьма условным.

Вернемся к GeForce3. У нас вышло уже довольно большое количество статей по этому графическому процессору, поэтому я просто дам ссылки на них для желающих познакомиться с аналитическими материалами, связанными с этим GPU, а также обзорами видеокарт на базе NVIDIA GeForce3:

(Я прошу обратить внимание на раздел Видеосистема, в котором будут появляться аннотации к обзорам видеокарт на новейшем процессоре от NVIDIA, в которых указано, на какие моменты сделан упор в той или иной статье).

Как известно уже из вышеперечисленных материалов, NVIDIA GeForce3 имеет частоту ядра 200 МГц, а комплектуется памятью, работающей на 230 (460) МГц. В силу своей архитектуры видеокарты на этом процессоре дают великолепную скорость в 32-битном цвете, обгоняя предшественников на основе GeForce2 Ultra, у которых ядро работает на частоте 250 МГц.

Несмотря на то, что GeForce3 выполнен по 0.15 мкм технологии, этот GPU имеет 57 миллионов транзисторов и очень сложен по своей архитектуре, в том числе наличие довольно большого объема кеша внутри чипа снижает потенциал по наращиванию тактовой частоты. А нужно ли ее вообще повышать? Может и этой частоты хватит на все и вся? Нет! И мы уже успели в этом убедиться в вышеперечисленных статьях, когда активизация некоторых функций приводит к значительному падению производительности, а уж тем паче при одновременном использовании, скажем, анизотропии и анти-алиасинга. Поэтому возможности по повышению частоты, а значит, и скорости работы чипсета и памяти нас очень и очень интересуют.

В эпиграфе говорится про холодильник. Ну что ж, давайте откроем (даже если нам не плохо, и голова у нас не болит :-)

У Аллы Пугачевой дальше говорится: "Достань там икорку, печень трески, трепанга возьми и вперед!" А у нас там… системный блок! И не простой, на базе Athlon 1,2 GHz:

  • процессор AMD Athlon 1200 (133MHz x 9):
  • системная плата Chaintech 7KJD (AMD760);
  • оперативная память 256 MB DDR SDRAM PC2100;
  • видеокарта Inno3D Tornado GeForce3;
  • жесткий диск IBM DTLA 45GB;
  • операционная система Windows 98 SE;

Как видно из спецификации тестового стенда, виновник торжества представлен видеокартой Inno3D Tornado GeForce3. Эта плата выполнена на основе эталонного дизайна, поэтому мало чем принципиально отличается от почти всех остальных своих собратьев (на сегодня только ASUS AGP-V8200/Deluxe имеет свой собственный дизайн). Мы уже рассказывали об этой карте. Тем не менее, в целях разгона ее пришлось "доработать":

Для этого была использована мелкозернистая наждачная бумага. Если посмотреть внимательно на чипсет, то можно заметить, что металлическая крышка в его центре чуть-чуть утоплена, а пластмассовые стенки возвышаются над центром. Даже если это составляет доли миллиметра, теплоотдача ухудшается, так как радиатор упирается в стенки, а тепло между крышкой и радиатором может передать только паста, что не очень хорошо. Поэтому при помощи наждака очень аккуратно убираем эту разницу по высоте между стенками чипа и центральной крышкой. Ну и теперь, как говорится, милости просим к нам на Колыму, в 10-градусный мороз :-) Да, чуть не забыл представить помощника — советский холодильник производства 80-х годов — "ОКА".

Разумеется, можно получить прекрасные результаты по разгону и без морозильника, например, используя элемент Пельтье. Продемонстрируем монтаж этой системы охлаждения на примере двух видеокарт.

ASUS AGP-V8200 Deluxe

Вначале мы демонтируем центральный радиатор, извлекаем из него черные клипсы, на которых он крепится к карте.

       

Клипсы подготовливаем к новому монтажу, сильно укорачивая пружину, которая обеспечивает прижим радиатора к плате. На фотографиях выше это все отображено. Затем подготавливаем сам чип, нанеся на него термопасту тонким слоем. И уже после этого устанавливаем сам элемент Пельтье (НЕ ПЕРЕПУТАЙТЕ ОХЛАЖДАЮЩУЮ И ВЫДЕЛЯЮЩУЮ ТЕПЛО СТОРОНЫ!). На снимках ниже это можно увидеть:

       

Ну и сверху следует закрепить кулер (расстояние от радиатора до платы стало больше, поэтому клипсы и подготовливались для такого случая):

       

Однако использование штатного кулера малоэффективно, так как элемент Пельтье выделяет огромное количество тепла, и низкореберный радиатор не в состоянии это тепло рассеять, поэтому требуется обязательное внешнее охлаждение. Но можно поступить иначе, используя кулеры от других устройств, например, от центральных процессоров. Можно выбрать, например, массивный кулер от Intel Pentium III, и его установить поверх модуля Пельтье:

       

На верхнем правом снимке показано, как элементарно этот радиатор можно закрепить при помощи канцелярских резинов и даже куска телефонного одножильного провода. Но подчас, как показала практика, и такого кулера недостаточно для рассеивания мощного потока тепла от элемента Пельтье. Поэтому можно использовать и более массивный кулер, вроде такого:


Это кулер Global Win предназначен для охлаждения процессоров AMD Athlon (Duron) и имеет высокооборотный вентилятор, поэтому проблем с охлаждением уже нет, однако шум этого устройства многим покажется очень раздражающим.

Я должен предупредить, что как при использовании элемента Пельтье, так и при охлаждении системного блока в обычном холодильнике с ледообразованием, есть большая вероятность образования КОНДЕНСАТА. Поэтому рекомендуется подобные опыты проводить только в разовом порядке для экспериментов и ни в коем случае не охлаждать подобным образом длительное время. Я также напоминаю, что ни я, ни iXBT.com, не несем ответственности за последствия разгона какого-либо устройства. При повышении частот выше номинала всю ответственность за последствия пользователь берет на себя.

Inno3D Tornado GeForce3

Собственно, операции по монтажу очень схожи с вышеперечисленными, поэтому я просто приведу снимки, на которых методика очевидна:

       

Такой способ охлаждения нам дает шанс поднять частоту работы GPU до 250-270 МГц, что, конечно же, меньше тех значений, что мы получили при эксперименте в морозильной камере, к тому же при использовании элемента Пельтье охлаждается только сам чип, а в морозилке — и графический процессор, и память. Однако по доступности последний описанный метод охлаждения, разумеется, более привлекателен.

Результаты тестов

При тестировании использовалась версия драйверов 12.40, VSync отключен. В качестве инструментария мы использовали id Software Quake3 v.1.17 — игровой тест, демонстрирующий работу платы в OpenGL с использованием стандартного демо-бенчмарка demo002 и бенчмарка Quaver, демонстрирующего работу видеокарт на тяжелом уровне Q3DM9, где много больших текстур.

Исследование разгона ядра и памяти на примере Quake3, demo002

При тестировании снимались замеры через каждые 10 МГц повышения частоты ядра при фиксированных максимальных и минимальных частотах памяти и наоборот. Такой экстремальный разгон в условиях морозильной камеры дал нам возможность получить частоты работы видеокарты на GeForce3 — 300/295 (590) МГц!!!

Итак, рассмотрим по разрешениям.

  • 1024x768


    Как и следовало ожидать, в 16-битном цвете разгон никакого эффекта не дает, вся производительность упирается в частоту центрального процессора. Да и в 32-битном цвете картина почти такая же.

  • 1280x1024


    Это разрешение уже менее отзывчиво на частоту CPU, а влияние акселератора резко возросло, особенно в 32-битном цвете. Интересно отметить, что увеличение частоты ядра намного больше прибыльно, нежели рост частоты по памяти. А в 16-битном цвете увеличение частоты работы памяти вообще мало что дает для графического процессора, работающего на 200 МГц, но для 300-мегагерцового чипа прирост пропускной способности видеопамяти уже довольно ощутимо сказывается на увеличении общей производительности. Это говорит о том, что GeForce3 — карты весьма сбалансированы, и для GPU, работающего на 200 МГц, более быстрая память просто не нужна. Только с ростом тактовой частоты ядра, особенно при подходе к максимальному (300 МГц) значению, нехватка пропускной способности памяти начинает сказываться, и тогда повышение частоты работы последней дает положительный эффект. При переходе с 16- на 32-битный цвет степень влияния частоты работы памяти усиливается, да это и понятно почему: объем информации, прогоняемый через видеопамять, резко возрастает, и пропускной способности памяти начинает уже не хватать при незначительном повышении частоты ядра.

  • 1600x1200


    Ситуация схожа с предыдущей.

По итогам этого тестирования можно сделать вывод, что если появится на рынке видеокарта уровня GeForce3 с частотами 300/295 (590) МГц и даже без дополнительных улучшений архитектуры этого процессора мы получаем в 1600х1200х32 свыше 100 fps, что говорит о получении абсолютной играбельности в этом сверхвысоком разрешении.

Исследование разгона ядра и памяти при активизации анизотропной фильтрации и анти-алиасинга

В наших статьях мы писали, что самой прожорливой в части производительности, но и в то же время самой эффективной по улучшению качества трехмерной сцены функцией является анизотропная фильтрация, особенно ее высшая степень (Level 8 или 32-tap). Производительность при ее активизации может упасть в 2.5-3 раза! Однако всем известна красота, получаемая при этом (см.3DGiтоги). А если еще прибавить анти-алиасинг? GeForce3 при этом начинает выглядеть, как позапрошлогодний чип, то есть демонстрировать играбельность на низшем уровне. Давайте посмотрим, а что даст в этом плане разгон:

1024x768

Очень хорошо видно, что разгон дал прирост аж на 47%! Мы получили 75 fps, что доказывает превосходную играбельность в разрешении 1024х768 при 32-битном цвете. Таким образом, имея акселератор с возможностями GeForce3, но работающий на частотах 300/295 (590) МГц, мы можем больше не думать, какой трехмерной функцией, улучшающей качество, пожертвовать. Можно спокойно играть при максимальной анизотропной фильтрации и с анти-алиасингом уровня Quincunx (который является наиболее оптимальных из всех видов АА у GeForce3).

Исследование разгона ядра и памяти на примере Quake3, Quaver

Это тестирование я провел при максимально возможном качестве (детализация геометрии и текстур были наилучшими, использовалась трилинейная фильтрация). На примере этого исследования было интересно посмотреть на сочетание производительности в 16- и 32-битном цвете при раздельном разгоне ядра и памяти.

Как и в первом случае, рассмотрим по разрешениям.

1024x768


Что сразу бросается в глаза? То, что на определенных частотах скорость в 32-битном цвете выше(!), чем в 16-битном. Посмотрите на первую диаграмму. На штатных частотах производительности примерно равны из-за ограничений по частоте процессора, но если оставить частоту ядра на 200 МГц, а память увеличивать, то прирост в 32-битном цвете получается более весомый, чем в 16-битном. О чем это говорит? А о том, что мы получили (наверно, впервые!) тот случай, когда пропускная способность видеопамяти уже более не является препятствием для потенциала графического процессора. Всем хорошо известно, что GPU выполняет все расчеты в 32-битном цвете и только при заданной 16-битной глубине он производит дизеринг, уменьшая битность цвета и объем информации, которую требуется прокачать через память. За счет последнего всегда 16-битный цвет и выигрывал по скорости. Чем больше уз накладывает пропускная способность памяти, тем больше разрыв между производительностями в 16- и 32-битном цвете.

А в данном случае ситуация обратная. Уже затраты на выполнение самого дизеринга становятся для 16-битного цвета фатальными! Работа в 32-битном цвете становится выгодной со всех точек зрения! Даже повысив не столь значительно скорость работы памяти, мы вбиваем крепкий гвоздь в крышку гроба "хай-колора".

Вторая диаграмма нам показывает — что же будет, если при максимально возможной частоте работы памяти постепенно увеличивать частоту работы ядра? При 200 МГц ему хватает с лихвой не только частоты работы памяти в 295 МГц, но и гораздо ниже, а вот при росте частоты чипа уже потребуется большая пропускная способность памяти. И мы видим, что только на уровне 280 МГц производительность в 16-битном цвете почти сравнялась с "труколорной", а это значит, что самым сбалансированным решением для 295 МГц по памяти будет частота работы GPU в 280 МГц (разумеется, в случае простого лобового разгона GeForce3 без улучшения его архитектуры).

1280x1024


Разрешение 1280х1024 нам демонстрирует сужение этой "вилки", то есть перекрестия 16- и 32-битного цветов на обеих диаграммах как бы идут навстречу друг другу, то есть сочетание частот, при которых 32-битный цвет — абсолютный лидер, более реже встречается, хотя и не намного.

1600x1200


Здесь мы просто видим продолжение этой тенденции, работа с таким разрешением уже требует большей пропускной способности памяти, поэтому опережение 32-битного цвета над 16-битным мы можем наблюдать только на очень высоких частотах работы памяти.

Выводы

Таким образом, эксперимент с засовыванием целого системного блока в морозилку нам дал очень интересные результаты:

Если бы появился в продаже акселератор, имеющий на борту просто разогнанный GeForce3 — чипсет (допустим, произведенный по 0.13 мкм технологии), а также супер-быструю 300-мегагерцовую DDR-память, то мы получили бы:

  1. великолепную производительность на всех современных играх в разрешении 1600х1200 в 32-битном цвете;
  2. прекрасную играбельность в разрешении 1024х768 в 32-битном цвете при активных анизотропии максимальной степени и анти-алиасинге уровня Quincunx (отсюда уже есть выбор: владельцы огромных мониторов могут играть в 1600х1200, владельцы мониторов поменьше могут играть в 1024х768 с анти-алиасингом);
  3. полное забвение 16-битного цвета, как динозавра времен ламповых электронно-вычислительных машин.

Поэтому будем надеяться, что предстоящее появление очередного детища NVIDIA в конце осени этого года нам даст все вышеперечисленное, да и не исключена оптимизация архитектуры, введение каких-либо интересных новшеств, позволяющих поднять планку как качества 3D-игр, так и скорость в очень сложных сценах, состоящих уже из сотен тысяч полигонов.




Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.