Первый взгляд на NV11 и NV15 — новые GPU от NVIDIA


Дожили.

Сегодня мы во второй раз предлагаем вам прочитать о том, что же нам готовит NVIDIA в первой половине 2000 года и, возможно, в конце 2000 года.

Итак, на смену GeForce 256 (NV10) приходят сразу два новых GPU, это NV15 и NV11. При этом будет предусмотрен вариант NV11 для мобильных компьютеров и вариант NV15GL для CAD/CAM систем и профессиональной графики. Пока известны только кодовые имена новых графических процессоров, однако можно с большой уверенностью говорить о том, что слово GeForce будет присутствовать в названии новых GPU. В рекламу этой марки уже вложена масса денег, и продвигать новое название просто нерентабельно. Понятно, что к слову GeForce будет приставка, символизирующая новое поколение, например, можно использовать приставку Ultra, римскую цифру II, Mobile или нечто в этом роде. Если отдел маркетинга NVIDIA пожелает, думаю, интернет-общественность поможет подобрать наилучшие сочетания. Но, скорее всего, в этот раз обойдутся без нашего участия.

Изначально NVIDIA планировала, что NV15 станет лишь улучшенной версией NV10, т.е. не было и речи о представлении в первой половине 2000 года нового поколения GPU. Однако жизнь внесла свои коррективы. Виной всему стал чип GeForce 256 (NV10), в архитектуре которого оказались серьезные недостатки. Разумеется, NVIDIA не афиширует эту информацию, но в контексте данной статьи это важный момент, поэтому мы уделим ему немного внимания. Изначально планировалось, что GeForce 256 будет работать на тактовой частоте около 200 МГц со всеми вытекающими последствиями, но в реальности архитектура этого GPU оказалась не столь удачной. Сроки поджимали, и на редизайн чипа времени не оставалось, нужно было запускать чип в серию. Проблема заключается в неожиданно высоком взаимовлиянии фронтов сигналов внутри чипа, вследствие чего на высоких частотах невозможно обеспечить стабильную работоспособность. Выходом из положения стало снижение тактовой частоты до 120 МГц у GeForce 256 (NV10) и до 135 МГц у Quadro (NV10GL). Более высокая тактовая частота у Quadro объясняется отличием во внутреннем строении этих двух чипов и, конечно же, маркетинговыми соображениями. Учитывая все недостатки в архитектуре GeForce 256, было решено отказаться при создании NV15 от дизайна ядра NV10 вообще, а использовать наработки по дизайну ядра NV20, которое планировалось к выпуску лишь на осень 2000 года. В результате, NV15 и NV11 имеют полностью переработанную архитектуру графического ядра, по сравнению с NV10, а значит, относятся уже ко второму поколению GPU. Самое серьезное новшество в ядре NV15 и NV11 — это наличие на каждом конвейере рендеринга пикселей двух текстурных блоков.

Разумеется, в новых чипах NV15 и NV11 будет интегрирован геометрический сопроцессор, выполняющий аппаратный расчет преобразования координат и освещения (HW T&L), а также Clipping (отсечение). Под Clipping подразумевается операция отсечения части сцены по четырем поверхностям, определяемым пользователем (viewing frustrum + user defined clip planes). При этом вся работа ведется на уровне полигонов, а не объектов. Именно этот тип отсечения чаще всего применяется на практике, т.к. позволяет существенно сократить нагрузку на шину памяти при последующем рендеринге.

Сейчас все чаще блок геометрических операций и установки вершинного освещения называют сокращенно HW TCL, подчеркивая наличие аппаратного Clipping, хотя и старое сокращение "HW T&L" ничем не хуже.

Разумеется, любое приложение, оптимизированное под GeForce 256, будет прекрасно работать на платах на базе NV15 и NV11.

Кроме HW TCL ядро NV15 и NV11 поддерживает на аппаратном уровне интерполяцию вершин полигонов, т.н. Vertex Blending, правда, как и в GeForce 256, для этого задействуется лишь две матрицы. В D3D 7.0 поддерживается до четырех Skinning матриц, тем не менее, в большинстве случаев вполне хватает и двух.

С появлением на свет NV11, точнее его специального варианта, компания NVIDIA выходит на новый для себя рынок мобильных решений. Впервые продукт от NVIDIA, а именно, один из вариантов чипа NV11 ориентирован на применение не только в настольных PC, но и в мобильных компьютерах. Использованию в ноутбуках способствует наличие расширенной поддержки режимов ACPI. Кроме того, в режиме пониженного напряжения мобильная версия чипа NV11 потребляет лишь 3 Вт энергии, что позволяет применять этот графический процессор в мобильных компьютерах. Заметим, что впервые для мобильных систем будет предлагаться графическая подсистема с аппаратной поддержкой расчетов установки освещения и преобразования координат (HW TCL). Тем не менее, отметим, что большинству обладателей портативных PC радоваться нечему, т.к. ноутбук — это не настольный PC, и сменить в нем видеоадаптер в большинстве случаев невозможно. Придется покупать новый лаптоп. С другой стороны, ноутбуки покупают не для игр, и возникает вопрос: а зачем нужен в мобильном компьютере такой мощный 3D-ускоритель? Ну, например, менеджеры смогут демонстрировать на ноутбуке преимущества HW TCL, т.е. обходиться на семинарах и презентациях полностью собственными средствами. В остальном же выпуск мобильной версии NV11 будет хорошо способствовать укреплению имиджа NVIDIA как передовой и универсальной компании в области 3D-графики.

Производительность блока HW TCL у чипов NV15 и NV11 будет примерно на 45%-50% выше, чем производительность блока HW T&L у GeForce 256. Причем, есть все основания предполагать, что, ввиду почти полной переработки архитектуры ядра, использование более одного источника освещения будет существенно меньше сказываться на общей производительности.

Новые GPU NV15 и NV11 будут производиться по 0.18 мкм технологическому процессу. Переход на новый процесс позволит повысить тактовую частоту графического ядра, уменьшить площадь кристалла, снизить энергопотребление и рассеиваемую мощность. Например, NV15 будет рассеивать в два раза меньше энергии, по сравнению с GeForce 256, а NV11 будет рассеивать на 30% меньше энергии, чем NV15. Вариант NV11 для мобильных PC будет рассеивать еще меньше энергии. Кроме того, производство новых чипов будет обходиться дешевле.

Чип NV15, как и GeForce 256, имеет четыре конвейера рендеринга, а чип NV11 имеет два конвейера рендеринга. По сути, NV11 является более дешевой версией NV15. Однако в NV11 есть отличия от NV15, о которых мы поговорим ниже.

NV15 будет иметь 256-разрядную архитектуру, а NV11 — соответственно 128-разрядную архитектуру.

Тактовая частота ядра NV15 и NV11 будет равна от 160 MHz до 200 МГц. Это штатная частота. Напомним, что штатная частота ядра GeForce 256 равна 120 МГц, при этом практика показала возможность разгона до 130-135 МГц без каких-либо проблем, а отдельные экземпляры удается заставить работать на частоте до 160 МГц! Можно предположить, что NV15 и NV11 удастся разогнать до 250 МГц. Вариант NV11 для мобильных PC будет способен работать на пониженных тактовых частотах. Снижение тактовой частоты влечет за собой снижение пиковой производительности, но в случае с мобильными компьютерами гораздо важнее низкое потребление энергии и минимально возможное рассеиваемое тепло.

Ключевой новинкой в NV15 и NV11 является то, что каждый конвейер рендеринга пикселей теперь имеет не один блок текстурирования, как это реализовано в GeForce 256, а два блока текстурирования. Это обеспечивает реализацию так называемого бесплатного мультитекстурирования, т.е. когда при наложении двух текстур на один пиксель не снижается общая пиковая величина fillrate. Кроме того, появляется возможность реализовать на аппаратном уровне анизотропную фильтрацию по 16 текстурным семплам. Это должно положительно сказаться на качестве 3D-графики, даже по сравнению с GeForce 256.

Встроив в NV15 и NV11 конвейеры рендеринга, способные накладывать на один пиксель две текстуры за один такт, NVIDIA взяла на вооружение то, что уже есть в Savage2000 и от чего отказалась 3dfx в своем чипе VSA-100. Тем не менее, конкуренты уже предлагают более мощные решения, например, ATI в своем новом чипе под кодовым именем Rage6.

Проиллюстрируем изменение величины fillrate в зависимости от режима текстурирования:

Название чипа (частота ядра)За один такт на пиксель
накладывается один тексель
За один такт на пиксель
накладывается два текселя
(режим мультитекстурирования)
GeForce 256 (120 МГц)480 Млн. Пикселей240 Млн. Пикселей
NV15 (160 — 200 МГц)640 — 800 Млн. Пикселей640 — 800 Млн. Пикселей
NV11 (160 — 200 МГц)320 — 400 Млн. Пикселей320 — 400 Млн. Пикселей
Savage2000 (125 МГц)250 Млн. Пикселей250 Млн. Пикселей
ATI Rage6 (200 — 400 МГц)400 — 800 Млн. Пикселей400 — 800 Млн. Пикселей
Voodoo5 5000 (2xVSA100, 166 — 183 МГц)664 — 732 Млн. Пикселей332 — 366 Млн. Пикселей
Voodoo5 6000 (4xVSA100, 166 — 183 МГц)1328 — 1464 Млн. Пикселей664 — 732 Млн. Пикселей

Нетрудно заметить, что в режиме мультитекстурирования (а этот режим применяется в большинстве современных игр) пиковая величина fillrate карты на базе NV15 находится примерно на уровне карты Voodoo5 6000. Теперь вспомните, что 3dfx назвала примерную стоимость Voodoo5 6000 в размере около $600. Как вы думаете, сколько будет стоить карта на базе NV15 с 64 Мб DDR SGRAM памяти на борту? Точно дешевле, чем Voodoo5 6000 со 128 Мб локальной видеопамяти. При этом, Voodoo5 не поддерживает HW T&L, но поддерживает эффекты T-Buffer. Правда пока не ясно, увидим ли мы в 2000 году хотя бы десяток игр, где применение эффектов T-Buffer будет реализовано и оправдано. Зато игры с поддержкой HW T&L в этом году точно будут, причем в количестве не менее 30. У Voodoo5 остается еще один козырь — full scene spatial antialiasing. Парировать это можно тем, что в драйверах для карт на базе GeForce 256 уже реализована поддержка FSAA, и падение производительности при этом почти такое же, как будет у карт серии Voodoo5. Кстати, в чипе Rage6 от ATI тоже реализована поддержка FSAA. В общем, пользователь получает возможность выбора между FSAA в низком разрешении (т.к. оно теперь ограничивается величиной fillrate) и игрой без FSAA, но в высоком разрешении, когда эффект aliasing менее заметен на глаз.

Теперь расскажем об остальных деталях.

Чипы NV15 и NV11 поддерживают память типа SDR и DDR SDRAM/SGRAM. Напомним, что память DDR тактуется по обоим фронтам (переходам) синхроимпульса, что дает возможность передачи данных при любом изменении состояния управляющего входа транзистора + конденсатора, что позволяет передавать вдвое больше данных, по сравнению с памятью типа SDR при одинаковой тактовой частоте. Причем, чип NV15 имеет (как и NV10) внутреннюю шину шириной 256 бит, что позволяет ему пропускать вдвое больше данных на одинаковой с NV11 частоте (NV11 имеет внутри чипа 128 бит шину). Оправдан или нет подобный подход, неизвестно, необходимо получить первые результаты тестов. Заметим только, что NV15, имея вдвое больше текстурных блоков, нежели NV10, и лишь в полтора раза более быструю память (для типичной платы), будет более заметно и резко страдать от возможного недостатка ее полосы пропускания. NV11, в свою очередь, имеет практически вдвое более низкую полосу пропускания, при равном NV10 числе текстурных блоков. Следовательно, мы можем ожидать повторения знакомой по TNT2 M64 ситуации (когда в некоторых режимах она проигрывает более медленной с точки зрения тактовой частоты TNT, а в некоторых ее опережает). Что касается внешнего интерфейса памяти, то NV15, также, как и GeForce 256 (NV10), поддерживают 256 разрядный интерфейс памяти, но, скорее всего, в NV15 картах, как и в картах на базе GeForce 256, будет задействован только 128-разрядный интерфейс в силу экономической целесообразности.

Чипы NV15 и NV11 поддерживают следующие объемы установленной локальной видеопамяти: 8 Мб, 16 Мб, 32 Мб, 48 Мб, 64 Мб, 96 Мб и 128 Мб.

Обратите внимание на возможность установки локальной видеопамяти размером 48 Мб и 96 Мб локальной видеопамяти, это т.н. dis-similar memory size. Пока нет разъяснений насчет того, каким образом можно будет использовать такие объемы памяти. Скорее всего, они будут применяться только с ядром NV15GL, ориентированым на CAD\CAM применение, причем не исключено, что NVIDIA будет использовать разные типы памяти. Для примера можно вспомнить, что в профессиональных 3D-акселераторах, например, от E&S, давно применяются нестандартные объемы памяти, правда, там используются два разных типа памяти. Для хранения текстур используется CDRAM (Cached DRAM), а для кадрового буфера применяется двухпортовая 3DRAM.

SDR-память будет работать на штатной частоте от 183 МГц до 200 МГц, в зависимости от типа чипов. При этом, в случае с NV11 допускается использование как 128-разрядного интерфейса памяти, так и 64-битного, что позволит производителям видеоадаптеров использовать более дешевую память. Очевидно, что в виду указанных выше внутренних ограничений NV11 не имеет смысла использовать с ней DDR-память, в полную 128 бит ширину внешнего интерфейса. Мобильный вариант NV11 будет иметь урезанный вдвое интерфейс памяти, т.е. будет поддерживаться 64-разрядный и 32-разрядный интерфейс памяти. Пусть вас не смущает такое урезание интерфейса памяти, оно вполне оправдано как с инженерной точки зрения, так и с функциональной. Мобильный вариант NV11 будет комплектоваться 8 Мб или 16 Мб локальной видеопамяти, а больше в ноутбуках и не нужно.

DDR-память будет работать на штатной частоте от 166 МГц до 200 МГц, в зависимости от типа чипов, что соответствует результирующей частот 333 МГц и 400 МГц.

Интерфейс памяти у NV15 может быть 128-разрядный или 256-разрядный. Тем не менее, как и в случае с GeForce 256, скорее всего, будет использоваться только 128-разрядная шина памяти. Это вызвано чисто экономическими соображениями. Кроме того, использование DDR-памяти позволяет компенсировать ограничение интерфейса.

NV15 будет иметь интегрированный RAMDAC, работающий с частотой 350 МГц. Возможно, частота RAMDAC будет увеличена. При этом будет использоваться DAC собственного производства NVIDIA под кодовым именем Picasso и имеющий интерфейс 128 бит. Здесь речь идет о ширине интерфейса от Frame Buffer к DAC. Внутренняя разрядность самого DAC — традиционные 24 бита, т.е., как всегда, по 8 бит на компоненту цвета. Выбор 128-битного интерфейса вызван тем, что чем он шире, тем меньше он загружает чип во время передачи на него изображения, и тем больше может быть частота DAC при фиксированной частоте ядра чипа. Да, заметим, что DAC интегрирован в один корпус с графическим ядром, но не в ядро. Это обходится несколько дороже, зато снижаются затраты на разработку (ранее NVIDIA использовала DAС от STMicroelectronics), но главное — повышает процент выхода годных чипов.

В чип NV15 интегрирован Single Link TMDS transmitter, что позволяет при наличии интерфейсного разъема на плате подключить DFP-монитор. При этом, в чипе реализован всего один CRT-C контроллер и один видеоканал, т.е. нет возможности одновременного вывода изображения на разные приемники.

NV15 и NV11 имеют встроенный HDTV-процессор, что дает возможность смотреть соответствующим образом закодированные ТВ-программы на мониторе. Оба чипа поддерживают интерфейс PCI 2.2 и AGP x4 (включая режим Fast Writes)

Отметим поддержку VIP 2.0 порта уровня I (8 бит, 75 МГц), что позволяет подключать внешние MPEG2 декодеры/кодеры.

Мобильный вариант NV11 будет поддерживать external spread spectrum clock modulation, т.е возможность изменения модуляции сигнала с целью снижения электромагнитного излучения. Это должно способствовать стабильной работе мобильного варианта NV11 в стесненных условиях внутри ноутбуков.

Для вывода видеосигнала на ТВ требуется установка TV-кодера, а в сами чипы NV15 и NV11 встроен цифровой интерфейс для подключения этих ТВ-кодеров.

Чип NV11 имеет два раздельных и независимых видеотракта и два CRTC (Cathode Ray Tube Controller), которые передают данные, сформированные графическим процессором, во встроенный RAMDAC, во внешний RAMDAC (опциональный), в двухканальный передатчик цифрового сигнала или в TV-encoder. Это дает возможность реализовать поддержку технологии Dual Display, которая позволяет подключать к видеоадаптеру на базе NV11 одновременно два устройства отображения:

  1. CRT + TV
  2. CRT + DFP
  3. CRT + CRT (требуется внешний RAMDAC)
  4. DFP + TV
  5. DFP + DFP

Благодаря интегрированному в чип NV11 Dual Link TMDS/LVDS трансмиттеру, для реализации поддержки DFP-мониторов не требуется дополнительных контроллеров, нужно лишь установить интерфейсные разъемы.

Заметим, что дополнительный RAMDAC требуется только в том случае, если нужно вывести два независимых изображения на два CRT-монитора. Для того, чтобы использовать второй CRT-монитор в качестве дублера первого (то есть, на втором мониторе полностью повторяется изображение с первого) или использования второго монитора для расширения рабочего стола, установка дополнительного RAMDAC на плату не требуется, аналогично тому, как это реализовано в G400.

Нетрудно заметить сходство технологии Dual Display от NVIDIA с технологией DualHead Display от Matrox.

К слову, в отличие от чипов G400 от Matrox, NV15/NV11 не будут поддерживать т.н. режим Color/Depth Mixed mode 16/32, обеспечивающий возможность выбора разрядности буфера глубины независимо от точности представления цвета. Например, при 32-битном цвете можно использовать 16 бит Z-буфер. Способствует увеличению производительности.

Что касается драйверов, то с этой точки зрения можно быть спокойным — NVIDIA будет продолжать выпускать унифицированные драйверы для всей линейки своих графических чипов. В способностях программистов из NVIDIA при поддержке специалистами из SGI сомневаться не приходится, тем более, что практика это подтверждает.

Относительно возможностей NV15 и NV11 в области 3D-графики мы рекомендуем почитать наши обзоры карт на базе GeForce 256. Представьте, что карты на NV15 и NV11 будут быстрее по скорости и будут обеспечивать лучшее качество изображений в 3D-графике, тогда общая картина о том, что нас ожидает, станет вполне понятной.

Ожидается, что в NV15 и NV11 будет существенно улучшена поддержка воспроизведения MPEG2 видео.

Возможно, мы увидим в качестве стандартной функции аппаратную поддержку краевого сглаживания (edge anti-aliasing) во всех вариантах чипов, а не только в NV15GL.

Пока нет никакой информации относительно того, есть ли в NV15 и NV11 поддержка EMBM и аппаратная поддержка S3TC. Программная поддержка S3TC есть уже в драйверах для карт на базе GeForce 256, и никто не мешает реализовать программную поддержку EMBM, тем более, что никаких лицензий от Matrox для этого не нужно, и уже есть слухи о том, что такая поддержка будет уже в драйверах для GeForce 256.

Первые чипы NV15 и NV11 производители видеоакселераторов начнут получать уже в марте-апреле. В марте ожидается официальный анонс и, возможно, мы увидим первые реальные платы на базе новых GPU, а начало массовых продаж следует ожидать уже во втором квартале. Скорее всего, производство чипов GeForce 256 будет прекращено одновременно с началом массового производства NV15 и NV11. Если принять во внимание, что в ближайшее время не будет дефицита чипов памяти типа DDR SGRAM, то в основной своей массе карты на NV15 и NV11 будут комплектоваться именно этим типом памяти.

Почему создается ощущение, что NVIDIA не торопится с анонсом своих новых графических процессоров? Ну, все просто. Сейчас анонсированы платы на базе GeForce 256 c 64 Мб локальной видеопамяти. До момента начала массовых поставок этих карт нет смысла торопиться. Во-первых, можно оценить заинтересованность покупателей в картах с такими объемами памяти на борту, во-вторых, есть хорошая возможность продать еще немного больше чипов GeForce 256. Кроме того, есть и неявные причины. Например, до сих пор ведется доработка самого чипа. Разумеется, речь не идет о полном редизайне, отлаживаются отдельные блоки. Например, известно, что у NVIDIA были сложности (или еще есть) с обеспечением работоспособности интегрированного TMDS-трансмиттера в NV15. В пользу такой информации говорит то, что даже такой крупный партнер NVIDIA, как Creative, до некоторых пор не имел работающих чипов NV15, хотя у самой NVIDIA уже давно есть и чипы, и карты на них.

Что касается цен на платы на базе NV15 и NV11, то наверняка карты из первых поставок с 32 Мб памяти типа DDR SGRAM на борту будут стоить до $350 и $300 соответственно. Кроме того, многое будет зависеть от текущего состояния дел на рынке. Если NVIDIA не будет иметь сильных конкурентов, то цены вряд ли будут сразу снижены. Зато уже в мае, когда должны появится очень сильные конкурирующие продукты от ATI в виде карт на базе Rage6, ценовая война может разгореться с новой силой. К сожалению, пока нет оснований считать, что появление в продаже карт серии Voodoo5 от 3dfx может существенно повлиять на ценовую политику NVIDIA.

Итак, можно констатировать, что NVIDIA в очередной раз подтверждает звание лидера рынка и индустрии. Обещанные продукты появляются в срок и обладают улучшенными характеристиками. Чипы NV15 и NV11 имеют параметры, которые очень сильно осложнят жизнь конкурентам NVIDIA. Чего стоит только реализация конвейеров рендеринга с двумя текстурными блоками, обеспечивающих бесплатное мультитекстурирование. Никто не ожидал от NVIDIA такого сильного хода, большинство было уверено лишь в косметических улучшениях GeForce 256. Сейчас понятно, что NVIDIA не просто учла архитектурные ошибки в GeForce 256, но и очень серьезно относится к решениям от конкурентов. Если бы NVIDIA не изменила свои планы и просто слегка улучшила GeForce 256, отложив выход второго поколения своих GPU до осени, т.е. до NV20, то майка лидера уже летом запросто могла бы перейти к ATI с ее очень мощным и прогрессивным Rage6. Сейчас же нас ждет увлекательное зрелище конкурентной борьбы между NVIDIA и ATI.

Интересным является вопрос о том, что же будут представлять собой NV20 и NV25. Скорее всего, NV20 будет улучшенной версией NV15, тем более, что изначально все ключевые особенности NV15 планировалось реализовать именно в NV20. Например, можно довести тактовую частоту ядра NV20 до уровня в 300 МГц. Это позволит удержать свои позиции на рынке до весны 2001 года, когда появится NV25 с совершенно новой архитектурой. Достаточно того, что объявленная производительность блока HW TCL у NV25 равна 150 млн. полигонам в секунду с аппаратно рассчитанным вершинным освещением, а при аппаратном преобразовании координат вершин и других операций, типа интерполяции вершин, производительность будет соответствовать примерно 45 млн. полигонов в секунду. Кроме того, в NV25 каждый конвейер рендеринга будет иметь по четыре блока текстурирования.

Отметим, что NVIDIA начинает продвижение на новый для нее рынок графических решений для мобильных систем. Учитывая успехи NVIDIA на рынке графики для настольных систем, можно прогнозировать хороший дебют, как минимум. Отметим, что немногим ранее со своим чипом Quadro NVIDIA вступила в борьбу за часть рынка графических процессоров для профессионального применения. Напомним, что не остался без внимания NVIDIA и рынок интегрированных решений, в третьем квартале мы увидим чипсет для системных плат Aladdin GeForce от Ali, в который будет интегрировано графическое ядро GeForce 256.

В общем, компания планомерно расширяет сферу своего влияния. Если вспомнить о том, что NVIDIA собирается заняться еще и производством звуковых чипов, то можно лишь оценить дальновидность Microsoft в выборе партнера для комплектации приставки X-Box.

Со своей стороны, мы вместе с вами с нетерпением ждем официального анонса и первых плат на новых GPU.




Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.