Интервью специалистов NVIDIA

Что самого важного и нового в 3D-графике 2005 года

Под общей редакцией Юрия Уральского (NVIDIA)





iXBT.com: Это интервью получено от группы специалистов NVIDIA, отредактировано главным специалистом по поддержке разработчиков в России — Юрием Уральским.

iXBT.com: Что означают слухи и разговоры о неполной совместимости некоторых решений с SM3.0 и имеют ли они под собой какую-либо почву?

Это зависит от предпочтения формальной буквы закона или того, что за ней реально подразумевалось. Мы считаем, что весь набор возможностей SM3.0 должен быть доступен разработчикам для реального использования. Например, железо может рапортовать о формальной поддержке текстурирования, скажем, в пиксельных конвейерах, но реально не делать доступными ни один формат текстур, таким образом, не давая использовать на практике текстурирование вообще. Кто потом захочет сказать, что такое железо поддерживает текстурирование? Наши продукты GeForce 6 и 7 серии реализуют полный набор возможностей SM3.0, и эта поддержка полностью сертифицирована WHQL.



iXBT.com: Какие моменты NVIDIA считает ключевыми в реализации современной SM3.0 архитектуры? На что делается основная ставка?

Ключевые возможности SM3.0: выборка текстур из вершинных шейдеров, возможность писать длинные шейдеры, требование к поддержке формата FP32, большее число ресурсов (например, входных и временных регистров), управление исполнением (переходы и циклы) в вершинных и пиксельных шейдерах. Главной целью для SM3.0 было предоставить новые, ранее недоступные возможности (такие, как вершинное текстурирование) и облегчить создание длинных и сложных шейдеров для разработчиков, особенно в контексте создания системы материалов для современных игровых движков.



iXBT.com: Как бы вы расставили приоритеты из следующего списка:

  • доступ к текстурам из вершинных шейдеров,
  • фильтрация FP16 текстур,
  • работа с FP16 буфером кадра,
  • MSAA в FP16 формате,
  • TAA,
  • эффективная реализация динамических ветвлений в шейдерах, еще какие то моменты

Говоря с точки зрения разработки игр, мы бы расположили возможности следующим образом:

  1. FP16 блендинг . Без этой возможности реализация HDR рендеринга становится достаточно болезненной для разработчиков и может вызывать значительные пенальти в ходе согласования и пересылок буферов.

  2. Transparency AA — сглаживание прозрачных полигонов. Иногда реализовать эту возможность без аппаратной поддержки очень сложно или неудобно с точки зрения программирования.

  3. Выборка текстур в вершинных шейдерах. Одна из ключевых и привлекательных возможностей SM3.0 позволяет создавать красивые визуальные эффекты по типу карт смещений (displacement mapping).

  4. Поддержка работы многих GPU (SLI) — С точки зрения разработчиков, эта возможность позволяет заранее иметь практическое дело с производительностью будущего железа. Сегодняшние high end системы на базе SLI будут соответствовать среднему уровню (middle-range) карт через два года. Учитывая ~3-х (или более) летний цикл разработки большинства игр, этот факт позволяет разработчикам заранее программировать с прицелом на 2 года вперед. (Уже не говоря о том, что это позволяет конечным пользователям играть в самые современные графически интенсивные игры в высоком разрешении с полным набором визуальных эффектов!)

  5. Dynamic branching — динамические ветвления (и циклы) могут быть полезны для некоторых определенных типов шейдеров, в которых вы можете избежать лишней работы, исходя из конкретных условий, меняющихся от пикселя к пикселю (« early out» shaders). Также, они помогают реализовывать сложные системы материалов (модели поверхностей), которые рассчитываются с учетом многих источников освещения с гибкими параметрами, которые можно задать извне шейдера.

  6. FP16 filtering — фильтрация плавающих текстур. Кто-то может говорить, что возможно реализовать эту опцию в шейдере, используя вычисления вместо аппаратной фильтрации, так что это не такая уж и важная возможность. Однако, с точки зрения программиста, это вносит неприятное исключение, которое повышает сложность поддержки и разработки и уменьшает стройность кода. Например, можно использовать один шейдер для расчета модели освещения с разными форматами текстур в зависимости от того, какие форматы поддерживает железо на данном ПК, с 8 бит целочисленных и до FP16 форматов. Но если фильтрация недоступна для некоторых определенных форматов, нам придется написать для них отдельные шейдеры, включающие алгоритм фильтрации. Это увеличит сложность кода и понизит его гибкость, уже не говоря об ударе по производительности, который наносит необходимость рассчитать 4 смещенных координаты, выбрать и усреднить четыре значения из текстуры. Все это вместо одной стандартной операции выборки значения. Между тем FP16 фильтрация выполняется на семействах NV4X и G7X без дополнительного пенальти в плане производительности.

    Также звучали предположения, что INT16 формат достаточен для HDR. Это может быть правдой в зависимости от типа освещения, который вы реализуете в движке, но не ставит знак абсолютного равенства между использованием целочисленного и плавающего представления. Отметим, что объем информации в обоих случаях тот же самый — 16 бит на компоненту, но критическая разница в том, как доступные значения распределены по абсолютной шкале. Это вопрос, из которого и вытекает существование и необходимость поддержки плавающей точки в железных реализациях, в том числе CPU. Представление с плавающей точкой распределяет значения нелинейно, с гораздо большей точностью по мере приближения к 0 (небольшие значения передаются с меньшей ошибкой). Этот подход хорошо соответствует системе зрения человека, которая может различать различия между источниками слабой интенсивности гораздо лучше, чем в случае ярких пятен. HDR это не просто возможность представлять большие значения, есть еще и критическая роль распределения представляемых значений. Попробуйте втиснуть INT16 в тот же диапазон что и FP16 — тогда в критическом, самом важном, участке [-1,1] вы получите всего 32 различные значения. С FP16 вы имеете более 30,000 значений в том же диапазоне. Вот почему вы можете заметить бандинг (полоски и дискретность) в случае использования INT16 формата для HDR рендеринга — вы теряете непрерывность и плавность представления значений и вычислений, которая была доступна для FP16 формата. Чтобы справиться с этим, программистам приходится использовать хитрости и менять оригинальный формат представления RGB значений, добавляя общий множитель (экспоненту) ко всем значениям (такой логический формат часто называют RGBE). Эта экспонента вычисляется в шейдере, и каждый раз, когда вы используете RGBE текстуру, вы вынуждены умножать значения на экспоненту перед использованием. Разумеется, вы теряете корректность фильтрации в этом случае, так как экспонента влияет на значения нелинейно и фильтрация перестает быть математически корректной между соседними пикселами. Но еще важнее тот факт, что вам приходится фактически эмулировать работу плавающей точки в своем шейдере вместо того чтобы просто иметь с ней дело.

  7. FP16 MSAA — MSAA буфера кадра в формате FP16. Это, несомненно, станет важной возможностью для будущего железа, добавив новую мощь в виде производительной реализации HDR с AA. В текущих поколениях железа вы имеете дело с неиграбельностью FP16 MSAA в разрешении больше чем 1024х768 — что пока ставит вас перед выбором — играть с небольшим разрешением, но с использованием AA, или с разрешением порядка 1280х1024 и более без АА. Принимая во внимание все большую популярность LCD мониторов с их фиксированным аппаратно истинным разрешением, становится ясно, что возможность играть в большем решении становится важнее (предпочтительнее).


iXBT.com: Почему доступ из вершинных модулей к текстурам выполняется в текущем поколении решений достаточно медленно, и без фильтрации, ведь многие программисты решили в итоге подождать с использованием этого метода в приложениях?

Все зависит от того какую разновидность вершинных шейдеров вы используете с текстурированием и где реально находится бутылочное горлышко в вашей игре. Если, например, узкое место — пиксельная часть конвейера и пиксельные шейдеры, вы можете себе позволить достаточно дорогие (с точки зрения производительности) шейдеры с вершинным текстурированием, без существенного влияния на общую производительность игры. В реальности разработчики уже успешно используют VTF (вершинное текстурирование) — например, в новой (готовящейся к выходу) игре Disney (Chronicles of Narnia) используется VTF для отлично выглядящей воды. Кроме того, есть еще игры типа Pacific Fighters (OpenGL) и Pitfall: Lost Expedition, Powerdrome, и т.д. Эти игры прекрасно используют VTF. Отметим, что VTF являть собой обязательным требованием DX10, и, как уже упоминалось ранее, определенно представляет собой возможность, которую будут использовать все больше и больше игр в будущем.



iXBT.com: В чипе есть широкие возможности по работе с FP16 буфером рендеринга, включая даже фильтрацию FP16 текстур — то, что отсутствует у самых новых чипов ATI, но не наблюдается MSAA в буфере кадров FP16 формата, который есть в последнем семействе ATI. Является ли эта возможность важной для приложений, и появится ли она в будущих решениях NVIDIA?

Выше мы уже затронули этот вопрос, относительно важности FP16 AA. Что касается будущих продуктов — я с удовольствием бы поговорил о них с вами, но, как вы хорошо понимаете, не могу сделать это :-)



iXBT.com: Есть ли какие-либо новшества и преимущества в плане кэширования данных — новые алгоритмы работы кэшей, их ассоциативность или размер возросли значительно, или нет? Что еще интересного было сделано в области кэширования и сжатия данных?

Каждое новое поколение железа, содержит изменения по сравнению с предыдущим. Они включают и кэши данных, и другие архитектурные аспекты.



iXBT.com: Какие возможности по ускорению обработки видео вы могли бы назвать ключевыми сейчас и в ближайшем будущем. Какие новшества могут ожидать нас в этом направлении и в плане совершенствования интерфейсов вывода в картах?

Сейчас важными видятся: ускоренное аппаратно MPEG2 и WMV9 декодирование на HD уровне качества, деинтерлейсинг HD видео, компенсация телеразвертки (3:2 and 2:2 pulldown) и распознавание/коррекция неверно заданного экранного формата. В ближайшем будущем — поддержка HDMI, декодирование H.264 (ПОЛНОЕ декодирование для поддержки Blue-ray и HD-DVD включая полный цикл — deblocking, motion compensation, CABAC inverse transform decode), в недалеком будущем. Мы увидим постоянное уменьшение степени нагрузки на CPU, и увеличение качества изображения. Плюс, улучшения в плане приема сигнала — лучшее качество закодированной информации, декодирования и подавления шумов.



iXBT.com: Станут ли графические архитектуры в приставках сильно отличаться от таковых на PC со временем? Насколько они разнятся сейчас, в текущем поколении (ps3 и xbox 360), и в чем разница подхода ATI и NVIDIA к этому вопросу? Как вы оцениваете перспективы этого рынка вообще и PS3 в частности, на каких моментах вы хотели бы заострить внимание?

Я думаю, что мы наблюдаем (и продолжим наблюдать) слияние графических архитектур консолей и PC. Однако PC графика будет по-прежнему владеть преимуществом — более новыми поколениями API и графических архитектур, чаще приходящими на смену, чем в случае консолей. Еще один тренд — увеличение уровня параллелизма CPU в архитектуре консолей, в лице Cell мы уже имеем дело с экстремально мощным набором выделенных параллельных блоков для обработки AI и физики. Мы верим, что RSX чип в PS3 вместе с Cell предоставит экстремально мощную платформу для разработчиков, которые создадут на ней красивейшие и реалистичные игры. Большим вопросом для всех платформ станет взаимодействие многочисленных параллельных процессов друг с другом, типы локальной памяти которые они будут использовать для промежуточных данных и общая иерархия памяти.



iXBT.com: WGF 2 — какова степень готовности, увидим ли мы готовые решения сразу после официального выхода Vista?

Мы ощущаем, что Vista и DirectX 10 (или как он будет называться) станут очень важной вехой в эволюции PC, в частности, в вопросах, связанных с потребностями графического железа. В данный момент мы пока не можем рассказать что-либо еще, оставайтесь на связи.



iXBT.com: В данный момент реализация динамических переходов в последних чипах NVIDIA далеко не оптимальна с точки зрения пенальти производительности, возникающего при исполнении шейдеров с динамическими ветвлениями. Будут ли значительные улучшения в этой области? Работает ли NVIDIA над этим вопросом?

Каждое успешное поколение нашего железа улучшает производительность по сравнению с предыдущим, и нет резона не ожидать подобного в будущем. Мы постоянно сотрудничаем с разработчиками для выявления возможностей, которые будут широко использоваться в будущих играх, и добиваемся их оптимальной реализации, насколько это возможно. Относительно динамических переходов и их реализации в GeForce 6/7 серий можно сказать следующее: Во-первых, производительность переходов в вершинных шейдерах превосходная, и это видно из тестов, которые проводят различные разработчики и обозреватели. В отношении переходов в пиксельных шейдерах, мы считаем, что сделали верный баланс между эффективностью переходов и числом транзисторов, потраченных на реализацию этой эффективности. Этот баланс позволил нам разместить 24 конвейера на 110нм чипе, в сравнении с 16 конвейерным чипом на 90нм (имеется в виду R520 — примечание редакции). Если вы сравните абсолютную производительность переходов в реальных ситуациях (например, играх), вы увидите, что наша реализация быстрее других именно благодаря выбранному балансу и архитектуре. Задайте себе вопрос: лучше ли иметь чип на 50% больше (в пересчете с учетом соотношения процессов) с 50% меньшим числом конвейеров, с меньшей итоговой совокупной производительностью и меньшей эффективностью в реальных ситуациях? Мы верим, что ответом станет четкое « НЕТ» .



iXBT.com: Когда реально появится возможность объединить 4 видеокарты в SLI?

Мы не можем (пока) комментировать этот вопрос.



iXBT.com: Когда 7800GT/GTX спустится в средний класс (и спустится ли)?

Король горы текущего поколения все время свергается следующим — этот факт оставался верным для всех GPU, разработанных в течение последних лет. Не важно, в какую нишу попадут сами оригинальные 7800 GT/GTX карты, часто, мы (через некоторое время) предлагаем новые решения с более низкой ценой и равной бывшим лидерам скоростью.



iXBT.com: Что думает NVIDIA по поводу заявлений ATI касаемо производительности и возможностей современных чипов в демках ToyShop & Parallax Mapping (свежая версия ATI SDK). Хотя официально первой демки еще нет, но вторая-то есть. И, значит, выводы можно сделать.

Эти демки написаны другой компанией для другого железа, производителем которого она и является. Гораздо интереснее сравнить производительность в играх, которые продаются в последние месяцы, чтобы понять, как какое железо показывает себя в реальных ситуациях. И я верю, что у вас на сайте есть очень подробный и свежий обзор, отлично иллюстрирующий эту позицию :-).



iXBT.com: Почему NVIDIA считает необходимым тратить усилия на реализацию таких (мало востребованных) технологий как фильтрация FP текстур и вершинное текстурирование, вместо того, чтобы сконцентрироваться на каких-то ключевых моментах, вроде того же динамического бранчинга?

Все эти технологии относительны. Как уже упоминалось ранее, FP фильтрация позволяет программистам жить легче, представляя им ту же функциональность, которая им доступна для целочисленных форматов. Выборка значений в вершинных шейдерах действительно актуальное и ключевое архитектурное изменение, ранее, до 6800 серии карт подобное было невозможно. Как и для динамических переходов в пиксельных шейдерах (о которых мы говорили ранее) мы считаем, что, в общем и целом, обладаем наиболее успешной архитектурой, которая значительно более эффективна в вопросах сложности чипа, чем любые другие доступные на рынке решения. Представьте, как возрастет ее эффективность с использованием нового 90 нм процесса.



iXBT.com: Мысли NVIDIA насчет унифицированной архитектуры хотелось бы снова услышать: будут ли делать, в первом поколении DX10 или до 2007-го не ждать? Что думают насчет Xenos вообще…

Я думаю, наш Главный Ученый Дэвид Кирк уже достаточно подробно ответил на вопрос « унифицированных против обычных» архитектур. Реальный вопрос — почему это должно беспокоить кого-либо? Программист не видит и, в общем-то, не беспокоится о том, является архитектура в железе унифицированной или нет. В общем, вопрос сводится только к эффективности этой архитектуры в сравнении с традиционной. Чем более обобщенную архитектуру вы создаете, тем менее способной она становится с точки зрения выполнения специфических задач. Так что решение об использовании унифицированной архитектуры в будущем будет зависеть от характера и разновидности нагрузок и подходов, которые мы там встретим.



iXBT.com: Также любопытно будет узнать, что думают в NVIDIA насчет Ageia (PPU) и последних шагов ATI в области физики на GPU.

Это очень интересная область. Использование отдельных сопроцессоров для физики позволит играм повысить степень притягательности процесса за счет симуляции физических законов в игровом мире. Большой вопрос для разработчиков в том, как это скажется на геймплее — если игровая физика влияет на геймплей, она становится очень непростым вопросом, не важно, на CPU она обрабатывается или еще где-то. Другая проблема — потенциальные задержки на многочисленные пересылки данных туда и обратно по шине.



iXBT.com: Планируется ли вернуть в чипы NV нормальную анизо после того, как ее сделала ATI в R5x0?

Отметим, что NV3X реально имела значительно лучшее качество реализации анизотропии, но пресса, в общем, не уделила заметного внимания этому факту. А сейчас наши конкуренты позади в производительности, так почему небольшие отличия в реализации анизотропии становятся такой большой новостью? Я думаю, что так не должно быть.

Также отметим, что нет реального определения « правильной» анизотропной фильтрации, в конце концов, вы всегда имеете дело с неким приближением, аппроксимацией на основе искаженного сигнала, где искажения происходят в геометрии, фильтрации, текстурировании. С момента представления GeForce 6 серии мы предоставляем пользователям контроль над анизотропией и другими установками фильтрации через настройки драйвера. В том числе и возможность выключения оптимизаций, используемых по умолчанию, для получения максимального качества фильтрации. В зависимости от приложения, пользователь может выбрать соответствующие настройки, причем наша, построенная на профилях, система позволяет делать это для каждой игры отдельно. Конечно, мы будем продолжать добавлять новые возможности, нацеленные на улучшение качества изображения в наши будущие архитектуры.



iXBT.com: Планируется ли добавление фильтраций в вершинное текстурирование или это мертворожденная технология как TrueForm.

VTF, как уже обсуждалось, очень значимая технология, которая позволяет создать целое семейство новых эффектов, недоступных ранее. Она также обязательна для DX10, так что определенно не может быть мертворожденной технологией, и не будет заброшена в скором будущем. Фильтрация для текстурных форматов в вершинных шейдерах – вопрос, который мы определенно будет исследовать, и иметь ввиду, в плане реализации в будущих архитектурах.



iXBT.com: Как относится NVIDIA к необходимости и перспективности шейдерной модели 3.0 в интегрированном видео?

Положительно. Иметь полноценную линейку с поддержкой SM3.0, от Hi-End и до интегрированных решений — заметное преимущество для разработчиков, которым не придется беспокоиться о специфике интегрированного и недорогого железа. Вместо этого разработчики смогут сконцентрироваться на создании игр с единой шейдерной моделью и не беспокоиться об отдельной поддержке отдельных случаев для некоторых чипов. Разумеется, вы не можете ожидать эффективной работы на всех разрешениях, со всеми включенными эффектами от некоторых недорогих чипов, но в рамках одной модели разработчик может легко позволить пользователю регулировать разрешения или отключать отдельные эффекты. Это сильно отличается от случая, когда разные методы рендеринга необходимо использовать для шейдеров 3.0, 2.0 или 1.x, а также для FFP. Унифицированная модель выльется в лучшие игры, с меньшими проблемами совместимости и привнесет традиционно консольные плюсы конечным пользователям. Нет ничего более досадного, чем купить игру и выяснить, что графическая подсистема не может ее выполнить.



iXBT.com: Перспектива декодирования H.264 (целиком, а не DCT) средствами видеокарты семейства NV4х (G7x)

Полное декодирование H.264 (включая обратную энтропию, преобразование, компенсацию движения, деблокинг и т.д.) будет доступно в будущих GPU. До этого времени будет выполняться только частичное ускорение H.264. Однако отметим, что наши конкуренты не предоставляют пока что полного декодирования в железе.



iXBT.com: Эффективность топологии звезда против топологии кольцо в контроллере памяти и эффективность (пере)программирования данного контроллера под конкретные задачи

У нас уже есть значительная степень программируемости в текущем интерфейсе памяти. И есть различные соображения, которые мы еще реализуем в будущем. Одно из ключевых соображений — какая реализация действительно эффективна с учетом стоимости. Любая реализация, требующая существенной площади кристалла без достаточного увеличения производительности, будет пустой тратой ресурсов. Всегда необходимо понять, насколько прирост производительности зависит от этих аспектов, а насколько определяется просто увеличением скорости памяти, и выбрать выгодное соотношение. Надо решить, что выгоднее — получить прирост за счет архитектурных улучшений или просто установить более быструю память, или выполнить иные оптимизации в других блоках чипа, не имеющих отношения к архитектуре памяти.



iXBT.com: Мнение о готовности семейства NV4x (G7x) к требованиям граф-интерфейса Vista.

NV4x и G7x полностью совместимы с Vista, включая поддержку пользовательского графического интерфейса Vista высшего уровня.



iXBT.com: Возможность программной/аппаратной эмуляции (или реализации) технологий сжатия текстур класса 3Dc на картах NVIDIA

Для текущего поколения мы предоставляем поддержку (эмуляцию) через формат V8U8, однако отзывы, которое мы получили от многих разработчиков, заключались в следующем: 3Dc не представляет реально сильного улучшения того, что мы уже имеем с DXT сжатием, но при этом требует создать и поддерживать отдельный путь рендеринга.



iXBT.com: Перспективность многоядерного решения технологии 2х/4х SLI на одной РСВ.

Это интересная возможность. Заметьте, что некоторые наши клиенты уже реализовали два GPU на одной плате.



iXBT.com: Общее видение перспектив развития 3D, по мнению NVIDIA.

С учетом 6 и 7 серии можно сделать предположение, что станет возможным в будущем. Мы ближе, но следующей чашей Грааля будут игры с кинематографическим качеством рендеринга. Представьте себе, вы смотрите « Властелина Колец» в кинотеатре, и затем покупаете одноименную игру по дороге домой, и игра ничем не отличается от кино внешне — в действительности она использует те же самые модели (текстуры и прочие наборы данных), что и кино. По мере выхода новых API, таких как DX10 и новых поколений GPU, мы увидим как еще больше технологий, используемых в кино рендеринге, найдут свою дорогу в игры и железо.

C технической точки зрения, мы практически уверены в использовании гораздо более длинных пиксельных шейдеров в ближайшее время, так как они представляют наиболее эффективный путь визуального улучшения игр для программистов без необходимости существенных изменений в исходном арте. В частности мы, скорее всего, будем наблюдать интенсивное использование двух классов шейдеров — с большим объемом вычислений, например для систем материалов, и эффектов процедурного (вычислимого) типа, хотя текстурирование и создание текстур и останется важной составляющей арт-конвейера разработки, в том числе для вышеперечисленных процедурных эффектов.

И с тоннами текстурирования для целей пост-процессинга (сглаживание, свечение, DOF и т.д.) GeForce 6 и 7 серии обладают очень хорошо сбалансированной архитектурой, способной выполнять оба класса задач предельно эффективно.



iXBT.com: Влияние технологий следующего поколения игровых (Xbox360/PS3) приставок на развитие 3D-технологий на РС и эффективность разработок кросс-платформенных проектов в частности.

Очевидно, что консоли сдвигаются в сторону использования графических архитектур, схожих с оными на PC. Сдается, что вопрос должен звучать так: как будущие PC технологии влияют на разработку 3D технологий для мира консолей :-)

Один из интересных аспектов — как использование множества процессоров в CPU консолей скажется на кросс-платформенной разработке игр. Сейчас в наличии значительное архитектурное различие между PC и консолями именно на стороне CPU и разработчикам придется столкнуться с этим различием нос-к-носу, разрабатывая многоплатформенные приложения. Я считаю что различия на стороне GPU заметно меньше и не прочат таких сложностей для кросс-платформенной разработки.



iXBT.com: Где и как можно увидеть обещанную эффективность новых драйверов на базе двуядерных платформ Intel/AMD?

Наши драйверы 80-го релиза уже получают преимущество на двуядерных системах, и мы будем продолжать улучшать поддержку драйверами таких конфигураций.



iXBT.com: Возможность использования ресурсов 3D-ускорителей для несвойственных ему задач (декодирование видео, расчет физ. моделей)

3D-железо обладает огромным объемом чистой математической мощи и, несомненно, задачи, которые хорошо укладываются в большое число параллельных вычислительных блоков, будут потенциальными кандидатами для обработки на GPU. Мы определенно задумываемся о применении всей этой математической мощи для задач, лежащих за пределами 3D графики. Возможно, читателям будет интересно посетить сайт www.gpgpu.org, посвященный этой тематике.



iXBT.com: Можно ли будет в будущих ускорителях NVIDIA использовать вершинные текстуры как массивы констант? Пускай выборка из текстур будет осуществляться только в режиме point sampling, а адресация текселей — как в расширении EXT_texture_rectangle. Главное, чтобы выборка из текстуры занимала около одного такта.

Не комментируя конкретных возможностей будущих поколений железа, я отмечу, что DX10 API требует всей вышеперечисленной функциональности. Будет выборка текстур в вершинном шейдере занимать 1 цикл или более, я не могу пока комментировать, но могу заверить, что мы выберем лучшее соотношение из доступных нам с учетом сложности и цены. Важно не забывать « Amdahl's Law» в таких случаях: Не всегда обязательно иметь VTF со скоростью 1 цикл, так как вполне возможно, что нагрузка, которую мы получим в качестве типовой в будущих приложениях, не будет требовать такой возможности. Например, по причине продолжения роста длинны пиксельных шейдеров, которые в итоге по прежнему останутся узким местом. В этом случае мы можем потратить за зря часть чипа, ускоряя нечто, что не будет узким местом в реальном использовании.



Мы благодарим сотрудников NVIDIA за любезную возможность выделения времени на ответы.




12 января 2006 Г.

NVIDIA: 3D- 2005

NVIDIA

3D- 2005

(NVIDIA)





iXBT.com: NVIDIA, — .

iXBT.com: SM3.0 - ?

, . , SM3.0 . , , , , , , . , ? GeForce 6 7 SM3.0, WHQL.



iXBT.com: NVIDIA SM3.0 ? ?

SM3.0: , , FP32, (, ), ( ) . SM3.0 , (, ) , .



iXBT.com: :

  • ,
  • FP16 ,
  • FP16 ,
  • MSAA FP16 ,
  • TAA,
  • ,

, :

  1. FP16 . HDR .

  2. Transparency AA — . .

  3. . SM3.0 (displacement mapping).

  4. GPU (SLI) — , . high end SLI (middle-range) . ~3- ( ) , 2 . ( , !)

  5. Dynamic branching — ( ) , , , (« early out» shaders). , ( ), , .

  6. FP16 filtering — . - , , , . , , , . , , , 8 FP16 . , , . , , 4 , . . FP16 NV4X G7X .

    , INT16 HDR. , , . , — 16 , , . , , CPU. , 0 ( ). , , . HDR , . INT16 FP16 — , , [-1,1] 32 . FP16 30,000 . ( ) INT16 HDR — , FP16 . , RGB , () ( RGBE). , , RGBE , . , , . , .

  7. FP16 MSAA — MSAA FP16. , , , HDR AA. FP16 MSAA 1024768 — — , AA, 12801024 . LCD , , ().


iXBT.com: , , ?

. , , — , ( ) , . VTF ( ) — , ( ) Disney (Chronicles of Narnia) VTF . , Pacific Fighters (OpenGL) Pitfall: Lost Expedition, Powerdrome, .. VTF. , VTF DX10, , , , .



iXBT.com: FP16 , FP16 — , ATI, MSAA FP16 , ATI. , NVIDIA?

, FP16 AA. — , , , :-)



iXBT.com: - — , , ? ?

, . , .



iXBT.com: . ?

: MPEG2 WMV9 HD , HD , (3:2 and 2:2 pulldown) / . — HDMI, H.264 ( Blue-ray HD-DVD — deblocking, motion compensation, CABAC inverse transform decode), . CPU, . , — , .



iXBT.com: PC ? , (ps3 xbox 360), ATI NVIDIA ? PS3 , ?

, ( ) PC. PC - — API , , . — CPU , Cell AI . , RSX PS3 Cell , . , .



iXBT.com: WGF 2 — , Vista?

, Vista DirectX 10 ( ) PC, , , . - , .



iXBT.com: NVIDIA , . ? NVIDIA ?

, . , , , . GeForce 6/7 : -, , , . , , , . 24 110 , 16 90 ( R520 — ). (, ), , . : 50% ( ) 50% , ? , « » .



iXBT.com: 4 SLI?

() .



iXBT.com: 7800GT/GTX ( )?

— GPU, . , 7800 GT/GTX , , ( ) .



iXBT.com: NVIDIA ATI ToyShop & Parallax Mapping ( ATI SDK). , - . , , .

, . , , , . , , :-).



iXBT.com: NVIDIA ( ) FP , , - , ?

. , FP , , . , , 6800 . ( ) , , , , , . , 90 .



iXBT.com: NVIDIA : , DX10 2007- ? Xenos …

, « » . — -? , -, , . , . , . , .



iXBT.com: , NVIDIA Ageia (PPU) ATI GPU.

. . , — , , , CPU -. — .



iXBT.com: NV , ATI R5x0?

, NV3X , , , . , ? , .

, « » , , , , , , . GeForce 6 . , , . , , , , . , , .



iXBT.com: TrueForm.

VTF, , , , . DX10, , . , , , .



iXBT.com: NVIDIA 3.0 ?

. SM3.0, Hi-End — , . . , , , . , 3.0, 2.0 1.x, FFP. , . , , .



iXBT.com: H.264 (, DCT) NV4 (G7x)

H.264 ( , , , ..) GPU. H.264. , .



iXBT.com: ()

. , . — . , , . , , , . , — , , .



iXBT.com: NV4x (G7x) - Vista.

NV4x G7x Vista, Vista .



iXBT.com: / ( ) 3Dc NVIDIA

() V8U8, , , : 3Dc , DXT , .



iXBT.com: 2/4 SLI .

. , GPU .



iXBT.com: 3D, NVIDIA.

6 7 , . , . , « » , , — ( ), . API, DX10 GPU, , , .

C , , . , , — , , () , - , .

- (, , DOF ..) GeForce 6 7 , .



iXBT.com: (Xbox360/PS3) 3D- - .

, , PC. , : PC 3D :-)

— CPU - . PC CPU --, . GPU - .



iXBT.com: Intel/AMD?

80- , .



iXBT.com: 3D- ( , . )

3D- , , , , GPU. , 3D . , www.gpgpu.org, .



iXBT.com: NVIDIA ? point sampling, — EXT_texture_rectangle. , .

, , DX10 API . 1 , , , . « Amdahl's Law» : VTF 1 , , , , . , , . , , .



NVIDIA .