Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики.
Продолжая посещать сайты проектов вы соглашаетесь с нашей
Политикой в отношении файлов cookie
Как же я ору от выбора игр для теста. Можно сверху приписать «Sponsored by nVidia».
С учётом того, что эта 5080 местами 7900xtx сливает которой уже несколько лет…
/* For GFX11 C matrices we have 1 VGPR per element even if the element type is
* 16bits. So with 8 fp16 elements we implement that with a f16vec16.
* We then use the coefficient generated by this function to figure out
* how many elements we really have.
*/
Никто никого не обманывает, Вот здесь вполне понятно как это будет считаться… Пока вижу из недостатков только большее потребление памяти, а в случае использования fp16 модели (не сжатой) можно и в скорости выиграть.
В общем я ошиблась. FSR4 уже работает на RDNA3:
Графический драйвер Vulkan для AMD Radeon (RADV), разработанный в качестве альтернативы официальному графическому драйверу Vulkan от AMD (AMDVLK), впервые позволяет выполнять масштабирование ИИ, для которого требуются ускорители ИИ графических процессоров с RDNA 4, на графических картах RDNA 3 (GFX11) с использованием эмуляции FP8 и VKD3D Proton под управлением Linux. Компиляция по-прежнему требует относительно высокого уровня знаний, но готовые пакеты вероятно появятся в обозримом будущем.
Это лишь вопрос времени, когда FSR 4 будет официально реализован в API Proton через VKD3D и затем будет работать на видеокартах RDNA 3 с помощью графических драйверов RADV и программной эмуляции или эмуляции FP8.
Раз тебе лень. Вот оттуда же: https://www.hardwareluxx.de/images/cdn02/uploads/2022/Dec/like_blockchain_0z/amd-rdna3-breakout-022_1920px.jpeg
FP16 у 7900xtx немного меньше чем у 3090ti, хотя можно и 40 серию глянуть.
FP32 немного меньше чем у 4090D, а FP64 выше 4090. АМД решали текущие задачи. Int8 эти карты могут решать но без удвоения скорости вычисления. См картинку по ссылке. Однако этой производительности за глаза, если мы сравниваем с аналогом cnn от нвидии. С учётом того, что fsr4 гибрид с элементами трансформера, будет на рдна3 картинка процентов на 10 хуже и скорости не +30 кадров, а +23 каких-нибудь условных…
Есть карты близкие к «несуществующему» рефу, есть aib различной разогнанности…. Вот и весь ответ. Есть экземпляры с аккуратным даунвольтом которые дотягивают до 5080.
Впрочем как и 7900хтх.
Ну, раз ты даже не прочитал тот самый протёкший «копиум» смысл печатать всё ещё раз? Сходи куда-нить типа закона мура. Там все твои вопросы пережеваны раз дцать….
Объясню просто. Они делают новую видяху и то, что с ней должно быть связано — должно быть идеально, так как очень много стартов у амд были с косяками. На запуске у рдна3 например были некоторые вопросики, сейчас же это очень близкие к идеалу видяхи.
Поэтому фср4 на выходе должен работать бескомпромиссно. Позже можно сделать и немного упрощённую версию для третьего поколения, но позже, что бы это никак не отражалось на рдна4. Примерно так.
С учётом того, что Черни заявил, что псср2 будет, по сути, адаптацией фср4 на пс5про, а она очень далека от рдна4 и скорее гибрид рдна2 и рдна3.5, они уже видят как это сделать. Да и сами амд заявили, что рассмотрят возможности бэкпорта фср4 для рдна3.
По поводу ии погляди на сообщения ниже, там есть и статья и архитектура по ссылкам.
Ты этот бред везде будешь пихать? Ознакомся с архитектурой RDNA3:
https://www.hardwareluxx.de/images/cdn02/uploads/2022/Dec/swank_thread_af/amd-rdna3-breakout-021_1920px.jpeg
https://www.hardwareluxx.de/images/cdn02/uploads/2022/Dec/like_blockchain_0z/amd-rdna3-breakout-022_1920px.jpeg
Форматы FP на 50-180 % менее эффективны с точки зрения вычислений на выделенном оборудовании, чем формат INT. В Int8 RDNA3 выполняется только одна такая инструкция за такт, но по производительности у старших моделей находится в районе 3070Ti. Только у 7600 позорные 44tops. Все остальные легко справятся с задачей апскейла.
Сетки обученные на FP8 конвертятся на Int8.
https://arxiv.org/pdf/2303.17951
Ну и в таблице производительности полнейший бред. В растре 9070xt выше 7900xtx, и 5070ti и 4080s и 5080. Предлагаю половину чемоданных игр от нвидии, такие как вуконг, 2077, АВ2, ну и ещё какую-нить заменить на Рокет лиг, спейсмарин 2, колду, хорайзн и тотал вор )))))
Бред, даже на тех процах, что стоят в боксе и пс4 это есть, причем боксы даже официально это в даташит записали, а там RDNA2 с небольшими бонусами. Ты путаешь доп ускорение с возможностью расчёта.
С учётом того, что эта 5080 местами 7900xtx сливает которой уже несколько лет…
* 16bits. So with 8 fp16 elements we implement that with a f16vec16.
* We then use the coefficient generated by this function to figure out
* how many elements we really have.
*/
Никто никого не обманывает, Вот здесь вполне понятно как это будет считаться… Пока вижу из недостатков только большее потребление памяти, а в случае использования fp16 модели (не сжатой) можно и в скорости выиграть.
Графический драйвер Vulkan для AMD Radeon (RADV), разработанный в качестве альтернативы официальному графическому драйверу Vulkan от AMD (AMDVLK), впервые позволяет выполнять масштабирование ИИ, для которого требуются ускорители ИИ графических процессоров с RDNA 4, на графических картах RDNA 3 (GFX11) с использованием эмуляции FP8 и VKD3D Proton под управлением Linux. Компиляция по-прежнему требует относительно высокого уровня знаний, но готовые пакеты вероятно появятся в обозримом будущем.
Это лишь вопрос времени, когда FSR 4 будет официально реализован в API Proton через VKD3D и затем будет работать на видеокартах RDNA 3 с помощью графических драйверов RADV и программной эмуляции или эмуляции FP8.
FP16 у 7900xtx немного меньше чем у 3090ti, хотя можно и 40 серию глянуть.
FP32 немного меньше чем у 4090D, а FP64 выше 4090. АМД решали текущие задачи. Int8 эти карты могут решать но без удвоения скорости вычисления. См картинку по ссылке. Однако этой производительности за глаза, если мы сравниваем с аналогом cnn от нвидии. С учётом того, что fsr4 гибрид с элементами трансформера, будет на рдна3 картинка процентов на 10 хуже и скорости не +30 кадров, а +23 каких-нибудь условных…
Впрочем как и 7900хтх.
Поэтому фср4 на выходе должен работать бескомпромиссно. Позже можно сделать и немного упрощённую версию для третьего поколения, но позже, что бы это никак не отражалось на рдна4. Примерно так.
С учётом того, что Черни заявил, что псср2 будет, по сути, адаптацией фср4 на пс5про, а она очень далека от рдна4 и скорее гибрид рдна2 и рдна3.5, они уже видят как это сделать. Да и сами амд заявили, что рассмотрят возможности бэкпорта фср4 для рдна3.
По поводу ии погляди на сообщения ниже, там есть и статья и архитектура по ссылкам.
https://www.hardwareluxx.de/images/cdn02/uploads/2022/Dec/swank_thread_af/amd-rdna3-breakout-021_1920px.jpeg
https://www.hardwareluxx.de/images/cdn02/uploads/2022/Dec/like_blockchain_0z/amd-rdna3-breakout-022_1920px.jpeg
Форматы FP на 50-180 % менее эффективны с точки зрения вычислений на выделенном оборудовании, чем формат INT. В Int8 RDNA3 выполняется только одна такая инструкция за такт, но по производительности у старших моделей находится в районе 3070Ti. Только у 7600 позорные 44tops. Все остальные легко справятся с задачей апскейла.
Сетки обученные на FP8 конвертятся на Int8.
https://arxiv.org/pdf/2303.17951