Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики.
Продолжая посещать сайты проектов вы соглашаетесь с нашей
Политикой в отношении файлов cookie
100158509694745820940@google
Комментатор
Nikolay Kuzmin
Рейтинг
+0.50
Автор не входит в состав редакции iXBT.com (подробнее »)
- ← предыдущая
- 1
- 2
- 3
- последняя
- следующая →
Вообще, фанаты АМД, вы никогда не задумывались, почему можно и нужно отключать лучи, снижать настройки по всем фронтам кроме одного, настроек качества текстур? Не выглядит ли это как попытки подогнать условия тестирования под психологически более приятный результат?
Что в Intel XE я не знаю, может там и подход подобный RDNA3, но в RDNA4, судя по статьям, решили таки делать отдельные узкоспециализированные блоки для нейросеток.
https://www.hardwareluxx.de/images/cdn02/uploads/2022/Dec/like_blockchain_0z/amd-rdna3-breakout-022_1920px.jpeg
И что мы видим? Мы видим алый прямоугольник с названием «многоцелевое АЛУ» с перечислением возможностей его использования. Можно выполнить инструкцию wave64 (т.е. одно и то же действие над вектором из 64 32битных компонентов, например 1 инструкцию шейдера над блоком до 64 пикселей). Можно запустить 2 wave32 одновременно, но одна из этих инструкций с ограничениями. Можно 64 dot2 умножения с типами (fp16, bf16, int8). Можно 64 dot4 умножения с типом int4.
Как видишь, всё ровно то что я тебе писал. Никакого ИИ-ядра в RDNA3 нет. Есть расточка потоковых процессоров, поддержка новых WMMA-инструкций для более эффективного выполнения ИИ-расчётов. Но эти расчёты отнимают процессорное время у рендеринга, когда считается WMMA-инструкция wave64/wave32 на данном процессоре не выполняются.
Ладно, дам выжимку с пояснениями. Да rx7900xtx может считать нейросети. Как и любой другой процессор, хоть одноядерный ARM. Да, нейросетевая нагрузка довольно хорошо параллелится, поэтому их можно достаточно эффективно считать в том числе и на любом GPU. Я вот, например, на своём старом 5700xt запускал какую-то ИИ-генерялку картинок. При том что никакого ускорителя ИИ в этой карте не было даже по заявлениям производителя. Да сам по себе 7900 достаточно мощен, поэтому он, вероятно, считает нейросети лучше чем, например, rtx2060. Всё так.
А теперь напрягись и попытайся понять: кроме возможности существует ещё и целесообразность и эффективность. Нейронки используются для апскейлинга у нвидии, интела и у АМД в RDNA4 потому что в этих GPU существуют специализированные блоки, которые могут заниматься этим эффективно, не мешая основному рендерингу. В RDNA3 таких блоков нет. Это подтверждается самими амдшниками (ссылку давал). Вот твоя собственная новость это подтверждает, никто не использовал простаивающие ИИ-ускорители в RDNA3, нет, просто патчем драйвера библиотеку FSR4 обманули, сообщив что тензорные ядра есть и эмулировали эти ядра на потоковых процессорах, в шейдерном фактически коде. Ты думаешь, в АМД драйверы совсем тупые люди пишут и не умеют воспользоваться теми функциями, которые они сами людям для нейронок предлагали? Нет. Ну так тогда почему FSR4 не работает на RDNA3, если там работы на месяц левым чувакам с RADV-драйвером?
Дальше перед тобой выбор, либо ты должна заподозрить АМД в предательстве, в том что они специально кинули всех владельцев старых карт чтоб заставить их купить новые. Либо осознать, что не все нейросети одинаково полезны, что может оказаться так, что на RDNA3 и более старых простой программный апскейлер по соотношению цена/качество обгоняет FSR4, и только когда появляются узкоспециализированные ИИ-ядра появляется смысл использовать нейронки для апскейла. Поэтому не надо мне показывать топсы 7900 и сравнивать их с 3060 или с чем ты там сравнивала, ибо в одном случае это халявные топсы специализированных ИИ-ядер, а в другом — занятый на 100% весь GPU.
Так что нет, как я и писал, АМД приврали, нет в RDNA3 никакого ИИ-ускорителя как такового, сам RDNA3 может выступать как ИИ-ускоритель, впрочем как и любая другая видеокарта способная в GPGPU.
Вот тебе ссылка на доку от АМД если не веришь https://gpuopen.com/learn/wmma_on_rdna3/
Но нет же, упёрся рогом «ускорители ИИ сёрано есть!!! АМД не могли соврать, они хорошие»
Про «идеально» улыбнуло, расскажи это покупателям RDNA2 с поддержкой трассировки лучей.
Вот смотри. FSR4 делает много всякого. Нужно интерполяцией картинки заниматься. Нужно совмещать информацию из 2х кадров. Нужно анализом оптического потока заниматься (т.е. поиском сдвинувшихся частей между кадрами), нужно промежуточные кадры генерировать, нужно артефакты обнаруживать и давить. Да даже шумодав простой тоже нужен. Вот неужели ничего из этого нельзя было переложить на простаивающие ИИ-ускорители в RDNA3? Посмотри на конкурента, DLSS4 многое делает на нейронках, для 50 серии отказались от аппаратного анализатора оптического потока и перенесли эту работу на нейронку, но для предыдущей оставили старый, а какие-то улучшения работают вообще везде, в том числе и на 20й. Что, ИИ-ускоритель в RDNA3 настолько стрёмный, что даже хуже чем в Тьюринге? Почему было не сделать профиль FSR4 для RDNA3? Эксклюзивность FSR4 для последнего поколения — это маркетинговая катастрофа для АМД, они столько времени ссали в уши покупателям на тему того, что они, в отличие от нвидия, не кидают старых покупателей и все фишки работают на поколения назад, а тут раз и самым верным покупателям, сдуру купившим 7900xtx по губам провели. Причём даже возможности апгрейда не оставили, 9070xt на апгрейд 7900xtx не тянет. Какие такие соображения заставили АМД совершить такой кидок? Экономия зарплаты +1 программиста что ли? Или не нашлось 7900xtx для тестирования? Более того, я сильно подозреваю, что реализация FSR4 на RDNA3 уже есть, они ведь не за полгода на коленках сварганили. Наверняка разработка годами велась на том железе, которое было. А это RDNA3. Возможно какие-то эксперименты велись ещё во время разработки FSR1, и, почти наверняка, нейросетевая реализация FSR пилилась одновременно с шейдерной FSR3 и если бы нейросетевой вариант оказался бы лучше то в продакшен пошёл бы он.
Нет, бро, не будет никакого коммерческого FSR4 на RDNA3. «Рассмотрят возможность» — это, как говорится, если дипломат сказал «может быть» это значит «нет». Такому кидку есть только одно объяснение: отсутствие физической возможности. Ну нет в RDNA3 никаких тензорных ядер, есть только возможность просчитывать нейронки на обычных АЛУ из CU, но их производительности недостаточно чтоб обогнать реализацию того же самого на шейдерах. Блин, это открытая информация, я тебе даже название инструкции для поиска дал. Поэтому в АМД занимаются damage control'ом, год будут «рассматривать возможность» как бы так FSR4 бэкпортировать, а потом пойдут новости о RDNA5, 7900xtx тогда исполнится 4 года и всё как-то потеряет актуальность и забудется.
Мне вот интересно, как вы объясняете себе эксклюзивность FSR4 для RDNA4? Ну типа почему бы хотя бы на сверхмощном RX7900xtx не сделать, уж коль скоро на 9060 будет работать? А ответ прост, так как нейросетевая нагрузка отъедает время CU, эффективнее вместо нейроночного FSR4 использовать программный FSR3. Как только появились нормальные специализированные под это дело ядра, стало возможно использовать нейронку.
Странная логика. Я вот купил себе вместо монитора монитор и никаких проблем поэтому не испытываю. А вместо смарттв я купил себе смарттв, но смарттв оказался мусором, пришлось подстраиваться. Вот, предупреждаю других людей, по возможности сторониться этой марки или хотя бы быть готовыми к проблемам.
Не, я бы понял, если бы я был фанатом эппл и вещал тут про божественную экосистему. Но нет же, у меня и последние несколько мобил были китайские, и планшеты, и роутер даже. Я просто точу чтоб техника выполняла очевидно ожидаемые функции нормально. Будь на месте хаера Самсунг или Сони — я бы назвал мусором и их.
И вот я по принципу «лучше взять твбокс и телевизор от одного производителя, и вообще в составе одного устройства» купил этого хаера. И что меня поразило, вот эта копеечная экономия. Ну покупаешь ты 65 дюймов олед матрицу от лыжи, но при этом экономишь на SoC, так что даже интерфейс не плавный. Сколько они там на этом сэкономили? Долларов 5? Ну, блин, как так можно вообще.