Комментарии / Публикации Sawaru / iXBT Live

Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики. Продолжая посещать сайты проектов вы соглашаетесь с нашей Политикой в отношении файлов cookie

Комментатор

Sawaru

Рейтинг

+1608.60

Автор не входит в состав редакции iXBT.com (подробнее »)

А их никто и не считает. Это просто маркетинг.
Простая истина, это просто название тех. процесса. И не важно как ты его называешь
P1274, N7 или 7LPE.
Производители как раз указывают плотность логики и плотность/размер SRAM. А так же характеристики.

Ну вот давайте чисто эмпирически, возьмём сухие числа и сравним.
RTX 3090Ti vs 4090
Pixel Rate 208.3 vs 483.8 GPixel/s
Texture Rate 625.0 vs 1,290 GTexel/s
FP32 40.00 vs 82.58 Tflops
Tensor 320 vs 1,321 Tflopss,
RT 78 vs 191 Tflops
Итого прирост по всем выше перечисленным операциям не менее чем в двое, относительно 3090Ti.

Кстати тут есть интересный момент. Если матричные вычисления неизбежно требуют ускорителя. Т.е. когда-то придётся реализовывать. Ибо кол-во решаемых задач только растёт.

То у АМД есть шанс выехать просто на честном рендере. За счёт масштабирования архитектуры. Те самые чиплеты.
Так же стоит помнить, что рендер кадра сильно зависим от операций растеризации и текстурирования, а это спец блоки.
Но куда девать столь выросшую шейдерную производительность? Она прям огромна.

И вот лишнюю шейдерную производительность (с плавающей запятой) + матричную можно и использовать для апскейла как и у нвидиа. В том числе сняв нагрузку с RT, ROP и TMU. Выиграв заветные фпсы.

P.s. просто интересная фантазия, но не лишённая смысла.

Так они и сделали её очень даже.
Вот просто стоит сравнить их с 3000 райзенами. Где размеры кристалла сопоставимы, но мощность заметно ниже. А греются они вполне сопоставимо.

По мне проблема ровно в одном. Концентрация тепла велика на столько, что теплопроводности припой + медь + термопаста не хватает.
Хотя вру, количество тепла в принципе не очень маленькое.
Плюс микронюансы вроде контакта водоблока и крышки и т.п.
Но в любом случае это — посредник определённой толщины.

Кто ж знает. Да и зачем им такое штучно производить? Кому надо, может и скальпировать.
Мне одно жаль, что в место крышки не поставить испарительную камеру, по идее жёсткости не хватит.

По идее скорость переноса тепла была бы выше. Так ещё и равномерней. Но блин, если на неё поставить СО, то площадь контакта, вероятно будет выгибаться.

Кремний. Встречал новость, что у 2х кристаллов разный частотный потенциал. Второй хуже.

Ну и да полученный результат относительно 7700х хуже. Как я и сказал.

Так начнём с уточнений.
Машинное зрение ≠ оптически поток.
Первый использует второй.
Чуть чуть разные вещи. Разные подмножества.
Вероятно в данном контексте стоит различать векторы движения (flow vectors) и векторы потока (motion vector), дабы не путаться о чём конкретно речь. Но не обязательно.

Но так по контексту, вы меня убедили, тут я не прав.
Ибо конкретно нахождение векторов потока, чисто аппаратная фича.

Хотя выше я имел ввиду скорей ASIC по алгоритм, а тут вероятно более универсальный блок, под определённые вычисления. Что в любом случае либо я не прав, либо я не прав ибо неверно сформулировал предложение.

Но извините, тензорное ядро тоже аппаратная фича. И найти векторный поток можно через матрицы, если я не ошибаюсь.
Т.е. подходит под формулировку аппаратного механизма. И да он высвобождает производительность GPU/CPU.

Кстати фрейм буфер откуда берутся отрендереные кадры тоже аппаратная фича и достаточно давно.

Т.е. весь вопрос как конкретно реализовали. Но тут ваша правда.

Просто скажем так. АМД может добавить ускоритель для матричных вычислений. И уже на её основе реализовать свой апскейл.
Так же с использованием оптического потока. В зависимости от алгоритма.
Пока искал информацию, наткнулся например на Метод Лукаса-Канаде.
Что как бы матрицы.

Так всё дело в том, что она вообще есть. Просто лишний посредник он не улучшает отвод тепла, на оборот. Сама крышка по любому медная.
Так мы ещё имеем дело, с достаточно большим количеством тепла на мм2.
Естественно проблема не в том, что бы рассеять тепло в окружающую среду с радиатора. А в том, что бы его эффективно на радиатор передать.

Естественно если ты отводишь тепло сразу на водоблок. Где тепло рассеивается в водном контуре, а после передаётся на радиатор, температуры будут ниже. Просто потому, что дельта температур будет выше. Т.е. температура водоблока будет ниже, нежели у крышки. И тепло будет отводиться лучше.

Крышка тебе нужна ровно для одного, для установки на неё системы охлаждения. Которые бывают сильно разные. Вот например если теплотрубки будут монтироваться без крышки и если они не над чиплетами, то тепло ты толком вообще не отведёшь. А так тепло ты уже снимаешь со всей поверхности крышки. Да и банально можно повредить кристалл при монтаже или транспортировке.

И снова смешались кони люди. Сам по себе DLSS как апскелейр не влияет на инпут лаг. А если вам из коробки включили рефлекс, то причём тут сам DLSS?
Вы тоже самое могли сделать и без DLSS или С DLSS 2.0
.
Повторяюсь вещи вообще не связанные. Дорисованные DLSS 3.0 кадры никак не влияют на инпутлаг. Совсем. Тебе тупо меж кадров подсовывают картинку. С которой ты кстати никак не взаимодействуешь. Там ничего не рендерится.
.
Отключи рефлекс и ты получишь нативный инпутлаг, который будет зависеть от FPS полученных при рендере сцены.
.
Ну ну. Не хуже обычного режима. Тот же FPS в обычном режиме, будет лучше аналогичного полученного от DLSS 3.
.
И да с каких пор 54мс это нормально? Пинг порой меньше.
Нормальный инпут 33,3-16,7мс

Решил я зайти на ютуб, посмотреть что к чему.
https://www.youtube.com/watch?v=FaOYYHNGlLs
Тут даже о потерях говорить не приходиться толком.
Хотя так же хорошо, для двух чиплетных моделей думаю не выйдет, будет по хуже.

Так это в принципе нормальная ситуация. График зависимости частот от потребления это экспонента. Оно у всех так, после определённого порога каждые последующие 100МГц будет жрать всё больше Ватт, нежели предыдущие. Больше потребление, выше тепловыделение и температуры соответственно

Просто маленькие чиплеты у АМД, чувствительней. Ибо считайте нет запаса по теплу, которое ты можешь эффективно отвести от кристалла.

Проблема АМД всё та же. Очень агрессивный буст которы завышает напряжения/потребление выше оптимальных.
Т.е. крайне забавная ситуация, он может работать лучше, но не работает.
Я такое уже с ZEN+ вижу. Первые ряженки просто не трогал.

Так в чём проблема? Включаешь Nvidia Reflex и всё на том. Получаешь свои 54. Как будто раньше этого сделать было нельзя лол.
Ну или AMD Anti-Lag. Для этого вам DLSS вообще не нужен.

А им и не нужно использовать ни машинное виденье, ни рисовать новых кадров, для того что бы просчитывать вектора движения.

Ещё раз основной механизм, в том КАК они улучшают существующий кадр.
А делают они это при помощи информации из предыдущего кадра. Иначе на основе чего улучшение-то?

Как раз основное отличие DLSS 2 и FSR 2. Что они и берут информацию из предыдущего кадра. И реконструируют текущий кадр из низкого разрешения в высокое.

И принципиальное отличие, что это игра все же а не статичный джипег. У тебя сцена от кадра к кадру меняется. Вот для того, что бы знать где какой пиксель должен быть и использую векторы движения. Иначе ты тупо один джипег наслоишь на другой шакальный джипег.

DLSS 3. Т.к. от кадра к кадру, информация меняется не очень сильно, то положение большинства вещей в кадре тебе уже известны. И нет смысла их заново рендерить. И зная векторы движений можно так же сохранить объекты которые не изменились. И даже дорисовать изменения в движущихся объектах.

Вне зависимости от количества векторов движения, вне зависимости от того, что ты будешь делать с информацией от векторов движения, они с DLSS 2 и FSR 2 не исчезнут.

По поводу DLSS. Вообще как раз важно где и как он используется. DLSS 1 и DLSS 2 это вообще разные технологии. У них из общего, разве что название и задачи. А то так DLSS можно и TAA назвать.
Так что нет не готовая технология, которая по факту ещё и не получила распространения особого.

Так открою тайну. В RTX 20/30 Серии тоже нет кодировщика AV1. Он должен появиться только с RTX 40 если ничего не путаю. Будет ли он в RX 7000, повторюсь мы не знаем на 100%.

По поводу 6500XT ну тк его оттуда вырезали ради удешевления. В чём отставание самого блока декодирования?
Вон «новая» встройка ryzen 7000 тоже умеет декодировать AV1 и кодировать H.264 и HEVC. Хотя 200% что VCN там старый (3.Х.Х).

Ещё раз. Нет ускорителей конкретного машинного зрения. Машинное зрения это софт. Алгоритмы которых опираются на определённый формант вычисений типа Bfloat 16. Вот под конкретные форматы и разрабатываются ускорители.
И такой блок у АМД УЖЕ есть на практике, я его вам озвучил выше. Он реализован в CDNA (2) архитектуре. И используется ровно для того же, для чего используется тензорные ядра. Ускорение вычислений.

И поставить они его могли, года как 2 назад, ибо тогда он уже был. Что говорить о 6 месяцах.
Т.к. rx 7000 не презентовали, мы не можем достоверно знать, есть ли там такой блок или нету. Вопрос тут ровно один, сочли ли нужным АМД ставить данный блок в RX 7000. Об этом мы должны узнать 3 ноября.

И тем не менее.
Ваши тезис про то что DLSS и FSR не используют векторы ошибочны.
-Они есть и используются.
Второй тезис про спецблоки крайне спорный. Ибо при желании они без каких либо проблем могут добавить спецблок.
Ну как желании, прагматичный расчёт верней.

Вот по лучам допустим соглашусь.

По DLSS снова спорно. Первый DLSS был не очень-то и распространён, особенно на старте. И был той ещё шнягой. Вот что она есть, что её нет. Его АМД прикрыли обычным шарпом, предшественником FSR.
DLSS 2 уже существенно лучше. И игр больше и качество не плохое. FSR 2 ему составляет конкуренцию, с некоторым опозданием конечно.
Простой FSR может сколько-то соперничать, но по мне другая весовая категория, хотя в целом не сильно плохо.
Сегодня имеем уже DLSS 3. По нему информации не хватает. Как о внедрении, так и о качестве. Так и не известно чем и когда ответят АМД.
Моя оценка тут такая. АМД отстают ДО 1 поколения, на текущий момент. Т.е. я бы не сказал, что отставание сильней.

А по каким критериям вы вообще кодеки оцениваете? Что АМД в догоняющих. Всё что нужно декодирует вроде. Кодирует всё кроме AV1.
Презентуют Rx 7000, там и ясно будет отстают или нет.

А теперь представим иную ситуацию. Тяжёлая сцена лучики 4к. И у вас условных 30-40 кадров. А рисует 80-120. И вы это ощутите на своей шкуре. Ну конечно если игра динамичная.

Тенденция как раз обязывает. Иначе у конкурента будет преимущество. И чем дальше, тем сильней. Сейчас спрос только растёт. Если не реализуешь, то потеряешь целую нишу на ровном месте. А это уж извините деньги.
И да речь велась про изначальный тезис.

Кого, я извиняюсь, используют FSR и DLSS2?
Вектора посчитанные по отрендеренной картинке?
Вы серьезно сейчас пытаетесь заявлять что DLSS и FSR создают какие-то вектора движения по уже готовому «жипегу» для вывода на экран?

Может не совсем так, как вы описали, т.е. не по «жипегу». но да они используют векторы движения. А вы как думали? Просто магическим образом придумывают детали для объектов в кадре?
Как раз на основе векторов движения и определяется положение объектов в кадре.
Именно по этому DLSS 2 и FSR 2 временное масштабирование кадра.

https://www.digitaltrends.com/computing/how-nvidia-dlss-3-works/

Frame generation isn’t just some AI secret sauce, though. In DLSS 2 and tools like FSR, motion vectors are a key input for the upscaling. They describe where objects are moving from one frame to the next, but motion vectors only apply to geometry in a scene. Elements that don’t have 3D geometry, like shadows, reflections, and particles, have traditionally been masked out of the upscaling process to avoid visual artifacts.

https://gpuopen.com/fidelityfx-superresolution-2/
Можете обратить внимание на How it works.

По поводу чудес. ML это лишь алгоритм, выработанный в процессе обучения. Он не обязателен. Например в DLSS, на сколько помню, нейронка занималась отсечением артефактов, т.е. гостинга.

Ну как сказать денег нет. Может их и меньше, но они есть и их становиться всё больше. В смысле АМД инвестирует свою прибыль в RnD. Так что может у них нет денег придумывать новые технологии и задавать тренд. Но есть, что бы не отставать от него. Да и специалисты у них имеются.
Плюс некоторая экономия и тактика. Экономят усилия в основном на софте. Но при этом придерживаются тактики открытости и некоторой совместимости оного.

А причём тут программный комплекс, речь была о аппаратной части!? Ваш тезис был в том, что у АМД не будет спецускорителей. А не софта. При том вы не уточняете где и когда их не будет.

Но мы сегодня имеем совершенно иной тренд. Есть спрос на вычисления с низкой точностью и матрицы.

Как видим АМД следует данному тренду. Чем и является AI Engine и Matrix Core. Так же и в процессорах реализуют соответствующие инструкции.

Как следствие, вот с чего бы им не добавить спецблок, если есть спрос на вычисления?
Блок же для ускорения лучей добавили.

По поводу векторов. Ну допустим и? FSR 2 и DLSS 2 их тоже используют. Главное отличие в другом, что DLSS 3 теперь на их основе дорисовывает весь кадр. А не реконструирует лишь часть кадра.
В чём чудеса то?

А это уже вероятно с nvidia reflex. Т.е. с оптимизацией задержек, которая не связана с самим длсс. Хотя могу и ошибаться.

«Спецускорителей в АМД точно не будет.»
-Вы далеко то не забегайте.
1)RT ускоритель то у них есть. Что спец блок.
2)У них уже есть Matrix Core в CDNA. Спец блок.
2.1)Считайте те же тензорные ядра.
3)Уже знаем про AI Engine в фениксах. Спец блок.

А вот я бы сказал не поможет. Ну как картинка будет плавной, а вот играть будет не приятно. Ибо от дорисованных кадров, время рендера никак не меняется. Т.е. инпутлаг будет мешать.
Так ещё и дорисованные кадры не бесплатные, тоже требуют вычислений.