Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики.
Продолжая посещать сайты проектов вы соглашаетесь с нашей
Политикой в отношении файлов cookie
Ну тут сложно судить. Будем честны. Такие вещи делаются сильно заранее. Явно более года, с учётом интеграции с GPU. За пару месяцев такую ответку всё же не склепать.
Вот первый DLSS АМД явно застал врасплох.
Ещё раз спецом подчеркну " fastest interconnect linking" Это не скорость микроархитектуры. Ибо она не считается в ТБ/сек.
Это скорость соединения, точнее даже передачи данных. Очевидно кеш на таких скоростях не работает. Просто возьмите обычный процессор, на частоте 3ГГц, с 16МБ кеша L3 и проведите тест в аиде. Спойлер вы и 1ТБ/сек не увидите.
Опять же АМД для соединения использует интерпозер. Если точнее TSMC CoWoS. Вот здесь вы и получите те самые 5,3 TБ/с. Именно на соединении.
В наилучшей ситуации, вы такую скорость можете, НЕ получить со всех 6 стеков кеша. Ибо в лучшем случае на стеке ~500ГБ/сек.
Дальше уже АМД говорят о «эффективной» псп. Т.е. о необходимой псп, если б не было кеша.
Я бы сказал дело в архитектуре.
Возможно в этом изменении:
«New AI instructions and increased AI throughput deliver up to 2.7X more performance than the previous AMD RDNA 2 architecture»
Тут можно провести аналогию с каким-нибудь AVX. В частности расширением VNNI. Вот вроде бы специализированная штука, но в тоже время это часть FPU блока, а не спец блок.
Т.е. вероятно АМД дорабатывают исполнительные блоки, добавляя новые инструкции, таким образом, что б и универсальность сохранить и что бы FSR хватило.
Ну и конечно не забываем, что всё таки, данное решение не особо ест ресурсы остальных блоков. Того же RT или TMU например.
Это у вас ошибки.
1)Это не псп RDNA3.
«the new chiplets leverage AMD Infinity Links and high-performance fanout packaging to deliver up to 5.3TB/s of bandwidth.»
На Одном слайде была же подпись chiplets Interconnects
2)Открываем источник:
«It also includes six of the new 6nm Memory Cache Die (MCD) at 37.5mm2, each with up to 16MB»
Смотря какой крепёж. Нарезать резьбу например, вообще плёвое дело. Даже универсальные станки годов 60-70х спокойно вывозят. Не говоря уже о старых станках с ЧПУ.
Как собственно штуцера, втулки и т.д.
У старых станков, ровно одна проблема износ.
И если станок обслуживали и ухаживали за ним. То он и сегодня будет вполне себе работать нормально.
Окей ладно под вопросом лишь старые ЧПУшки. Где проблема другого рода. Ну не найдёшь сейчас блок управления.
Опять же скорость L3 кеша, не очень то и большая, тем более на частотах далёких от тех же 5ГГц. По сравнению с памятью 18000МТ/с на 384бит шине.
И ровно 0 смысла от кеша, если у тебя много кеш промахов. Ибо он тебе даст примерно ничего, ибо всё равно придётся обращаться к подсистеме памяти.
У кеша ровно одна задача, оперативно обеспечивать информацией. И если этой информации в кеше нет, то с задачей он справляется не очень. И именно из за того, что данные находятся в кеше мы и получаем выйгрыш в виде «чтобы текстуры читались быстрее из LLC.»
Вообще изначально этот тезис вообще не верный. Ибо текстурки не читаются быстрее (Если речь не о задержах, на которые GPU скорей плевать, чем нет). Смысл в ином. У тебя происходит меньше обращений к подсистеме памяти, в виду того, что данные находятся в кеше. Но от этого пропускная способность подсистемы памяти не меняется вообще. Но используется эффективнее. Что собственно и имеется в виду в данной надписи.
Можете почитать.
https://www.3dcenter.org/news/hardware-und-nachrichten-links-des-31-mai-2021
Та самая кривая:
https://twitter.com/Locuza_/status/1405419020090814467/photo/1
Ну-ну.
Он присоединился к AMД в 13г. Т.е. уже не участвовал в разработке новой архитектуры компании (GCN).
Главным архитектором его назначили лишь в 2015.
А к концу 2017, он в «творческом» отпуске. И сваливает к интелу.
Т.е. итого по заслугам в АМД.
работа над GCN 3.
Далее он уже возглавлет разработки:
GCN 4, старые добрые полярисы (rx 400/500)
И венец его творения GCN 5, да здравствуют веги.
А вот фундаментальный труд по разработке CDNA/RDNA он уже не застал.
И это лучшее, что случалась с АМД? Очень не смешная шутка.
Просто вспоминаем Келлера, который приложил руку к ядрам K7, K8, Zen. И не просто приложил, порой в некоторых моментах, его решения были и вовсе ключевыми.
Т.е. к ключевым микроархитектурам компании. По совместительству очень даже успешным. По мимо того ядра K8 и Zen, это не эволюция микроархитектур, а революция. Т.е. работа проделана крайне колоссальная.
Да какая-нибудь Су и та внесла больший вклад в АМД.
Вообще не факт. Вот если суммировать.
Сколько будет кеша 256-384МБ?
Из расчёта 32МБ кеша на кристалл (с учётом, что ничего не порезано).
Это очень и очень много, по меркам кеша.
По идее для FHD и QHD попаданий в кеш будет более ~80%. Но возможности для роста не бесконечны.
Это основываясь на информации про RDNA2.
Например для Нави 22 попадание в 96МБ кеша, для FHD ~78%
Нави 21, у которого уже 128МБ кеша, для того же разрешения попадание в кеш ~80%.
В основном увеличение кеша будет полезно для UHD и выше.
И это по мимо того, что нам говорят о увеличении пропускной способности подсистемы памяти. Что в принципе, делает кеш мисс дешевле, ибо проще получить необходимые данные, при прочих равных. (при учёте, что GPU как таковой, не столь требователен к задержкам).
Т.е. ну вжарите вы за дорого ещё 384 МБ кеша, а толку? Ну типо сможете обеспечивать GPU информацией, для каких-нибудь 8к разрешений. (если будет конечно). Но какой толк? Там уже упор явно будет в вычислительную мощность GPU.
Ну я вот хз, как часто выламывают прям разъём и экран одновременно. Телефон же надо как-то заряжать, починят. Т.е. последовательно выломать, достаточно сложно.
А вот побить экран крайне просто.
50/50.
Нужно что бы, ты мог включить этот режим, например при подключении к пк, по проводу. И без доп манипуляций со смартфоном.
-Для тех случаев, когда у тебя повреждён экран или просто сенсор.
При дефектовке в 0.07 на кв.см, линии распила 0,2мм и 4мм отступе от края, при конфигурации чип 24х25мм (600мм²):
мы получаем 29 битых чипов. И ещё 4 окажутся на крае пластины и не влезут целиком.
die Yeld 66.68% Т.е. всего 59чипов AD102.
Так я брал Defect Density 0,07/sq.cm Что в принципе нормальный показатель.
И выход годных кристаллов получается
13900К 83.76%.
Чиплет с ядрами АМД 95,2%
SoC АМД 91,79%
Нет дело не в этом. Дешевле пилить игры на UE5. Чем развивать свой движок. При том насколько помню, там есть свои библиотеки с ассетами или что-то в этом роде.
самого техпроцесса, стоимость оборудования для производства, стоимость технического обслуживания, а также стоимость строительства самой фабрики или на худой конец стоимость ее переоборудования под новый техпроцесс.
С какой стати? Они уже включены в цену пластины. Это отпускная цена.
Вот первый DLSS АМД явно застал врасплох.
Это скорость соединения, точнее даже передачи данных. Очевидно кеш на таких скоростях не работает. Просто возьмите обычный процессор, на частоте 3ГГц, с 16МБ кеша L3 и проведите тест в аиде. Спойлер вы и 1ТБ/сек не увидите.
Опять же АМД для соединения использует интерпозер. Если точнее TSMC CoWoS. Вот здесь вы и получите те самые 5,3 TБ/с. Именно на соединении.
В наилучшей ситуации, вы такую скорость можете, НЕ получить со всех 6 стеков кеша. Ибо в лучшем случае на стеке ~500ГБ/сек.
Дальше уже АМД говорят о «эффективной» псп. Т.е. о необходимой псп, если б не было кеша.
Возможно в этом изменении:
«New AI instructions and increased AI throughput deliver up to 2.7X more performance than the previous AMD RDNA 2 architecture»
Тут можно провести аналогию с каким-нибудь AVX. В частности расширением VNNI. Вот вроде бы специализированная штука, но в тоже время это часть FPU блока, а не спец блок.
Т.е. вероятно АМД дорабатывают исполнительные блоки, добавляя новые инструкции, таким образом, что б и универсальность сохранить и что бы FSR хватило.
Ну и конечно не забываем, что всё таки, данное решение не особо ест ресурсы остальных блоков. Того же RT или TMU например.
1)Это не псп RDNA3.
«the new chiplets leverage AMD Infinity Links and high-performance fanout packaging to deliver up to 5.3TB/s of bandwidth.»
На Одном слайде была же подпись chiplets Interconnects
2)Открываем источник:
«It also includes six of the new 6nm Memory Cache Die (MCD) at 37.5mm2, each with up to 16MB»
Пусть он и местный не фанат.
Наверное просто минусить и молчать, не очень хорошо.
Как собственно штуцера, втулки и т.д.
У старых станков, ровно одна проблема износ.
И если станок обслуживали и ухаживали за ним. То он и сегодня будет вполне себе работать нормально.
Окей ладно под вопросом лишь старые ЧПУшки. Где проблема другого рода. Ну не найдёшь сейчас блок управления.
?????
Опять же скорость L3 кеша, не очень то и большая, тем более на частотах далёких от тех же 5ГГц. По сравнению с памятью 18000МТ/с на 384бит шине.
И ровно 0 смысла от кеша, если у тебя много кеш промахов. Ибо он тебе даст примерно ничего, ибо всё равно придётся обращаться к подсистеме памяти.
У кеша ровно одна задача, оперативно обеспечивать информацией. И если этой информации в кеше нет, то с задачей он справляется не очень. И именно из за того, что данные находятся в кеше мы и получаем выйгрыш в виде «чтобы текстуры читались быстрее из LLC.»
Вообще изначально этот тезис вообще не верный. Ибо текстурки не читаются быстрее (Если речь не о задержах, на которые GPU скорей плевать, чем нет). Смысл в ином. У тебя происходит меньше обращений к подсистеме памяти, в виду того, что данные находятся в кеше. Но от этого пропускная способность подсистемы памяти не меняется вообще. Но используется эффективнее. Что собственно и имеется в виду в данной надписи.
https://www.3dcenter.org/news/hardware-und-nachrichten-links-des-31-mai-2021
Та самая кривая:
https://twitter.com/Locuza_/status/1405419020090814467/photo/1
Он присоединился к AMД в 13г. Т.е. уже не участвовал в разработке новой архитектуры компании (GCN).
Главным архитектором его назначили лишь в 2015.
А к концу 2017, он в «творческом» отпуске. И сваливает к интелу.
Т.е. итого по заслугам в АМД.
работа над GCN 3.
Далее он уже возглавлет разработки:
GCN 4, старые добрые полярисы (rx 400/500)
И венец его творения GCN 5, да здравствуют веги.
А вот фундаментальный труд по разработке CDNA/RDNA он уже не застал.
И это лучшее, что случалась с АМД? Очень не смешная шутка.
Просто вспоминаем Келлера, который приложил руку к ядрам K7, K8, Zen. И не просто приложил, порой в некоторых моментах, его решения были и вовсе ключевыми.
Т.е. к ключевым микроархитектурам компании. По совместительству очень даже успешным. По мимо того ядра K8 и Zen, это не эволюция микроархитектур, а революция. Т.е. работа проделана крайне колоссальная.
Да какая-нибудь Су и та внесла больший вклад в АМД.
Сколько будет кеша 256-384МБ?
Из расчёта 32МБ кеша на кристалл (с учётом, что ничего не порезано).
Это очень и очень много, по меркам кеша.
По идее для FHD и QHD попаданий в кеш будет более ~80%. Но возможности для роста не бесконечны.
Это основываясь на информации про RDNA2.
Например для Нави 22 попадание в 96МБ кеша, для FHD ~78%
Нави 21, у которого уже 128МБ кеша, для того же разрешения попадание в кеш ~80%.
В основном увеличение кеша будет полезно для UHD и выше.
И это по мимо того, что нам говорят о увеличении пропускной способности подсистемы памяти. Что в принципе, делает кеш мисс дешевле, ибо проще получить необходимые данные, при прочих равных. (при учёте, что GPU как таковой, не столь требователен к задержкам).
Т.е. ну вжарите вы за дорого ещё 384 МБ кеша, а толку? Ну типо сможете обеспечивать GPU информацией, для каких-нибудь 8к разрешений. (если будет конечно). Но какой толк? Там уже упор явно будет в вычислительную мощность GPU.
А вот побить экран крайне просто.
Нужно что бы, ты мог включить этот режим, например при подключении к пк, по проводу. И без доп манипуляций со смартфоном.
-Для тех случаев, когда у тебя повреждён экран или просто сенсор.
При дефектовке в 0.07 на кв.см, линии распила 0,2мм и 4мм отступе от края, при конфигурации чип 24х25мм (600мм²):
мы получаем 29 битых чипов. И ещё 4 окажутся на крае пластины и не влезут целиком.
die Yeld 66.68% Т.е. всего 59чипов AD102.
По другому die Yeld калькулятору 56.
И выход годных кристаллов получается
13900К 83.76%.
Чиплет с ядрами АМД 95,2%
SoC АМД 91,79%
-Но это не себестоимость. А только стоимость изготовления такого кристалла и его размещение на подложке.
Ответ Morkovkin на комментарий
С какой стати? Они уже включены в цену пластины. Это отпускная цена.
«Почти» в двое выше, нежели базовая нежели у E ядер интела? Вы это хотели сказать.
При наличии AVX-512 и большем кол-во инструкций на такт?