Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики.
Продолжая посещать сайты проектов вы соглашаетесь с нашей
Политикой в отношении файлов cookie
Вы ещё скажите, что AMD 3D cache это не TSMC 3D SoIC.
https://wccftech.com/tsmc-cowos-production-at-full-capacity-as-demand-skyrockets-nvidia-amd-and-more-trying-to-get-their-hands-on-interposers/
AMD Вообще CoWoS использовала в 7 радеоне. Что вообще до IF.
Вот ещё в догонку.
https://www.tomshardware.com/news/amd-ceo-to-negotiate-2nm-3nm-chip-supplies-with-tsmc
«So, AMD's Lisa Su will also discuss collaboration with TSMC, Ase Technology, and SPIL on the advanced packaging front. At present, AMD already uses TSMC's 3D SoIC (system on integrated chips) platform, such as CoWoS (chip on wafer on the substrate) packaging technology, as well as Ase's fan-out embedded bridge (FO-EB) packaging method for some of its products, according to DigiTimes(opens in new tab).»
Окей наклеим на процессор Интел, наклейку, допустим ЯДРО. Он станет отечественным?
Ещё раз спецом для чукч, которые писатели. То что вы видите на картинке, разработано и выпущено TSMC. Что там от АМД кроме шильдика и маркетинговых слайдов, не понятно.
Как? Ну телеки как-то дорисовывают кадры.
У АМД была подобная фигня Fluid Motion.
У НВ Optical Flow.
Идея то проста. Берём отрендереные кадры. Которые хранятся в том же фрейм буфере. И оцениваем изменения в кадрах.
Т.к. большинство деталей, меж 2 кадрами практически не меняется. То не так и сложно дорисовать 3 промежуточный кадр используя те же векторы движения.
Всё строится ровно на одном, предположение изменений в кадре. И вопрос лишь в алгоритмах. Которые ты можешь реализовывать по разному.
Например опираясь на типичные вычисления. Без использования аппаратного ускорителя.
И тот самый AI движок, это просто ускоритель, который занимается в основном матричными вычислениями. Который даёт нам производительность
fp16 (возможно и fp32) (скорее всего в матричном режиме)
bf16
int 4/8
И данные форматы, вполне стандартные. Вот и весь ваш отдельный AI движок. Где AI от слова маркетинг.
Отвечу просто. Вспоминаем г-синк. Для которого Нвидиа придумала отдельную проприетарную плату. И предлагали её пихать производителям мониторов.
И просто вспоминаем приход фрисинка от АМД. Который в тупую опирался на отраслевые стандарты, например DisplayPort Adaptive-Sync
Так что генерация кадров может и железная фича.
Но вопрос в необходимости «железности».
Ибо генерация кадров для нвидиа и АМД не что-то новое. И вполне себе работало, пусть и не в играх, без аппаратной проприетарщины.
И если АМД выкатит FSR 3, и получит примерно похожий результат. Это послужит доказательством как минимум того, что аппаратные фичи не очень и нужны.
Вопросов всего пара. Цена решения и его эффективность.
Тут аналогия проста. Кодеки. Декодировать видосик в ютубе, можно и без них, программно. Но тем не менее, рационально их добавить. Ибо эффективно и не требует значительных трат (ибо например не занимает кучу места в кристалле).
И тут покажет кто прав, время и практика. Но оба подхода имеют право на жизнь.
В чём тут работа АМД ещё стоит выяснить.
Ибо по факту, это просто интерпозер. Который делается и разрабатывается TSMC.
Их вообще у компании несколько.
CoWoS (chip on wafer on substrate)
InFO (integrated fan-out),
SoIC (system-on-integrated-chips) и
WoW (wafer-on-wafer)
По сути и 3D кеш по большей части заслуга TSMC. Как и большинство вещей, касающихся непосредственно производства.
Но тут стоит помнить пару вещей. Инженеры AMD напрямую работают с инженерами TSMC, совместно решая некоторые проблемы. (в основном касающихся физ. дизайна продуктов)
Так же возможно AMD разрабатывала физ дизайн интерпозера. Т.е. разводку показанную на картинке.
Всё же подобные вещи учитываются при разработке дизайна микроархитектуры. А не вот поставил и пользуешься.
Ну сейчас, в долгую покупать нормально, тут и профи быть не надо. Ибо что мы имеем глобально. ФРС всё повышает ключевую ставку. От этого фин сектор падает. Деньги от туда уходят.
S&P 500 тоже с пика в прошлом году просел.
Что уж говорить о волатильной крипте.
Но это не может продолжаться вечно. Цель то замедлить инфляцию.
Ну и опять же пока у нас капитализм, особенно с гегемонией США, паттерны будут повторяться.
Я это к чему. Смотрим как они решали кризис 2007-2008, тот же коронокризис. Т.е. ФРС будет балансировать меж инфляцией и заливанием экономики зеленью.
И вот когда они начнут печатать деньги, финансовый сектор начнёт расти. Крипта в том числе.
Есть и менее значимые события. Как например легализация крипты. Что тоже создаёт покупательную способность.
Тот же Маск разгоняя хайп, привлекает своих фанатиков, что создаёт спрос.
Но глобально пока рынки падают, сменить сам тренд, не так и просто.
Современных 7нм ТП нет. И у военных тоже, им не надо.
И оборудования под данный ТП нет. Даже 180-90нм нет, только разрабатывают.
Как и 300мм пластин особо чистого кремния.
И т.д.
Им то плевать на быстрее.
Просто вспоминаем на каких компьютерах осуществлялась космическая программа, в прошлом столетии.
Итого военным абсолютно насрать ракета наводиться на цель/координаты наносекунду или микросекунду.
У них не происходит моделирование термоядерного синтеза. Они не сворачивают белки. Т.е. огромные вычислительные мощности им не нужны.
Ядерный щит, доставшийся от СССР. Тоже вычислительными мощностями не блистал. Думаю его и не модернизировали.
Им нужна надёжность. т.е. если во время наведения у тебя чип откажет, в виду разных причин, это уже фиаско. И тут только зрелые Т.П.
Лучшее куда могут пойти такие чипы в военке. Это в обычные компьютеры. Т.е. в офис. И да там, 7нм и менее избыточно. Косынка и на 28нм лагать не будет.
Да и на 45нм тоже пойдёт.
Ну 5600G Дальше что?
FSR запускал ну например в SCORN. Ой фпс упал. ой ой ой. А нет? Как работает?
Ну и например в Chernobylite fsr 1 врубался ранее. Сейчас качать 34ГБ в падлу.
«некоторые настройки типа альтернативной синхронизации приводят к артефактам или тормозам или вообще слету драйвера»
-Ну-ну. Расскажи мне сказочник, как у меня всё артефачит и дрова слитают.
-И конечно рандомно фризит. Даже не статтерит.
-У меня почему то хром всего 4ГБ из озу жрёт. Под стройку зарезервировано 645МБ.
упппсс.
Мало того, у друга сейчас тарахтит 584. И тоже подобных траблов нет. Хотя за FSR сказать не могу. Он не пользовался.
У АМД Проблемы «ВСЕГДА». Гыгы.
https://www.youtube.com/watch?v=xwYJ4wo88P0&t=1s
ну-ну. Там в коментах хватает разных отзывов.
Смотрим описание драйверов
https://www.techpowerup.com/download/nvidia-geforce-graphics-drivers/#changes-517-48-whql
Вот это я понимаю редко. А 520+ драйвера на которые идут жалобы, вообще не поломанные.
И да мистер врунишка, где мои проблемы с драйвером? Они же ВСЕГДА у АМД, драйвер 22.10.1, до того ещё хренова туча версий.
Вообще факт. Ибо опять же это лишние транзисторы, которые ты не будешь использовать вовсе. Помните у АМД сильная унификация. Это дорого. Такое не будут закладывать здесь и сейчас. (Такие решения должны быть экономически целесообразны)
Так же АМД, явно стараются добиться оптимальных характеристик устройства. По сему размеры кеша тоже оптимальны. Ну вот условное его удвоение даст нам каких-нибудь +3-5%. Ибо скалирование попаданий в кеш не линейное. Так ещё и вычислительная способность не вырастет. С тем же успехом наращиваем частоты.
Во вторых слухи это слухи, они не всегда сбываются. А если слух даже правдив. То по срокам разработки, это может быть и rx 8000, да даже rx 9000. Ибо разработка занимает несколько лет. Такие крупные компании как АМД, могут укладываться в срок 3 года. Обычно вовсе 5.
При том особенность в том, что компания разрабатывает микроархитектуры параллельно. Очевидно в несколько команд. С некоторой, периодической ротацией инженеров.
А по поводу корпуса не расплавиться. Карта вам не индукционная печь.
Лучшее что нам могут выкатить, некий экспериментальный образец с чиплетами. Типов 5800x3d или RADEON VII. (ну например для обкатки на практике)
Могут, но не будут. Перенос стоит денег. Есть совместимы Т.П. с одинаковыми правилами проектирования и билиотеками. А есть не совместимые.
Например N7>N7P>N6 совместимы. А вот N7 и N7+ уже нет.
Тут так же N5P и N4P не совместимы. Так что по факту перенести АМД не может. Придётся портировать, т.е. по сути переделывать физ. дизайн как минимум. И это стоит не самых малых денег. По мимо того, что N4P априори дороже.
А вот отбраковка условно бесплатна. Со временем качество подрастает. В следствие чего получается больше качественных чипов. И тут просто выпускают новые карточки, вот и всё.
«RV and Portability satellite internet customers can’t get Priority Access at all, while there are different brackets for anyone with a Business account or who’s using Starlink at sea.»
-Из того же источника.
Ага ага. А Fluid motion они тоже придумали перед презентацией да? Ну и наверное презентация FSR 3, в UE была тоже постановой, склёпанная за день.
-Очевидно на разработку таких технологий нужно время. И Нвидиа в том числе. Они наверное её тоже для презенташки придумали.
И так сказать вертикальную интеграцию никто не отменял.
Нет, нет и ещё раз нет.
«бОльшую производительность»
-Конвейер GPU и система кешей неразрывно связаны.
Всё просто, бутылочное горлышко вылезет с другой стороны.
«Или поставить два GPU на одну подложку»
-Такие вещи предусматривают на этапе проектирования. Тебе нужна коммутация меж 2 чипами. Мало того, у тебя вся иерархия кешей, регистров, а так же устройство конвейера обязаны учитывать данную особенность. Особенно важен будет внутренний планировщик, который распределяет нагрузку меж блоками. Иначе распределение вычислений, не будет бесшовным.
-В ином случае, ты в тупую получишь SLI, с очень быстрым мостом.
Единственное, что возможно, это то, что АМД выпустит новую ревизию чипов, на более высоких частотах. И то по причине, что они разрабатывали архитектуру с прицелом на 3ГГц.
Но вполне вероятно, просто снизили ТТХ, что бы не терять чипы на отбраковке, в поисках золотых семплов.
«Себестоимость это горсть песка, немного металла и текстолит. „
-Так может говорить человек, который никогда в жизни не считал себестоимость.
-Ну либо придуривается.
И да это бред. Стоимость сырья не равна себестоимости.
Ну тут сложно судить. Будем честны. Такие вещи делаются сильно заранее. Явно более года, с учётом интеграции с GPU. За пару месяцев такую ответку всё же не склепать.
Вот первый DLSS АМД явно застал врасплох.
Cyberpunk 2077
3090
https://www.youtube.com/watch?v=Jqlu76-sdkc
или для 3090ti
https://youtu.be/VpZPRxMAzXs?t=176
теперь примерно сопоставим с графиком АМД.
3090 ~19 FPS в среднем.
на слайде АМД
ХТ = 18 FPS
ХТХ = 24 FPS
Для той же 4090 похожего не нашёл при беглом осмотре. Видел RT выше ультра. с моментальным FPS 30-40 и в других сценах.
https://wccftech.com/tsmc-cowos-production-at-full-capacity-as-demand-skyrockets-nvidia-amd-and-more-trying-to-get-their-hands-on-interposers/
AMD Вообще CoWoS использовала в 7 радеоне. Что вообще до IF.
Вот ещё в догонку.
https://www.tomshardware.com/news/amd-ceo-to-negotiate-2nm-3nm-chip-supplies-with-tsmc
«So, AMD's Lisa Su will also discuss collaboration with TSMC, Ase Technology, and SPIL on the advanced packaging front. At present, AMD already uses TSMC's 3D SoIC (system on integrated chips) platform, such as CoWoS (chip on wafer on the substrate) packaging technology, as well as Ase's fan-out embedded bridge (FO-EB) packaging method for some of its products, according to DigiTimes(opens in new tab).»
Ещё раз спецом для чукч, которые писатели. То что вы видите на картинке, разработано и выпущено TSMC. Что там от АМД кроме шильдика и маркетинговых слайдов, не понятно.
У АМД была подобная фигня Fluid Motion.
У НВ Optical Flow.
Идея то проста. Берём отрендереные кадры. Которые хранятся в том же фрейм буфере. И оцениваем изменения в кадрах.
Т.к. большинство деталей, меж 2 кадрами практически не меняется. То не так и сложно дорисовать 3 промежуточный кадр используя те же векторы движения.
Всё строится ровно на одном, предположение изменений в кадре. И вопрос лишь в алгоритмах. Которые ты можешь реализовывать по разному.
Например опираясь на типичные вычисления. Без использования аппаратного ускорителя.
И тот самый AI движок, это просто ускоритель, который занимается в основном матричными вычислениями. Который даёт нам производительность
fp16 (возможно и fp32) (скорее всего в матричном режиме)
bf16
int 4/8
И данные форматы, вполне стандартные. Вот и весь ваш отдельный AI движок. Где AI от слова маркетинг.
И просто вспоминаем приход фрисинка от АМД. Который в тупую опирался на отраслевые стандарты, например DisplayPort Adaptive-Sync
Так что генерация кадров может и железная фича.
Но вопрос в необходимости «железности».
Ибо генерация кадров для нвидиа и АМД не что-то новое. И вполне себе работало, пусть и не в играх, без аппаратной проприетарщины.
И если АМД выкатит FSR 3, и получит примерно похожий результат. Это послужит доказательством как минимум того, что аппаратные фичи не очень и нужны.
Вопросов всего пара. Цена решения и его эффективность.
Тут аналогия проста. Кодеки. Декодировать видосик в ютубе, можно и без них, программно. Но тем не менее, рационально их добавить. Ибо эффективно и не требует значительных трат (ибо например не занимает кучу места в кристалле).
И тут покажет кто прав, время и практика. Но оба подхода имеют право на жизнь.
Ибо по факту, это просто интерпозер. Который делается и разрабатывается TSMC.
Их вообще у компании несколько.
CoWoS (chip on wafer on substrate)
InFO (integrated fan-out),
SoIC (system-on-integrated-chips) и
WoW (wafer-on-wafer)
По сути и 3D кеш по большей части заслуга TSMC. Как и большинство вещей, касающихся непосредственно производства.
Но тут стоит помнить пару вещей. Инженеры AMD напрямую работают с инженерами TSMC, совместно решая некоторые проблемы. (в основном касающихся физ. дизайна продуктов)
Так же возможно AMD разрабатывала физ дизайн интерпозера. Т.е. разводку показанную на картинке.
Всё же подобные вещи учитываются при разработке дизайна микроархитектуры. А не вот поставил и пользуешься.
S&P 500 тоже с пика в прошлом году просел.
Что уж говорить о волатильной крипте.
Но это не может продолжаться вечно. Цель то замедлить инфляцию.
Ну и опять же пока у нас капитализм, особенно с гегемонией США, паттерны будут повторяться.
Я это к чему. Смотрим как они решали кризис 2007-2008, тот же коронокризис. Т.е. ФРС будет балансировать меж инфляцией и заливанием экономики зеленью.
И вот когда они начнут печатать деньги, финансовый сектор начнёт расти. Крипта в том числе.
Есть и менее значимые события. Как например легализация крипты. Что тоже создаёт покупательную способность.
Тот же Маск разгоняя хайп, привлекает своих фанатиков, что создаёт спрос.
Но глобально пока рынки падают, сменить сам тренд, не так и просто.
А вот в короткую торговать сложно.
а тут 7нм нужны.
И оборудования под данный ТП нет. Даже 180-90нм нет, только разрабатывают.
Как и 300мм пластин особо чистого кремния.
И т.д.
Просто вспоминаем на каких компьютерах осуществлялась космическая программа, в прошлом столетии.
Итого военным абсолютно насрать ракета наводиться на цель/координаты наносекунду или микросекунду.
У них не происходит моделирование термоядерного синтеза. Они не сворачивают белки. Т.е. огромные вычислительные мощности им не нужны.
Ядерный щит, доставшийся от СССР. Тоже вычислительными мощностями не блистал. Думаю его и не модернизировали.
Им нужна надёжность. т.е. если во время наведения у тебя чип откажет, в виду разных причин, это уже фиаско. И тут только зрелые Т.П.
Лучшее куда могут пойти такие чипы в военке. Это в обычные компьютеры. Т.е. в офис. И да там, 7нм и менее избыточно. Косынка и на 28нм лагать не будет.
Да и на 45нм тоже пойдёт.
FSR запускал ну например в SCORN. Ой фпс упал. ой ой ой. А нет? Как работает?
Ну и например в Chernobylite fsr 1 врубался ранее. Сейчас качать 34ГБ в падлу.
«некоторые настройки типа альтернативной синхронизации приводят к артефактам или тормозам или вообще слету драйвера»
-Ну-ну. Расскажи мне сказочник, как у меня всё артефачит и дрова слитают.
-И конечно рандомно фризит. Даже не статтерит.
-У меня почему то хром всего 4ГБ из озу жрёт. Под стройку зарезервировано 645МБ.
упппсс.
Мало того, у друга сейчас тарахтит 584. И тоже подобных траблов нет. Хотя за FSR сказать не могу. Он не пользовался.
У АМД Проблемы «ВСЕГДА». Гыгы.
ну-ну. Там в коментах хватает разных отзывов.
Смотрим описание драйверов
https://www.techpowerup.com/download/nvidia-geforce-graphics-drivers/#changes-517-48-whql
Вот это я понимаю редко. А 520+ драйвера на которые идут жалобы, вообще не поломанные.
И да мистер врунишка, где мои проблемы с драйвером? Они же ВСЕГДА у АМД, драйвер 22.10.1, до того ещё хренова туча версий.
Так же АМД, явно стараются добиться оптимальных характеристик устройства. По сему размеры кеша тоже оптимальны. Ну вот условное его удвоение даст нам каких-нибудь +3-5%. Ибо скалирование попаданий в кеш не линейное. Так ещё и вычислительная способность не вырастет. С тем же успехом наращиваем частоты.
Во вторых слухи это слухи, они не всегда сбываются. А если слух даже правдив. То по срокам разработки, это может быть и rx 8000, да даже rx 9000. Ибо разработка занимает несколько лет. Такие крупные компании как АМД, могут укладываться в срок 3 года. Обычно вовсе 5.
При том особенность в том, что компания разрабатывает микроархитектуры параллельно. Очевидно в несколько команд. С некоторой, периодической ротацией инженеров.
А по поводу корпуса не расплавиться. Карта вам не индукционная печь.
Лучшее что нам могут выкатить, некий экспериментальный образец с чиплетами. Типов 5800x3d или RADEON VII. (ну например для обкатки на практике)
Например N7>N7P>N6 совместимы. А вот N7 и N7+ уже нет.
Тут так же N5P и N4P не совместимы. Так что по факту перенести АМД не может. Придётся портировать, т.е. по сути переделывать физ. дизайн как минимум. И это стоит не самых малых денег. По мимо того, что N4P априори дороже.
А вот отбраковка условно бесплатна. Со временем качество подрастает. В следствие чего получается больше качественных чипов. И тут просто выпускают новые карточки, вот и всё.
Могут выкатить 7970 3GHz edition :)
-Из того же источника.
-Очевидно на разработку таких технологий нужно время. И Нвидиа в том числе. Они наверное её тоже для презенташки придумали.
И так сказать вертикальную интеграцию никто не отменял.
«бОльшую производительность»
-Конвейер GPU и система кешей неразрывно связаны.
Всё просто, бутылочное горлышко вылезет с другой стороны.
«Или поставить два GPU на одну подложку»
-Такие вещи предусматривают на этапе проектирования. Тебе нужна коммутация меж 2 чипами. Мало того, у тебя вся иерархия кешей, регистров, а так же устройство конвейера обязаны учитывать данную особенность. Особенно важен будет внутренний планировщик, который распределяет нагрузку меж блоками. Иначе распределение вычислений, не будет бесшовным.
-В ином случае, ты в тупую получишь SLI, с очень быстрым мостом.
Единственное, что возможно, это то, что АМД выпустит новую ревизию чипов, на более высоких частотах. И то по причине, что они разрабатывали архитектуру с прицелом на 3ГГц.
Но вполне вероятно, просто снизили ТТХ, что бы не терять чипы на отбраковке, в поисках золотых семплов.
-Так может говорить человек, который никогда в жизни не считал себестоимость.
-Ну либо придуривается.
И да это бред. Стоимость сырья не равна себестоимости.
Вот первый DLSS АМД явно застал врасплох.