Автор не входит в состав редакции iXBT.com (подробнее »)
avatar
так очень простой же расчёт
8700МГц*64бит = 556800Мбит/сек
Переведём в байты
556800Мбит/сек / 8 = 69600МБ/сек
Переведём в гигабайты
69600/1024=67,96ГБ/сек
На один канал естественно, для 2х каналов х2
Или 135,93 ГБ/сек
.
Тайминги же конечно не адекватные. Переведём циклы в нс. первый тайминг 127
(1000/4350)*127 = 29нс
Абсолютный хлам. Ибо те же 6400 cl50 будет иметь задержку
(1000/3200)*50 = 15,6нс
При псп в 2х канале 100 ГБ/сек. Т.е. за 36% псп. Мы получаем практически вдвое выше задержку по первичному таймингу в нс.
avatar
Лол кек с фига ли.
У тебя на b450 mATX плате, которая в рознице стоит до 7к руб. Примерно 8 фаз для питания ядер процессора, по моему 50А и конечно с радиатором. А тебе всего нужно 200А тока для 5950х при потреблении более 250Вт (200А*1,3V=260Вт).
Что уж говорить просто 150Вт 5800х который в пике такое кушать будет. Нужно то всего 125А тока, при напряжении 1,2V.
На SoC у тебя отдельные фазы идут.
.
А 7к это по сути средне низкий сегмент. Полноценный средний сегмент материнок как правило более 10к руб т.е. 12-15к.
avatar
Кхм. У 5600х та же площадь кристалла. А 40Вт дополнительного тепла, ни коим образом не нуждается в дополнительных 100$ на СО. Учитывая что топовые воздушки идут как раз примерно от 100$.
И как я и сказал, в худшем случает даунвольт в биосе решит проблему.
avatar
Смысл? Разница в TDP 40Вт.
В худшем случае в биосе ограничиваешь потребление. Всё равно получишь куда больше.
А в реальности у них один и тот же лимит PPT в 142Вт. Зависит от настроек материнки, ибо априори может быть включен тот же PBO и прочие бусты. Которые скорей всего и упрусть в PPT.
А так штатных 105Вт отвести реально и средненькой башней. Тем более в играх.
.
Это вам не 5900х или 5950х.
avatar
Ну тк тут речь не о демонстрации, а о внедрении.
И как по мне используешь другие инструкции, которые писали нвидиа, для работы с нейронками на тензорах.
А то что вы написали, это описание работы, на картах без Матричных блоков, т.е. на блоках общего назначения, при том на ГП которые поддерживают инструкцию DP4a.
А так как видим в теории реализация на RTX'ах должна быть возможна.
avatar
ну ты сравнил. У эльбруса заказ ~30000. Что в рамках тсмс вообще единичное производство. Это работа примерно одного степпера, менее чем 24ч.
Когда АМД столько за месяц у одного только ритейла продать может. Приоритеты очевидны.
.
И я не слышал, о переносе заказов. Только о увеличении сроков исполнения.
И те же МЦСТ до кризиса НЕ работали на склад. А размещали заказ, когда был клиент. О каком переносе сроков речь? Пруфы в студию.
avatar
Это видимо речь, про те же Pascal'и и им подобные.
Pascal (GP102, GP104 и GP106) вводят новые 8-битные целочисленные 4-элементные векторные инструкции скалярного произведения (DP4A)
Эти гибкие инструкции полезны для линейных алгебраических вычислений, таких как умножение матриц и свертки.
Но по факту тензорные ядра могут в INT8
Тензорные ядра NVIDIA позволяют выполнять операции различной точности: TF32, FP16, INT8 и INT4, обеспечивая исключительную универсальность и производительность.
1)https://developer.nvidia.com/blog/mixed-precision-programming-cuda-8/
2)https://www.nvidia.com/ru-ru/data-center/tensor-cores/
avatar
А какая разница? Tensor core и Matrix engine это аппаратный блок для операций с матрицами. Так что если блок для одних и тех же вычислений, то о какой частичной совместимости речь?
Я не понимаю, если производительности блока хватает, что мешает полной реализации технологии? Технологии XeSS и DLSS 2.0 вообще одного поля ягоды, реализованы на одних и тех же принципах. Ибо Интел например переманила к себе одного из разработчиков DLSS.
И фактически разработчик софта, используя команды описаные разработчиком SS и железки может спокойным образом реализовать XeSS на тех же RTX'ах.
Ибо Intel явно задокументируют как работать и реализовывать XeSS.
Так же как и любой разработчик железки описывает как работать с железкой и какими командами.
avatar
Так это вообще не отменяет моего тезиса.
.
Ибо себестоимость единицы продукции будет расти только в том случае, если много брака. А точнее, только если брак не исправим. Иначе в отбраковку. И не так важно куда пойдут эти кристаллы, в 5950х или 5600х. Ибо в данной ситуации количество кристаллов фактически тоже, да и цена пластины та же.
.
Да и фактически АМД и не надо большое кол-во top SKU. Просто потому, как нужен всего 1 такой кристалл, на один 5950х, второй кристалл уже хуже. А все остальные процессоры отбраковка. А так же известны случае когда в 5800х 2 кристалла по 4 ядра.
% не ликвида вообще стремится к минимуму. Ибо
1)Крайне низкая площадь, шансы на то, что большая часть площади окажется забракована, стремиться к минимуму
2) Тех процесс уже давно отработан и кол-во брака в принципе сведено к минимум <5%
И этого уже хватает для аргументации.
.
Так же очевидно, что для дешёвых линеек нужно больше кристаллов ибо их и продаётся больше в штуках. В тех же тредриперах и эпиках используется всё те же кристаллы, но они не блещут частотным потенциалом как правило. И сюда так же сливается весь неликвид. Ибо есть модели с 8 ядрами, но тоже кол-во кеша (256МБ). Что говорит о том, что там 8 кристаллов! Где работает примерно 1 ядро на кристалл, т.е. остальные либо битые, либо заблокированные.
.
Т.е. не леквидом может выступать только тот процессор. Где биты большая часть транзисторов в принципе! Ибо даже если цело 1 ядро, шины данных и L3 кеш, то он уже годен.
.
А я заложил порядка 8% площади, на брак и прочее. Что не мало.
.
Итого с пластины мы имеем ~800 кристаллов для процессоров. И из этих 800 кристаллов и проводим бининг. А имея примерно 800 кристаллов, себестоимость примерна та, что я считал сверху. Ибо реально не важно куда эти кристаллы пойдут в эпики или в самые младшие райзены. Ибо деньги будут получены, следственно себестоимость около реальной.
И если не хватает так сказать голден семплов, ты по идее заказываешь больше пластин. А остальное продаёшь как отбраковку, которая имеет ту же себестоимость.
avatar
Разные страны. Разные магазины. Инфляция.
Причин может быть масса.
avatar
Но FSR и апскелит слабо/плохо.
Ибо реконструкция кадра ОП.
А так же знаете о чём говорит открытость технологии? В том что её смогут использовать все!
.
Т.к. это нейросеть и реконструкция кадра, то работать оно будет на Intel Arc, и на RTX 20/30. Если разработчик того захочет. Ибо у обоих компаний в данных линейках есть матричные блоки.
Кстати у АМД тоже есть матричные блоки, НО! В другой архитектуре в CDNA. Так что пока игровые карты на RDNA в пролёте, ибо не целесообразно использовать блоки общего назначения.
.
У FSR по сути нет будущего. Ибо не способна создать качественную картинку из низкого разрешения. А не способна, ибо негде взять детали для кадра. FSR так лишь делает картинку, а точнее контуры более резкими. Что и делает визуально картинку более чёткой, при более низком разрешении рендера. Но вот от того же перешарпа никуда не деться.
Т.е. по сути сравнительно не большой выигрыш. Но зато нет артефактов типо гостинга, которые не отсекла нейросеть. Да и внедрять просто и дешёво.
.
И по сути какое дело, сейчас оно не плохо. Но будущего без реконструкции у него нет. А со временем парк железа который будет работать с XeSS и DLSS только будет расти. Как и количество игр.
.
Тут вопрос лишь в планах развития технологии АМД. Они могут в rx 7000 впихнуть матричные блоки и запилить FSR 2.0 с реконструкцией кадра и нейронками. Вопрос лишь в том, хотят ли тратить на это время и деньги. ибо развитие, продвижение и поддержка данной технологии стоит денег, при том чем сложней технология тем дороже. А если хотят, то им как бы придётся догонять NV и Intel у которых уже есть опыт да и сама технология, а у амд такого нет. Хотя будет весело если АМД ещё раз какой-нибудь простой технологией сможет конкурировать.
avatar
Ну на самом деле НЕ дешевле. Как минимум потому, что у TSMC есть своя маржа, которую платят АМД при заказе.
Но оно работает иначе. Ибо сорян но контракты. А они долгосрочные. И заключаются сильно заранее. Так же как, есть квоты и если ты их исчерпал, сорян но линий ты больше забронировать не сможешь. Количество квот естественно определяет TSMC.
.
Т.е. вот так просто взвинтить цену не выйдет.
.
К тому же в связи с кризисом цены скакнули до 20%.
.
И всё равно конкретно кремний стоит копейки. Условно цена на 300мм пластину 7нм составляет 11.220к$
Площадь пластины 70650мм2. Возьмём эффективную площадь как 65000. Остальная площадь полностью бракованные изделия, площадь под тех нужды и края где не поместились процессоры.
Площадь 1 кристалла с ядрами составляет 80,4мм2.
65000/80,4≈808 процессоров! Часть из них пойдёт на 5600х и 5900х ибо часть кристаллов будет битая или не соответствовать ттх, но это не большая доля. Остальное же в 5800х 5950х. Но в целом мы получаем себестоимость одного кристалла
11220/808=13,89$.
.
Но тут такая цена ибо кристаллы достаточно маленькие. А так же потому как тех процесс зрелый. На новых ТП брака больше. Дак ещё кол-во брака растёт с площадью. И вроде это оптовые цены. При низкой серийности, ценник будет выше.
.
Существенно влияет на цену RnD. Ибо это миллионные, а то и миллиардные инвестиции, в течение 3 лет как правило. И конечно же маржа, которая прибавляется в % к себестоимости.
avatar
Финансы тут даже не самая большая проблема.
АМД достаточно долгое время вообще жила в долг. Что говорит о том, что деньги то найти можно. И даже выплатила его.
.
А вот, что куда важней так это штат сотрудников. Хороших инженеров так просто не найти. И тут АМД кстати покупает xilinx. И напомню, что до этого у АМД штат всего 10000 человек. У Нвидиа или интел примерно на порядок больше.
По мимо сотрудников ещё роляют наработки компании и патенты. Без них никуда. Тут у АМД всё не плохо.
Ну и наконец надёжные партнёры. Тут те же АМД например осваивают новых партнёров, например в лице Samsung.
.
Ибо если тебе не хватает денег, для проектов, есть инвесторы и кредиторы. А вот остальное добиться куда сложней.
.
Хотя и деньги критичны.
avatar
Ну ну речь идёт мол короткий контакт по этому сигналу меньше идти=выше псп.
Тупизм. И причём тут вообще тдп?
У тебя псп в 400ГБ/сек обеспечивает с одной стороны 8 канальный контроллер памяти, с другой стороны частоты модулей памяти в 6400МГц.
Иначе хоть ты усрись хоть впаивай память поверх процессора, толку будет ноль если у тебя каналов памяти меньше или эффективные частоты ниже, псп выше от коротких контактов ты не получишь.
.
Распаривание озу на одной подложке, даёт нам малую длинну контакта. Что в первую очередь уменьшает именно наводки. Что и позволяет передавать сигнал без потерь. И чем больше нужно передать данных на одном контакте, тем это критичней. Ну либо при большом кол-ве контактов критично.
.
Как видим так близко не нужно располагать даже gddr6x с эффективной частотой в 21ГГц. Что уж там lpddr5 с её 6,4ГГц. Или 512 битной шине против 1024, 2048 или 4096.
.
Как видим и без этого идиотизма внедряют ddr5 и без этой фигни существуют 8 канальные процессоры.
.
А теперь пойди распаяй 256ГБ или 512ГБ или сколько там будет лимит для ddr5. На подложке с процессором и озвуч цену лул.
avatar
Ну так оно и очевидно. Чем дешевле продукт, тем больше он продаётся в штуках.
И типо вот кто его купит за 280? Что бы на нём заработать. Когда есть альтернатива.
avatar
Себестоимость производства кремния в процессоре копейки. Большая часть стоимости процессора это RnD и маржа.
Как пример стоимость одной 300мм пластины выполненной по 7нм у TSMC до подорожания стоила $9,346. Вычислить кол-во процессоров с пластины и их себестоимость можете сами.
avatar
Ну ну сразу видно, что понимает он. обычную DDR память распаивать ага. Очень нужно. Верим на слово. Или всё же пруфы?
avatar
Теперь вопрос нафиг нужен 5600х? Когда можно взять 5800х всего накинув 20$. Или 12600К.
Надо было снижать до 200...250$
avatar
Потому что распаивать обычную ddr память на подложке с процессором, это максимально не нужно и ублюдочно. Вы хоть сами понимаете для чего это нужно?
Хмм 5% год? zen2 +15% ipc. zen3 +19% ipc. Плюс % от роста частоты. Плюс в zen2 кол-во ядер удвоилось.
Где 5% в год?
avatar
Та не ты шо. Слишком дорого. Эти 128 или 256 метров кеша, встанут дороже самого процессора. Нецелесообразно.