Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики.
Продолжая посещать сайты проектов вы соглашаетесь с нашей
Политикой в отношении файлов cookie
Честно не знаю. Но расчётно кеш маленький 1 кристалл всего 36 мм²
Сам кристалл стоит копейки. Его устанавливать вероятно даже дороже.
Просто с 300мм подложки, их выйдет более 1.5к штук.
А одна пластина после удорожания в худшем случае будет стоить 11к$
.
Хотя давайте посчитаем.
допустим эффективная площадь, будет ну 63000мм² остальное брак, края где не поместился кристалл и площадь под тех нужды. т.е. 7650мм².
63000/36=1750чипов кеша. 11000/1750=6,3$ 1 кристалл. Я думаю установить его чуть ли не дороже выйдет ибо лишние действия и сложности, да и 3д технологии тсмс в новинку.
Мб вы и правы, я вероятно не так понял, но всегда посредник это плохо и какова теплопроводность силикона который применили? Сильно сомневаюсь, что это лучше металлизированного кремния, при том медью, у которого высокая теплопроводность.
Если тот же структурный силикон так хорош, то почему используют припой, от кристалла к крышке?
Сомнительно, что оно так хорошо.
А если оно такие хуже чем кремний, то мы получим худший отвод тепла, выше температуру в хот спотах, а может и в среднем по чипу. Так и градиент температур.
Физика есть физика.
Оно немного не так работает. Они удалили 95% кристалла, над кешем, что бы сверху законектить, отдельный чип с кешем. А сам кристалл утопили ещё в подложку.
Так что не факт, что оно будет холодней.
А т.к. ядра не прилегают на прямую к крышке, то отводить тепло будет не так удобно.
И возможно будет локальный нагрев.
Чел давай по порядку.
.
По потребление. У интел есть такая вещь как pl2, который работает для буст частот и как правило из коробки проц будет пытаться достигать именно Pl2. В данном случае это 225Вт. А если есть запас по охладу может и ещё сильнее бустится.
Так что в реальности, если тебе не только поиграть, а ведь для этого и нужно много ядер, крайне вероятно, что увидишь те самые 200Вт.
.
Главное результат? Извините но десктоп тоже имеет свои пределы, это тебе не рабочая станция, где ты можешь себе позволить тратить казённые деньги, да и не волнует тебя особо, что там с оборудованием.
Десктоп же это как правило твоё личное железо и бог с ним с потреблением, да не приятно. Но тут тогда стоит вопрос отвода тепла. И как подпункт, ты тепло то, не куда-нибудь выкидываешь, например за окно. А греешь комнату, что не очень приятно, в плане того, что условия охлаждения усложняются. Так что результат в спринте не имеет никакого смысла, если у тебя марафон.
.
Большие ядра.
Cудя по всему AVX-512(но это не точно) и AMX(тут точно) блоки залочены. Как и размер L2 кеша меньше всего 1,25метров, вместо 2.
У малых ядер отсутствует часть инструкций. FMA/AVX к примеру. Что скажется на FP производительности.
Так же у малых ядер иная иерархия кеша. У них нету одной из ступенек кеша. По сути нет классического L2. А идёт сразу большой L2 который сидит на кольцевой шине. Да и задержки большие для L2. Так что это по сути уже L3 кеш. Так же нет кеша микроопераций. А так же похоже проще маршрутизация данных. И нет HT.
Единственно что хорошо, у малых ядер разделены исполнительные порты для int и fp ну как у амд.
Так что нужны реальные тесты, а не маркетинговые от интел.
В реальных задачах всё может быть не так радужно, как в той же синтетике.
Так что я бы прям не горячился так яро заявлять, что вот 8+8 рвут 16 ядер амд. Нужно посмотреть независимые тесты, а не ангажированные.
уточню вызывает опасения отвод тепла. Да кеш производит незначительно больше тепла. Но структура кристалла теперь иная и выглядит оно так. картинка кристалла
Как видим слева с 3д кешем кристал и площадь которая прилегает к крышке чуть меньше. При том прилегает как раз сам 3д кеш, а вот основной источник тепла ядра, по видимому не прилегают к крышке. микроархитектура в кристалле
Но это пол беды.
Вторым фактором как по мне является цена. Она может немного увеличиться каждый кристалл с кешем примерно 36мм2, что в производстве самих кристаллов не так дорого. Но вот для их установки потребовались некоторые изменения, а это денег стоит. Ну и конечно инженеры который пришли к данному решению, тоже хотят кушать. Надеюсь только на то, что АМД на cpu с данным кешем цену не взвинтят.
Т.е. в идеале
zen3 дешевеет.
zen3+ занимает его ценовую нишу.
Данный вариант возможен.
Плюс должны представить zen3+ с 3D V-Cache. Там прирост IPC ожидают 10...15%
Но на второй вариант я бы так сильно не расчитывал.
Знают лол.
Во первых макс буст частота указывается для 1-2 ядер/потоков.
Во вторых, качественный CCX только один, и в нём всего пара таких ядер.
По этому отбраковка дело простое.
Тех процесс зрелый, кол-во брака не более 5%. Площадь маленькая, шанс на брак низкий. Как итог себестоимость конкретно производства кристаллов копейки.
И типо смысл с вами говорить после фразы, что там никто не знает. это просто уже безнадёжно.
Да это как алгоритм ethash. В окне майнера есть строчка.
Значит монеты ETH и ETC и возможно ещё какие-то.
Собственно сейчас самые популярные и прибыльные для GPU майнинга.
что с другими альткоинами непонятно. Ибо всё же A100 имеет немного другой конвейер, в котором упор сделан на fp16 и fp64 вычисления. Но в целом огромная псп и низкие задержки всегда хорошо.
А оно хорошо?
1 не особо унифицирована, ибо ядра то гетерогенные!
1.1 А как же сегментация?
2 и что? Как бы в чём сокральный смысл?
3 энергоэффективность в контексте малых ядер всё же имеет иное значение. Точнее будет сказать сконцентрировано на малом потреблении. Когда у амд не столько низко потребление, сколько производительность на ватт, что тоже энергоэффективность.
Вот у меня собственно и стоял вопрос, а зачем оно в десктопе то!
Ноуты, там важна энергоэффективность.
Сервера там рулит параллельность вычислений и чем больше ядер тем лучше.
В десктопе же мы видим 8+8. Которые по логике вещей должны быть хуже чем 16 ядер амд. тест ipc
Исходя из теста мы узнаем что zen3 имеет на 7,5% выше IPC чем rocket lake. А большое ядро alder lake будет быстрее чем rocket lake, на 19%
т.е. golden cove на 11,5% быстрее по IPC, но таких ядер всего 8.
Когда малые ядра имеют показателю ipc на уровне skylake, а rocket lake быстрее skylake на 18%.
Т.е. 1e= 0.847r (ядру рокет лейков)
1p=1.19r
zen3=1.075r
.
16z3*1.075=17.2R
8e*0.847+8p*1.19=16,296R
16z3>8e+8p по IPC. на ~5,5% в среднем.
За частоты сказать на самом деле сложно
5950х может в играх работать на 4,7ггц.
А вот в том же cinebench 4.6ггц в ручном разгоне только. Учитывая то что у интела жор то не самый малый. То я пожалуй возьму всё же 4,4ГГц по всем ядрам для 5950х.
Тут же у нас 5ГГц и 3,7ГГц. т.е. 4,35 в среднем. Т.е. 5950х на 1% быстрее?
Ну опять же нужны прям реальные тесты.
.
Аргументирую почему взял такую частоту для 5950х.
У райзенов PBO кусок говна, он слишком агрессивный и слишком задирает вольтаж, что не даёт возможности достичь хорошего показателя частоты по всем ядрам.
В ручном же режиме (1.181v при потреблении 165Вт из отзыва человека) на сжо это реальный показатель, при том это не предел разгона. При том человек тестил Cinebench который относительно тяжёлый и юзает те же avx.
Так же под alder lake тоже нужна водянка, правда у них буст по лучше работает. И частота по всем ядрам достигается вероятно при pl2 т.е. 225Вт.
.
Так что вот примерно такие результаты мы имеем в среднем по селу. И в теории таки 5950х может быть лучше.
Так там себестоимость не высокая на самом деле не высокая.
цена 300мм пластины на 7нм ноде была 9346$ в сентябре 2020.
На 300мм пластине пластине поместится:
я возьму площадь пластины как 60000mm² (из 70650mm²) ибо часть процессоров по краям не поместиться, часть под технические нужды и часть брак.
60000mm²/80.7 mm²(zen3 die size) = 744шт
Допустим пластина подорожает на все 20%, хотя может от 10% до 20%.
9346$+20%=11215$
Теперь выясним себестоимость чиплета с ядрами без учёта RnD
11215$/ 744шт=15$ за кристалл.
В старших cpu кристалла 2. итого 30$ уже с наценкой tsmc.
Так у нас есть ещё IO die На 12нм GF. Допустим они тоже повысят цену на 20%.
(как расчётную цену беру на 12нм tsmc)
3984+20%= 4780$ за те же 300мм.
60000mm²/125 mm²= 480шт
4780$/480шт=9,96≈10$
Т.е. после удорожания кристаллы у АМД будут стоить всего 40$. К сожалению примерных цен на подложки, корпусирование, тепло распределительную крышку, сборку и логистику я не знаю. Но вероятно не так и дорого.
Т.е. большая часть цены это RnD и маржа АМД.
Т.к. товар уже продаётся достаточное время, что позволило окупить RnD или около того. Так ещё продукт изначально подорожал на те же 50$ которые вероятно почти чистая маржа АМД т.к. у интела ничего лучше не было.
Так что скидывает цену есть куда. Так что очень даже могут.
.
Повышение цены на самом деле больше ударит по GPU там площади большие, как следствие сильно меньше кристаллов с подложки, так ещё и брака больше.
Я бы вот про слабее не был так уверен. Нужно массовое тестирование. Особенно в раб задачах. Ибо малые ядра всё же имеют ниже частоты и IPC. и 16/24 не факт что будет быстрее чем 16/32. Но такое возможно.
Но очевидно дороже. АМД так же могут скинуть цены на те же 50у.е. или более.
А так же выпустят рефреш с +10...15% производительности.
Опять же как факт майнеры и перекупы за Q1 2021 в самый разгар майнинга купили только 25% карт.
Вон в новости даже на 260лямов купил говёную отбраковку, чисто для майнеров.
На графике же
2p+8e=4p*1.5 я исключил по сути 2p ибо они есть и там и там.
т.е. 2p-2p+8e=(4p-2p)*1.5
Просто потому как 2p есть в обоих конфигах и по логике разницу в производительности давать не должны. Вот и вышло что 8е=2p*1.5
или 8е=3p => p=8e/3=2.67e.
Но опять же график то всратый.
Но выводы у вас примерно верные. Если исходить из того что малые ядра так хороши, то реально почему бы не пихать такие конфиги как 2p+16e Или более. Просто потому как они ж сами позиционируют, что p кор хороши в однопотоке. Тогда 2х ядер 4х потоков то хватит за глаза для малопоточной нагрузки.
Аргументация?
Я допустим согласен, если идёт речь про апгрейд системы. Ну например при наличии b450 матери и старше.
А так alder lake поддерживают ddr4 значит разницу в стоимости памяти не считаем.
Материнки? Так вроде цены сопоставимы, не?
Охлад и там и там нужен хороший, ибо у райзенов кристаллы маленькие и тепло отвеодить сложно. А интелы жрут как не в себя.
Почему выгодней?
Ес чо сам смотри слайд. это ж полная срань. Я тебе подобные писюльки могу и в паинте нарисовать.
Типо тут даже примерно нефига не ясно.
1 график
одопоток
P-core жрёт примерно на 30...50% больше и даёт на 50% производительности, чем E-core.
Второй график итого более сраный.
мультипоток
10 физ ядер 12 потоков, сравнивают с 4/8. Зачем? Типо HT в среднем даёт не так много условных 10...20% но оно по сути почти ничего не стоит, ибо просто второй поток команд, которое использует тоже ядро, кода оно простаивает. И тут 10физ ядер быстрее всего на 50% чем 4 физ ядра. Давайте исключим из уравнения 2/4 больших ядра.
Выходит что 8 маленьких ядер всего на 50% быстрее, чем 2 больших ядра. Но да они энергоэффективней, т.к. частоты выше на 1...1,3ГГц. А учитывая то, что зависимость частоты от напряжения не линейная, а скорей движется по экспоненте...
.
Golden Cove примерно на 42% быстрее по IPC чем Skylake, у которого поговаривают IPC как у малых ядер.
В чём смысл использовать кучу малых ядер? Берёшь и пихаешь больше Golden Cove ядер, снижаешь немного частоты даже до того же уровня малых ядер, и получишь больше производительности за счёт IPC. А если потратить время которое ушло на ядро тремонт, для энергоэффективности больших ядер?
Сам кристалл стоит копейки. Его устанавливать вероятно даже дороже.
Просто с 300мм подложки, их выйдет более 1.5к штук.
А одна пластина после удорожания в худшем случае будет стоить 11к$
.
Хотя давайте посчитаем.
допустим эффективная площадь, будет ну 63000мм² остальное брак, края где не поместился кристалл и площадь под тех нужды. т.е. 7650мм².
63000/36=1750чипов кеша. 11000/1750=6,3$ 1 кристалл. Я думаю установить его чуть ли не дороже выйдет ибо лишние действия и сложности, да и 3д технологии тсмс в новинку.
Если тот же структурный силикон так хорош, то почему используют припой, от кристалла к крышке?
Сомнительно, что оно так хорошо.
А если оно такие хуже чем кремний, то мы получим худший отвод тепла, выше температуру в хот спотах, а может и в среднем по чипу. Так и градиент температур.
Физика есть физика.
https://en.wikipedia.org/wiki/Tremont_(microarchitecture)
Покажи исполнительные блоки avx
Так что не факт, что оно будет холодней.
А т.к. ядра не прилегают на прямую к крышке, то отводить тепло будет не так удобно.
И возможно будет локальный нагрев.
.
По потребление. У интел есть такая вещь как pl2, который работает для буст частот и как правило из коробки проц будет пытаться достигать именно Pl2. В данном случае это 225Вт. А если есть запас по охладу может и ещё сильнее бустится.
Так что в реальности, если тебе не только поиграть, а ведь для этого и нужно много ядер, крайне вероятно, что увидишь те самые 200Вт.
.
Главное результат? Извините но десктоп тоже имеет свои пределы, это тебе не рабочая станция, где ты можешь себе позволить тратить казённые деньги, да и не волнует тебя особо, что там с оборудованием.
Десктоп же это как правило твоё личное железо и бог с ним с потреблением, да не приятно. Но тут тогда стоит вопрос отвода тепла. И как подпункт, ты тепло то, не куда-нибудь выкидываешь, например за окно. А греешь комнату, что не очень приятно, в плане того, что условия охлаждения усложняются. Так что результат в спринте не имеет никакого смысла, если у тебя марафон.
.
Большие ядра.
Cудя по всему AVX-512(но это не точно) и AMX(тут точно) блоки залочены. Как и размер L2 кеша меньше всего 1,25метров, вместо 2.
У малых ядер отсутствует часть инструкций. FMA/AVX к примеру. Что скажется на FP производительности.
Так же у малых ядер иная иерархия кеша. У них нету одной из ступенек кеша. По сути нет классического L2. А идёт сразу большой L2 который сидит на кольцевой шине. Да и задержки большие для L2. Так что это по сути уже L3 кеш. Так же нет кеша микроопераций. А так же похоже проще маршрутизация данных. И нет HT.
Единственно что хорошо, у малых ядер разделены исполнительные порты для int и fp ну как у амд.
Так что нужны реальные тесты, а не маркетинговые от интел.
В реальных задачах всё может быть не так радужно, как в той же синтетике.
Так что я бы прям не горячился так яро заявлять, что вот 8+8 рвут 16 ядер амд. Нужно посмотреть независимые тесты, а не ангажированные.
картинка кристалла
Как видим слева с 3д кешем кристал и площадь которая прилегает к крышке чуть меньше. При том прилегает как раз сам 3д кеш, а вот основной источник тепла ядра, по видимому не прилегают к крышке.
микроархитектура в кристалле
Но это пол беды.
Вторым фактором как по мне является цена. Она может немного увеличиться каждый кристалл с кешем примерно 36мм2, что в производстве самих кристаллов не так дорого. Но вот для их установки потребовались некоторые изменения, а это денег стоит. Ну и конечно инженеры который пришли к данному решению, тоже хотят кушать. Надеюсь только на то, что АМД на cpu с данным кешем цену не взвинтят.
Т.е. в идеале
zen3 дешевеет.
zen3+ занимает его ценовую нишу.
Плюс должны представить zen3+ с 3D V-Cache. Там прирост IPC ожидают 10...15%
Но на второй вариант я бы так сильно не расчитывал.
Во первых макс буст частота указывается для 1-2 ядер/потоков.
Во вторых, качественный CCX только один, и в нём всего пара таких ядер.
По этому отбраковка дело простое.
Тех процесс зрелый, кол-во брака не более 5%. Площадь маленькая, шанс на брак низкий. Как итог себестоимость конкретно производства кристаллов копейки.
И типо смысл с вами говорить после фразы, что там никто не знает. это просто уже безнадёжно.
Значит монеты ETH и ETC и возможно ещё какие-то.
Собственно сейчас самые популярные и прибыльные для GPU майнинга.
что с другими альткоинами непонятно. Ибо всё же A100 имеет немного другой конвейер, в котором упор сделан на fp16 и fp64 вычисления. Но в целом огромная псп и низкие задержки всегда хорошо.
1 не особо унифицирована, ибо ядра то гетерогенные!
1.1 А как же сегментация?
2 и что? Как бы в чём сокральный смысл?
3 энергоэффективность в контексте малых ядер всё же имеет иное значение. Точнее будет сказать сконцентрировано на малом потреблении. Когда у амд не столько низко потребление, сколько производительность на ватт, что тоже энергоэффективность.
Ноуты, там важна энергоэффективность.
Сервера там рулит параллельность вычислений и чем больше ядер тем лучше.
В десктопе же мы видим 8+8. Которые по логике вещей должны быть хуже чем 16 ядер амд.
тест ipc
Исходя из теста мы узнаем что zen3 имеет на 7,5% выше IPC чем rocket lake. А большое ядро alder lake будет быстрее чем rocket lake, на 19%
т.е. golden cove на 11,5% быстрее по IPC, но таких ядер всего 8.
Когда малые ядра имеют показателю ipc на уровне skylake, а rocket lake быстрее skylake на 18%.
Т.е. 1e= 0.847r (ядру рокет лейков)
1p=1.19r
zen3=1.075r
.
16z3*1.075=17.2R
8e*0.847+8p*1.19=16,296R
16z3>8e+8p по IPC. на ~5,5% в среднем.
За частоты сказать на самом деле сложно
5950х может в играх работать на 4,7ггц.
А вот в том же cinebench 4.6ггц в ручном разгоне только. Учитывая то что у интела жор то не самый малый. То я пожалуй возьму всё же 4,4ГГц по всем ядрам для 5950х.
Тут же у нас 5ГГц и 3,7ГГц. т.е. 4,35 в среднем. Т.е. 5950х на 1% быстрее?
Ну опять же нужны прям реальные тесты.
.
Аргументирую почему взял такую частоту для 5950х.
У райзенов PBO кусок говна, он слишком агрессивный и слишком задирает вольтаж, что не даёт возможности достичь хорошего показателя частоты по всем ядрам.
В ручном же режиме (1.181v при потреблении 165Вт из отзыва человека) на сжо это реальный показатель, при том это не предел разгона. При том человек тестил Cinebench который относительно тяжёлый и юзает те же avx.
Так же под alder lake тоже нужна водянка, правда у них буст по лучше работает. И частота по всем ядрам достигается вероятно при pl2 т.е. 225Вт.
.
Так что вот примерно такие результаты мы имеем в среднем по селу. И в теории таки 5950х может быть лучше.
цена 300мм пластины на 7нм ноде была 9346$ в сентябре 2020.
На 300мм пластине пластине поместится:
я возьму площадь пластины как 60000mm² (из 70650mm²) ибо часть процессоров по краям не поместиться, часть под технические нужды и часть брак.
60000mm²/80.7 mm²(zen3 die size) = 744шт
Допустим пластина подорожает на все 20%, хотя может от 10% до 20%.
9346$+20%=11215$
Теперь выясним себестоимость чиплета с ядрами без учёта RnD
11215$/ 744шт=15$ за кристалл.
В старших cpu кристалла 2. итого 30$ уже с наценкой tsmc.
Так у нас есть ещё IO die На 12нм GF. Допустим они тоже повысят цену на 20%.
(как расчётную цену беру на 12нм tsmc)
3984+20%= 4780$ за те же 300мм.
60000mm²/125 mm²= 480шт
4780$/480шт=9,96≈10$
Т.е. после удорожания кристаллы у АМД будут стоить всего 40$. К сожалению примерных цен на подложки, корпусирование, тепло распределительную крышку, сборку и логистику я не знаю. Но вероятно не так и дорого.
Т.е. большая часть цены это RnD и маржа АМД.
Т.к. товар уже продаётся достаточное время, что позволило окупить RnD или около того. Так ещё продукт изначально подорожал на те же 50$ которые вероятно почти чистая маржа АМД т.к. у интела ничего лучше не было.
Так что скидывает цену есть куда. Так что очень даже могут.
.
Повышение цены на самом деле больше ударит по GPU там площади большие, как следствие сильно меньше кристаллов с подложки, так ещё и брака больше.
Но очевидно дороже. АМД так же могут скинуть цены на те же 50у.е. или более.
А так же выпустят рефреш с +10...15% производительности.
Вон в новости даже на 260лямов купил говёную отбраковку, чисто для майнеров.
2p+8e=4p*1.5 я исключил по сути 2p ибо они есть и там и там.
т.е. 2p-2p+8e=(4p-2p)*1.5
Просто потому как 2p есть в обоих конфигах и по логике разницу в производительности давать не должны. Вот и вышло что 8е=2p*1.5
или 8е=3p => p=8e/3=2.67e.
Но опять же график то всратый.
Но выводы у вас примерно верные. Если исходить из того что малые ядра так хороши, то реально почему бы не пихать такие конфиги как 2p+16e Или более. Просто потому как они ж сами позиционируют, что p кор хороши в однопотоке. Тогда 2х ядер 4х потоков то хватит за глаза для малопоточной нагрузки.
Я допустим согласен, если идёт речь про апгрейд системы. Ну например при наличии b450 матери и старше.
А так alder lake поддерживают ddr4 значит разницу в стоимости памяти не считаем.
Материнки? Так вроде цены сопоставимы, не?
Охлад и там и там нужен хороший, ибо у райзенов кристаллы маленькие и тепло отвеодить сложно. А интелы жрут как не в себя.
Почему выгодней?
Типо тут даже примерно нефига не ясно.
1 график
одопоток
P-core жрёт примерно на 30...50% больше и даёт на 50% производительности, чем E-core.
Второй график итого более сраный.
мультипоток
10 физ ядер 12 потоков, сравнивают с 4/8. Зачем? Типо HT в среднем даёт не так много условных 10...20% но оно по сути почти ничего не стоит, ибо просто второй поток команд, которое использует тоже ядро, кода оно простаивает. И тут 10физ ядер быстрее всего на 50% чем 4 физ ядра. Давайте исключим из уравнения 2/4 больших ядра.
Выходит что 8 маленьких ядер всего на 50% быстрее, чем 2 больших ядра. Но да они энергоэффективней, т.к. частоты выше на 1...1,3ГГц. А учитывая то, что зависимость частоты от напряжения не линейная, а скорей движется по экспоненте...
.
Golden Cove примерно на 42% быстрее по IPC чем Skylake, у которого поговаривают IPC как у малых ядер.
В чём смысл использовать кучу малых ядер? Берёшь и пихаешь больше Golden Cove ядер, снижаешь немного частоты даже до того же уровня малых ядер, и получишь больше производительности за счёт IPC. А если потратить время которое ушло на ядро тремонт, для энергоэффективности больших ядер?