Комментарии / Публикации Sawaru / iXBT Live

Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики. Продолжая посещать сайты проектов вы соглашаетесь с нашей Политикой в отношении файлов cookie

Комментатор

Sawaru

Рейтинг

+1610.00

Автор не входит в состав редакции iXBT.com (подробнее »)

Честно, даже этого не нужно. Да манагеры будут жировать, куда ж без этого, но тем не менее, добавленной стоимости всё равно осталось бы больше. Т.к. речь о производится и не производится.
Просто потому, что при обработке продукта есть человеческий труд, вот он и оседает.
И чем более трудоёмкое/наукоёмкое производство тем больше прибавочного продукта осядет в стране.
Что вообще очень полезно, т.к. эти деньги возвращаются в экономику.

При том, что это именно в логике данной системы, при которой мы собственно и живём.

Проблема в том, что декодер, не особо работает с комплексными инструкциями.
Ладно я может немного перевираю. Но тем не менее, у декодера есть порты.
И у современных микроархитектур он выглядит примерно так 4 простых порта под инструкции, 1 под комплексные. У э ядер интела, вообще декодер не может выполнять комплексные инструкции.

При том ARM не энергоэффективней x86 (я про сами системы команд). Но при сопоставимом уровне производительности.
Просто для сравнения
https://www.top500.org/lists/top500/2022/11/
На втором месте FUGAKU c A64FX. Проц специально разработанный под HPC.
В остальном же видим эпики 3 поколения, как представители x86.
И тут важный прикол, оба процессора на одном тех процессе!

Ваше мнение попросту устарело же. Сегодня ARM не энергоэффективные, но и производительность у них так же выросла до соответствующего уровня.
Что бы поднять производительность по факту им тоже пришлось идти по пути усложнения архитектуры/микроархитектуры.

Так что разница которую мы можем увидеть кроется в микроархитектуре (т.е. дизайне процессора) и тех. процессе. А не в самой системе команд.

По поводу FPU aida. Тут 2 момента. Процессор динамически управляет частотой, даёшь нагрузку ниже, бустимся выше. частота выше = потребление повыше.
При том вы точно уверены что он не использует те же SSE или MMX инструкции? Т.е. SIMD инструкции, которые как раз наша FPU часть.
Скорее всего будут. А FPU aida, это скорей про тяжелые AVX инструкции.

Декодеры конечно тоже потребляют энергию, но ставить их в ровен явно лишнее. Работа существенно проще, да и транзисторов меньше, чем в бек энде.
При том, не все инструкции нужно декодировать! В х86 есть очередь микроопераций. Часть которых возвращается обратно и хранится в кеше микроопераций и может быть использована повторно.

Короче говоря
https://upload.wikimedia.org/wikipedia/commons/e/ee/Cmos-chip_structure_in_2000s_%28en%29.svg
Вот так выглядит наш чип.
Транзисторы находятся в FEOL
Линии питания и коммутация в BEOL

А чип монтируется и так в перевёрнутом состоянии. Оно так и называется flip chip
https://i.pcmag.com/imagery/encyclopedia-terms/flip-chip-amkflip.fit_lim.size_1050x.gif

Ну раз сударь доволен, что же может быть лучше! Но всё же можно как-то лучше скомпилировать.
.
А так самая горячая точка, как раз бекэнд конвейера, в частности думаю FPU часть. В связи с интенсивностью вычислений.
.
А так вы правы. Но думаю как-то исхитриться можно. Например сделать на оборот кеш и ядра (энергоэффективные) с низу кристалла. Просто потому, что они априори меньше потребляют и меньше выделяют тепла. И лучше снимать тепло с самой горячей точки, с наименьшим кол-вом посредников.
.
Но для этого нужно менять принципы питания кристалла.
Я ещё сам не до конца переварил. Но похоже такую возможность нам дают такие технологии как samsung bspdn или intel power via.

«Мы же можем доверять достоверности информации британских и американских СМИ!?»
Боюсь не можем. И такая информация, будет считаться фейковой.

Кхм тут есть маленькая проблемка.
У них же есть «Принцип территориальной целостности государств».
Т.е. по сути противоречат сами себе? Классно придумали.

При том, самоопределение должно происходить без вмешательства из вне. Т.е. если есть вмешательство допустим НАТО, то уже не легитимно получается, согласно принципам ООН.
Ну и так же есть некоторые процедуры, типа референдума.

А теперь следите за руками.
>>7 апреля 2014 в Донецке была провозглашена Донецкая Народная Республика.
>>12 апреля 2014 объявился некто Стрелков, в том же Славянске, о чём говорилось в новости:
https://ria.ru/20220414/voyna-1783525675.html
>>13 апреля 2014 Совет нацбезопасности Украины принял решение о начале АТО
>>11 мая 2014 провели референдум.
>>12 мая 2014 республики объявили о суверенитете.
>>12 мая 2014 Стрелков возглавил вооруженные силы ДНР. По информации:
https://vz.ru/news/2014/5/12/686380.html
>>21 февраля 2022 независимость ДНР и ЛНР, признали в РФ :)
>>24 февраля 2022 начало СВО.

Обратите внимание на личность Стрелкова в этой хронологии. Кто он такой предлагаю изучить самим. Т.к. у меня достоверной информации нет. Мы же можем доверять достоверности информации наших СМИ!?

Могу сказать лишь одно, начиналось действительно как народное движение.

Есть ещё риторический вопрос, а много ли личностей осталось, которые начинали это народное движение? Конечно я про известных/руководящих личностей типа Моторолы.

Лично я наверное и не мог, согласен проблема.
Далее, вот с чего бы я должен угадывать, желает ли сударь, тратить время или нет? Это ваше личное дело, не моё. Тем более не заставляю.
Какое отношение скромность имеет к умению сжимать мысль?

Ну тогда вопроса 2.
А куда вы таким образом хотите отводить тепло?
А куда вы денете всю разводку, через которую подключаются и запитываются чипы?

И? Райзены с 2 чиплетами и так, имели разные частоты ~150-200МГц.
Ибо мы имеем по базе 2 разных кристалла. Первый чиплет у АМД всегда был частотным. Т.е. имел более высокие токи утечки, что позволяет при том же напряжении получать более высокие частоты.
Второй чиплет АМД использовали с меньшими токами утечки. Такому кремнию нужны более высокие напряжения, для получения заветной частоты, но он потребляет меньше тока!
Таким образом АМД немного выйгрывает в отбраковке, но и энергоэффективности.
Разница лишь в том, что для пользователя это по факту было не видно. Т.к. частоты при многопоточной нагрузке задавались из возможностей самого слабого кристалла.

Неожиданно кешу нужно питание и запитан он от CCD же!

Ну и в конце то концов, а ничего что мы имеем разный TDP?
120W против 170W??? А PPT будет 162W vs 230W. Если сравниваем 7950X3D с 7950X. Вот совсем не смущает? И снова вспоминаем предыдущий пункт.

Мало того у кристалла с кешем так же будет своя вольт-частотная характеристика, при том она плавает в зависимости от качества.

И конечно же у такого кристалла свои ограничения, т.е. лимиты. Есть ещё и ограничения со стороны соединения.

Т.е. имеем 2 разных CCD, один из которых априори более быстрый, так второй имеет более низкие лимиты по напряжению с током, но мало того он ещё в рамках этого ограничения запитывает кеш, т.е. на сам CCD выходит меньше питания.

Интеееерееесннооооо почему же один CCD имеет частоты ниже то?

Всё чуточку сложней. Вот мы имеем Ядра процессора, IO и контроллер памяти.
IO и КП к ядрам в случае AMD подключаются при помощи IF. Кластеры ядер меж собой тоже соединены IF.
А вот внутри 1 кластера, всё уже не так просто.
https://www.ixbt.com/img/n1/news/2020/10/1/AMD-Ryzen-5000-Zen-3-Desktop-CPU_Vermeer_Die-Shot_1-scaled_large.jpg
Как видим подключение следующее, L2 подключён к L3. А куски L3 связаны меж собой. При том не совсем понятно каким именно образом. Скорее всего это или кольцо или меш.

И тут уж зависит что вы хотите. CCD на CCD достаточно просто.
А вот если вы хотите CCD+3D кеш + ещё ядра. То вот тут вырисовывается проблема.
3D кеш подключается к кристаллу крайне просто. Просто монтируешь через TSV на уже существующий кеш и готово, всё и так будет связано внутренней шиной.

Но отсюда проблема, как подключить отдельно ещё ядра? Если мы подключим их через связанный L3 кеш, то получим просто 2 CCD по сути.
А через L2 нельзя, он же у каждого ядра свой. При том нужно соединять с областью где хранятся данные. При том ядра меж собой должны быть соединены.

Но ещё мы видим, как много места занимает L3. Итого единственный вариант получается, делаем кластер из 4х ядер, без L3 кеша, коммутируем меж собой L2 кеш и соединяем его с GMI (IF). И ставим 2 таких кластера.
Смекаете, что получается? Правильно малые ядра!

Но в обоих случаях, есть маленькая проблемка. Количество тепла на мм2.
Ибо основным источником тепла, является не кеш, а конвейер, который ещё и находится по краям кристалла.
Тепло нужно эффективно снимать и распределять. А кол-во тепла на мм2 у райзенов и так уже не маленькое.

Другими словами, под обычной теплораспределительной крышкой, такое сделать проблематично. Которая ещё служит монтажной поверхностью для СО.
Итого важны 2свойства.
1)Теплопроводность
2)Жёсткость

При том есть нюанс, не все решения имеют одинаковую теплопроводность по горизонтали и вертикали. От горизонтали зависит пятно нагрева, т.е распределение тепла по площади. От вертикали с какой скоростью мы передадим тепло на СО.
От жёсткости понятное дело зависит монтаж СО, т.е. сопряжение поверхностей.

В голове вертятся только испарительная камера, но хватит ли ей жёсткости?
Либо использование графена, для лучшего распределения тепла по площади крышки. И конечно лучше не делать её толстой.

Об этом упомянуто.

Вам уже в целом ответили. Кремний отлично проводит тепло. А ещё внутри кремния, мама родная, есть слои металла, в частности та же медь. Тем более, что с HBM отводили тепло. С райзенов с 3D кешем отводят тепло. А есть ещё 3D nand и да тоже без проблем.

Кстати, к кристаллу CPU, вы охлаждающий блок не прижимаете, сперва крышка!

По мимо того, что 3д компоновка позволяет отводить тепло. Так ещё и повышает масштабируемость! Плюсы же зависят от направления, куда будем развивать продукт.

Например если берём райзены. Можно будет переместить CCD на IOD. Т.е. по сути выступит интерпозером. И это будет чертовски быстрый и эффективный интерконект. Ибо короткий тракт, разведённый в кремнии.

И это только цветочки. Мы таким образом может разбивать SoC на блоки и отдельные элементы выносить на чиплет. Но в плоскости далеко не уедешь с коммутацией будут проблемы, да и пространство ограничено. Что и решает 3д компоновка.

А как показала практика чиплетный дизайн позволяет на повысить выход годных, что сказывается в лучшую сторону на ТТХ. Но и использовать разные тех. процессы.
Т.е. эффективность тоже подрастёт.

Хз откуда вы взяли данные для асуса. Но что мы имеем тут батарейку на 65Wh и TDP 28W.
Точно пол часа?
Открыв ютуб видим же, что мониторинг говорит о 82 минутах работы при заряде 87%, в CP2077.
При том, можно обратить внимание, что GPU задушен по частоте. Т.е. асус может нам дать побольше производительности.

«В этом АМД существенно уступает.»
Правильно, АМД сопоставима по размерам с нвидиа. Но играет на 2 направления, точнее уже 3. По приоритетам выходит примерно так CPU>GPU>FPGA.
Т.е. подразделение графики у АМД явно меньше, чем у Nvidia, следственно и возможностей у них меньше.
Вообще удивительно как они там справляются. Догонять лидера рынка, при меньших ресурсах, это не просто. Так что не столько АМД, сколько её инженеры заслуживают уважения.

>>Вот и получит самса низкий yield и прочие приколы =)
Собственно он потому и называется GAE и именно потому его заменит GAP
>>И не нужно рисковать с необкатанной технологией.
Как видим, на N2 они так же будут внедрять эту не обкатанную технологию. И вот мы возвращаемся к сложностям выше.
>>Не важно. У N3E...
Который не базовый N3, а улучшенный. Который появится только в этому году. И сравнивать его уместно уже с 3 GAP, т.к. модификации одного года.
«GAP will offer a power reduction of up to 50%, improve performance by 30%, and reduce the area by 35%.»
«In other words, compared to 3GAE, 3GAP should offer roughly up to 10% power reduction, 5.5% performance improvement, and 22% reduction in area.»
Маленький нюанс, уменьшение площади, не совсем увеличение плотности.
По сему опять цитата:
«Translating area reduction into transistor density, it works out to a roughly 1.2x density improvement for first-generation 3GAE which is then increased to 1.54x (still over 5nm) for 3GAP»
>>«чипы жирнее и стоить дешевле.»
жирнее? Скорее всего, но смотря какие параметры сравниваем. Дешевле очень вряд ли. Понимаете ли, выжать с FinFET последние соки тоже очень не просто. При том, что в N3 сделан большой шаг в сторону гибкости.

По сути самса должна смочь в т. п. с низким потреблением (LP).
MBCFET, как раз нужны для производительных (HP) т.п., но тут много я бы не ждал.
Отдельно вопрос стоит, а как там с памятью (SRAM ячейка).

«Это risk-production»
Уже mass production. risk был в середине 2022.
Всё оттуда же
https://fuse.wikichip.org/wp-content/uploads/2022/07/ss-roadmap-3gae-3gap-2gap-wc.png

«TSMC в прошлом году ещё запустила такой.»
Не запустила или не такой. У них FIN транзистор. Технически совершенно разные вещи. Следственно свои сложности и нюансы.

«Важно не то, какой там у них транзисторы «системы», а даёт ли это преимущества.»
Крайне ошибочное мнение. Это как раз очень важно. Ибо от этого зависят как преимущества, так и недостатки, о которых вы почему то решили забыть.

Написаны же преимущества
«3GAE can reduce power by up to 45%, improve performance by 23%, and reduce the area by 16%.»
Т.е. основной выигрыш самсунг получила в области энергоэффективности.
+ докучи MBCFET, что тоже GAA
https://fuse.wikichip.org/wp-content/uploads/2022/07/3gaa-dtco-wc.png

А тем временем Самса 3нм GAA с уже запустила по факту
https://fuse.wikichip.org/news/6932/samsung-3nm-gaafet-enters-risk-production-discusses-next-gen-improvements/
Он конечно Ранний но всё же. К концу данного года должны уже освоить 3 GAP.

Так что да, до 2025г у Самсунга фора. Не факт, что поможет.

«но Samsung считает, что сможет обойти конкурента.»
-Тут кстати нужен уточняющий вопрос. А в чём они собираются обойти конкурента?

Я в оружиее слаб, но раз управление дистанционное, можно забить канал шумами. Да и как там с защитой от ЭМИ?

А кто сказал что это номинал? По факту всего того что вы пишите нету. Есть безопасные значения и нет. Превышение которых чревато разрушением внутренней структуры.
Что выясняется ещё на фабрике при тестировании.
.
Тем более мы тут априори имеем иную конструкцию. У нас 3д кеш монтируется и запитывается с кристалла же. Так ещё и тепло передается на кеш. Т.е. структура априори более уязвимая.
Т.е. меньше запас прочности.
.
Да и в конце концов, качество будет разное. Я уж не говорю о том, что тут мы можем иметь дело с разными тех. процессами, в рамках одной ноды конечно.
Т.е. вольтаж lp и hp тех. процессов будет разный.