Автор не входит в состав редакции iXBT.com (подробнее »)
avatar
Ну тк с тех процессами пока ещё есть куда расти, как минимум в кремнии, можно совершить переход на GAAFET транзистор.
Можно применить иную компоновку, например 3D.
Можно и нужно менять материалы в составе транзисторов.
А позже можно и вообще возможно уйдёт от кремния, к более прогрессивному материалу.
Но думаю того что есть, хватит нам какое то время.
И тем не менее, сейчас интел и амд используют не максимальную плотность тех процессов, в угоду производительности.
Да и радикальное улучшение, в моём понимание это революционные улучшение, как при переходе на ядро зен. Когда улучшения ядра зен, на зен2, зен3 и т.д. Это эволюционные улучшения и назвать их радикальными я не могу. И вот, что имелось в виду, лично я хызы.
avatar
«Зачем», что бы не извергать из себя бред? И смысл говорить о том, что ещё не придумано априори? Это уже фантазёрство. Да и risc (старее чем дети школьного возраста). Конечно, если не смотреть на подробности, как это делаете вы.
Да и хотя бы затем, что в настольном сегменте, х86 с нами ещё пробудет, некоторое время, какое не знаю. И за это время, не появится вдруг новая архитектура и вдруг не займёт нишу х86 процессоров.
avatar
Дело в том, что ощутимая часть инструкций унаследованных х86 по сути нужны только для обратной совместимости с устаревшим софтом, поэтому именно для этого багажа можно было бы и перейти на эмуляцию.
Ну вот и что с того? Это в принципе почти роли то и не играет.
Вы бы лучше рассмотрели саму микроархитектуру, где какждый производитель, на основе выборки и статистики оптимизирует набор исполнительных блоков, из чего и получается рост инструкций за такт. И если правильно помню, сохранение устаревших инструкций, по сути влияет не столько на производительность, сколько усложняет проектирование, по моему, декодера (но тут уж извиняйте подзабыл). И кстати вот вам условные схемы микроархитектур интела и амд, вроде zen2 и ice lake.

avatar
Так между интел и амд кросс лицензия и все инструкции на х86 соответственно унифицированы и достаточно часто их разрабатывает интел. И только сами производители выбирают, что им реализовывать, в рамках микроархитектуры. Те же AVX инструкции одинаковые, только вот амд решила, не реализовывать, в настольном сегменте по крайней мере avx-512 и не тратить на этот блок транзисторный бюджет, а решили обойтись обычным avx-2 блоком.
avatar
Ну так, область применения Cerebras, иная.
И в данной области, можно вообще использовать полностью заказные решения.
Как те же суперкомпьютеры. Да и проблемы у них иные, там производительность упирается, не столько в производительность ядер, как в шину данных, которыми связаны компоненты системы.
А если вам вдруг понадобилось больше чем 16 ядер, то привет hedt платформа, те же тредриперы. Так к тому же, там и периферии воткнуть можно больше, и каналов памяти больше.
А в домашних системах пока и так хорошо, учитывая то, что 4 года назад, на обычной десктопной платформе, было всего 4/8 в лице 7700к.
Т.е. удвоение ядер, уже произошло дважды.
Ну конечно окей были местами 8/8 фх, или 6 ядерные фены.
Но о них я умолчу ибо они были плохи в производительности на ядро и вышли слишком рано или урезанные, что бы они могли нормально конкурировать с корками в плане производительности. (про цену молчу, не о том речь)
avatar
Так я и не отрицаю, я безграмотный и никогда любовью к языкам не отличался. А вот проецировать мои черты как личности, на любых других людей, уже с вашей стороны глупо.
Ибо в принципе стоит понимать, что у людей в принципе разные способности. Конечно, мои плохие познания, в русском языке, чести мне не делают. Т.е. очевидно плохо. И тем не менее, лично мне, это не мешает излагать мысли. Да и в принципе, это комментарии, которые не вызывают у меня желания приводить мысль в порядок и излагать её более доступно. Ибо это как минимум требует времени, для вычитки материала, который я написал.
И уж тем более, что тут местами авторы статей косячат.
Так что приношу свои извинения, это всё, что я могу сделать в данной ситуации.
avatar
Оно конечно справедливо, но в ведьмак я тоже иград на харде и было поприятней.
Тут в целом само по себе не сложно, в том плане, что патернов атаки мало.
Но вот проблемы появились тогда, когда я почему то перестал уметь в контратаки совсем, а когда начинается комба ты её не можешь сбить.
И вот сейчас у меня 3 по счёту бой и оппоненту я с удара сношу 1% хп, выносливости хватает порядка 2-3, по моему сильной атакой. А проигрываю с 2 ударов. Отсюда и сложность, нужно долбить это чучело 5-10-20 минут, не подставляясь.
Ах да из неприятного, когда нпс начал комбо(или удар точно не помню), он ещё может попасть в твой хитбокс примерно с метра, когда визуально ты отошёл и он не попадает, а вот полученный урон говорит об обратном. Т.е. деш не спасает.
Конечно было бы лучше в плане урона, прокачай я ветку рукопашки, но вот ради сайд квеста, прям хызы насколько это надо.
avatar
Так всем очевидно, что будет новый сокет, и смена обоснована переходом на DDR5.
Ам4 и так поддерживает 5 поколений камней, 4 из которых с ядром zen и одно с ядром Bristol Ridge.
А то что вы пишете дальше, вопрос зачем? Вы хоть понимаете, что транслятор, который интерпретирует те же х86 инструкции в понятные М1 риск инструкции к самому риску не имеет никакого отношения! И кстати трансляция одних инструкций в другие ведёт к потере производительности.
А может вы ещё не знаете строение х86 ядра и думаете, что это классический Cisc?

Ответ tetriz на комментарий
А вот если они пойдут по пути унификации блоков, с относительно эффективной эмуляцией всего этого придуманного зоопарка инструкций для обратной совместимости

Такого априори быть не может, ибо как вы сказали унифицированый блок всегда будет проигрывать в производительности/потреблению/размерам, обычному специальному блоку определённой архитектуры, при исполнении команд данной архитектуры. Да и в целом есть те же FPGA решения если вам очень надо, тут хоть risc, cisc, vliw что запрограммируешь, то и будет.
Единственный вопрос к х86, это вопрос новых инструкций.
avatar
На одном кристалле все ядра конечно хорошо, но очень сложно и дорого делать такой единый кристалл.
Так об этом я и пишу всю ветку.
Сейчас чиплет на 8 ядер, будет целесообразность сделают и на 12 и на 16.
Сделают когда темпы роста IPC замедлятся и когда захотят в тех же серверах кол-во ядер поднять, за счёт более тонких тех процессов.
Многокамневое решение не дорого для чипа, но дорого для материнки с огромными задержками при взаимодействии камней.
Ну не такие уж и большие, где то 75нс, при внутренних задерках порядка 25нс. Зато можно масштабировать сколько угодно. В отличии от той же кольцевой шины или её склейки. И тут прикол в том, что если 1 CCX потребуются данные из других CCX это будет всё те же 75 нс и не важно 5 или 10. Когда та же кольцевая шина имеет предел по кол-ву ядер, с которыми она работает эффективно.
И тут очевидно, снижение паразитных задержек между чиплетами скажется благоприятно, для всех продуктов амд, кроме тех где всего 1 CCD. А учитывая то, что они хотят внедрить тот же дизайн и в гпу, то это максимально верное решение.
И опять же лично я не вижу смысла наращивать кол-во ядер в потребительском сегменте, тех же 16 ядер сейчас хватает с большим запасом.
.
Опять же рано или поздно они увеличат кол-во ядер в CCX, что бы показать миру эту инновацию и выгодно её продать.
А сейчас это выстрел себе же в колено ибо сломают свою же сегментацию рынка.
avatar
Я в плане живучести персонажа на харде про ведьмак говорил. Там ты хоть худо бедно пару плюх переживаешь, хорошие доспехи спасают+ парирование. Или использовать знаки.
А тут же при высоком арморе толку ровным счётом 0, что качай техническую ветку, что нет. Это максимально фигово для геймплея. Ибо условный снайпер так и вообще может ваншотнуть. Из за чего прохождение где ты получаешь урон, в принципе катится в помойку. А это например всё милишное урожие. И остаётся варик тупо из скрытности ваншотать в голову. Либо из скрытности тупо взламывать противника. Вот это вариативность прокачки.
А так простая драка, где противники слабей перса на пару лвлов, с получением урона выглядит примерно так, получил урон спрятался, прожал хил, выстрелил.
Тот же деш как по мне очень слабый у персонажа, хз можно ли его прокачать. Ну типо дважды тапнуть клавишу, ради деша в 1 метр прямо скажем хрень. Когда можно тупо не высовываться. Та же милишка в простых драках возможно либо с малыми группами, либо только с клинками богомола из за напрыга, иначе ты труп. Т.е. те жи ножи, мачете, катаны очень слабы, ибо вариация где ты можешь танковать благодаря прокачке и хорошего армора, нету. Из за чего так же слабо актуально автоматическое оружие. Ибо зачем если можно взять револьвер, одеть глушитель, и косить врагов, а они даже не понимают, что происходит. Или можно взломать камеру и тупо закидывать врагов пока те не умрут и опять же нет у них опций, что сделать.
Если тебе не нужно убивать одевая миротворец и ли мод для оптики и всё враги вместо смерти нокаутируются, а урон плюс минус тот же.
Насчёт дробовиков хызы, не играл с ними особо. Те же энергетические рейлганы, тоже не особо прочувствовал.
Транспорт мне лично не очень понравился, не прочувствовал нормальное управление, транспорт в игре плюс минус одинаковый, только с разными скинами.
Так же не по кайфу особо кулачные драки, да у меня не прокачена ветка для них, но тем не менее конкретно раздражает то, что те же комбо атаки не сбиваются и я всё так же отлетаю за одну комбу. Ах да в 1.03 у меня контратаки получались, в 1.06 перестали. Т.е. опять же максимально тупо и без вариативно. Тот же кулачный бой в ведьмаке получше обставлен будет.
Сейчас прохожу в основном разбросанные сайд квесты, эх если б ещё реджина не вбаговалась. И некоторые из них уникальные. В целом окей неплохо, местами хорошо.
Но в целом как рпг составляющей мне не хватает грёбаных разветвлённых диалогов, ветвление в игре очень слабое. Вспоминаю те же фолычи вплоть до 4 части.
Так же можно добавить, что не хватает кастомизации/модификации транспорта, да и модификация снаряги крайне скудная и унылая, как пример тот же 4 фалаут, где можно система модификаций была весьма разнообразной.
avatar
Вот я бы не сказал, «знают что делают»
Ибо механики местами кривые. Точнее нелогичные.
Возьмём систему прокачки, той же выносливости, это чистой воды др*ч*льня. Ибо прогрессия по опыту слишком жёсткая, когда прокачка сама по себе крайне медленная.
Из такого есть например максимально фекальный навык в скрытности, которые позволяет метать ножи. И ладно бы в игре были б метательные ножи, а так ты берёшь снаряжаешь в слот оружия нож для ближнего боя и кидаешь его. Всё нет ножа и что бы использовать навык второй раз, одень новый нож)
Ну а механика крафта сама по себе немного унылая, так к тому же не удобно разбирать кучи предметов в инвентаре, а уж умнику который придумал, для крафта удерживать кнопку мыши руки бы и вовсе оторвал. Почему нельзя было сделать так, что бы можно было закрафтить кучу предметов разом? А ведь есть специальный перк для перекрафта низкотировых компонентов, в более высокий тир и вот сиди по 1 штучке крафти. А учитывая сколько времени надо для прокачки хай левелов, привет тупой и долгий перекрафт.
А вот тут мб я как то не так играю, но имея примерно с кило брони, ложусь на 2 выстрела всю игру, на хай сложности, офк от врагов моего уровня. И единственный возможный геймплей это не получать урона вообще. В том же ведьмаке с этим было получше.
Так что весьма спорное суждение.
avatar
Ага, только вот есть проблемы. Что 108мп это говно. И норм фото будет только при биннинге 4х пикселей, а в тёмное время суток 9 пикселей.
Ибо тот же ISOCELL Bright HMX, имел размеры пикселя всего 0,8мкм. Когда при бининге 2х2 и 3х3, уже 1,6мкм и 2,4мкм.
Но вот физику не обманешь TetraCell/Nonacell имеют недостатки в виде склонности к графическим дефектам. Если конкретнее, т.к. физически пиксели меньше, то они больше подвержены влиянию взаимных шумов и засветки. Из за чего страдает детализация, не говоря о том, что склейка пикселей требует более сложных алгоритмов, а значит и больше вычислительной мощности.
К сравнению приведу тот же 50мп imx 700, с RYYB фильтром и Quad Bayer, та же склейка 2х2.
Вот только он изначально имеет размер пикселя 1,22мкм, что на 50% больше. Так ещё и при биннинге имеет размер 2,44мкм.
Что всё так же позволяет снимать в 8к, но при этом за счёт того, что матрица больше и фильтр RYYB, камера лучше будет снимать в темноте.
А при дневной съёмке будет куда меньше дефектов.
avatar
Ага только вот IOD чиплет сам по себе фигово масштабируется.
Второе именно в этом чиплете находится КП, IF для связи с чиплетами и все внешние линии, типа PCIe, usb.
И освобождение места на подложке не решает проблему, удорожания чиплетов с ядрами. Так же как и не решает проблему отвода тепла, если добавить ещё один мелкий чиплет.
Не говоря уже о том, что использовать 5нм для чиплета ввода вывода, безумно дорого. Если можно использовать 10-8-7нм.
И получится что? Если как вы пишете «без увеличения с ссх или ссд ядер.»
То вы каким образом придумали отводить от данных чиплетов тепло?
И так щас площадь ядер жутко маленькая на 7нм, 84мм2. А ведь амд используют, базовый N7, в лучшем случае N7P.
Когда N5, существенно увеличит плотность. Ибо он на 81% плотнее(для hd).
И даже при увеличении транзисторного бюджета, на разработку микроархитектуры, площадь может уменьшится. Из за чего мы получим увеличение теплового потока. И если добавить ещё 1-2 чиплета на подложку, вы чем это будете охлаждать? Кастом водой? Азотом?
Ну или вы задушите все ядра по потреблению в хлам?
А главное на кой оно надо? Когда для таких решений есть threadripper'ы.
avatar
5900 лучший только из за биннинга чипов из за чего на 1 ядро чуть выше буст. А в целом посмотрите тесты, в реале 5800 будет даже пошустрее! Хотя разница крайней мала. А шустрее, просто потому, что не нужно обращаться ко второму CCD.
И л3 костыль не для ддр4, а для чиплетного дизайна, дабы на 1 CCD хранить больше информации и что бы как можно реже гонять данные по шине. И поверьте чиплеты у амд не уйдут.
А насчёт гетерогенных процессоров интел я бы вообще так сильно не парился, они не могут составить конкуренцию тем же 32 потокам амд. Дай бог они смогут тягаться с 24 потоками.
А дело в чём, малые ядра проще, ну оно и понятно, они энергоэффективные
image

image

И пока не ясно, как их будут соединять меж собой, кольцевая шина тоже не резиновая.
А насчёт задержек меж CCD вы не совсем правы, ибо ещё с зен+ напрашивалось объединение 4 ядерные CCX в 8, но произошло это только в зен3.
И тут единственный вариант работать с шиной, контроллером и разводкой.
Ибо сейчас всё работает через IOD. И потенциальная замен данного чиплета и увеличение частоты работы IF может сказаться положительно, или расширение самой шины. Но тем не менее паразитные задержки будут от них никуда не деться, всё же физически кристаллы далековато друг от друга.
Так что кеша меньше не станет.
И вы забыли, что увеличение IPC так же зачастую требует увеличение кол-во регистров и кешей.
avatar
Раздувать 1 CCX до 12 ядер
это дорого
не решает проблему замедления кеша, ибо 48 метров L3 будут медленней нынешних 32.
Скорость кеша итак уже пострадала когда 2 CCX объединили в один, но в целом в зен 3 пересмотрели саму работу с кешем, ну и конечно межъядерные задержки меж 8 ядрами снизились. Но сам кеш на физическом уровне стал медленнее.
the new Zen3 cache at 4MB depth here measured in at 10.127ns on the 5950X, compared to 9.237ns on the 3950X. Translating this into cycles corresponds to a regression from 42.9 cycles to 51.1 cycles on average, or basically +8 cycles. AMD’s official figures here are 39 cycles and 46 cycles for Zen2 and Zen3, a +7-cycle regression – in line with what we measure, accounting for TLB effects.
Latencies past 8MB still go up even though the L3 is 32MB deep, and that’s simply because it exceeds the L2 TLB capacity of 2K pages with a 4K page size.
По этому впихнуть ещё 4 ядра, плохая затея, ибо приведёт к увеличению размера кристалла, что не очень выгодно амд.
Для того, что бы 1 CCX стал 12 ядерным, нужно в очередной раз переработать иерархию кеша, возможно переработать межъядерную шину, а теперь вопрос зачем это амд сейчас?
.
Им и так нужно переработать кп под ддр5, нужно оптимизировать конвейер(ядро) дабы прибавить ещё IPC, по хорошему нужно доработать IF и IOD чиплет в целом. И в частности нужно уменьшить паразитные задержки между CCD, дабы повысить ту же производительность.
И ведь в целом в интересах амд развивать чиплетный дизайн и производительность ядер. А не увеличивать их кол-во ибо в настольном сегменте 16 ядер сейчас это прям с избытком. Для остального есть уже hedt и сервера.
Так тем более, конкурентов данным решениям нет.
Наращивание ядер будет скорее позже, когда это как минимум будет необходимо индустрии, когда это будет экономически целесообразно для амд.
Конечно всегда есть контраргумент в виде того, что у амд кристаллы унифицированы. И что бы нарастить кол-во ядер нужно раздувать CCX или снова размещать несколько CCX в одном CCD.
Но я реально не думаю, что в zen4 будут наращивать, мб в zen5-6.
Когда 5нм обкатают или вообще на более плотный тех процесс перейдут.
Да и нужно чем то удивлять, да бы поднимать продажи.
avatar
Да, простите, всё верно, SRAM ячеек. Тогда уж дополню, у N5 TSMC SRam ячейка уменьшится всего на 22% (для hd) по сравнению с N7, от 0.027 µm² к 0.021 µm².
Когда та же плотность скакнула куда сильней от N7+ 114 MTr/mm² к N5 171 MTr/mm² (для того же hd) т.е. + 50% к плотности.
.
Так и смысл обычному потребители от 24-32 ядер в десктопах? Сейчас был скачёк относительно безболезненный, за счёт чиплетного дизайна. Т.е. за счёт нескольких CCX и\или CCD.
А теперь представьте если ещё раздуть CCX допустим до тех же 16 ядер. Прирост однако будет не линейным. Т.е. пострадает производительность каждого ядра.
Добавить ещё один кристал CCD тоже не вариант, ибо что бы такое сделать, нужно место на подложке, а для этого нужно уменьшить размер каждого CCD или увеличить подложку. Но в любом случае, для обычного десктопа это вылезет проблемой с охлаждением, уже сейчас два CCD то сложно охладить. Это вам не hedt платформа всё же.
avatar
Скажем так наращивание кол-ва ядер, немного затруднительно.
Начнём с основного проблем проектирования.
И смысл тут какой, что бы увеличить тот же IPC зачастую нужно трогать кеш и регистры.
Что бы увеличить кол-во ядер нужно так же пересматривать работу кеша, в частности L3. И чем больше ядер имею доступ к L3 кешу тем он медленней, речь идёт про один CCX, и это очень плохо, ведь в таких условиях производительность каждого ядра будет снижена из за нехватки данных, но в целом это можно компенсировать. Можно будет увеличить L1 и L2 кеши, переработать шину данных.
Но вот следующая проблема тоже накладывает ограничения. И суть такова, что dram ячейка хуже сжимается при переходе на более тонкий тех процесс, из за чего сложнее увеличивать кол-во кеша, за счёт более тонкого тех процесса. А как известно большую часть cpu занимает именно кеш, а не сами ядра.
К тому же более тонкие тех процессы, тоже имеют ряд проблем. Та же TSMC в первую очередь ориентирована на клиентов мобильного рынка из за чего, в первую очередь у них отрабатывается lp тех процесс, а максимальная плотность пишется для hd тех процесса. И данные тех процессы не лучший вариант для настольных компьютеров.
Ибо в настольном сегменте важна производительность, в частности частоты, которая зависит от скорость срабатывания транзистора так и от низких токов утечек, которые позволяют поднимать выше напряжение, ради увеличения частоты, при том не вызывая излишний нагрев. Ибо чем выше токи утечек тем выше нагрев.
Но сама проблема заключается в том, что чем меньше транзистор тем выше туннелирование и выше сопротивление, что плохо. Конечно с этим инженеры борются, но всё же. По этому зачастую, в hp Тех процессе плотность ниже.
Так же при смене тех процесса на более тонкий может уменьшится площадь кристалла, что приведёт к уменьшении площади отвода тепла, что приводит к усложнению отвода тепла при том же или даже меньшем потреблении, яркий пример переход на чиплетный дизайн.
Так что в общем и целом очередное удвоение ядер, я думаю, сейчас будет хуже, чем наращивание производительности одного ядра. И уж тем более большинство софт нужно адаптировать, под увеличившееся кол-во ядер. Нет конечно можно выпустить говнософт, который будет уметь в большое кол-во ядер, но толку будет мало, если софт будет просто потреблять больше ресурсов в тех же условиях. Ибо индустрия движется к тому, что нанимают более дешёвых программистов, тех же индусов, которые пишут говнокод, а компенсируется это с другой стороны IT индустрии, за счёт растущей производительности железа.
avatar
Нет конечно разгон в ноутбуках, это полная бредятина.
Но вот тонкая настройка как на десктопах, это будет вполне себе приемлемо. Если конечно вендоры запилят норм поддержку. А то вроде как есть такое, что в ноутах настройки биос сильно порезаны или скрыты.
И вот интересно, а озу они тоже дадут возможность разгонять?
P.s. если не прав поясните.
avatar
ядра zen3 делят теплопакет с встроенной графикой vega8.
Отсюда и могла пострадать производительность в один поток, ибо при однопоточной производительности теплопакет распределяется в пользу одного ядра.
Отсюда и важны условия тестирования. А иначе данные цифры весьма условны.
avatar
Ну это пока ещё спорный момент, этот apu ещё не вышел.
И вполне возможно ему придётся конкурировать с рокет лейками, и будет резонно сравнивать графику данных apu. И тут уже не факт, что старая вега, которую, возможно, не трогали в этом поколении будет лучше.