Автор не входит в состав редакции iXBT.com (подробнее »)
avatar
И что же записывается процессором «для внутренних нужд» в L1/L2, если НЕ данные приложений и ссылки на них? По ссылке говорится как раз таки о большом влиянии Л1/Л2 кэша на производительность приложений.
avatar
Ознакомлен. Ни одной фразы вида «Л1/Л2 кэш практически не оказывает влияния на приложения» по ссылочке нет. Собственный тезис-то раскрыть можно?
avatar
Увеличили вдвое Л2 кэш чтобы уменьшить размер ядра? Что? Мб мой вопрос неправильно был прочитан, перефразирую:
Если Л1/Л2 кэш «практически не оказывает влияния на приложения», зачем АМД в Зен4 удвоило его размер?
avatar
Все чуть сложнее чем объяснили выше.
AMD’s new chipset driver installs a new AMD 3D V-Cache Performance Optimizer Driver that can change the CPPC2 performance rankings of the cores based on system events like the power mode or keyboard focus. As noted, CPPC2 typically ranks cores by frequency, but the new chipset driver can dynamically change the core rankings to prefer the 3D V-Cache-equipped chiplet when Windows Game Mode or the Mixed Reality power mode becomes active.
The Xbox Game Bar contains a KGL (known good list) of games that it detects when active, thus triggering Game Mode (you can also instruct the game bar to recognize unknown games and/or other applications as games). The driver communicates with the Windows Game Mode feature, which becomes active when the Xbox Game Bar detects a game is running.
https://www.tomshardware.com/reviews/amd-ryzen-9-7950x3d-cpu-review
avatar
Хорошо, перепутал. Опять-таки отключённое, а не урезанное.
.
Пример есть, я его привёл выше. Вы думаете pufpuf/pafpaf это абстрактный конь в вакууме? У них десятки реальных соответствий, если не сотни.
.
Троя использует количественное преимущество. «Давайте добавим в программу кучу новых мелких ядер чтобы она работала быстрее». Качественному раскрытию (пресловутый IPC) этих ядер при этом гетерогенность мешает. Ядра и так немало времени простаивают в ожидании данных, а не вычислениями занимаются, и программистам/компиляторам трудно с этим бороться. В рамках гетерогенной архитектуры это ещё сложнее.
.
Поэтому остаётся только закидывать больше ядер. Это работает, но у такого подхода и минусы существенные.
avatar
В 5500 л3 кэш отключён, а не урезан. Это ещё не та экономия, о которой речь выше.
.
Особую оптимизацию объяснить нетрудно. На примере ниже — «Например в одной микроархитектуре инструкция pufpuf r32 выполняется за 1 такт, в другой за 5. В обеих микроархитектурах инструкции одинаковые, вот только производительность этих одинаковых инструкций разная».
.
При этом в обоих микроархитектурах может быть инструкция pafpaf r32, делающая тоже самое за 3 такта в обоих случаях. Понятно, что если у нас только микроархитектура-1, то нужно pufpuf r32, а если только микроархитектура-2, то pafpaf. А если сразу оба типа ядер, то что делать? Непонятно.
.
Поэтому под одну микроархитектуру оптимизировать проще.
.
P. S. Аргумент «никто не считает инструкции» неверен, так как под капотом в большинстве языков программирования будет то, что описано выше.
avatar
Во-первых если разница только в частотах то их лучше примут. Что по комментариям видно.
Во-вторых можно в первом поколении опробовать соединение разных чиплетов и планировщик под них, а через несколько лет в новом поколении начать делать чиплеты по 8 ядер Zen5 и 16 ядер Zen5c, например.
Последнее соображение дополнительно подтверждается тем, что Л3 кэш занимает много места, как раз можно будет сделать экономный дизайн.
.
Непосредственно от ужимания частот выигрыша немного, согласен. Но «на перспективу» клепания х2 ядер на той же площади — вполне себе.
.
И если (!) отличия будут только в частотах и кэше, то и оптимизировать под такую микроархитектуру будет реально. В отличие от принципиально разных Golden Cove/Gracemount. Тоже хорошо.
avatar
Если они не оказывают влияния, зачем их поменяли в Zen4?
avatar
Загуглил, таки добавили спустя полтора года с релиза альдеров. Хорошо.
avatar
Ещё раз — у Интела тоже не «different ISA», а «same ISA», набор инструкций одинаковый. Так что ты цитируешь ровно такую же маркетинговую фигню. Одинаковые инструкции ещё не означают одинаковой микроархитектуры.
.
Например в одной микроархитектуре инструкция pufpuf r32 выполняется за 1 такт, в другой за 5. В обеих микроархитектурах инструкции одинаковые, вот только производительность этих одинаковых инструкций разная.
.
Поэтому обещать одинаковую ISA мало. Вот пообещают same microarchitecture — тогда совсем другое дело.
avatar
Нужен. Арифметика нужна везде. 10 лет назад обычный AVX почти не использовали, сегодня он в каждой второй программе.
avatar
« Как следствие ядро, разработанное специально под условия низкого потребления, будет лучше.»
А его применение будет хуже. Оптимизировать под гомогенную архитектуру куда проще, что с лихвой может перекрыть данный недостаток. Если микроархитектуры действительно будут одинаковыми.
«Титанические продвижения Интел»
Какие? Выпустили одно проприетарное приложение на одну ОС?
avatar
У АМД есть и SSE и AVX вплоть до AVX512 что в серверном, что в десктопном (в отличие от Интела) сегменте. О чем конкретно речь? Intel Embree это просто библиотека по лучикам, таких полно. Вы ещё скажите что Интел будут пользоваться потому что у неё библиотеки с быстрой сортировкой (https://github.com/intel/x86-simd-sort) есть ))) Плохой пример.
avatar
Интел тоже хвастался что ISA одинаковые, софт/код/инструкции те же. У них это до сих пор в гайде по оптимизации висит:
« To simplify the programming model and provide flexibility, the following design decisions were made on the instruction set level:
● All core types have the same instruction set.
● AVX512 is disabled on P-cores and not available on E-cores.»
.
Вот только при одинаковой ISA микроархитектуры заметно отличаются. Разница отнюдь не только в частотах.
.
И ни одно обещание АМД пока одинаковых микроархитектур не гарантирует. Только одинаковый набор инструкций и расширений к ним. Это достижение и у Интела имеется. Слухи из темы о том что все будет на Зен4 обнадеживающие, но формулировки в официальных заявлениях «одинаковый код» скорее настораживающие.
avatar
На малых ядрах есть и AVX и AVX2. AVX512 нет, но его и на больших ядрах официально нет.
avatar
Для тихих переносов нет. Для громких рефрешей да.
avatar
Написано aero, значит весит как перышко.
avatar
Так ли он нужен, если потоков планируется все-равно больше чем у конкурента?
avatar
Последнее — не аргумент. Для много чего тоже изначально заявлялось о 7 нм. Потом 6 нм подтянули. Но скорее всего таки приберегут, да.
avatar
Раз выйдут преемники, то сразу устареют, да. Придется выбрасывать.