Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики.
Продолжая посещать сайты проектов вы соглашаетесь с нашей
Политикой в отношении файлов cookie
SpaceMareen
Новичок
SpaceMareen
Рейтинг
+284.90
Автор не входит в состав редакции iXBT.com (подробнее »)
Вот поломки позднее первого месяца это уже релевантные и печалящие случаи.
.
«The support for the new AVX512 instructions is quite good, and it includes many of the extra subsets of AVX512. Here, I have to correct a common misunderstanding. The Zen 4 does not execute a 512-bit vector instruction by using a 256-bit execution unit twice, but by using two 256-bit units simultaneously. It does not split a 512-bit instruction into two 256-bit micro-operations, like the Zen 1 that splits 256-bit instructions into two 128-bit micro-operations. The Zen 4 has four 256-bit execution units. Two of these units can do floating point addition, and the other two can do floating point multiplication. All four can do integer vector addition etc. This gives a maximum throughput for 512-bit vectors of one floating point vector multiplication and one floating point vector addition, or two integer vector additions, per clock cycle. This throughput is doubled for vectors of 256 bits or less. It is still advantageous to use 512-bit instructions if the throughput is limited by instruction decoding or micro-operation queues or code cache or something else. It is rare that execution unit throughput is the bottleneck.
.
The only downside of using AVX512 is the compare instructions. The AVX512 instruction set is storing the result of a vector compare instruction in a special mask register, where earlier instruction sets use a normal vector register. The compare instructions with mask register results have longer latencies than the legacy SSE and AVX compare instructions. On the other hand, you can use a mask register to select or disable individual elements of a vector at zero cost.»
.
https://www.agner.org/forum/viewtopic.php?f=1&t=87&sid=2de04688179fb772953f7f9d944bfcc3
У Факторио и Старкрафта есть встроенные бенчмарки, пускай научатся показывать их. С Тотал Варом кое-как научились же.
.
На самом деле разница все-таки есть, не стоит так радикально говорить что «неважно какой проц». В одном случае играется поздняя стадия, до которой люди доигрывают, во втором случае ультрапоздняя, до которой обычно не доигрывает никто. Хотя соседние поколения на разных платформах ради этого апгрейдить бессмысленно, конечно.
Всем лень, но не всем доступна роскошь лени.
>это ОС и должна делать, а не кто во что гораздо лепить многопоточность
Зачем тут противопоставление? От того кто кто-то «налепил» многопоточность ОС хуже раскидывать потоки по ядрам не станет
Во-вторых 60 кукурузных ядер на частоте 1 ГГц с х86 архитектурой трудно назвать GPU, поэтому Интел в итоге и переименовали их в CPU Xeon Phi.
Во-третьих Xeon Phi/Knights Landing не был закрыт чисто из-за конкуренции со стороны ГПУ АМД/Нвидии. Просто Интел научился добавлять расширения AVX-512 в другие серверные процессоры с некукурузными ядрами, которые могли делать что угодно.
1. 7900х это HEDT, на другом сокете, не как настольные Skylake. Причем это именно огрызок серверов в хай энд десктоп под видом топа. У них немного разные ISA с обычным десктопом. У AMD в Эпиках и Рязанях до сих пор была строго одинаковая, о чем речь в комментарии выше.
2. Cooper Lake является примером чисто серверной микроархитектуры без аналогов в десктопе и HEDT. Такой пример получше.
.
Открываем статистику Steam. Жмём Other settings.
https://store.steampowered.com/hwsurvey
SSE2 100%, SSE 4.2 99%, AVX 95%, AVX2 89%, AVX-512 9%.
.
Вопрос — какой игровой разработчик будет работать на 9% рынка? AVX/AVX2 не первый год занимают 90-95%, но использующие их игры стали выходить только в последнее время, и далеко не все. Поэтому в играх очень нескоро.
.
Я бы сказал что главная проблема в том что AVX/AVX2 не используют толком. Обычно просто флагом к компилятору, но компилятор не всемогущ, ручками чаще быстрее. Но дольше и дороже.
https://youtu.be/yQ-c6SmVuDY