Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики.
Продолжая посещать сайты проектов вы соглашаетесь с нашей
Политикой в отношении файлов cookie
SpaceMareen
Новичок
SpaceMareen
Рейтинг
+286.30
Автор не входит в состав редакции iXBT.com (подробнее »)
.
Это все чистая правда — но не значит, что в Zen4 плохая имплементация AVX-512. Наоборот можно сказать что АМД нашли способ улучшить производительность АВХ2 параллельно добавлению АВХ-512.
.
Например у Интела в IceLake либо 2 целочисленных 512-битных сложения, либо 3 256-битных. У АМД в Zen4 либо 2 целочисленных 512-битных сложения, либо 4 256-битных. Это не АВХ-512 хуже, это АВХ-2 лучше.
.
« The Zen 4 is the first AMD processor to support the AVX512 instruction set with 512-bit vector registers. The maximum throughput for 512-bit vector instructions is one floating point vector addition and one floating point vector multiplication per clock cycle, or two integer vector instructions per clock cycle. This throughput is doubled for vectors of 256 bits or less.»
.
« There are three ports that can handle integer vector arithmetic and logic operations, port 0, 1, and 5. Port 0 and 1 have 256 bit width, while port 5 has 512 bit width. A 512 bit vector operation can use either port 5 or port 0 and 1 combined. For example, integer vector addition with a vector size of up to 256 bits has a throughput of three instructions per clock cycle, while addition of 512 bit vectors has a throughput of two instructions per clock cycle because port 0 and 1 need to be combined to make a 512-bit operation.
Only port 0 and 1 can handle floating point vector operations. Both have 256 bit width. The throughput is two floating point operations per clock cycle with scalars and vectors of 128 or 256 bits, while the throughput is one floating point vector operation per clock cycle with 512 bit vectors, using port 0 and 1 combined»
https://www.caranddriver.com/news/a29428694/electric-car-owners-power-shutdown-california/
То ли ещё будет.