Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики.
Продолжая посещать сайты проектов вы соглашаетесь с нашей
Политикой в отношении файлов cookie
SpaceMareen
Новичок
SpaceMareen
Рейтинг
+286.50
Автор не входит в состав редакции iXBT.com (подробнее »)
https://www.extremetech.com/computing/intel-18a-cpus-on-target-for-2025-launch-ceo-confirms
Это не тех процесс задерживается, это лунышки торопятся.
.
Смотрим, какой командой они меряют
MINGW64 ~/Documents/tmp/avx-turbo (master)
$ grep -R «512_xor_zero»
asm-methods.asm:test_func avx512_xor_zero, {}, {vpxord zmm0, zmm0, zmm0}
avx-turbo.cpp: x(avx512_xor_zero, «512-bit zeroing xord», AVX512F) \
MINGW64 ~/Documents/tmp/avx-turbo (master)
$ grep -R «256_xor_zero»
asm-methods.asm:test_func avx256_xor_zero, {}, {vpxor ymm0, ymm0, ymm0}
avx-turbo.cpp: x(avx256_xor_zero, «256-bit zeroing xor», AVX2 ) \
.
Открываем uops.info/table.html, вбиваем этим команды
.
Микроархитектура/AVX2/AVX512 пропускная способность, данные с uops info, measured
Tiger Lake / 0.33 / 0.5
Sunny Cove / 0.33 / 0.5
Zen 4 / 0.25 / 0.5
.
Для этих команд в принципе не должно быть одинаковых мопсов, разница в пропускной способности кратная. Интересно, где собака зарыта.
.
В любом случае ответ не в частоте. Разница в частоте в любом случае пренебрежительно мала, если мы говорим об AVX-тяжелом коде. Вы потеряете максимум 10% от частот в турбо, этим 70% разницу не объяснить
.
При двукратной разнице между исполнением AVX2 и AVX512 в чистой арифметике может быть разница в пользу АВХ512, если:
1) Был упор в декодер микроопераций, т.к. 1 512 бит сложение занимает одну микрооперацию, а у АВХ2 уйдёт две
2) У АВХ512 лучше условные операции за счёт масок