Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики.
Продолжая посещать сайты проектов вы соглашаетесь с нашей
Политикой в отношении файлов cookie
SpaceMareen
Новичок
SpaceMareen
Рейтинг
+286.40
Автор не входит в состав редакции iXBT.com (подробнее »)
То есть планировщик.
.
А вот здесь не согласен. С декодером много проблем именно потому, что вариативную длину команд декодировать трудно. Кэши микроопераций не от хорошей жизни добавляют. Упор в скорость декодирования команд себя проявляет чаще, чем в исполнительные блоки, на тех же Зен процессорах так точно.
.
Вот есть кэш микроопераций на 2048 операций. Полностью забили его, положим. Выполняется 5 инструкций в секунду, а декодируется всего 3. Значит через 1024 тактов производительность процессора упадёт на 40%. Беда.
https://youtu.be/7K8XRHnaMRI?t=1200s
https://stackoverflow.com/questions/77712908/why-performance-for-this-index-of-max-function-over-many-arrays-of-256-bytes-is
https://github.com/GameTechDev/HybridDetect
.
Опять же практика — ноутбуки на интел арках сделали, бесплатно выбрасывать не хочется, продадим хотя бы по себестоимости. Примеры можно подобрать разные. Естественно делать так постоянно не хочется, но иногда приходится, потому что спрос-предложение работает именно так.
.
Если вещи связаны, это не значит что все теплое мягкое и что все мягкое теплое.
.
https://github.com/intel/llvm/blob/sycl/sycl/doc/GetStartedGuide.md
Getting Started with oneAPI DPC++
The DPC++ Compiler compiles C++ and SYCL* source files with code for both CPU and a wide range of compute accelerators such as GPU and FPGA.
Table of contents
Prerequisites
Create DPC++ workspace
Build DPC++ toolchain
Build DPC++ toolchain with libc++ library
Build DPC++ toolchain with support for NVIDIA CUDA
Build DPC++ toolchain with support for HIP AMD
Build DPC++ toolchain with support for HIP NVIDIA
Build DPC++ toolchain with support for ESIMD CPU Emulation
Build DPC++ toolchain with support for runtime kernel fusion
Build DPC++ toolchain with a custom Unified Runtime
.
Вот вроде бы сделали интерфейс через который можно под любое целевое оборудование программировать, хоть процессоры, хоть видеокарты, просто выбираешь нужный ускоритель. Круто. Но всю эту байду нужно пересобрать с нуля. Хочешь АМД — иди build toolchain with support for HIP AMD. Хочешь Невидию — for HIP NVIDIA либо CUDA NVIDIA. А без пересборки сделать нельзя =( Спасибо хоть не с нуля писать заставляют, всего лишь пересобрать компилятор
.
И получается что в наличии не швейцарский нож, а карточный набор, который нужно разложить так чтобы на нем сошлись звёзды. Вещь все ещё классная, конечно, но много-много можно было бы улучшить.