Комментарии / Публикации SpaceMareen / iXBT Live

Как показали тесты 128 бит не проблема. Проблема что ядер в 4060ti меньше чем в 3060ti.

7945HX уже выпустили, базовый TDP 55W, бустятся в зависимости от ноута до 80-120W в CPU-only нагрузках.

Потому что кристаллы ГП огромные, в отличие от. 4090 — 600 мм^2, 450W TDP, 0.75 ватт на 1 мм. 13900k — 250 мм^2, 253W PL2, 1 ватт на 1 мм. Если 13900к до 0.75 ватт снизить (до 185 ватт), то ситуация выровняется.

Интел уже влез.

5% это типичный рефреш

del

SIMD инструкции и на Интел и на АМД есть. Джава скомпилирует SIMD код, он и на Интел и на АМД будет шустрым. Intel oneAPI, опять-таки, хорошо работает и на Интел, и на АМД-железе.

Вопрос был о 100к потоков на Х10/Джаве, ответ о краш-текстах в какой то там программе. Ладно, так и быть посмотрим.
.
« задача на 120 ядрах AMD EPYC считается несколько дольше, чем на 88 ядрах Intel Skylake. »
.
Считается несколько дольше. Уже не «намного». Как интересно.
.
Хорошо, объясняю. Xeon в 2020 году обладали AVX-512, причём с двумя FMA модулями, а Zen2 AVX-512 не поддерживало. Для физических симуляций это очень важно. Поэтому в физических симуляциях Интел имел некоторое преимущество. И все. Нет никакой особой магии оптимизации под Интел.

Так это Джава или Х10? Что значит «намного медленнее»? Это сколько? Кто «мы», по какой ссылке можно ознакомиться?

Скинь пример любого кода который на любом процессоре Интел запустится в десятки раз быстрее чем на аналогичном процессоре АМД. Спойлер: таких примеров нет.

Просто NUC оставить было нельзя? Обязательно сделать его ASUS ROG TUF Phoenix Dual NUC Extreme OC?

Заточенность под конкретную микроархитектуру даже в крайних случаях не перекрывает х1.5 разницы в абсолютной производительности.

Великий язык, созданный в 2004 году и за 19 лет набравший аж 30 репозиториев на Гитхабе. Для сравнения у упомянутой Java 3.8 миллиона.

> клиентам важна беспроблемность, то есть совместимость с софтом
Полный бред, весь софт который запустятся на Сапфире запустится и на Эпике, у них одинаковая ISA и расширения.
.
Проблемы могут быть только с ошибками работы процев, только это не софт, а именно что хард. Вот только по этой части проблемы изредка бывают у обеих компаний.

Для нейронок есть тесты.
https://www.tomshardware.com/news/stable-diffusion-gpu-benchmarks

4060 это обычный ноутбучный середняк. Середняки всегда были слабее хх80/хх90.

Вполне игровой.

Не зря, у Интела речь именно о приоритете, а не о привязке ядер. SetThreadPriority, THREAD_PRIORITY_NORMAL. В той же таблице.
.
Хорошо, допустим Интел как-то печатает какие ядра гибридные а какие нет. Хотя примеров вывода на странице нет, это слегка настораживается. Потому что стандартный cpuid никаких потоков и ядер вообще не печатает, внизу страницы пример. Но хорошо, поверим Интелу.
https://learn.microsoft.com/en-us/cpp/intrinsics/cpuid-cpuidex?view=msvc-170
.
> Мы ведь можем сделать что-то подобное на C например?
Да, и у Майкрософта и по вашей ссылке примеры на С/С++. Только в Ubuntu CPUID по умолчанию вообще нет. Он устанавливается в одну строку, так что нестрашно, но все таки не часть ядра.
.
С выводом в целом согласен, но очень много проволочек, каждый раз переизобретать велосипед костыльными подсчетами cpuid неохота.
.
УПД. Посмотрел что залито Интелом по ссылке на гитхаб
https://github.com/GameTechDev/HybridDetect
Выглядит как уже готовая библиотека, в которой можно определять на какие ядра потоки определять. « Demonstrates split topology threadpools, as well as homogeneous/heterogeneous threadpool adaption. Rendering is done via the critical P-Cores and asteroid simulation is performed using E-Cores». Это то, о чем у меня шла речь — должна быть общедоступная библиотека с хорошим интерфейсом. Интел молодцы.

За час-другой в погребе будет такая же температура как на улице.

Ещё в степень двойки возведите, потому что помимо affinity есть ещё и priority. Интел в гайдах для игроделов больше о приоритетности потоков пишет, чем о привязке ядер. Чтобы не было голодания с просадками из-за того что у главного потока на 20 мс отняли хлеб и на это время ГП ничего не делает.
.
И это ещё накладывается на необходимость прикинуть на какие ядра делать affinity. Через что вы там их делать собрались? Не помню, что печатает CPUID, но помню, что по умолчанию он не везде установлен. По умолчанию доступны cat /proc/cpuinfo и lscpu. Которые количество ядер не печатают, они печатают количество потоков. Вот введёте вы lscpu и вам напечатает «у меня 13900к 32 ядра». Что дальше? Это 16+0 или 8+16 процессор? Как это понять? Вручную составлять таблицу, что ага, 13900к это 8+16? А если юзер отключит SMT и печататься будет 13900к 24 ядра? Еще по варианту учитывать? Умножаем количество рассматриваемых случаев на два.
.
Итого у нас 2 ОС * (affinity + priority) * SMT on/off = минимум 8 сценариев. Плюс нерешенная задача с физическими/логическими ядрами. Слишком много геморроя, если мы говорим о чем-то запущенном на больше чем паре компов. Короче говоря, проблема не в том что разработчики ленивые, а в том что это не их зона ответственности.