Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики.
Продолжая посещать сайты проектов вы соглашаетесь с нашей
Политикой в отношении файлов cookie
А я не крою (кроилово всегда ведёт к попадалову в долгосрочной перспективе), и не беру бюджетные обрезки. Только X. В любом случае в один прекрасный момент и старые X новые процы поддерживать прекратят — придётся менять.
Никакой «аналогичности» нет, иначе бы были заявлены 7нм. А раз не заявлены — значит такое заявление может вызвать походы в суды на предмет несоответствия заявленному. Вот и весь сказ.
Ну то есть конкретно ваши задачи, конечно, могут чисто случайно с чем-то из этого теста совпасть, но шанс такого совпадения в пределах произвольного набора типовых задач (AVX и не-AVX) минимален. То же расширение IFMA — это очень специфичная вещь, если в вашей задаче всегда использовался FPFMA — на IFMA пересесть будет даже не «не просто», а я бы сказал «никак» — только переработка алгоритмов «с нуля».
На деле же имеет место быть специфичная заточка варианта реализации теста под 512-битный юнит (и IFMA?) конкретной линейки. Для всех остальных платформ реализация сделана одинаковым способом.
Результаты теста это и отражают, собственно — разница между теми же 9900k и 2700X в том же тесте в пределах 20%. Количество юнитов у 9900k — 2x256. У 8121U — 1x512. У Ryzen — 2x128, но они полутактовые («4x128 1/2t»).
То есть, даже тем, что данный конкретный тест является максимально чувствительным к ширине порта, объяснить кратную разницу в пользу одного 512-битного порта 8121U сложно, между 4x128 1/2t и 2x256 совсем иные цифры. Это именно что специфичная заточка теста под конкретный случай.
Поглядел, что такое 3DPM — так это же собственный анандовский тест… Тогда его даже смысла обсуждать нет, по разным причинам. Чистая синтетика с разовой заточкой под новую архитектуру. Собирают они его (сюрприз) интеловским компилером.
Там другая проблемка. Если пресловутый тест взяться оптимизировать конкретно под 4-модульный 1/2t AVX128 /2FMA/ (Ryzen), вполне возможно, что тот же самый тест покажет далеко не меньший результат. Проблема именно в том, что оптимизация сделана под конкретную платформу, а остальные идут жевать генерик, и это преподносится как вин.
Ну то есть здесь не платформа выбрана под задачу, а именно задача подогнана под платформу.
Но вообще да — под каждую задачу нужен свой инструмент. Где-то решает Xeon, где-то TR (хотя вот с последним не всё так однозначно), где-то EPYC. А где-то их всех Ryzen порвёт, как тузик ту грелку.
Тест заточен конкретно под широкий AVX и шедулинг такового интелом. В чём смысл данного теста? Показать, что единичная узкоспецифичная оптимизация единичной задачи даёт в своём единичном случае исключительный результат? Так точно, возражений нет. Задача должна оптимизироваться под платформу выполнения.
Естественно, CPU с поддержкой команд, необходимых для таковой оптимизации, «разорвёт» generic-код в хлам и щепки :)
Вы приводите в пример задачу, которая имеет очень существенную специфику, требует именно AVX, и обобщаете на всё возможное. Самый же простой пример задачи, которая упрётся в псп и инты — это сборка (компиляция) здоровенных проектов на почти любом языке. И она более распространена на воркстейшнах, нежели массивная ЦОС, под которую обычно ставят уже серверы. Это если вы под ЦОС не понимаете что-то вроде полуручного аудиомонтажа, конечно.
Перечитайте слова «не проектировались». Срок «годности» определяет не дата выхода, а установленный (и не обязательно публикуемый) производителем срок жизни/поддержки, который у A320 таким образом оказывается меньше, чем у прочих вариаций. Ультрабюджетка — она и есть ультрабюджетка.
Что же до «несчастных» пользователей, которые надеялись скроить — так Zen+ подешевеет, и у любителей ультрабюджетки тоже будет более серьёзный выбор.
Не баксы, EUR.
Результаты теста это и отражают, собственно — разница между теми же 9900k и 2700X в том же тесте в пределах 20%. Количество юнитов у 9900k — 2x256. У 8121U — 1x512. У Ryzen — 2x128, но они полутактовые («4x128 1/2t»).
То есть, даже тем, что данный конкретный тест является максимально чувствительным к ширине порта, объяснить кратную разницу в пользу одного 512-битного порта 8121U сложно, между 4x128 1/2t и 2x256 совсем иные цифры. Это именно что специфичная заточка теста под конкретный случай.
Поглядел, что такое 3DPM — так это же собственный анандовский тест… Тогда его даже смысла обсуждать нет, по разным причинам. Чистая синтетика с разовой заточкой под новую архитектуру. Собирают они его (сюрприз) интеловским компилером.
Ну то есть здесь не платформа выбрана под задачу, а именно задача подогнана под платформу.
Но вообще да — под каждую задачу нужен свой инструмент. Где-то решает Xeon, где-то TR (хотя вот с последним не всё так однозначно), где-то EPYC. А где-то их всех Ryzen порвёт, как тузик ту грелку.
Естественно, CPU с поддержкой команд, необходимых для таковой оптимизации, «разорвёт» generic-код в хлам и щепки :)
Что же до «несчастных» пользователей, которые надеялись скроить — так Zen+ подешевеет, и у любителей ультрабюджетки тоже будет более серьёзный выбор.