Тестирование процессоров Ryzen Threadripper 2920X и 2970WX (второе поколение Ryzen Threadripper)

Методика тестирования компьютерных систем образца 2017 года

Тестирование процессоров Ryzen Threadripper 2950X и 2990WX (второе поколение Ryzen Threadripper)

В статье, посвященной тестированию Ryzen Threadripper 2950X и 2990WX, мы упоминали и их младших братьев — 2920Х и 2970WX. В принципе, они идентичны старшим во всем, кроме количества активных ядер в каждом ССХ — тут их три, а не четыре (т. е. суммарно 12/24, а не 16/32). Анонсирована вся четверка «второго поколения» была одновременно, но в продаже они появлялась поэтапно: сначала топовый 2990WX в первой половине августа, затем 2950Х ближе к концу месяца... и, наконец, недавно в торговые сети начали поступать 2920Х и 2970WX, причем без особого шума. Что, в общем-то, понятно: это всего лишь более дешевые, но менее производительные (в рамках семейства, разумеется) модели. При этом 2970WX столь же специфический товар, как и 2990WX, который нужно еще суметь загрузить работой, причем учитывая особенности этого семейства в виде несимметричного доступа к памяти (у половины кристаллов «своей» вообще нет, а к «чужой» все они «ходят» с увеличенными задержками). Ryzen Threadripper 2920Х же, в свою очередь, был бы интересен многим экономным покупателям, если бы не внутрифирменная конкуренция: компания устроила весьма активную распродажу моделей первого поколения, причем особенно заметным снижение цен оказалось как раз на 12-ядерный 1920Х — вплоть до ценового паритета с Intel Core i7-8700K (несмотря на разные рекомендованные цены), не говоря уже о только-только начинающем свой путь в розницу Core i9-9900K. И, спрашивается, зачем при таком раскладе ждать немного более дорогой 2920Х? :)

С другой стороны, понятно, что весь этот аттракцион неслыханной щедрости продлится максимум до окончания складских запасов «старых» (но все еще более чем актуальных) процессоров. Далее в продаже останутся только модели второго поколения — а там, глядишь, придет время переходить с Zen+ на Zen2, так что как раз на нынешнее «второе поколение» начнутся распродажи. В любом случае, проблем с поставками процессоров AMD не испытывает, системные платы пока остаются прежними (нового чипсета для этой платформы нет, благо он ей не слишком нужен), так что Ryzen Threadripper 2920Х и 2970WX сейчас органично встраиваются в ряды процессоров для TR4 по цене. Производительность их тоже не составляет труда спрогнозировать. Впрочем, зачем предполагать то, что можно измерить? Чем мы сегодня и займемся — хотя бы для полноты итогов. Тем более, что появился и еще один повод вернуться к линейке WX.

Dynamic Local Mode — новый режим работы с памятью

Как уже не раз было сказано (и не только нами), процессоры Ryzen Threadripper по сути своей напоминают многосокетные системы со всеми вытекающими: в частности, не все ядра имеют равноправный доступ ко всему объему системной памяти, поскольку контроллеров памяти два. Некоторые приложения профессионального назначения на NUMA «ложатся» хорошо — но в основном из-за того, что под такие особенности их много лет подряд и оптимизировали. Порядка десяти лет — уж точно: в более-менее массовых системах такое появилось со времен Xeon под LGA1366 (но в 2012 году мы сталкивались с тем, что рендеринг (!) в Maya, например, на паре четырехъядерных процессоров выполнялся в лучшем случае с той же скоростью, что и на одном шестиядерном — а то и медленнее). А вот рассчитанные на «стандартные ПК» приложения такой метод работы очень часто на дух не переносят. Кроме того, им может понадобиться доступ к памяти на максимальной скорости для одного вычислительного потока (или нескольких связанных по данным потоков), что осуществляется как раз при наиболее полной загрузке каналов контроллеров. Неравномерностью же задержек в этом случае иногда можно пренебречь.

Поскольку AMD изначально позиционировала Ryzen Threadripper для топовых, но персональных систем, причем даже игровых, эту проблему пришлось решать — в частности, реализацией двух режимов доступа к памяти: «классического» NUMA (он же Local Mode) и эмуляции UMA (Distributed Mode). В принципе, первый чаще оказывается быстрее (или, как минимум, не медленнее), так что он и выбран по умолчанию. Переключаться между режимами можно, но обязательно требуется перезагрузка компьютера, так что слишком уж популярным этот процесс не стал.

Появление процессоров серии WX проблему только усугубило, поскольку в их случае и Local Mode может привести к росту задержек при доступе к памяти. «Виной» тому — два дополнительных кристалла, самостоятельно с периферией не связанных, так что им в любом случае «наружу» приходится обращаться через «соседей». Собственно, именно это и является причиной того, почему процессоры Ryzen Threadripper WX иногда отстают и от Х. При полной загрузке всех ядер такого не происходит, поскольку эти модели имеют очевидную фору в количестве ядер. А вот при неполной загрузке более высокую производительность можно получить, когда все потоки в пределах NUMA-кластера выполняются на одном («ведущем» кристалле). Но можно получить и более низкую производительность, поскольку такой подход вступает в противоречие с работой технологии Turbo Core, тем сильнее увеличивающей частоту, чем меньше ядер в кристалле загружено. Таким образом, опять не удается ограничиться одним режимом «для всех случаев» — придется выбирать, что важнее: низкие задержки доступа к памяти или чуть более высокая частота. К счастью, в этом случае можно обходиться и без промежуточных перезагрузок — простым переключением режима в утилите Ryzen Master (которая на данный момент все равно необходима для функционирования Dynamic Local Mode). В общем, поэкспериментировать с режимами имеет смысл даже ради отдельных приложений — тем более, что даже как-то «обидно» покупать процессор дороже тысячи долларов и не «выжать» из него всё в используемых программах.

Отметим, что AMD особо упирает на полезность режима Dynamic Local Mode для игровых приложений. Наше же мнение относительно оправданности приобретения системы на данной платформе для игр озвучено не раз: даже Х для этого не нужны, не говоря уже о WX. Конечно, эти процессоры справляются и с такими нагрузками, но делают это не лучше, чем куда более дешевые Ryzen 7, поэтому для игр могут использоваться лишь в числе прочих задач (не собирать же для них отдельный компьютер, в конце-то концов!). А вот как нововведение скажется на других приложениях, интересно проверить.

Конфигурация тестовых стендов

Процессор AMD Ryzen Threadripper 2920X AMD Ryzen Threadripper 2950X AMD Ryzen Threadripper 2970WX AMD Ryzen Threadripper 2990WX
Название ядра Colfax Colfax Colfax Colfax
Технология производства 12 нм 12 нм 12 нм 12 нм
Частота ядра, ГГц 3,5/4,3 3,5/4,4 3,0/4,2 3,0/4,2
Количество ядер/потоков 12/24 16/32 24/48 32/64
Кэш L1 (сумм.), I/D, КБ 768/384 1024/512 1536/768 2048/1024
Кэш L2, КБ 12×512 16×512 24×512 32×512
Кэш L3, МиБ 32 32 64 64
Оперативная память 4×DDR4-2933 4×DDR4-2933 4×DDR4-2993 4×DDR4-2993
TDP, Вт 180 180 250 250
Количество линий PCIe 3.0 60 60 60 60
Цена Н/Д Н/Д

Фактически теперь мы можем собрать воедино все четыре модели Ryzen Threadripper «второго» поколения, чем и воспользуемся. Заодно и протестируем 2990WX в новом режиме Dynamic Local.

Процессор AMD Ryzen Threadripper 1920X AMD Ryzen Threadripper 1950X
Название ядра Summit Ridge Summit Ridge
Технология производства 14 нм 14 нм
Частота ядра, ГГц 3,5/4,0 3,4/4,0
Количество ядер/потоков 12/24 16/32
Кэш L1 (сумм.), I/D, КБ 768/384 1024/512
Кэш L2, КБ 12×512 16×512
Кэш L3, МиБ 32 32
Оперативная память 4×DDR4-2666 4×DDR4-2666
TDP, Вт 180 180
Количество линий PCIe 3.0 60 60
Цена

С «первым» поколением все просто — представляло оно собой всего одну линейку из трех моделей. Младшая была снабжена всего восемью ядрами, так что не слишком интересна, а остальные две мы тестировали. Сегодня возьмем обе.

Процессор AMD Ryzen 5 2600X AMD Ryzen 7 2700X
Название ядра Pinnacle Ridge Pinnacle Ridge
Технология производства 12 нм 12 нм
Частота ядра, ГГц 3,6/4,2 3,7/4,3
Количество ядер/потоков 6/12 8/16
Кэш L1 (сумм.), I/D, КБ 384/192 512/256
Кэш L2, КБ 6×512 8×512
Кэш L3, МиБ 16 16
Оперативная память 2×DDR4-2933 2×DDR4-2993
TDP, Вт 95 105
Количество линий PCIe 3.0 20 20
Цена

И пару старших Ryzen 5 и Ryzen 7 для AM4 тоже возьмем, благо они, по сути, представляют собой половинки от 2920Х и 2950Х соответственно. «Четвертинками» 2970WX и 2990WX их считать по понятным причинам не получается, но если хочется — тоже можно :)

Процессор Intel Core i7-8086K Intel Core i9-9900K Intel Core i9-7900X Intel Core i9-7940X Intel Core i9-7980XE
Название ядра Coffee Lake Coffee Lake Refresh Skylake-X Skylake-X Skylake-X
Технология производства 14 нм 14 нм 14 нм 14 нм 14 нм
Частота ядра, ГГц 4,0/5,0 3,6/5,0 3,3/4,3 3,1/4,3 2,6/4,2
Количество ядер/потоков 6/12 8/16 10/20 14/28 18/36
Кэш L1 (сумм.), I/D, КБ 192/192 256/256 320/320 448/448 576/576
Кэш L2, КБ 6×256 8×256 10×1024 14×1024 18×1024
Кэш L3, МиБ 12 16 13,75 19,25 24,75
Оперативная память 2×DDR4-2666 2×DDR4-2666 4×DDR4-2666 4×DDR4-2666 4×DDR4-2666
TDP, Вт 95 95 140 165 165
Количество линий PCIe 3.0 16 16 44 44 44
Цена

Прямое сравнение с процессорами Intel по-прежнему затруднено: формально Ryzen Threadripper конкурируют с HEDT Core i9, а фактически последние стоят дороже. Что же касается Core i7 для платформы LGA2066, то таковые интересны не производительностью (с этой точки зрения старшие процессоры для LGA1151 выглядят в среднем лучше), а лишь возможностями по подключению периферии — да и то относится это только к новинкам «девятого» поколения, которые мы все равно не тестировали. Поэтому волюнтаристское решение: берем лучшие модели для массовой платформы (с шестью и восемью ядрами), а также Core i9-7900X, i9-7940X и i9-7980XE. Просто для массовости — все равно они все уже протестированы.

В остальном конфигурации были примерно равными: один и тот же SSD, видеокарта и 8 ГБ памяти на канал (т. е. 16 ГБ для LGA1151/AM4 и вдвое больше для HEDT-платформ). Частота памяти — штатная для решений Intel и Ryzen 7, но немного повышенная для Threadripper. Так было сделано и во время тестов первого поколения: мы использовали DDR4-2933 для всех процессоров AMD, хотя штатно они поддерживали только DDR4-2666. Сейчас DDR4-2933 стала штатной, но поскольку мы использовали модули, рассчитанные на 3200 МГц, такую частоту и выбрали. В принципе, разгоном это по нынешним временам считать трудно: как показали последние испытания системных плат, текущие версии AGESA позволяют памяти «нормально жить» и на 3,5+ ГГц. Толку, правда, от этого куда меньше, чем принято считать в некоторых кругах :)

Методика тестирования

Методика подробно описана в отдельной статье. Здесь же вкратце напомним, что базируется она на следующих четырех китах:

Подробные результаты всех тестов доступны в виде полной таблицы с результатами (в формате Microsoft Excel 97—2003). Непосредственно же в статьях мы используем уже обработанные данные. В особенности это относится к тестам приложений, где все нормируется относительно референсной системы (AMD FX-8350 с 16 ГБ памяти, видеокартой GeForce GTX 1070 и SSD Corsair Force LE 960 ГБ) и группируется по сферам применения компьютера.

Правда, от игровых тестов мы в очередной раз отказываемся. Хоть AMD и утверждает, что процессоры линейки X хорошо подходят геймерам и энтузиастам, мы все-таки склонны считать, что лучше всего геймерам подходят... хорошие видеокарты :) При этом таковые все еще не бывают настолько «хорошими», чтобы им не хватило даже самых дешевых процессоров из сегодняшнего тестирования. Впрочем, при тестах по обновленной методике, мы этот вопрос рассмотрим, благо там и игры обновлены. А как эти игры работают на GTX 1070 с процессорами разных уровней — мы давно и хорошо знаем. Собственно, в первую очередь нас сегодня интересует сравнение процессорной производительности, причем сравнить хочется с как можно большим количеством других моделей, поэтому мы используем прошлогоднюю тестовую методику: по ней накоплена очень большая база результатов. И в планируемом итоговом материале без новых Ryzen Threadripper, разумеется, обойтись будет нельзя.

iXBT Application Benchmark 2017

В принципе, уже «первого» поколения Ryzen Threadripper достаточно, чтобы обгонять любые процессоры Intel в этой группе, а если говорить про «второе», то тут уже и 2920Х отстает только от i9-7980XE, так что с межплатформенной конкуренцией дело ясное :) Если же говорить о внутрифирменной, то внимания заслуживают в первую очередь результаты 2970WX и 2990WX. Они практически совпадают, т. е. таким количеством ядер эти программы «хорошо распорядиться» не могут. А вот организационные проблемы у WX-серии общие. Использование режима Dynamic Local их немного ослабляет, но полностью не решает — иначе бы оба процессора работали бы не хуже (как минимум), чем 2950Х.

Зато этим программам сколько ядер не дай — все мало. Хотя... Хотя разница в производительности между 2990WX и 2970WX в относительном исчислении уменьшилась сравнительно с парой 2950Х/2920Х, например, так что и здесь определенная «точка насыщения» на горизонте уже маячит. Но «маячить» она начала по большому счету из-за самого появления линейки WX — главного новшества Ryzen Threadripper «второго» поколения, поскольку в равных условиях прирост производительности относительно «первого» не так уж и велик (и без учета WX i9-7980XE формально остается лидером). Dynamic Local в таких условиях ничего не дает — потому что и не может: все равно «грузить» работой надо все ядра.

Поддержка многопоточности в этих приложениях неплохая, но ограниченная — так что гоняться за многоядерными «монстрами» не слишком-то и нужно. Особенно если говорить о процессорах Intel, где Core i9-9900K (на самом деле — даже и i7-9700K) обгоняет любые модели под LGA2066. Впрочем, и у AMD тут ситуация лучше, но не принципиально — цена растет куда быстрее производительности. А «второе» поколения лучше «первого» просто потому, что «второе». Да и Dynamic Local лишь замедляет все программы группы.

Lightroom — заметно ускоряет, что и на общем результате в группе сказаться может. Хоть и не принципиально — WX здесь совсем не блещут, да и вообще положение многоядерных моделей в целом даже хуже, чем при работе с видео. В общем, не те задачи, ради которых такие процессоры имеет смысл приобретать. Хотя абсолютные результаты Х-серии «второго» поколения и неплохи, но с практической точки зрения это значимо разве что для 2920Х.

Казалось бы, чем больше ядер — тем лучше. Но и тут есть нюансы. Во-первых, 2920Х сумел догнать 1950Х несмотря на меньшее количество ядер — улучшение их качества дало о себе знать. При этом от 2950Х он отстает больше, чем 1920Х от 1950Х, т. е. наблюдаем очередное подтверждение того, что какие-то «затыки» компания в Zen+ подправила явно — масштабируемость Threadripper улучшилась. Правда WX это не слишком помогает — 2970WX и 2990WX методом грубой силы обогнали всех остальных участников, но не принципиально. А друг от друга и вовсе практически не отличаются.

Мы очень надеялись на Dynamic Local — ожидания не оправдались. Вообще же программа похоже оптимизирована идеально, но под... процессоры Intel c кольцевой шиной. И только под них — любые архитектурные отличия мгновенно приводят к низкой скорости работы.

2920X сумел обогнать не только оба «старых» Ryzen Threadripper, но и все процессоры Intel — очень достойный результат. Вот дальше увеличивать производительность становится сложно — придется попотеть. И заметим, что Dynamic Local практически не сказался на четырех программах из пяти, зато SolidWorks ускорился радикально: до уровня 2950Х. В принципе, так и должно быть в идеальном случае. Но, к сожалению, таких «идеальных случаев» мы сегодня обнаружили куда меньше, чем рассчитывали изначально.

Закономерный общий итог — все Ryzen Threadripper сбились плотной кучей и «пасутся» где-то вместе с самыми быстрыми и дорогими процессорами Intel. Исключением является, разве что, старый 1920Х, но свою задачу «не уступать младшим Core i9 и заметно обгонять все Core i7» он по-прежнему отлично выполняет — да еще и подешевел за год. А оба (теперь уже можно утверждать точно) WX — специфические процессоры для специфических задач. При правильном использовании могут быть самыми быстрыми на рынке — но зачастую уступают и куда более дешевым моделям для массовых платформ. Что забавно, все режимы работы с памятью ведут себя подобным образом: где-то лучшим оказывается один, где-то второй... теперь вот и третий к ним добавился. Как говорится, наши руки не для скуки :)

Энергопотребление и энергоэффективность

Что любопытно — режим Dynamic Local позволяет экономить электроэнергию. Но ничего неожиданного — при его использовании «дополнительные» кристаллы WX-серии без явной необходимости работой не нагружаются, так что могут и «поспать». «Основные» же больше положенного в любом случае не «съедят» — откуда и такой эффект. Полезный, но не принципиальный — системы на WX остаются самыми прожорливыми. Этажом ниже живут обычные Ryzen Threadripper и процессоры Intel для LGA2066, а решения для массовых платформ обеих компаний экономичнее по сути в разы (ближайшие родственники Core i7-8086K так и вовсе давно в ноутбуки «помещаются»).

Впрочем, если оценивать все в комплексе, то «энергоэффективность» Ryzen Threadripper соответствует аналогичным моделям для АМ4 — если, конечно, ограничиться и там, и там Х-сериями. Понятно почему — кристаллы, в общем-то, те же. WX же и в этом плане хуже; хотя побочная эффективность режима Dynamic Local заметна, но положение дел не меняет.

Итого

К моделям 2×6 и 4×6 мы изначально относились скептически, поскольку успели протестировать их старших «собратьев», а тут, в принципе, то же самое — но урезанное и удешевленное. К концу тестирования скептицизм уменьшился. Например, стало понятно, что 2920Х и должен стоить дороже, чем 1920Х, поскольку он в среднем сопоставим по производительности с (некогда «флагманским») 1950Х, но дешевле. Да и 2970WX с учетом цены можно воспринимать как довольно интересную бюджетную (если такой термин здесь применим, конечно) альтернативу 2990WX — проблемы у них общие, производительность различается не радикально, а вот цены заметно разные.

Тем более, что при всех особенностях платформы TR4 конкурировать ей на данный момент практически не с кем: ничего аналогичного по совокупности характеристик в ассортименте Intel не водится. Есть неплохие процессоры для LGA2066 — но со своими нюансами, да и заметно дороже (Core i7 для этой платформы, пожалуй, можно больше и вовсе не принимать во внимание). Есть вторая версия LGA1151, где все просто и понятно — но аналогичного уровня производительности процессоры для нее все же не обеспечивают (да еще и пресловутый дефицит «толкает» розничные цены того же i9-9900K на уровень даже не 1920Х, а ближе к 1950Х/2920Х). Поэтому прямое сравнение Ryzen Threadripper «второго» поколения возможно только с «первым» — а тут и анализировать нечего: новые процессоры немного, но лучше старых (странно было бы видеть обратное), сохраняя полную совместимость с проверенной платформой. И это если говорить только о моделях Х-серии, потому что у WX аналогов совсем нет и не было. Это очень специфичные модели, однако в каких-то сценариях они могут быть просто безальтернативными. Особенно если ответственно подойти не только к выбору, но и к последующей тонкой настройке. Причем возможность настройки AMD еще немного увеличила, добавив новый режим работы с памятью специально для WX, и, что удобно, переключаться между Dynamic Local Mode и Local Mode можно прямо «на лету», выбирая оптимальный вариант для конкретной ресурсоемкой задачи (а при отсутствии таковых процессоры данной линейки вообще не нужны). Да, это немного сложнее, чем просто пользоваться системой, не обращая внимания ни на что. Но для таких сценариев использования данная платформа и не предназначена ;)

11 декабря 2018 Г.