«Nehemiah» — новое ядро VIA C3 и перспективы его применения




Не сказать, чтобы вся мировая общественность с трепетом и замиранием сердца ожидала анонса нового процессорного ядра от всемирно известного и стремительно диверсифицирующего производство изготовителя различных периферийных контроллеров, системных плат, настенных и настольных обогревателей и даже изредка чипсетов — тайваньской компании VIA Technologies. Тем не менее, определенный интерес был, особенно у обозревателей компьютерного железа, давно уставших описывать и измерять в баллах, fps и секундах свой восторг по поводу прибавления пары сотен мегагерц у и так не страдавшего от их отсутствия рядового топового процессора. Причем интерес, мы бы сказали, чисто спортивный. Ну, в самом деле, можно принимать ставки: заработают ли, наконец, все x86-приложения на изначально x86-совместимом процессоре? Да и еще есть вопросы подстать.

Мы свой интерес удовлетворили, теперь предлагаем сделать то же самое вам.

VIA C3 «Nehemiah»

front       back

По маркировке на крышке новое ядро опознать вообще невозможно (суффикс «A» свидетельствует лишь о наличии кэша второго уровня — равно как и у первых только обретших кэш L2 процессоров Celeron)

Для освежения в памяти деталей архитектуры не самых частых гостей наших обзоров — процессоров VIA C3 — предлагаем вам обратить свое внимание на сравнение решений для low-end, где, в частности, был представлен гигагерцовый процессор VIA C3 на ядре Ezra-T (принимающий участие и в нынешнем тестировании).

Впрочем, сегодняшний новичок отличается от предшественника хоть и не сильно, но довольно принципиально: в процессорное ядро, впервые со времен Samuel2/Ezra/Ezra-T, внесены действительно заметные изменения. Основные характеристики представляемого решения следующие:

Nehemiah CPUID
  • Упаковка: стандартная CPGA или EBGA для Socket 370
  • Совместимость с материнскими платами соответствующего процессорного разъема
  • Полная x86-совместимость (будем надеяться :))
  • Поддержка наборов процессорных инструкций MMX и SSE
  • 64-килобайтные 4-канальные кэши первого уровня (L1) данных и команд
  • 64-килобайтный (эксклюзивный) 16-канальный кэш второго уровня (L2), работающий на полной частоте ядра
  • Два 8-канальных кэша соответствия адресов (TLB) на 128 записей с кэшами страниц адресов (PDC) на 8 записей
  • Кэш адресов переходов (Branch Target Address Cache) на 1024 записи
  • Традиционный для процессоров VIA «уникальный усовершенствованный алгоритм предсказания переходов» :)
  • 16-ступенчатый конвейер
  • Работающий на полной частоте ядра блок FPU
  • Поддержка APIC в будущих степпингах ядра
  • Частота шины: 133 МГц (возможна работа на 100 и 66 МГц)
  • 0,13-микронный тех. процесс с применением медных соединений
  • Размер ядра: 52 мм2
  • Частоты (данные на момент анонса): 1,0, 1,06, 1,13, 1,20 ГГц
  • Напряжение питания: 1,4 В (может быть изменено в будущих моделях)
  • Предельная температура ядра: 70°C для упаковки CPGA и 85°C для упаковки EBGA
  • Рассеиваемая мощность: 5,0—5,3 Вт в ждущем режиме, 15,0—18,4 Вт максимум для CPGA (для EBGA выше, так как выше предельная температура ядра, при которой проводятся измерения)

В принципе, новое ядро характеризуется еще несколькими архитектурными особенностями, но мы ограничимся упоминанием уже перечисленных, так как, с нашей точки зрения, излишняя детализация в данном случае будет мало кому интересна.

Теперь вкратце оценим различия между ядром Nehemiah и тем, с чем его можно сравнивать. На фоне Ezra-T практически все выглядит замечательно: расширенные и улучшенные кэши, полноскоростной блок FPU, поддержка SSE сулят приличную прибавку к производительности. (Заметим в скобках, что возможность исполнения процессором SSE-инструкций, разумеется, не гарантирует сама по себе определенной скорости их исполнения, но все же на некоторый выигрыш в производительности мы рассчитывать вправе — иначе не имело смысла вводить подобную поддержку.) Удлиненный конвейер предполагает больший частотный (в частности, разгонный) потенциал.

Есть, однако, и неприятные моменты: их всего два, но зато каких! Во-первых, заметно возросло тепловыделение процессора: хотя гигагерцовая модель и выделяет всего 15 Вт (в сравнении, например, с 27,8 Вт у Celeron «Tualatin» 1A ГГц и 46,1 Вт у Duron «Morgan» 1 ГГц), но уже требует активного охлаждения, а значит, потерян очень важный козырь процессоров C3. Во-вторых, к нашему огромному сожалению, Nehemiah требует использования Tualatin-совместимых материнских плат, то есть никак не подходит для апгрейда системы на, например, i440BX. Теоретически можно озаботиться созданием специальных переходников для подключения процессоров на этом ядре к старым платам, вот только что-то подсказывает нам, что никто не будет этим заниматься.

Разгон

Чтобы немного утешиться после горьких известий с архитектурного фронта, противопоставим им любимое развлечение компьютерных фанатов: разгон. Ну, в самом деле: Celeron по частоте вдвое уже тыщу раз разгоняли, мостики на Athlon зарисовывали, прорубали и возводили — давайте теперь из принципа надругаемся над продукцией VIA! И не будем задаваться вопросом о целесообразности и эффективности разгона — для настоящих спортсменов это несолидно.

Помимо банального разгона шиной, который зависит от возможностей материнской платы (если, конечно, не «держат» прочие комплектующие, например, память), в нашем распоряжении остается еще коэффициент умножения. У процессоров C3 он зашит, но не на железном уровне, а на уровне MSR (специальных внутренних регистров процессора), и в принципе, доступен для модификации программным путем. Изменения будут действовать до следующей перезагрузки, так что резонно осуществлять их из BIOS (предварительно отредактировав его) или из автоматически загружающейся при старте системы программы.

Но есть способ лучше! Как могли заметить самые наблюдательные, на оборотной стороне процессорного корпуса, прямо над кристаллом с маркировкой, имеется ряд характерно выглядящих мостиков. Для не имевших дела с процессорами AMD поясним: замыкание разомкнутых контактов в паре-«мостике» (кусочками графита в карандашном следе, специальным токопроводящим клеем или лаком, припоем и т. д.) приводит к установке соответствующего бита в MSR-регистре после включения питания в «1», а размыкание (не рекомендуется для фабрично соединенных контактов ввиду потенциальных механических проблем) — в «0». Таким образом, немного поэкспериментировав с сочетаниями замыкаемых мостиков, можно добиться повышения коэффициента умножения процессора (поскольку именно за это отвечают рассматриваемые контакты), что мы с легкостью и сделали: после соединения всех мостиков внутренний множитель установился в «x16», но поскольку на текущий момент процессор с таким множителем в линейке просто не предусмотрен, заработал наш испытуемый на частоте 133x9=1200 МГц.

Что же до результатов разгона шиной, можно отметить максимальную достигнутую на плате ASUS TUSL2-С частоту 148x7,5=1100 МГц, а предварительно модифицированный до множителя «x9» процессор разогнался по шине чуть хуже — до 144x9=~1300 МГц. Таким образом, можем констатировать, что разгонный потенциал нового ядра действительно чуть выше, чем у старого, но до возможностей линейки Celeron «Tualatin» (процессоры которой, напомним, «стартуют» с шины 100 МГц) очень далеко, даже при «комплексном» разгоне.

Исследование производительности

Вздохнем грустно над единственными двумя достоинствами VIA C3, перечеркнутыми с выходом нового ядра, взбодрим себя мыслью о чистой спортивной победе, достигнутой над частотой подопытного экземпляра, и перейдем к выяснению уровня производительности.

Тестовый стенд:

  • Процессоры:
    • VIA C3 (Nehemiah) 1 ГГц (133x7,5), Socket 370
    • VIA C3 (Ezra-T) 1 ГГц (133x7,5), Socket 370
    • Intel Celeron (Tualatin) 1,3 ГГц (100x13), Socket 370
  • Материнские платы:
  • Память:
    • 2x256 МБ PC166 SDR SDRAM DIMM Tonicom, CL 2 (частота памяти составляла 100 МГц при работе с Intel Celeron (Tualatin) и 133 МГц при работе с VIA C3)
    • 2x256 МБ PC3200(DDR400) DDR SDRAM DIMM Winbond, CL 2 (при тестировании использовалась в качестве PC2100(DDR266))
  • Внешняя видеокарта: ASUS 8200T5 GeForce3 Ti500
  • Жесткий диск: IBM IC35L040AVER07-0, 7200 об/мин

Программное обеспечение:

    ОС и драйверы:
    • Windows XP Professional SP1
    • DirectX 8.1
    • VIA 4-in-1 4.45
    • VIA CLE266 VGA Drivers 01.19.01
    • Intel chipset software installation utility 4.00.1009
    • Intel Application Accelerator 2.2
    • NVIDIA Detonator v28.32 (VSync=Off)
    Тестовые приложения:
    • CPU RightMark 2002 RC2
    • RazorLame 1.1.4 + Lame codec 3.92
    • VirtualDub 1.4.9 + DivX codec 5.02 Pro
    • WinAce 2.11
    • Discreet 3ds max 4.26
    • BAPCo & MadOnion SYSmark 2002
    • MadOnion 3DMark 2001 SE build 330
    • Gray Matter Studios & Nerve Software Return to Castle Wolfenstein v1.1
    • DroneZmarK

Заметьте, что мы не используем в тестах разогнанный вариант нового C3, так как действительно интересно лишь сравнить его с предшественником (который был представлен у нас в лаборатории образцом с частотой 1 ГГц). Что же до сравнения с процессором Celeron (Tualatin), то… увидите все сами на диаграммах. В конце статьи мы еще вернемся к этой линии сопоставления и закончим мысль.

Еще одним интересным вариантом, представленным в тестах, стало применение новой платы от VIA (VPSD), основанной на чипсете CLE266. Наши постоянные читатели уже могли видеть этот чипсет в деле, теперь же VIA представляет на нем модель общего назначения, обычного формата mATX. В силу специфики CLE266 (очень слабое, с точки зрения производительности в играх (о чем речь впереди), встроенное видеоядро и отсутствие поддержки внешнего AGP-порта), удел подобной платы — применение в бюджетных офисных или нишевых домашних компьютерах, но окончательно расставят все по своим местам результаты тестов.

CLE266  VT8235

Результаты тестов

Традиционно начнем с исследования в CPU RightMark и оценим, какими задатками обладает новое ядро C3.

При решении дифференциальных уравнений, где используются только обычные x87- и MMX-инструкции, эффект от удвоения частоты работы блока FPU у Nehemiah виден невооруженным глазом (почти в полтора раза), и еще менее вооруженным глазом видно, что по совокупности технических характеристик даже новому C3 до Tualatin очень далеко.

Рендеринг — и снова полуторакратное превосходство в скорости FPU у Nehemiah, и — ура! — SSE-инструкции действительно исполняются, причем со вполне сравнимой с Celeron скоростью. Конечно, даже при использовании SSE, даже со скидкой на большую частоту процессора Intel превосходство последнего более чем двукратное, но именно «рост над собой» у C3 вполне похвален.

Напомним, что C3 «Ezra-T» этот тест пройти не мог, так как кодек Lame вылетал с ошибками (по заверениям программистов кодека — на вполне стандартном MMX-коде). Здесь мы констатируем, таким образом, лишь слабость «числодробилки» C3 в сравнении с Celeron «Tualatin» (что мы уже имели возможность наблюдать по результатам CPU RightMark), да негативное влияние на скорость чипсета CLE266, несмотря даже на то, что в этом тесте видео не используется, а пропускная способность памяти DDR на этом чипсете теоретически в два раза выше.

Эффектные цифры, полученные в результате кодирования видеопотока в формат MPEG4, не дают возможности сбиться на скучный расчет процентов. Два часа на Ezra-T, час на Nehemiah и полчаса на Tualatin — картина ясна как день. Впрочем, опыт в комментировании результатов этого теста заставляет добавить к уже упомянутым еще одну причину, оказывающую значительное влияние на производительность исследуемых систем: у процессоров C3 на обоих ядрах очень низкая скорость обмена данными с памятью. Причем по записи все сегодняшние участники примерно равны, и Celeron даже немного проигрывает (примерно 200 МБ/с против 230), а вот читает из памяти процессор Intel, со своими 750 МБ/с, чуть ли не в два с половиной раза быстрее. Что же касается CLE266+DDR266, то никакой пользы от теоретической полосы пропускания этой пары C3 не получает, да еще и обращения к видеопамяти (постоянные под Windows GUI, хоть и отнимающие в целом долю процента времени) вносят свою лепту в низкую скорость системы. Очевидно, что с процессорами Intel чипсет проявил бы себя куда лучше (в тех приложениях, разумеется, где не требуется производительность видеоускорителя).



Результаты этих двух совершенно различных по алгоритму и зависимостям тестовых приложений мы прокомментируем вместе, потому что есть в них одна очень даже большая странность. Celeron привычно далеко впереди, хотя и меньше при архивировании в WinAce, потому что тест сильно зависит от скорости памяти, а производительность финального рендеринга в 3ds max традиционно пропорциональна лишь частоте процессора. Использование CLE266 привычно замедляет Nehemiah, хотя нигде величина этого замедления не превышает 5%. Но вот последняя пара сравнения показывает абсолютно непонятную на первый взгляд картину: Ezra-T почти или даже совершенно не отстает от Nehemiah. Казалось бы: новое ядро превосходит старое во всех аспектах производительности — одна только голая скорость FPU значительно выше, а уж до сопроцессора тот же рендеринг жаден до невозможности.

И тут мы вынуждены сделать вполне естественный и все объясняющий вывод: значит, процессор тут не причем. А вспоминая предыдущий параграф, только и остается предположить, что именно в низкую скорость чтения из памяти и упирается производительность данных двух приложений при исполнении на процессоре C3. Причем, если пролистать старые статьи раздела, то можно обнаружить, что и на линейке Celeron «Tualatin» она тоже упирается в память, только показатели при этом, конечно, повыше — как раз в те самые ~2,5 раза в 3ds max (где преобладает считывание данных для рендеринга из памяти) и поскромнее в WinAce, где значительную долю времени занимает запись в память.

В офисном синтетическом тесте SYSmark Nehemiah поднял знамя павшего в неравной борьбе со скриптом тестового пакета товарища, успешно дойдя до финишных цифр, которые оказались не такими уж плохими. Впрочем, как мы в очередной раз терпеливо повторяем, практического смысла в этих результатах нет или он очень слабоуловим, потому что итоговый балл подтестов невозможно перевести на язык понятных секунд реакции используемых приложений на действия пользователя. Однако желающие могут демонстрировать «снятые» цифры своим собеседникам и делать из получившейся картины какие им заблагорассудится выводы.



Сравнение C3 и Celeron в играх вряд ли даст нам новую пищу для размышлений, так как все характерные ситуации зависимости тестовых приложений от тех или иных системных ресурсов мы уже наблюдали. Зато пришел черед проверить в деле встроенный ускоритель CLE266 (CastleRock). Отсутствие Hardware T&L отчетливо проглядывает в общем балле 3DMark этой системы и позволяет оценить уровень производительности в современных играх, давно уже ориентированных на HTCL. Впрочем, в отдельных играх при помощи программной эмуляции результат достигается более или менее приближенный к возможности играть, но не более.



Поскольку нормальный OpenGL-драйвер для CastleRock отсутствует, нет ничего удивительного в том, что и «Return to Castle Wolfenstein», и древняя игра «DroneZ» стартовать на этой системе отказались. Из результатов же остальных участников хотелось бы отметить один характерный момент: при значительном усложнении игровой сцены в «DroneZ» производительность Nehemiah упала сравнительно мало, явно реагируя на возросшие расчетные способности нового ядра по сравнению со старым.

Что касается практического опыта использования C3 на VIA C3M266-L, то можем добавить, что скорость в чудом запустившейся игре «Serious Sam: The Second Encounter» составляла всего 11,5 fps в максимально легком режиме, но зато любые видеофильмы как в формате DVD, так и в формате MPEG4 просматривались в максимально возможном качестве без какого-либо торможения. Так что если считать, как в старые добрые времена, что решения от VIA надо воспринимать в качестве единого целого, то бюджетный компьютер или телеприставка из C3 «Nehemiah» + VIA C3M266-L вполне получаются.

Выводы

Мы принципиально не старались соблюсти чистоту и академичность тестирования, сравнивая процессоры разной архитектуры на разной частоте. Дело в том, что по сравнению с Intel Celeron процессор VIA C3 все еще остается, положа руку на сердце, «никаким» (и это отчетливо видно без какого-либо выравнивания по частоте), несмотря на существенный «рост над собой». Заострять же внимание на росте быстродействия нового C3 по отношению к старому, мы тоже особого смысла не видим по одной простой причине: учитывая результаты Celeron, мы не видим вообще никакого смысла в заострении внимания на производительности этого процессора. Это, можно сказать, единственный в своем роде, по-своему уникальный современный x86-процессор, который де-факто вообще не имеет такой характеристики, как «производительность». :)

Начальная цена C3 «Nehemiah» названа в районе 30 долларов, и, очевидно, она есть и будет сравнима с нынешними 40 долларами за Celeron «Tualatin», который уже имеется в продаже при частотах до 1,4 ГГц. (В любом случае, не будет же VIA продавать свою новенькую блестящую игрушку за 10 долларов?!) При этом по производительности (да, все, забыли это слово) даже новый C3 и рядом не валялся, инфраструктура им требуется одинаковая, ну разве что на электроэнергии сэкономить получится. Таким образом, мы вновь возвращаемся к началу статьи и настраиваемся на созерцательный лад, откладывая в сторону кошелек.

Ведь приятно же, черт возьми, что VIA наконец выпустила процессор, который без проблем исполняет x86-совместимый код. И SSE на нем работает, да еще и неплохо работает — вообще праздник! Выйди такое чудо год назад — был бы полноценным участником рынка, формировал бы будущее.

А сейчас мы вполне можем с удовольствием пообсуждать, какое именно из новшеств ядра больше сказывается на увеличении производительности… Или вот: взять появившийся блок исполнения инструкций SSE и пропавший, судя по отчету флагов внутренних регистров, блок исполнения инструкций 3DNow!. Мы в настоящий момент не располагаем полной документацией VIA, но вот ведь какая штука: зная современную традицию ставить внутри процессора ядро, исполняющее в реальности совсем другие, отличные от поступающих снаружи, команды, и сведя эту традицию воедино с фактом исчезновения блока исполнения одних инструкций на фоне появления блока исполнения других, а также вспомнив столь любимый VIA принцип повторно использовать все, что только можно, и до тех пор, пока только можно, так и хочется спросить: а появлялось ли и исчезало ли что-то вообще? Быть может, у C3 просто есть один специальный универсальный (или даже подо что-то «заточенный») блок, исполняющий внутренний RISC-подобный микрокод, которому «перепрошили транслятор»? Это, конечно, всего лишь предположение, но все же, все же… Интересно!




Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.