Обзор процессора AMD Athlon 600 МГц


Кажется, со времени 486 процессоров, когда и Intel и AMD сосуществовали бок о бок и практически не конкурировали между собой, пользуясь одними и теми же технологиями, AMD впервые имеет шанс положить Intel на лопатки. Почему? Ответ прост — на рынке появился новый процессор седьмого поколения AMD Athlon.

Но сначала обратимся к истории. Первым процессором, который AMD разрабатывала самостоятельно, был K5, выпущенный в 1996 году. Сейчас о нем уже мало кто помнит, правда и помнить там особо нечего. Как всегда, опоздав с выпуском этого кристалла, отставая по тактовой частоте и производительности, AMD не смогла тогда завоевать расположения пользователей.

После этого провала AMD приобрела забытую сейчас фирму NexGen, еще одного независимого разработчика x86 процессоров, который обладал передовой на то время технологией и в небольших количествах выпускал кристаллы без арифметического сопроцессора. Используя эти наработки, AMD спроектировала новое поколение своих CPU — K6. По операциям с целыми числами эти процессоры стали превосходить аналоги от Intel, однако блок операций с плавающей точкой все еще оставлял желать лучшего. А так как начинающие активно набирать популярность игры в жанре Action опирались в своих вычислениях именно на FPU, AMD K6 вновь ждал провал.

AMD не сдавалась и для нужд компьютерных игр предложила использовать не сопроцессор, а специально спроектированный набор SIMD-инструкций 3DNow!. Так появился процессор AMD K6-2, в котором к обычному ядру K6 добавился еще один блок операций с числами одинарной точности с плавающей точкой. Благодаря тому, что он мог выполнять однотипные вычисления с четырьмя парами операндов одновременно, на специально оптимизированных под 3DNow! приложениях K6-2 показывал неплохую производительность. Однако, из специально и как следует оптимизированных оказался только Quake2, а потому пользователи, в большинстве своем, остались недовольны.

Тогда AMD к своему процессору K6-2 добавила интегрированный в ядро кеш второго уровня, работающий на частоте кристалла. Это спасло производительность — полученный K6-III мог успешно конкурировать с аналогами, однако, Intel практически задавил это начинание ценами. Celeron обходился значительно дешевле, обеспечивая, тем не менее, вполне пристойное быстродействие.

В результате мы получили то, что получили. Находясь в состоянии ценовой войны, Intel и AMD пришли к тому, что самые дешевые Intel Celeron продаются практически по себестоимости, если не ниже, а на рынке дорогих процессоров обосновался другой продукт от Intel — Pentium III. Единственный оставшийся шанс выжить для измотанной и порастерявшей в борьбе свои капиталы AMD — вылезти на рынок дорогих и производительных процессоров. Причем, закрепиться на нем не за счет цены — этим оружием в совершенстве владеет Intel, который может сбрасывать цены значительно сильнее AMD, а за счет быстродействия. Именно это и попыталась сделать AMD, выбросив на рынок процессор нового поколения — Athlon.

Если подойти к архитектуре AMD Athlon поверхностно, то основные его параметры можно обрисовать следующим образом:

  • Чип, производимый по технологии 0.25 мкм
  • Ядро нового поколения с кодовым именем Argon, содержащее 22 млн. транзисторов
  • Работает в специальных материнских платах с процессорным разъемом Slot A
  • Использует высокопроизводительную системную шину Alpha EV6, лицензированную у DEC
  • Кеш первого уровня 128 Кбайт — по 64 Кбайта на код и на данные
  • Кеш второго уровня 512 Кбайт. Расположен вне процессорного ядра, но в процессорном картридже. Работает на половинной частоте ядра
  • Напряжение питания — 1.6В
  • Набор SIMD-инструкций 3DNow!, расширенный дополнительными командами. Всего 45 команд
  • Выпускаются версии с частотами 500, 550, 600 и 650 МГц. Версия с частотой 700 МГц появится в ближайшее время

Следует иметь в виду, что когда в начале 2000 года начнет функционировать новая Дрезденская Fab30, выпускающая Athlon по 0.18 мкм технологии, на которую AMD возлагает особые надежды, что-то из перечисленных выше параметров может и поменяться.

Однако таким простым процессор AMD Athlon кажется только лишь на первый взгляд. На самом же деле за этими несколькими строками скрываются многочисленные архитектурные инновации, которые мы рассмотрим позднее. Однако и простые характеристики AMD Athlon впечатляют. Например, как нетрудно заметить, Athlon превосходит Intel не только по максимальной тактовой частоте (у Intel Pentium III она 600 МГц, да и к тому же при этом он работает на повышенном до 2.05В напряжении ядра), но и по размеру кеша первого уровня, который у Intel Pentium III всего 32 Кбайта.



Перейдем же к более подробному рассмотрению архитектуры AMD Athlon.

Системная шина

Прежде чем углубляться в сам процессор, посмотрим, чем же отличается системная шина EV6, примененная AMD, от привычной интеловской GTL+. Внешнее сходство бывает обманчиво. Хотя процессорный разъем Slot A на системных платах для процессора AMD Athlon выглядит также как и Slot 1, перевернутый на 180 градусов, шинные протоколы и назначения контактов у Intel Pentium III и AMD Athlon совершенно различны. Более того, различно даже число задействованных сигналов — Athlon использует примерно половину из 242 контактов, в то время как Pentium III всего четверть. Внешняя похожесть вызвана тем, что AMD просто хотела облегчить жизнь производителям системных плат, которым не придется покупать особенные разъемы для установки на Slot A системные платы. Только и всего.

На самом же деле, хоть EV6 и работает на частоте 100 МГц, передача данных по ней, в отличие от GTL+ ведется на обоих фронтах сигнала, потому фактическая частота передачи данных составляет 200 МГц. Если учесть тот факт, что ширина шины EV6 — 72 бита, 8 из которых используется под ECC (контрольную сумму), то получаем скорость передачи данных 64бита х 200 МГц = 1,6 Гбайт/с. Напомню, что пропускная способность GTL+, работающей на 100 МГц в два раза меньше — 800 Мбайт/с. Повышение частоты GTL+ до 133 МГц дает увеличение пропускной способности при этом только до 1,06 Гбайт/с. Казалось бы, как в случае с GTL+, так и с EV6 получаются внушительные значения пропускной способности. Однако, только современная PC100 память может отожрать от нее до 800 Мбайт/с, а AGP, работающий в режиме 2x — до 528 Мбайт/с. Не говоря уже о PCI и всякой другой мелочевке. Получается, что GTL+ уже сейчас может не справляться с передаваемыми объемами данных. У EV6 же в этом случае все в порядке, потому эта шина более перспективна.

При этом, как частота GTL+ может быть увеличена со 100 до 133 МГц, планируется, что и частота EV6 также впоследствии достигнет значения 133 (266), а затем и 200 (400) МГц. Однако планы эти могут и не осуществиться — реализовать работу на материнской плате EV6, требующую большего количества контактных дорожек, несколько сложнее, особенно на больших частотах. Хотя если у AMD все получится, пропускная способность системной шины может достичь 2.1 и 3.2 Гбайта/с соответственно, что позволит беспрепятственно применять в Athlon-системах, например, высокопроизводительную 266-мегагерцовую DDR SDRAM.

Еще одна интересная особенность EV6 заключается в поддержке многопроцессорных систем, на рынок которых AMD планирует выйти в наступающем году. В отличие от GTL+, EV6 обеспечивает соединение точка-точка между процессорами и чипсетом, что позволяет выделить всю пропускную способность шины для каждого процессора. Теоретически таким образом может подключаться до 14 процессоров. Ограничения же на количество процессоров в интеловских системах обусловлено, в частности, и тем фактом, что общая пропускная способность GTL+ делится поровну между CPU. Потому, EV6 кажется перспективной и при использовании в многопроцессорных системах.


EV6

GTL+

Кеш

Прежде чем переходить непосредственно к функционированию AMD Athlon, хочется затронуть тему L1 и L2 кешей.

Что касается кеша L1 в AMD Athlon, то его размер 128 Кбайт превосходит размер L1 кеша в Intel Pentium III аж в 4 раза, не только подкрепляя высокую производительность Athlon, но и обеспечивая его эффективную работу на высоких частотах. В частности, одна из проблем используемой Intel архитектуры Katmai, которая, похоже, уже не позволяет наращивать быстродействие простым увеличением тактовой частоты, как раз заключается в малом объеме L1 кеша, который начинает захлебываться при частотах, приближающихся к гигагерцу. AMD Athlon лишен этого недостатка.

Что же касается кеша L2, то и тут AMD оказалось на высоте. Во-первых, интегрированный в ядро tag для L2-кеша поддерживает его размеры от 512 Кбайт до 16 Мбайт. Pentium III, как известно, имеет внешнюю Tag-RAM, подерживающую только 512-килобайтный кеш второго уровня. К тому же, Athlon может использовать различные делители для скорости L2-кеша: 1:1, 1:2, 2:3 и 1:3. Такое разнообразие делителей позволяет AMD не зависеть от поставщиков SRAM определенной скорости, особенно при выпуске более быстрых моделей.

Благодаря возможности варьировать размеры и скорости кеша второго уровня AMD собирается выпускать четыре семейства процессоров Athlon, ориентированных на разные рынки.

Архитектура. Общие положения

Вот мы и подошли к рассказу о том, как же, собственно, работает Athlon. Как и процессоры от Intel с ядром, унаследованным от Pentium Pro, процессоры Athlon имеют внутреннюю RISC-архитектуру. Это означает, что все CISC-команды, обрабатываемые процессором, сначала раскладываются на простые RISC-операции, а потом только начинают обрабатываться в вычислительных устройствах CPU. Казалось бы, зачем усложнять себе жизнь? Оказывается, есть зачем. Сравнительно простые RISC-инструкции могут выполняться процессором по несколько штук одновременно и намного облегчают предсказание переходов, тем самым позволяя наращивать производительность за счет большего параллелизма. Говоря более просто, тот производитель, который сделает более "параллельный" процессор, имеет шанс добиться превосходства в производительности гораздо меньшими усилиями. AMD при проектировании Athlon, по-видимому, руководствовалась и этим принципом.

Однако перед тем, как начать работу над параллельными потоками инструкций, процессор должен их откуда-то получить. Для этого в AMD Athlon, как впрочем и в Intel Pentium III, применяется дешифратор команд (декодер), который преобразует поступающий на вход процессора код. Дешифратор в AMD Athlon может раскладывать на RISC-составляющие до трех входящих CISC-команд одновременно. Современные интеловские процессоры могут также обрабатывать до трех команд, однако если для Athlon совершенно все равно, какие команды он расщепляет, Pentium III хочет, чтобы две из трех инструкций были простыми и только одна - сложной. Это приводит к тому, что если Athlon за каждый процессорный такт может переварить три инструкции независимо ни от чего, то у Pentium III отдельные части дешифратора могут простаивать из-за неоптимизированного кода.

Перед тем, как попасть в соответствующий вычислительный блок, поступающий поток RISC-команд задерживается в небольшом буфере (Instruction Control Unit), который, что уже неудивительно, у AMD Athlon расчитан на 72 инструкции против 20 у Pentium III. Увеличивая этот буфер, AMD попыталась добиться того, чтобы дешифратор команд не простаивал из-за переполнения Instruction Control Unit.

Еще один момент, заслуживающий внимания — вчетверо большая, чем у Pentium III, таблица предсказания переходов размером 2048 ячеек, в которой сохраняются предыдущие результаты выполнения логических операций. На основании этих данных процессор прогнозирует их результаты при их повторном выполнении. Благодаря этой технике AMD Athlon правильно предсказывает результаты ветвлений где-то в 95% случаев, что очень даже неплохо, если учесть, что аналогичная характеристика у Intel Pentium III всего 90%.

Посмотрим теперь, что же происходит в Athlon, когда дело доходит непосредственно до вычислений.

Целочисленные операции

С целочисленными операциями у процессоров от AMD всегда все было в порядке. Со времен AMD K6 процессоры от Intel проигрывали именно в скорости целочисленных вычислений. Тем не менее, в Athlon AMD напрочь отказалась от старого наследия.

Благодаря наличию трех конвейерных блоков исполнения целочисленных команд (Integer Execution Unit) AMD Athlon может выполнять три целочисленные инструкции одновременно. Что же касается Pentium III, то его возможности ограничиваются одновременным выполнением только двух команд.

Отдельно хочется затронуть вопрос конвейеров. Оптимальной глубиной конвейера для процессоров с современными скоростями считается 9 стадий. Увеличение этого числа приводит к ускорению процесса обработки команд, так как скорость работы конвейера определяется работой самой медленной его стадии. Однако, в случае слишком большого конвейера при ошибках в предсказании переходов оказывается что большая часть работы по исполнению команд, уже вошедших на конвейер выполнена напрасно. Его приходится очищать и начинать процесс заново.

Потому в AMD Athlon глубина целочисленных конвейеров составляет 10 стадий, что близко к оптимуму. К сожалению, поклонники продукции Intel снова не услышат ничего утешительного, так как конвейер в Pentium III состоит из 12-17 стадий в зависимости от типа исполняемой инструкции.

Вполне закономерными в свете вышеизложенного выглядят результаты теста ZD CPUMark 99, измеряющего производительность операций с целыми числами и памятью:

Вот это да! Первый тест и первый крупный успех AMD Athlon — его превосходство над Intel Pentium III на той же тактовой частоте составляет более 20%! Вот что значит большой кеш плюс большее количество лучше организованных конвейеров! Однако пока не стоит особенно обольщаться, скорость работы современных приложений, особенно игр, зависит от целочисленной производительности не так сильно, как от вещественночисленной. Потому посмотрим, что же представляет из себя новый конвейерный FPU в Athlon.

Вещественные операции

С замиранием сердца обращаем наш взгляд на блок FPU, встроенный в Athlon. Как мы все хорошо помним, для предыдущих процессоров AMD операции с плавающей точкой были настоящей ахиллесовой пятой. Главной проблемой было то, что блок FPU в K6, K6-2 и K6-III был неконвейеризированый. Это приводило к тому, что хотя многие операции с плавающей точкой в FPU от AMD выполнялись за меньшее число тактов, чем на интеловских процессорах, общая производительность была катастрофически низкой, так как следующая вещественная операция не могла начать выполняться до завершения предыдущей. А что-то менять в своем FPU AMD в то время не хотела, призывая разработчиков к отказу от его использования в пользу 3DNow!.

Но, похоже, прошлый опыт научил AMD. В Athlon арифметический сопроцессор имеет конвейер глубиной 15 стадий против 25 у Pentium III. Не следует забывать, что, как уже говорилось выше, более длинный конвейер не всегда обеспечивает лучшую производительность. К тому же, существенным недостатком Intel Pentium III, которого в Athlon, естественно нет, является неконвейерезируемость операций FMUL и FDIV.

FPU в Athlon объединяет в себе три блока: один для выполнения простых операций типа сложения, второй — для сложных операций типа умножения и третий — для операций с данными. Благодаря такому разделению работы Athlon может выполнять одновременно по две вещественночисленные инструкциии. А ведь такого не умеет даже Intel Pentium III — он выполняет инструкции только последовательно!

Так что, как это ни странно, FPU интеловских процессоров оказался не таким уж замечательным, как это принято было считать ранее. Результаты теста ZD FPU WinMark это подтверждают — AMD переиграла Intel на чужом поле:

Только работая на частоте 650 МГц Pentium III удается догнать новый суперFPU AMD Athlon. Результат крайне непривычный, но многообещающий — наконец-то процессор от AMD должен задать жару и в 3D играх.

MMX

На первый взгляд с выполнением MMX-операций у Athlon по сравнению с K6-III изменений не произошло. Однако это не совсем так. Хотя и MMX-инструкции используются в крайне небольшом числе приложений, AMD добавила в этот набор еще несколько инструкций, которые также появились в MMX-блоке процессора Pentium III. В их число вошли нахождение среднего, максимума и минимума и изощренные пересылки данных.

Если обратить внимание на архитектурные особенности, то в AMD Athlon имеется по два блока MMX, потому на обоих процессорах — и на Athlon, и на Pentium III — может выполняться одновременно пара MMX-инструкций. Однако, MMX-блоки в AMD Athlon имеют большую, чем у Pentium III латентность, что теоретически должно приводить к отставанию этого CPU в MMX-приложениях. Для того, чтобы протестировать реальную скорость MMX мы воспользовались старым добрым тестом Intel Media Benchmark:

Странно, но, несмотря на теоретический проигрыш, Athlon на практике все равно остается на высоте. Этот успех можно отнести как на счет большего кеша или лучшего декодера инструкций. Однако, еще раз должен отметить, что реально используют MMX очень малое число программ, потому, если даже Athlon бы проигрывал Pentium III в повседневной работе это, скорее всего, заметно бы не было.

А вот что касается вещественных SIMD-инструкций, то они приобретают все большее и большее значение.

3DNow!

Блока 3DNow! в AMD Athlon коснулись сильные изменения. Хотя его архитектура и осталась неизменной - два конвейера обрабатывают инструкции, работающие с 64-битными регистрами, в которых лежат пары вещественных чисел одинарной точности, в сам набор команд было добавлено 24 новинки. Новые операции должны не только позволить увеличить скорость обработки данных, но и позволить задействовать технологию 3DNow! в таких областях, как распознавание звука и видео, а также интернет :) Кроме этого, по аналогии с SSE были добавлены и инструкции для работы с данными, находящимися в кеше. Поддержка обновленного набора 3DNow! уже встроена в Windows 98 SE и в DirectX 6.2.

Таким образом, в набор 3DNow! входит теперь 45 команд, против 71 инструкции в SSE от Intel. Причем, судя по всему, использование новых команд должно дать еще больший эффект от 3DNow! В доказательство этого факта AMD распространила дополнительный DLL для известного теста 3DMark 99 MAX, задействующий новые возможности процессора.

Специально для оценки эффективности процессора в 3D-играх, 3DMark 99 MAX предлагает индекс CPU 3DМark, просчитывающий 3D-сцены, но не выводящий их не экран. Таким образом, получается результат, зависящий только от возможностей процессора по обработке 3D-графики и от пропускной способности основной памяти. Мы изучили быстродействие AMD Athlon по этому тесту как с использованием старого 3DNow!, так и с новым Enhanced 3DNow! и без этой технологии вообще. Для сопоставления результатов был протестирован и Intel Pentium III, с включенной SSE-оптимизацией и без нее:

Как мы видим, AMD Athlon по этому тесту чрезвычайно силен. Даже без использования новых 3DNow! инструкций он остается в недосягаемости для процессоров Intel. Все это дает нам право ожидать выдающейся производительности в 3D-играх. А мы обратим взор на гораздо более актуальный вопрос — эффективность различных наборов SIMD-инструкций: SSE и 3DNow!. Для этого посмотрим на прирост производительности в 3DMark 99 MAX при включении соответствующей оптимизации:

Что же, результат показателен. Если старый набор 3DNow!, состоящий из 21 инструкции, обеспечивал выигрыш практически аналогичный приросту производительности от SSE, то новый 45-командный выводит SIMD инструкции от AMD далеко вперед. Правда, все это результаты синтетического теста, что будет в реальных приложениях зависит от разработчиков. А мы можем только лишь их призвать оптимизировать свои изделия как под SSE, так и под 3DNow!, тем более после выхода AMD Athlon оба набора стали гораздо более близки по своим возможностям.

Производительность

После того, как мы рассмотрели устройство AMD Athlon с разных позиций и протестировали его различные части синтетическими тестами, пришло время посмотреть, как он будет вести себя в реальной жизни. Пока фанаты AMD предвкушают высокие результаты их нового фетиша, опишем наши тестовые системы.

Система на базе AMD Athlon:

  • Процессор AMD Athlon 600 МГц;
  • Системная плата MSI MS-6167;
  • Видеокарта Diamond Viper V770 Ultra;
  • Звуковая карта Creative Sound Blaster Live!;
  • Жесткий диск IBM IBM DJNA 372200
  • 128 Мбайт SEC PC-100 SDRAM

Система на базе Intel Pentium III:

  • Процессор Intel Pentium III 550 и 600 МГц. Данные по Intel Pentium III 650 МГц получены путем разгона до 6,5х100 МГц;
  • Системная плата ABIT BE6;
  • Видеокарта Diamond Viper V770 Ultra;
  • Звуковая карта Creative Sound Blaster Live!;
  • Жесткий диск IBM IBM DJNA 372200
  • 128 Мбайт SEC PC-100 SDRAM

Тесты проводились под управлением операционной системы MS Windows98 SE, во всех 3D-тестах было установлено разрешение 800x600x16.

Первым делом по сложившейся традиции посмотрим на скорость, обеспечиваемую AMD Athlon в офисных приложениях:

Скорость Athlon, работающего на частоте 600 МГц, оказывается практически такой же, как и у Pentium III 650 МГц. Да, лучшая работа с целыми числами и больший кеш обеспечивают превосходство Athlon над Pentium III в бизнес-приложениях при одинаковой тактовой частоте. Однако, толку от того что MS Word или MS Excel будет работать быстрее — немного. Где действительно нужна скорость, так это в современных 3D-играх. Но для начала прикинем скорость в 3D на синтетическом тесте 3DMark 99 MAX:

Athlon не разочаровал нас и здесь. Даже без специальной оптимизации под новые 3DNow!-инструкции этот процессор обеспечивает превосходство даже над Intel Pentium III, работающем на большой тактовой частоте. Но перейдем же, наконец, к реальным тестам — 3D-играм. Первой в списке будет OpenGL-игра Quake2, имеющая специально оптимизированный под 3DNow! минипорт:

Хотя в Quake2, на котором AMD ранее демонстрировала преимущества технологии 3DNow!, и процессоры K6-2 и K6-III вели себя неплохо, такого выигрыша в 25% от Athlon никто даже не ожидал. А ведь это не синтетический тест, а реальное приложение, причем во многом зависящее от возможностей видеокарты. При этом следует иметь в виду, что в нашей тестовой системе была установлена видеокарта на чипе nVidia Riva TNT2. Если бы это была 3dfx Voodoo3, то преимущество было бы еще больше! Но чтобы не подозревать AMD в жульничестве, мы воспользовались и другим игровым OpenGL приложением, к которому AMD руку приложить еще не успела — Quake3 Arena Test:







Ну что же, мы опять видим то самое 25-процентное преимущество AMD Athlon во всех режимах, кроме High Quality, где скорость ограничивается уже возможностями графической карты, а не процессора. Так что, высокоскоростной конвейерный FPU теперь не только не подводит AMD, но и дает возможность стать Athlon самым быстрым процессором для игр. Подтверждение этому можно найти и в результатах Direct3D-игр, например Expendable:

И снова даже Intel Pentium III 650 не может нагнать нашего героя. Ну и в заключение — результаты по одной из самых тяжелых для процессора игр, Unreal:

В принципе, сказать уже нечего — как не крути, AMD Athlon получается быстрее Intel Pentium III.

Что же, тот факт, что Athlon всегда обгоняет Pentium III, говорит сам за себя. Наличие прекрасного арифметического сопроцессора, высокая целочисленная производительность и качественная поддержка SIMD-инструкций превратили Athlon в отличный процессор для развлечений и повседневной работы.

Разгон

Делая всесторонний обзор нового процессора, нельзя не остановиться и на таком важном пункте, как разгон. Правда, поводов для оптимизма здесь немного.

Хотя ядро Athlon не имеет никакой внутренней фиксации ни умножения, ни частоты, номинальная скорость процессора задается расположением нескольких резисторов на процессорной плате. Потому, если вы хотите изменить какие-либо параметры CPU, вы вынуждены снимать картридж, автоматически теряя гарантию и рисковать собственным процессором, перепаивая детальки.

Правда, есть и другой способ. Процессорная плата Athlon снабжена технологическим разъемом, доступ к которому возможен, к слову сказать, опять-таки после снятия картриджа. Посредством этого разъема к CPU может быть подключен дополнительный адаптер, позволяющий изменить умножение и частоту шины. Огорчает одно — непонятно, где брать эти адаптеры. Пока мы не слышали ни о штучных, ни о серийных поставках этих деталей.

Что касается конкретных результатов, то Kryotech разгоняет в своих охлаждающих установках AMD Athlon 600 до 800 МГц, и это внушает оптимизм.

То есть, Athlon вполне разгоняем, но сделать это на практике очень непросто. Поэтому, похоже, разгон этого процессора не станет таким массовым спортом, как оверклокинг Intel Pentium III или Celeron. Тем не менее, недобросовестные продавцы, ищущие легкой наживы и имеющие необходимые навыки, легко могут заняться перемеркировкой процессоров Athlon. Против таких махинаций, к сожалению, AMD не предлагает никакой защиты.

Чипсеты

Прекратив разрабатывать процессоры под гнездо Super 7 и начав продвигать собственный Slot A и системную шину EV6, AMD оказалась отрезана от всех интеловских наработок на поприще чипсетов и системных плат. Теперь AMD придется самой создавать необходимую инфраструктуру, чтобы мы могли приобрести не только процессор, но и системную плату, оборудованную Slot A.

И, судя по первым успехам, ей это удалось. На первое время компания разработала собственный набор логики AMD 750, имеющий кодовое имя Irongate, а также собственный дизайн системной платы — Fester, который был растиражирован рядом тайваньских производителей.

Сам чипсет AMD 750 не представляет собой ничего особенного — по возможностям он аналогичен i440BX. Но большего, в принципе, и не надо. AMD Athlon, как мы видели, и так работает нормально и даже обгоняет по производительности конкурирующие продукты.

AMD 750 имеет традиционую архитектуру и состоит из северного моста AMD 751 и южного AMD 756. Северный мост обеспечивает взаимодействие посредством шины EV6 процессора с памятью и шинами PCI и AGP, поддерживая до 768 Мбайт оперативной памяти PC100 в не более чем трех модулях, AGP 2x и 6 PCI bus maser устройств. Южный мост, осуществляющий интерфейс со всей периферией, кроме обычных функций, умеет работать с UltraDMA/66 IDE-устройствами.

Здесь хочется затронуть еще одну волнующую всех проблему — совместимость. Все мы помним, что для функционирования предыдущих плат, ориентированных на процессоры AMD, требовалась установка специального минипорта, включающего AGP GART драйвер. Этот момент вызывал наибольшие нарекания пользователей, так как часто драйвер отказывался нормально работать с определенными видеокартами. Для корректной работы Athlon с AGP драйвер тоже надо устанавливать, однако можно сказать уверенно — его реализация во много раз изменилась к лучшему. Нам не удалось найти ни одной карты из современных, которая бы работала некорректно. И вообще, говоря о стабильности и совместимости — проблем AMD Athlon ни при работе под Windows 98, ни при работе под Windows NT не вызывал. Так что с надежностью и стабильностью Athlon-систем все должно быть в порядке.

Любопытно, но как оказалось из-за того, что шина EV6 используется и в процессорах Alpha, Irongate может применяться на системных платах и под этот процессор, в частности, системная плата UP1000 от API (для Alpha) основывается именно на этом чипсете.

Хотя на данный момент Irongate выглядит вполне современно, пройдет какое-то время, и его возможностей будет явно недостаточно. AMD, хотя и продолжает свои разработки, планируя внедрить в Irongate поддержку AGP 4x и памяти PC133 или Direct RDRAM, делает это крайне неохотно. По расчетам компании к проектированию Athlon-чипсетов должны быть привлечены тайваньские производители VIA, SiS и ALI, которые не отказались поучаствовать в продвижении нового процессора на рынок.

VIA уже объявила свой Athlon-чипсет KX133, который отличается от Irongate поддержкой памяти PC133 и AGP 4x. Архитектура KX133 также традиционная — северный мост VT8371 и любой южный мост от имеющихся у VIA чипсетов, например VT82C686A. Видимо, именно этот чипсет станет впоследствии самым массовым, на то есть все предпосылки. Обладая более широкими возможностями, например поддержкой до 2 Гбайт оперативной памяти, он появится на рынке уже в четвертом квартале.

Ну а если говорить о более далеких перспективах, то там нас ждут и SMP, и поддержка более скоростной системной шины, и решения с интегрированной графикой. Так что, видимо, с чипсетами под AMD Athlon все будет в порядке.

Системные платы

Для облегчения жизни разработчикам плат AMD разработала референс-дизайн Fester, который и был им передан в расчете на то, что к выходу Athlon тайваньские производители заполнят рынок платами своего изготовления. Сама AMD выпустила лишь небольшое количество плат, предназначенных только для демонстрации, а не для продажи. Однако, в действительности, все произошло не совсем так, как хотелось AMD.

Дело в том, что предложенный дизайн был шестислойным, в то время как практически все современные материнские платы — четырехслойные. Этот момент вызвал некоторые затруднения у производителей, и с платами получилась небольшая задержка. Более того, даже первые выпущенные серийно платы MSI пришлось отзывать из-за низкой стабильности. На производственные трудности наложилось и давление, оказываемое Intel, который во время дефицита чипсетов имеет неплохое влияние на производителей. Таким образом, к настоящему моменту объявлены только платы шести производителей — MSI, Gigabyte, FIC, Asus, Biostar, и GVC, а доступно и того меньше.

Есть информация, что ASUS и FIC работают в настоящий момент над созданием собственно, четырехслойного дизайна, однако, ждать плодов их творчества следует еще не скоро.

Нам удалось раздобыть образцы только двух плат под AMD Athlon — MSI MS-6167 и Gigabyte GA-7IX. Говорят, что уже доступны еще две платы — FIC SD11 и GVC QS750, однако нам их в продаже найти не удалось. Что же касается найденных нами образцов от MSI и Gigabyte, то они выполнены на основе дизайна Fester: MSI подошла к вопросу бесхитростно и просто повторила референс-дизайн. Gigabyte же подошел к делу более творчески и внес отдельные косметические изменения. Однако все равно в результате мы имеем две платы, похожие как капли воды.


Microstar MS-6167

Gigabyte GA-7IX

Обе платы выполнены в ATX-формате, основаны на чипсете AMD 750, поддерживают процессоры со скоростями до гигагерца и имеют по 5 слотов PCI, 2 — ISA, 1 — AGP и по три разъема под DIMM. Естественно, имеется поддержка UltraDMA/66. Системный мониторинг также присутствует и реализован контроллером W83782D. Единственные видимые отличия есть только в BIOS Setup — MS-6167 имеет большее число настроек для работы с памятью. Setup же 7IX более понятен для неискушенного пользователя.

Что касается скоростей работы обоих плат — то они практически идентичны и рассмотрение их различия не заслуживает внимания. Думается, наиболее логичным шагом в настоящий момент будет немного подождать выхода системных плат и от других фирм, которые занимались редизайном Fester. Эти платы как могут быть более скоростными, так и наделены новыми возможностями, например, опциями для беспрепятственного разгона Athlon.

Выводы

Пора подводить итоги. AMD Athlon является на сегодня самым быстрым x86-процессором с передовой архитектурой, что подтверждают наши тесты. Intel сейчас ничего не может противопоставить успеху AMD - архитектура Katmai практически исчерпала свои возможности, в то время как AMD может беспрепятственно увеличивать частоты своих кристаллов. Переход Intel на технологию 0.18 мкм вряд ли надолго сможет решить проблему: завод AMD в Дрездене, который будет выпускать Athlon по аналогичной технологии, но с применением медных проводников находится уже практически на стадии запуска. Кроме того, без изменения архитектуры ядра Intel неоткуда почерпнуть дополнительного прироста быстродействия, потому вся надежда микропроцессорного гиганта должна возлагаться на Willamette, который, впрочем, выйдет не очень скоро.

Короче, AMD имеет все шансы утереть нос Intel и не только поправить свое пошатнувшееся материальное положение, но и отодвинуть Intel на второй план. Для этого только лишь и надо, что удовлетворить спрос на Athlon и системные платы для него. Однако, сделать это, не имея больших производственных мощностей, будет не очень просто.

В результате ситуация может повернуться как в пользу AMD, так и против нее. А нам остается только ждать, смотреть и искренне надеяться, что справедливость восторжествует.

Процессор AMD Athlon 600 предоставлен фирмой CHI, тел. (095)158-6816
Системная плата MSI Ms-6167 предоставлена фирмой Инел
Системная плата Gigabyte GA-7IX предоставлена фирмой Формоза
Процессор Intel Pentium III 600 предоставлен интернет-магазином www.dostavka.ru



27 сентября 1999 Г.

Обзор процессора AMD Athlon 600 МГц

Обзор процессора AMD Athlon 600 МГц

Кажется, со времени 486 процессоров, когда и Intel и AMD сосуществовали бок о бок и практически не конкурировали между собой, пользуясь одними и теми же технологиями, AMD впервые имеет шанс положить Intel на лопатки. Почему? Ответ прост — на рынке появился новый процессор седьмого поколения AMD Athlon.

Но сначала обратимся к истории. Первым процессором, который AMD разрабатывала самостоятельно, был K5, выпущенный в 1996 году. Сейчас о нем уже мало кто помнит, правда и помнить там особо нечего. Как всегда, опоздав с выпуском этого кристалла, отставая по тактовой частоте и производительности, AMD не смогла тогда завоевать расположения пользователей.

После этого провала AMD приобрела забытую сейчас фирму NexGen, еще одного независимого разработчика x86 процессоров, который обладал передовой на то время технологией и в небольших количествах выпускал кристаллы без арифметического сопроцессора. Используя эти наработки, AMD спроектировала новое поколение своих CPU — K6. По операциям с целыми числами эти процессоры стали превосходить аналоги от Intel, однако блок операций с плавающей точкой все еще оставлял желать лучшего. А так как начинающие активно набирать популярность игры в жанре Action опирались в своих вычислениях именно на FPU, AMD K6 вновь ждал провал.

AMD не сдавалась и для нужд компьютерных игр предложила использовать не сопроцессор, а специально спроектированный набор SIMD-инструкций 3DNow!. Так появился процессор AMD K6-2, в котором к обычному ядру K6 добавился еще один блок операций с числами одинарной точности с плавающей точкой. Благодаря тому, что он мог выполнять однотипные вычисления с четырьмя парами операндов одновременно, на специально оптимизированных под 3DNow! приложениях K6-2 показывал неплохую производительность. Однако, из специально и как следует оптимизированных оказался только Quake2, а потому пользователи, в большинстве своем, остались недовольны.

Тогда AMD к своему процессору K6-2 добавила интегрированный в ядро кеш второго уровня, работающий на частоте кристалла. Это спасло производительность — полученный K6-III мог успешно конкурировать с аналогами, однако, Intel практически задавил это начинание ценами. Celeron обходился значительно дешевле, обеспечивая, тем не менее, вполне пристойное быстродействие.

В результате мы получили то, что получили. Находясь в состоянии ценовой войны, Intel и AMD пришли к тому, что самые дешевые Intel Celeron продаются практически по себестоимости, если не ниже, а на рынке дорогих процессоров обосновался другой продукт от Intel — Pentium III. Единственный оставшийся шанс выжить для измотанной и порастерявшей в борьбе свои капиталы AMD — вылезти на рынок дорогих и производительных процессоров. Причем, закрепиться на нем не за счет цены — этим оружием в совершенстве владеет Intel, который может сбрасывать цены значительно сильнее AMD, а за счет быстродействия. Именно это и попыталась сделать AMD, выбросив на рынок процессор нового поколения — Athlon.

Если подойти к архитектуре AMD Athlon поверхностно, то основные его параметры можно обрисовать следующим образом:

  • Чип, производимый по технологии 0.25 мкм
  • Ядро нового поколения с кодовым именем Argon, содержащее 22 млн. транзисторов
  • Работает в специальных материнских платах с процессорным разъемом Slot A
  • Использует высокопроизводительную системную шину Alpha EV6, лицензированную у DEC
  • Кеш первого уровня 128 Кбайт — по 64 Кбайта на код и на данные
  • Кеш второго уровня 512 Кбайт. Расположен вне процессорного ядра, но в процессорном картридже. Работает на половинной частоте ядра
  • Напряжение питания — 1.6В
  • Набор SIMD-инструкций 3DNow!, расширенный дополнительными командами. Всего 45 команд
  • Выпускаются версии с частотами 500, 550, 600 и 650 МГц. Версия с частотой 700 МГц появится в ближайшее время

Следует иметь в виду, что когда в начале 2000 года начнет функционировать новая Дрезденская Fab30, выпускающая Athlon по 0.18 мкм технологии, на которую AMD возлагает особые надежды, что-то из перечисленных выше параметров может и поменяться.

Однако таким простым процессор AMD Athlon кажется только лишь на первый взгляд. На самом же деле за этими несколькими строками скрываются многочисленные архитектурные инновации, которые мы рассмотрим позднее. Однако и простые характеристики AMD Athlon впечатляют. Например, как нетрудно заметить, Athlon превосходит Intel не только по максимальной тактовой частоте (у Intel Pentium III она 600 МГц, да и к тому же при этом он работает на повышенном до 2.05В напряжении ядра), но и по размеру кеша первого уровня, который у Intel Pentium III всего 32 Кбайта.



Перейдем же к более подробному рассмотрению архитектуры AMD Athlon.

Системная шина

Прежде чем углубляться в сам процессор, посмотрим, чем же отличается системная шина EV6, примененная AMD, от привычной интеловской GTL+. Внешнее сходство бывает обманчиво. Хотя процессорный разъем Slot A на системных платах для процессора AMD Athlon выглядит также как и Slot 1, перевернутый на 180 градусов, шинные протоколы и назначения контактов у Intel Pentium III и AMD Athlon совершенно различны. Более того, различно даже число задействованных сигналов — Athlon использует примерно половину из 242 контактов, в то время как Pentium III всего четверть. Внешняя похожесть вызвана тем, что AMD просто хотела облегчить жизнь производителям системных плат, которым не придется покупать особенные разъемы для установки на Slot A системные платы. Только и всего.

На самом же деле, хоть EV6 и работает на частоте 100 МГц, передача данных по ней, в отличие от GTL+ ведется на обоих фронтах сигнала, потому фактическая частота передачи данных составляет 200 МГц. Если учесть тот факт, что ширина шины EV6 — 72 бита, 8 из которых используется под ECC (контрольную сумму), то получаем скорость передачи данных 64бита х 200 МГц = 1,6 Гбайт/с. Напомню, что пропускная способность GTL+, работающей на 100 МГц в два раза меньше — 800 Мбайт/с. Повышение частоты GTL+ до 133 МГц дает увеличение пропускной способности при этом только до 1,06 Гбайт/с. Казалось бы, как в случае с GTL+, так и с EV6 получаются внушительные значения пропускной способности. Однако, только современная PC100 память может отожрать от нее до 800 Мбайт/с, а AGP, работающий в режиме 2x — до 528 Мбайт/с. Не говоря уже о PCI и всякой другой мелочевке. Получается, что GTL+ уже сейчас может не справляться с передаваемыми объемами данных. У EV6 же в этом случае все в порядке, потому эта шина более перспективна.

При этом, как частота GTL+ может быть увеличена со 100 до 133 МГц, планируется, что и частота EV6 также впоследствии достигнет значения 133 (266), а затем и 200 (400) МГц. Однако планы эти могут и не осуществиться — реализовать работу на материнской плате EV6, требующую большего количества контактных дорожек, несколько сложнее, особенно на больших частотах. Хотя если у AMD все получится, пропускная способность системной шины может достичь 2.1 и 3.2 Гбайта/с соответственно, что позволит беспрепятственно применять в Athlon-системах, например, высокопроизводительную 266-мегагерцовую DDR SDRAM.

Еще одна интересная особенность EV6 заключается в поддержке многопроцессорных систем, на рынок которых AMD планирует выйти в наступающем году. В отличие от GTL+, EV6 обеспечивает соединение точка-точка между процессорами и чипсетом, что позволяет выделить всю пропускную способность шины для каждого процессора. Теоретически таким образом может подключаться до 14 процессоров. Ограничения же на количество процессоров в интеловских системах обусловлено, в частности, и тем фактом, что общая пропускная способность GTL+ делится поровну между CPU. Потому, EV6 кажется перспективной и при использовании в многопроцессорных системах.


EV6

GTL+

Кеш

Прежде чем переходить непосредственно к функционированию AMD Athlon, хочется затронуть тему L1 и L2 кешей.

Что касается кеша L1 в AMD Athlon, то его размер 128 Кбайт превосходит размер L1 кеша в Intel Pentium III аж в 4 раза, не только подкрепляя высокую производительность Athlon, но и обеспечивая его эффективную работу на высоких частотах. В частности, одна из проблем используемой Intel архитектуры Katmai, которая, похоже, уже не позволяет наращивать быстродействие простым увеличением тактовой частоты, как раз заключается в малом объеме L1 кеша, который начинает захлебываться при частотах, приближающихся к гигагерцу. AMD Athlon лишен этого недостатка.

Что же касается кеша L2, то и тут AMD оказалось на высоте. Во-первых, интегрированный в ядро tag для L2-кеша поддерживает его размеры от 512 Кбайт до 16 Мбайт. Pentium III, как известно, имеет внешнюю Tag-RAM, подерживающую только 512-килобайтный кеш второго уровня. К тому же, Athlon может использовать различные делители для скорости L2-кеша: 1:1, 1:2, 2:3 и 1:3. Такое разнообразие делителей позволяет AMD не зависеть от поставщиков SRAM определенной скорости, особенно при выпуске более быстрых моделей.

Благодаря возможности варьировать размеры и скорости кеша второго уровня AMD собирается выпускать четыре семейства процессоров Athlon, ориентированных на разные рынки.

Архитектура. Общие положения

Вот мы и подошли к рассказу о том, как же, собственно, работает Athlon. Как и процессоры от Intel с ядром, унаследованным от Pentium Pro, процессоры Athlon имеют внутреннюю RISC-архитектуру. Это означает, что все CISC-команды, обрабатываемые процессором, сначала раскладываются на простые RISC-операции, а потом только начинают обрабатываться в вычислительных устройствах CPU. Казалось бы, зачем усложнять себе жизнь? Оказывается, есть зачем. Сравнительно простые RISC-инструкции могут выполняться процессором по несколько штук одновременно и намного облегчают предсказание переходов, тем самым позволяя наращивать производительность за счет большего параллелизма. Говоря более просто, тот производитель, который сделает более "параллельный" процессор, имеет шанс добиться превосходства в производительности гораздо меньшими усилиями. AMD при проектировании Athlon, по-видимому, руководствовалась и этим принципом.

Однако перед тем, как начать работу над параллельными потоками инструкций, процессор должен их откуда-то получить. Для этого в AMD Athlon, как впрочем и в Intel Pentium III, применяется дешифратор команд (декодер), который преобразует поступающий на вход процессора код. Дешифратор в AMD Athlon может раскладывать на RISC-составляющие до трех входящих CISC-команд одновременно. Современные интеловские процессоры могут также обрабатывать до трех команд, однако если для Athlon совершенно все равно, какие команды он расщепляет, Pentium III хочет, чтобы две из трех инструкций были простыми и только одна - сложной. Это приводит к тому, что если Athlon за каждый процессорный такт может переварить три инструкции независимо ни от чего, то у Pentium III отдельные части дешифратора могут простаивать из-за неоптимизированного кода.

Перед тем, как попасть в соответствующий вычислительный блок, поступающий поток RISC-команд задерживается в небольшом буфере (Instruction Control Unit), который, что уже неудивительно, у AMD Athlon расчитан на 72 инструкции против 20 у Pentium III. Увеличивая этот буфер, AMD попыталась добиться того, чтобы дешифратор команд не простаивал из-за переполнения Instruction Control Unit.

Еще один момент, заслуживающий внимания — вчетверо большая, чем у Pentium III, таблица предсказания переходов размером 2048 ячеек, в которой сохраняются предыдущие результаты выполнения логических операций. На основании этих данных процессор прогнозирует их результаты при их повторном выполнении. Благодаря этой технике AMD Athlon правильно предсказывает результаты ветвлений где-то в 95% случаев, что очень даже неплохо, если учесть, что аналогичная характеристика у Intel Pentium III всего 90%.

Посмотрим теперь, что же происходит в Athlon, когда дело доходит непосредственно до вычислений.

Целочисленные операции

С целочисленными операциями у процессоров от AMD всегда все было в порядке. Со времен AMD K6 процессоры от Intel проигрывали именно в скорости целочисленных вычислений. Тем не менее, в Athlon AMD напрочь отказалась от старого наследия.

Благодаря наличию трех конвейерных блоков исполнения целочисленных команд (Integer Execution Unit) AMD Athlon может выполнять три целочисленные инструкции одновременно. Что же касается Pentium III, то его возможности ограничиваются одновременным выполнением только двух команд.

Отдельно хочется затронуть вопрос конвейеров. Оптимальной глубиной конвейера для процессоров с современными скоростями считается 9 стадий. Увеличение этого числа приводит к ускорению процесса обработки команд, так как скорость работы конвейера определяется работой самой медленной его стадии. Однако, в случае слишком большого конвейера при ошибках в предсказании переходов оказывается что большая часть работы по исполнению команд, уже вошедших на конвейер выполнена напрасно. Его приходится очищать и начинать процесс заново.

Потому в AMD Athlon глубина целочисленных конвейеров составляет 10 стадий, что близко к оптимуму. К сожалению, поклонники продукции Intel снова не услышат ничего утешительного, так как конвейер в Pentium III состоит из 12-17 стадий в зависимости от типа исполняемой инструкции.

Вполне закономерными в свете вышеизложенного выглядят результаты теста ZD CPUMark 99, измеряющего производительность операций с целыми числами и памятью:

Вот это да! Первый тест и первый крупный успех AMD Athlon — его превосходство над Intel Pentium III на той же тактовой частоте составляет более 20%! Вот что значит большой кеш плюс большее количество лучше организованных конвейеров! Однако пока не стоит особенно обольщаться, скорость работы современных приложений, особенно игр, зависит от целочисленной производительности не так сильно, как от вещественночисленной. Потому посмотрим, что же представляет из себя новый конвейерный FPU в Athlon.

Вещественные операции

С замиранием сердца обращаем наш взгляд на блок FPU, встроенный в Athlon. Как мы все хорошо помним, для предыдущих процессоров AMD операции с плавающей точкой были настоящей ахиллесовой пятой. Главной проблемой было то, что блок FPU в K6, K6-2 и K6-III был неконвейеризированый. Это приводило к тому, что хотя многие операции с плавающей точкой в FPU от AMD выполнялись за меньшее число тактов, чем на интеловских процессорах, общая производительность была катастрофически низкой, так как следующая вещественная операция не могла начать выполняться до завершения предыдущей. А что-то менять в своем FPU AMD в то время не хотела, призывая разработчиков к отказу от его использования в пользу 3DNow!.

Но, похоже, прошлый опыт научил AMD. В Athlon арифметический сопроцессор имеет конвейер глубиной 15 стадий против 25 у Pentium III. Не следует забывать, что, как уже говорилось выше, более длинный конвейер не всегда обеспечивает лучшую производительность. К тому же, существенным недостатком Intel Pentium III, которого в Athlon, естественно нет, является неконвейерезируемость операций FMUL и FDIV.

FPU в Athlon объединяет в себе три блока: один для выполнения простых операций типа сложения, второй — для сложных операций типа умножения и третий — для операций с данными. Благодаря такому разделению работы Athlon может выполнять одновременно по две вещественночисленные инструкциии. А ведь такого не умеет даже Intel Pentium III — он выполняет инструкции только последовательно!

Так что, как это ни странно, FPU интеловских процессоров оказался не таким уж замечательным, как это принято было считать ранее. Результаты теста ZD FPU WinMark это подтверждают — AMD переиграла Intel на чужом поле:

Только работая на частоте 650 МГц Pentium III удается догнать новый суперFPU AMD Athlon. Результат крайне непривычный, но многообещающий — наконец-то процессор от AMD должен задать жару и в 3D играх.

MMX

На первый взгляд с выполнением MMX-операций у Athlon по сравнению с K6-III изменений не произошло. Однако это не совсем так. Хотя и MMX-инструкции используются в крайне небольшом числе приложений, AMD добавила в этот набор еще несколько инструкций, которые также появились в MMX-блоке процессора Pentium III. В их число вошли нахождение среднего, максимума и минимума и изощренные пересылки данных.

Если обратить внимание на архитектурные особенности, то в AMD Athlon имеется по два блока MMX, потому на обоих процессорах — и на Athlon, и на Pentium III — может выполняться одновременно пара MMX-инструкций. Однако, MMX-блоки в AMD Athlon имеют большую, чем у Pentium III латентность, что теоретически должно приводить к отставанию этого CPU в MMX-приложениях. Для того, чтобы протестировать реальную скорость MMX мы воспользовались старым добрым тестом Intel Media Benchmark:

Странно, но, несмотря на теоретический проигрыш, Athlon на практике все равно остается на высоте. Этот успех можно отнести как на счет большего кеша или лучшего декодера инструкций. Однако, еще раз должен отметить, что реально используют MMX очень малое число программ, потому, если даже Athlon бы проигрывал Pentium III в повседневной работе это, скорее всего, заметно бы не было.

А вот что касается вещественных SIMD-инструкций, то они приобретают все большее и большее значение.

3DNow!

Блока 3DNow! в AMD Athlon коснулись сильные изменения. Хотя его архитектура и осталась неизменной - два конвейера обрабатывают инструкции, работающие с 64-битными регистрами, в которых лежат пары вещественных чисел одинарной точности, в сам набор команд было добавлено 24 новинки. Новые операции должны не только позволить увеличить скорость обработки данных, но и позволить задействовать технологию 3DNow! в таких областях, как распознавание звука и видео, а также интернет :) Кроме этого, по аналогии с SSE были добавлены и инструкции для работы с данными, находящимися в кеше. Поддержка обновленного набора 3DNow! уже встроена в Windows 98 SE и в DirectX 6.2.

Таким образом, в набор 3DNow! входит теперь 45 команд, против 71 инструкции в SSE от Intel. Причем, судя по всему, использование новых команд должно дать еще больший эффект от 3DNow! В доказательство этого факта AMD распространила дополнительный DLL для известного теста 3DMark 99 MAX, задействующий новые возможности процессора.

Специально для оценки эффективности процессора в 3D-играх, 3DMark 99 MAX предлагает индекс CPU 3DМark, просчитывающий 3D-сцены, но не выводящий их не экран. Таким образом, получается результат, зависящий только от возможностей процессора по обработке 3D-графики и от пропускной способности основной памяти. Мы изучили быстродействие AMD Athlon по этому тесту как с использованием старого 3DNow!, так и с новым Enhanced 3DNow! и без этой технологии вообще. Для сопоставления результатов был протестирован и Intel Pentium III, с включенной SSE-оптимизацией и без нее:

Как мы видим, AMD Athlon по этому тесту чрезвычайно силен. Даже без использования новых 3DNow! инструкций он остается в недосягаемости для процессоров Intel. Все это дает нам право ожидать выдающейся производительности в 3D-играх. А мы обратим взор на гораздо более актуальный вопрос — эффективность различных наборов SIMD-инструкций: SSE и 3DNow!. Для этого посмотрим на прирост производительности в 3DMark 99 MAX при включении соответствующей оптимизации:

Что же, результат показателен. Если старый набор 3DNow!, состоящий из 21 инструкции, обеспечивал выигрыш практически аналогичный приросту производительности от SSE, то новый 45-командный выводит SIMD инструкции от AMD далеко вперед. Правда, все это результаты синтетического теста, что будет в реальных приложениях зависит от разработчиков. А мы можем только лишь их призвать оптимизировать свои изделия как под SSE, так и под 3DNow!, тем более после выхода AMD Athlon оба набора стали гораздо более близки по своим возможностям.

Производительность

После того, как мы рассмотрели устройство AMD Athlon с разных позиций и протестировали его различные части синтетическими тестами, пришло время посмотреть, как он будет вести себя в реальной жизни. Пока фанаты AMD предвкушают высокие результаты их нового фетиша, опишем наши тестовые системы.

Система на базе AMD Athlon:

  • Процессор AMD Athlon 600 МГц;
  • Системная плата MSI MS-6167;
  • Видеокарта Diamond Viper V770 Ultra;
  • Звуковая карта Creative Sound Blaster Live!;
  • Жесткий диск IBM IBM DJNA 372200
  • 128 Мбайт SEC PC-100 SDRAM

Система на базе Intel Pentium III:

  • Процессор Intel Pentium III 550 и 600 МГц. Данные по Intel Pentium III 650 МГц получены путем разгона до 6,5х100 МГц;
  • Системная плата ABIT BE6;
  • Видеокарта Diamond Viper V770 Ultra;
  • Звуковая карта Creative Sound Blaster Live!;
  • Жесткий диск IBM IBM DJNA 372200
  • 128 Мбайт SEC PC-100 SDRAM

Тесты проводились под управлением операционной системы MS Windows98 SE, во всех 3D-тестах было установлено разрешение 800x600x16.

Первым делом по сложившейся традиции посмотрим на скорость, обеспечиваемую AMD Athlon в офисных приложениях:

Скорость Athlon, работающего на частоте 600 МГц, оказывается практически такой же, как и у Pentium III 650 МГц. Да, лучшая работа с целыми числами и больший кеш обеспечивают превосходство Athlon над Pentium III в бизнес-приложениях при одинаковой тактовой частоте. Однако, толку от того что MS Word или MS Excel будет работать быстрее — немного. Где действительно нужна скорость, так это в современных 3D-играх. Но для начала прикинем скорость в 3D на синтетическом тесте 3DMark 99 MAX:

Athlon не разочаровал нас и здесь. Даже без специальной оптимизации под новые 3DNow!-инструкции этот процессор обеспечивает превосходство даже над Intel Pentium III, работающем на большой тактовой частоте. Но перейдем же, наконец, к реальным тестам — 3D-играм. Первой в списке будет OpenGL-игра Quake2, имеющая специально оптимизированный под 3DNow! минипорт:

Хотя в Quake2, на котором AMD ранее демонстрировала преимущества технологии 3DNow!, и процессоры K6-2 и K6-III вели себя неплохо, такого выигрыша в 25% от Athlon никто даже не ожидал. А ведь это не синтетический тест, а реальное приложение, причем во многом зависящее от возможностей видеокарты. При этом следует иметь в виду, что в нашей тестовой системе была установлена видеокарта на чипе nVidia Riva TNT2. Если бы это была 3dfx Voodoo3, то преимущество было бы еще больше! Но чтобы не подозревать AMD в жульничестве, мы воспользовались и другим игровым OpenGL приложением, к которому AMD руку приложить еще не успела — Quake3 Arena Test:







Ну что же, мы опять видим то самое 25-процентное преимущество AMD Athlon во всех режимах, кроме High Quality, где скорость ограничивается уже возможностями графической карты, а не процессора. Так что, высокоскоростной конвейерный FPU теперь не только не подводит AMD, но и дает возможность стать Athlon самым быстрым процессором для игр. Подтверждение этому можно найти и в результатах Direct3D-игр, например Expendable:

И снова даже Intel Pentium III 650 не может нагнать нашего героя. Ну и в заключение — результаты по одной из самых тяжелых для процессора игр, Unreal:

В принципе, сказать уже нечего — как не крути, AMD Athlon получается быстрее Intel Pentium III.

Что же, тот факт, что Athlon всегда обгоняет Pentium III, говорит сам за себя. Наличие прекрасного арифметического сопроцессора, высокая целочисленная производительность и качественная поддержка SIMD-инструкций превратили Athlon в отличный процессор для развлечений и повседневной работы.

Разгон

Делая всесторонний обзор нового процессора, нельзя не остановиться и на таком важном пункте, как разгон. Правда, поводов для оптимизма здесь немного.

Хотя ядро Athlon не имеет никакой внутренней фиксации ни умножения, ни частоты, номинальная скорость процессора задается расположением нескольких резисторов на процессорной плате. Потому, если вы хотите изменить какие-либо параметры CPU, вы вынуждены снимать картридж, автоматически теряя гарантию и рисковать собственным процессором, перепаивая детальки.

Правда, есть и другой способ. Процессорная плата Athlon снабжена технологическим разъемом, доступ к которому возможен, к слову сказать, опять-таки после снятия картриджа. Посредством этого разъема к CPU может быть подключен дополнительный адаптер, позволяющий изменить умножение и частоту шины. Огорчает одно — непонятно, где брать эти адаптеры. Пока мы не слышали ни о штучных, ни о серийных поставках этих деталей.

Что касается конкретных результатов, то Kryotech разгоняет в своих охлаждающих установках AMD Athlon 600 до 800 МГц, и это внушает оптимизм.

То есть, Athlon вполне разгоняем, но сделать это на практике очень непросто. Поэтому, похоже, разгон этого процессора не станет таким массовым спортом, как оверклокинг Intel Pentium III или Celeron. Тем не менее, недобросовестные продавцы, ищущие легкой наживы и имеющие необходимые навыки, легко могут заняться перемеркировкой процессоров Athlon. Против таких махинаций, к сожалению, AMD не предлагает никакой защиты.

Чипсеты

Прекратив разрабатывать процессоры под гнездо Super 7 и начав продвигать собственный Slot A и системную шину EV6, AMD оказалась отрезана от всех интеловских наработок на поприще чипсетов и системных плат. Теперь AMD придется самой создавать необходимую инфраструктуру, чтобы мы могли приобрести не только процессор, но и системную плату, оборудованную Slot A.

И, судя по первым успехам, ей это удалось. На первое время компания разработала собственный набор логики AMD 750, имеющий кодовое имя Irongate, а также собственный дизайн системной платы — Fester, который был растиражирован рядом тайваньских производителей.

Сам чипсет AMD 750 не представляет собой ничего особенного — по возможностям он аналогичен i440BX. Но большего, в принципе, и не надо. AMD Athlon, как мы видели, и так работает нормально и даже обгоняет по производительности конкурирующие продукты.

AMD 750 имеет традиционую архитектуру и состоит из северного моста AMD 751 и южного AMD 756. Северный мост обеспечивает взаимодействие посредством шины EV6 процессора с памятью и шинами PCI и AGP, поддерживая до 768 Мбайт оперативной памяти PC100 в не более чем трех модулях, AGP 2x и 6 PCI bus maser устройств. Южный мост, осуществляющий интерфейс со всей периферией, кроме обычных функций, умеет работать с UltraDMA/66 IDE-устройствами.

Здесь хочется затронуть еще одну волнующую всех проблему — совместимость. Все мы помним, что для функционирования предыдущих плат, ориентированных на процессоры AMD, требовалась установка специального минипорта, включающего AGP GART драйвер. Этот момент вызывал наибольшие нарекания пользователей, так как часто драйвер отказывался нормально работать с определенными видеокартами. Для корректной работы Athlon с AGP драйвер тоже надо устанавливать, однако можно сказать уверенно — его реализация во много раз изменилась к лучшему. Нам не удалось найти ни одной карты из современных, которая бы работала некорректно. И вообще, говоря о стабильности и совместимости — проблем AMD Athlon ни при работе под Windows 98, ни при работе под Windows NT не вызывал. Так что с надежностью и стабильностью Athlon-систем все должно быть в порядке.

Любопытно, но как оказалось из-за того, что шина EV6 используется и в процессорах Alpha, Irongate может применяться на системных платах и под этот процессор, в частности, системная плата UP1000 от API (для Alpha) основывается именно на этом чипсете.

Хотя на данный момент Irongate выглядит вполне современно, пройдет какое-то время, и его возможностей будет явно недостаточно. AMD, хотя и продолжает свои разработки, планируя внедрить в Irongate поддержку AGP 4x и памяти PC133 или Direct RDRAM, делает это крайне неохотно. По расчетам компании к проектированию Athlon-чипсетов должны быть привлечены тайваньские производители VIA, SiS и ALI, которые не отказались поучаствовать в продвижении нового процессора на рынок.

VIA уже объявила свой Athlon-чипсет KX133, который отличается от Irongate поддержкой памяти PC133 и AGP 4x. Архитектура KX133 также традиционная — северный мост VT8371 и любой южный мост от имеющихся у VIA чипсетов, например VT82C686A. Видимо, именно этот чипсет станет впоследствии самым массовым, на то есть все предпосылки. Обладая более широкими возможностями, например поддержкой до 2 Гбайт оперативной памяти, он появится на рынке уже в четвертом квартале.

Ну а если говорить о более далеких перспективах, то там нас ждут и SMP, и поддержка более скоростной системной шины, и решения с интегрированной графикой. Так что, видимо, с чипсетами под AMD Athlon все будет в порядке.

Системные платы

Для облегчения жизни разработчикам плат AMD разработала референс-дизайн Fester, который и был им передан в расчете на то, что к выходу Athlon тайваньские производители заполнят рынок платами своего изготовления. Сама AMD выпустила лишь небольшое количество плат, предназначенных только для демонстрации, а не для продажи. Однако, в действительности, все произошло не совсем так, как хотелось AMD.

Дело в том, что предложенный дизайн был шестислойным, в то время как практически все современные материнские платы — четырехслойные. Этот момент вызвал некоторые затруднения у производителей, и с платами получилась небольшая задержка. Более того, даже первые выпущенные серийно платы MSI пришлось отзывать из-за низкой стабильности. На производственные трудности наложилось и давление, оказываемое Intel, который во время дефицита чипсетов имеет неплохое влияние на производителей. Таким образом, к настоящему моменту объявлены только платы шести производителей — MSI, Gigabyte, FIC, Asus, Biostar, и GVC, а доступно и того меньше.

Есть информация, что ASUS и FIC работают в настоящий момент над созданием собственно, четырехслойного дизайна, однако, ждать плодов их творчества следует еще не скоро.

Нам удалось раздобыть образцы только двух плат под AMD Athlon — MSI MS-6167 и Gigabyte GA-7IX. Говорят, что уже доступны еще две платы — FIC SD11 и GVC QS750, однако нам их в продаже найти не удалось. Что же касается найденных нами образцов от MSI и Gigabyte, то они выполнены на основе дизайна Fester: MSI подошла к вопросу бесхитростно и просто повторила референс-дизайн. Gigabyte же подошел к делу более творчески и внес отдельные косметические изменения. Однако все равно в результате мы имеем две платы, похожие как капли воды.


Microstar MS-6167

Gigabyte GA-7IX

Обе платы выполнены в ATX-формате, основаны на чипсете AMD 750, поддерживают процессоры со скоростями до гигагерца и имеют по 5 слотов PCI, 2 — ISA, 1 — AGP и по три разъема под DIMM. Естественно, имеется поддержка UltraDMA/66. Системный мониторинг также присутствует и реализован контроллером W83782D. Единственные видимые отличия есть только в BIOS Setup — MS-6167 имеет большее число настроек для работы с памятью. Setup же 7IX более понятен для неискушенного пользователя.

Что касается скоростей работы обоих плат — то они практически идентичны и рассмотрение их различия не заслуживает внимания. Думается, наиболее логичным шагом в настоящий момент будет немного подождать выхода системных плат и от других фирм, которые занимались редизайном Fester. Эти платы как могут быть более скоростными, так и наделены новыми возможностями, например, опциями для беспрепятственного разгона Athlon.

Выводы

Пора подводить итоги. AMD Athlon является на сегодня самым быстрым x86-процессором с передовой архитектурой, что подтверждают наши тесты. Intel сейчас ничего не может противопоставить успеху AMD - архитектура Katmai практически исчерпала свои возможности, в то время как AMD может беспрепятственно увеличивать частоты своих кристаллов. Переход Intel на технологию 0.18 мкм вряд ли надолго сможет решить проблему: завод AMD в Дрездене, который будет выпускать Athlon по аналогичной технологии, но с применением медных проводников находится уже практически на стадии запуска. Кроме того, без изменения архитектуры ядра Intel неоткуда почерпнуть дополнительного прироста быстродействия, потому вся надежда микропроцессорного гиганта должна возлагаться на Willamette, который, впрочем, выйдет не очень скоро.

Короче, AMD имеет все шансы утереть нос Intel и не только поправить свое пошатнувшееся материальное положение, но и отодвинуть Intel на второй план. Для этого только лишь и надо, что удовлетворить спрос на Athlon и системные платы для него. Однако, сделать это, не имея больших производственных мощностей, будет не очень просто.

В результате ситуация может повернуться как в пользу AMD, так и против нее. А нам остается только ждать, смотреть и искренне надеяться, что справедливость восторжествует.

Процессор AMD Athlon 600 предоставлен фирмой CHI, тел. (095)158-6816
Системная плата MSI Ms-6167 предоставлена фирмой Инел
Системная плата Gigabyte GA-7IX предоставлена фирмой Формоза
Процессор Intel Pentium III 600 предоставлен интернет-магазином www.dostavka.ru