Тестирование гигабитных сетевых адаптеров на платформе TYAN Trinity GC-SL

Часть первая: 32bit PCI интерфейс


Подчасть 2: производительность адаптеров, загрузка процессора и PI

Результаты разбиты на два раздела. В первом сведены диаграммы усредненной максимальной скорости работы адаптеров, загрузки процессора в этот момент и индекса производительности PI. Во втором — исследование работы адаптеров при изменении размера передаваемого блока данных на разных MTU (с помощью программы NetPIPE, Linux).

Во время тестирования снимался показатель усредненной максимальной пропускной способности адаптера за заданный период времени. И, если это позволяла программа, загрузка процессора в этот период. Но, так как по отдельности показатели пропусной способности адаптера и загрузки процессора противоположны по своим значениям (кому нужна скорость гигабит, если в этот момент процессор будет загружен на 100% ?), пришла мысль объединить эти два показателя в одной формуле.

Казалось бы, формула, отражающая оценку производительности карты, очевидна — достаточно разделить скорость передачи на загруженность процессора, но все оказалось несколько сложнее. К примеру, пропускная способность карты не превышает 100Мбит (это на гигабитном то адаптере!), а загрузка процессора, соответственно, невысокая — Скажем, 5%. Путем простого деления получается, что такой гигабитный адаптер будет иметь очень высокий индекс, но такой показатель будет далек от реальности. Поэтому мы, совместно с Алексеем Кузнецовым, за что ему отдельное спасибо, ввели понятие «условного индекса» (Relative Index, RI) и полученные результаты умножали на соотношение реальной скорости передачи карты к пиковой.

Итого, индекс производительности (Perfomance Index, PI) рассчитывается следующим образом:

PI = T/C * T/1000, где

  • T — полученная в тесте максимальная скорость, в мегабитах
  • C — полученная в тесте загрузка процессора, в процентах
  • 1000 — максимальная теоретическая скорость адаптера, в мегабитах



Результаты NTTTCP, Windows

Первыми идут результаты тестирования в NTTTCP. Вынужден отметить, что в данном случае тест NTTTCP меня разочаровал — в большинстве случаев результаты, полученные в нем, были ниже, чем в других тестах и никакие попытки не приводили к стабильному их увеличению. Видимо в следующий раз тест уже не будет использоваться.

максимальная скорость адаптеров при разном размере Jumbo-фреймов

загрузка процессора при тестировании адаптеров на разных размерах Jumbo-фреймов

индекс производительности адаптеров на разных размерах Jumbo-фреймов, наиболее показательная диаграмма для NTTTCP

Результаты большинства адаптеров близки. Разочаровывает низкая скорость TRENDnet TEG-PCITX2 (старая, двухчиповая модель) и крайне низкая скорость CNet ProG2000L на чипе RTL8169. На CNet ProG2000L стоит отметить очень высокую загрузку процессора, особенно при отключенных Jumbo кадрах. Это характерно для любых картах на чипах от Realtek, но в данном случае еще и скорость очень низкая! Так же очень высокая загрузка процессора при отключенных Jumbo у карты D-Link DGE-510T.

Впрочем, все вышенаписанное хорошо видно на сводной диаграмме индекса производительности. 3Com, середнячек на отключенных Jumbo-фреймах, показывает очень высокие результаты на Jumbo размером 6000 и 9000. Так же стоит отметить стабильно высокие (и близкие друг к другу) результаты у адаптеров от SysKonnect. Аутсайдер — карта на чипе Realtek, ее индекс вообще ниже нуля.

Результаты Iperf, Windows

Следующими идут результаты по производительности адаптеров под Iperf. К сожалению, программа не снимает загрузку процессора, поэтому диаграмм про загрузке процессора и PI-индеку нет.

максимальная скорость адаптеров при разном размере Jumbo-фреймов на Iperf

Результаты конгруэнтны NTTTCP, только чуть выше. Все выводы по NTTTCP можно применить и к Iperf.



Результаты NetIQ Chariot, Windows

Тест позволяет снимать как показатели пропускной способности адаптера, так и загрузку процессора в этот момент. Поэтому для данного теста приведены все три диаграммы, включая диаграмму по Perfomance Index.

максимальная скорость адаптеров при разном размере Jumbo-фреймов, NetIQ Chariot

загрузка процессора при тестировании адаптеров на разных размерах Jumbo-фреймов, NetIQ Chariot

индекс производительности адаптеров на разных размерах Jumbo-фреймов, наиболее показательная диаграмма для NetIQ Chariot

Опять таки, результаты и выводы подобны тесту NTTTCP. При включенных Jumbo, адаптер от 3Com показывает скорость чуть выше, чем другие, но и сильнее загружает процессор. Странно, но факт — при размере кадра в 3000 байт, адаптер от 3Com показывает очень высокую скорость и относительно слабо загружает процессор, поэтому лидирует по индексу PI. Но уже на кадрах размером 6000 и выше, загрузка процессора при его работе сильно возрастает (а скорость возрастает незначительно), поэтому в большинстве тестов с включенными Jumbo он немного уступает идущим плотной группой адаптерам от SysKonnect. Кстати, последние выигрывают и на кадрах размером 1500 байт (т.е. отключенных Jumbo фреймах). Правда последнее не сильно интересно, так как я пока не слышал о материнских платах, куда интегрируют гигабитные контроллеры, используемые в адаптерах SysKonnect.

Результаты NetIQ Chariot, Linux

В прошлое тестирование результаты под Windows и Linux сильно друг от друга отличались. Посмотрим, что нас ждет в этом тестировании.

максимальная скорость адаптеров при разном размере Jumbo-фреймов, NetIQ Chariot

загрузка процессора при тестировании адаптеров на разных размерах Jumbo-фреймов, NetIQ Chariot

индекс производительности адаптеров на разных размерах Jumbo-фреймов, наиболее показательная диаграмма для NetIQ Chariot

К сожалению, в случае адаптеров CNet ProG2000L чуда не произошло. Скорость их осталось на чрезвычайно низком уровне (хоть и стала выше по сравнению с Windows). А при включенных Jumbo-фреймах, как уже было сказано выше, их протестировать не удалось.

Почему то в этом тестировании старая двухчиповая версия адаптера от Trendnet (TRENDnet TEG-PCITX2) упорно показывает крайне низкие результаты. В прошлом тестировании они были намного выше. Возможно, это какая то локальная несовместимость с материнской платой?

Лидером по PI в этот раз стал адаптер 3Com 3C996B-T на драйвере bcm5700 (на драйвере tg3 его скорость практически таже, но загрузка процессора в два раза выше). Так же неплохо показывают себя D-Link DGE-510T и ZyXEL Omni Lan PCI G1 (вот только у драйвера последнего адаптера большие проблемы со стабильностью). Адаптеры SysKonnet, опять идущие плотной группой, держат твердую середину.

Результаты пиковой производительности в NetPIPE, Linux

Утилита NetPIPE гоняет трафик, постоянно увеличивая размер передаваемого пакета информации. Таким образом она позволяет узнать узкие места, где у адаптера могут случится провалы производительности. В результате мы можем оценить пиковую скорость адаптера (обычно на больших размерах пакетов) и график изменения скорости на всем промежутке от пакетов минимального размера, до максимального.

пиковая скорость адаптеров при разном размере Jumbo-фреймов, NetPIPE

Большинство адаптеров (исключая CNet ProG2000L, ZyXEL Omni Lan PCI G1 и TRENDnet TEG-PCITX2) показывают высокую пиковую скорость.

 

Навигация:

 

 




Дополнительно

Тестирование гигабитных сетевых адаптеров на платформе TYAN Trinity GC-SL. Часть первая: 32bit PCI интерфейс

Тестирование гигабитных сетевых адаптеров на платформе TYAN Trinity GC-SL

Часть первая: 32bit PCI интерфейс

Подчасть 2: производительность адаптеров, загрузка процессора и PI

Результаты разбиты на два раздела. В первом сведены диаграммы усредненной максимальной скорости работы адаптеров, загрузки процессора в этот момент и индекса производительности PI. Во втором — исследование работы адаптеров при изменении размера передаваемого блока данных на разных MTU (с помощью программы NetPIPE, Linux).

Во время тестирования снимался показатель усредненной максимальной пропускной способности адаптера за заданный период времени. И, если это позволяла программа, загрузка процессора в этот период. Но, так как по отдельности показатели пропусной способности адаптера и загрузки процессора противоположны по своим значениям (кому нужна скорость гигабит, если в этот момент процессор будет загружен на 100% ?), пришла мысль объединить эти два показателя в одной формуле.

Казалось бы, формула, отражающая оценку производительности карты, очевидна — достаточно разделить скорость передачи на загруженность процессора, но все оказалось несколько сложнее. К примеру, пропускная способность карты не превышает 100Мбит (это на гигабитном то адаптере!), а загрузка процессора, соответственно, невысокая — Скажем, 5%. Путем простого деления получается, что такой гигабитный адаптер будет иметь очень высокий индекс, но такой показатель будет далек от реальности. Поэтому мы, совместно с Алексеем Кузнецовым, за что ему отдельное спасибо, ввели понятие «условного индекса» (Relative Index, RI) и полученные результаты умножали на соотношение реальной скорости передачи карты к пиковой.

Итого, индекс производительности (Perfomance Index, PI) рассчитывается следующим образом:

PI = T/C * T/1000, где

  • T — полученная в тесте максимальная скорость, в мегабитах
  • C — полученная в тесте загрузка процессора, в процентах
  • 1000 — максимальная теоретическая скорость адаптера, в мегабитах



Результаты NTTTCP, Windows

Первыми идут результаты тестирования в NTTTCP. Вынужден отметить, что в данном случае тест NTTTCP меня разочаровал — в большинстве случаев результаты, полученные в нем, были ниже, чем в других тестах и никакие попытки не приводили к стабильному их увеличению. Видимо в следующий раз тест уже не будет использоваться.

максимальная скорость адаптеров при разном размере Jumbo-фреймов

загрузка процессора при тестировании адаптеров на разных размерах Jumbo-фреймов

индекс производительности адаптеров на разных размерах Jumbo-фреймов, наиболее показательная диаграмма для NTTTCP

Результаты большинства адаптеров близки. Разочаровывает низкая скорость TRENDnet TEG-PCITX2 (старая, двухчиповая модель) и крайне низкая скорость CNet ProG2000L на чипе RTL8169. На CNet ProG2000L стоит отметить очень высокую загрузку процессора, особенно при отключенных Jumbo кадрах. Это характерно для любых картах на чипах от Realtek, но в данном случае еще и скорость очень низкая! Так же очень высокая загрузка процессора при отключенных Jumbo у карты D-Link DGE-510T.

Впрочем, все вышенаписанное хорошо видно на сводной диаграмме индекса производительности. 3Com, середнячек на отключенных Jumbo-фреймах, показывает очень высокие результаты на Jumbo размером 6000 и 9000. Так же стоит отметить стабильно высокие (и близкие друг к другу) результаты у адаптеров от SysKonnect. Аутсайдер — карта на чипе Realtek, ее индекс вообще ниже нуля.

Результаты Iperf, Windows

Следующими идут результаты по производительности адаптеров под Iperf. К сожалению, программа не снимает загрузку процессора, поэтому диаграмм про загрузке процессора и PI-индеку нет.

максимальная скорость адаптеров при разном размере Jumbo-фреймов на Iperf

Результаты конгруэнтны NTTTCP, только чуть выше. Все выводы по NTTTCP можно применить и к Iperf.



Результаты NetIQ Chariot, Windows

Тест позволяет снимать как показатели пропускной способности адаптера, так и загрузку процессора в этот момент. Поэтому для данного теста приведены все три диаграммы, включая диаграмму по Perfomance Index.

максимальная скорость адаптеров при разном размере Jumbo-фреймов, NetIQ Chariot

загрузка процессора при тестировании адаптеров на разных размерах Jumbo-фреймов, NetIQ Chariot

индекс производительности адаптеров на разных размерах Jumbo-фреймов, наиболее показательная диаграмма для NetIQ Chariot

Опять таки, результаты и выводы подобны тесту NTTTCP. При включенных Jumbo, адаптер от 3Com показывает скорость чуть выше, чем другие, но и сильнее загружает процессор. Странно, но факт — при размере кадра в 3000 байт, адаптер от 3Com показывает очень высокую скорость и относительно слабо загружает процессор, поэтому лидирует по индексу PI. Но уже на кадрах размером 6000 и выше, загрузка процессора при его работе сильно возрастает (а скорость возрастает незначительно), поэтому в большинстве тестов с включенными Jumbo он немного уступает идущим плотной группой адаптерам от SysKonnect. Кстати, последние выигрывают и на кадрах размером 1500 байт (т.е. отключенных Jumbo фреймах). Правда последнее не сильно интересно, так как я пока не слышал о материнских платах, куда интегрируют гигабитные контроллеры, используемые в адаптерах SysKonnect.

Результаты NetIQ Chariot, Linux

В прошлое тестирование результаты под Windows и Linux сильно друг от друга отличались. Посмотрим, что нас ждет в этом тестировании.

максимальная скорость адаптеров при разном размере Jumbo-фреймов, NetIQ Chariot

загрузка процессора при тестировании адаптеров на разных размерах Jumbo-фреймов, NetIQ Chariot

индекс производительности адаптеров на разных размерах Jumbo-фреймов, наиболее показательная диаграмма для NetIQ Chariot

К сожалению, в случае адаптеров CNet ProG2000L чуда не произошло. Скорость их осталось на чрезвычайно низком уровне (хоть и стала выше по сравнению с Windows). А при включенных Jumbo-фреймах, как уже было сказано выше, их протестировать не удалось.

Почему то в этом тестировании старая двухчиповая версия адаптера от Trendnet (TRENDnet TEG-PCITX2) упорно показывает крайне низкие результаты. В прошлом тестировании они были намного выше. Возможно, это какая то локальная несовместимость с материнской платой?

Лидером по PI в этот раз стал адаптер 3Com 3C996B-T на драйвере bcm5700 (на драйвере tg3 его скорость практически таже, но загрузка процессора в два раза выше). Так же неплохо показывают себя D-Link DGE-510T и ZyXEL Omni Lan PCI G1 (вот только у драйвера последнего адаптера большие проблемы со стабильностью). Адаптеры SysKonnet, опять идущие плотной группой, держат твердую середину.

Результаты пиковой производительности в NetPIPE, Linux

Утилита NetPIPE гоняет трафик, постоянно увеличивая размер передаваемого пакета информации. Таким образом она позволяет узнать узкие места, где у адаптера могут случится провалы производительности. В результате мы можем оценить пиковую скорость адаптера (обычно на больших размерах пакетов) и график изменения скорости на всем промежутке от пакетов минимального размера, до максимального.

пиковая скорость адаптеров при разном размере Jumbo-фреймов, NetPIPE

Большинство адаптеров (исключая CNet ProG2000L, ZyXEL Omni Lan PCI G1 и TRENDnet TEG-PCITX2) показывают высокую пиковую скорость.

 

Навигация: