Методика сравнительного тестирования кулеров

теоретические и практические вопросы


Совершенно естественно, что многие из вас, наши дорогие читатели, решая вопрос о покупке кулера, обращаются за помощью, советом или же просто информацией о конкретном изделии не только к закадычным друзьям-приятелям, но и к многочисленным "железячным" интернет-ресурсам. Благо, в Сети за последние год-два тематика охлаждения компьютеров выдвинулась на самые передовые рубежи, и обзоры тех или иных кулеров можно отыскать чуть ли не в каждом веб-уголке. Не буду скрывать, некоторые из этих публикаций зачастую оказываются достаточно интересными и информативными. Но есть один нюанс, который я не в силах оставить незамеченным: подавляющее большинство моих коллег очень несерьезно относятся к практике тестирования кулеров. В итоге, публикуя результаты некорректно поставленного эксперимента, они вводят в заблуждение не только сами себя, но и своих читателей.

Располагая емким багажом теоретических и практических изысканий, мы разработали собственную методику тестирования кулеров, которая позволяет давать достаточно объективную сравнительную оценку их эффективности. В недавнем обзоре были затронуты некоторые вопросы общего подхода и самой методики. Теперь мы вновь вернемся к рассмотрению этой темы, но уже более подробно. Итак, приступим!

Исходные предпосылки

Существует количественная характеристика теплообменных процессов между поверхностью какого-либо тела и окружающей средой - коэффициент теплоотдачи a (Вт/м²К). Коэффициент теплоотдачи является коэффициентом пропорциональности в законе Ньютона для теплоотдачи:

q = aDT,

где q — плотность теплового потока (Вт/м²), а DT — перепад температур между поверхностью тела и окружающей средой.

Коэффициент теплоотдачи характеризует интенсивность теплообмена: при малых значениях (затрудненный теплообмен) температура поверхности тела существенно превышает температуру окружающей среды, при высоких значениях (усиленный теплообмен) температура поверхности незначительно отличается от температуры окружающей среды. Следует отметить, что коэффициент теплоотдачи не является, строго говоря, физической характеристикой тела, а определяется его конструктивными параметрами и параметрами окружающей среды. В инженерной практике использование коэффициента теплоотдачи не всегда оправдано (особенно в сложных теплообменных системах, одним из частных примеров которых является самый обыкновенный процессорный кулер), поэтому чаще применяют обратную величину — термическое сопротивление q (м²К/Вт).

В данном случае речь идет о внешнем термическом сопротивлении, характеризующем теплообменные процессы в так называемом пограничном слое. Когда же необходимо охарактеризовать теплообменнные процессы внутри тела, вводится понятие внутреннего термического сопротивления, которое определяется конструктивными параметрами тела и теплопроводностью материала. Сумма двух вышеуказанных характеристик образует полное термическое сопротивление (назовем его просто термосопротивлением) — одну из главнейших характеристик любой теплообменной системы.

Многие производители кулеров в качестве одной из основных технических характеристик своих изделий указывают именно термосопротивление (забугорной единицей измерения является °C/W). Казалось бы, зачем весь этот сыр-бор: количественная характеристика уже имеется, а арифметический расчет температуры не составит большого труда?! Тут я не могу удержаться и имею полное право употребить коронную фразу: "На самом деле не все так просто!" ;-)

Во-первых, нет унифицированного подхода к экспериментальной оценке термосопротивления. Часть производителей указывают термосопротивление "чисто" кулера (qса — theta case to ambient), определяющее температуру поверхности процессорного кристалла. Другие же указывают термосопротивление системы процессор-кулер (q — theta junction to ambient), которое определяет уже температуру процессорного ядра. В результате получается ничем не обоснованная путаница. К тому же выудить у производителя информацию о том, какое именно термосопротивление указано, порой чрезвычайно трудно.

Во-вторых, некоторые, откровенно говоря, бессовестные производители указывают просто-напросто расчетные значения термосопротивлений, которые оказываются меньше реальных в два, а то и в три раза!

В-третьих, в силу ряда физических эффектов (эффект сопротивления растеканию — наиболее существенный из них), которые наблюдаются при площади теплового источника (процессорного кристалла), много меньшей площади подошвы радиатора, реальное термосопротивление кулера увеличивается, как минимум, в полтора раза. Конфигурации тестовых симуляторов, используемых некоторыми производителями, совершенно не учитывают подобные явления.

В конечном итоге мы получаем, скажем прямо, полную белиберду с характеристиками кулеров, публикуемыми производителями, и приходим к необходимости проведения собственного расследования их эффективности. Для выяснения всех обстоятельств дела нам нужно найти ответ на несколько вопросов:

  • Что и чем измерять?
  • Как измерять?
  • И, наконец, как отделить зерна от плевел, иначе говоря, определить достоверный результат?

Как раз этим мы сейчас и займемся.

Выбор тестовой платформы

Интуитивно понятно, что первичным результатом нашего исследования должна быть температура. Но температура чего? Давайте разберемся!

Как уже было сказано выше, в инженерной практике принято характеризовать системы охлаждения микроэлектронных устройств одним из двух параметров: термосопротивлением qса или q (а иногда и сразу двумя). Замечу, что оба этих параметра, в приложении их к процессорным кулерам, являются сами по себе составными (суммой нескольких более детализированных термосопротивлений), но мы пока выпустим этот факт из рассмотрения. При известной температуре окружающей среды и рассеиваемой мощности для экспериментального определения первого параметра необходимо найти температуру поверхности охлаждаемого устройства, а для определения второго параметра — некую внутреннюю температуру устройства. В нашем случае это будет температура поверхности процессорного кристалла и температура процессорного ядра, соответственно.

С температурами определились. Как же теперь их измерить? Есть два пути конструирования тестовой платформы. Первый — симулировать тепловую нагрузку процессора нагревательным элементом (тестовый симулятор). Второй — использовать собственно сам процессор (компьютерный стенд).

По первому пути следуют немногочисленные, наиболее "продвинутые" производители кулеров, а также научно-исследовательские лаборатории. Тестовый симулятор состоит из прототипа материнской платы с вмонтированным в сокет нагревательным элементом (транзисторы, пленочный элемент и т.п.), комплекта контактных пластин (hot plate) и комплекта контрольно-измерительной аппаратуры.


Иллюстрация предоставлена Asia Vital Components Co.

Неоспоримым достоинством подобного способа температурных измерений является высокая точность и корректность экспериментальных результатов. Гибко варьируя тепловую нагрузку и конфигурацию контактных пластин, можно найти достаточно точные значения термосопротивлений, как говорится, на все случаи жизни. К сожалению, даже при технически относительно примитивной, но в тоже время корректной в исследовательском плане конфигурации симулятора, его стоимость исчисляется не одной тысячей долларов. А при использовании высокоточной контрольно-измерительной аппаратуры стоимость такого стенда увеличивается уже на порядок.

Второй путь предоставляет большую свободу выбора и намного легче в финансовом плане. Есть платформа Intel, есть платформа AMD, есть, наконец, самые разнообразные цифровые термометры, если возможности температурного мониторинга материнских плат по каким-либо причинам вас не устраивают. Просто глаза разбегаются! ;-) Однако, несмотря на широчайший ассортимент, правильный выбор только один. Какой? Давайте проясним этот момент!

На некоторых зарубежных сайтах для температурных измерений применяют цифровые термометры, используя в качестве температурного пробника термопары Т-типа или К-типа (наиболее популярен термометр Omega HH23). Ребята уверяют своих читателей в хорошей точности и непогрешимости своих температурных измерений. Так ли это на самом деле? Позволю себе несколько критических замечаний:

1. Температурная характеристика термопары (зависимость контактной термо-э.д.с от разности температур контактов), вообще говоря, нелинейная. В широко распространенных цифровых термометрах система линеаризации этой характеристики отсутствует. Поэтому о корректном сравнительном анализе температур говорить не приходится.

2. Для измерения термопарой абсолютной температуры требуется температурный эталон. В цифровых термометрах применяются схемы аппаратной компенсации эталонного контакта. В относительно простых термометрах такие схемы реализованы не на должном уровне.

3. Термопары требуют калибровки. Термопары, входящие в стандартный комплект поставки термометров не откалиброваны. Для последующей более или менее точной калибровки требуются дополнительные устройства, типа портативных калибраторов. Для точной калибровки требуются уже весьма сложные и дорогие калибраторы с применением естественных температурных эталонов. Еще один негативный момент: даже если термопара отлично откалибрована, с течением времени под воздействием внешних негативных факторов (повышенная влажность, коррозия, механические микроповреждения спая и т.п.) происходит ее раскалибровка, что приводит к серьезным отклонениям показаний прибора от истинных значений температуры.

4. Для температурных измерений с помощью термопары требуется "хирургическое вмешательство" в радиатор (минижелоба или сквозные отверстия в подошве радиатора, куда собственно и помещается термопара). Это приводит к нарушению естественного температурного поля в системе процессор-кулер, а значит и к искажению результатов.

5. Невозможно обеспечить контакт термопары и радиатора без тепловых потерь. Неизбежно появление дополнительного контактного термосопротивления и, соответственно, искажение результатов, особенно при установке термопары в сквозные отверстия в подошве радиатора.

Приведен далеко не полный список трудностей, возникающих при использовании термопар. Но и этого вполне достаточно, чтобы пока отложить термопару в сторону.

Переходим теперь к платформе AMD. Очень часто в зарубежных публикациях (да и в некоторых отечественных тоже) встречаются, с позволения сказать, температурные тесты, которые основываются на показаниях термисторного пробника, смонтированного в сокет материнской платы. Такие "тесты" не имеют никакого морального права на существование. На этот счет хочу употребить почти библейскую фразу: "… ибо не ведают, что творят!" (начало фразы опускаю из этических соображений). Не исправляет плачевное положение и применение внешних термисторных пробников вместо термопары.

Почему все так плохо? Вот ответы:

1. Температурная характеристика термистора (зависимость сопротивления термистора от температуры) сильно нелинейная. Это приводит к серьезным искажениям результатов (искажения, кстати, увеличиваются с возрастанием температуры). Ни о каком сравнительном анализе результатов при этом не может идти и речи.

2. Как и в случае с термопарой (если монтировать термистор в "искалеченном" радиаторе) неизбежно появление контактного термосопротивления, что приводит к дополнительному искажению результата.

3. Когда термистор смонтирован в сокете, результаты, полученные с его помощью очень слабо связаны с температурой ядра и тем более с температурой поверхности процессорного кристалла. Полученные результаты отражают характер только лишь вторичного теплового потока (ядро-нижняя часть процессорного корпуса-сокет) и не позволяют судить о первичном тепловом потоке (ядро-поверхность кристалла-кулер). Особенно показателен случай, когда термистор даже не касается процессорного корпуса. Такие измерения сродни гаданию на кофейной гуще и, строго говоря, не имеют никакого отношения к исследовательской практике.

Ну, с термисторами вроде все ясно: полный капут, ни больше, ни меньше. В нашей исследовательской практике им не место! Остается платформа Intel. Как с ней-то дела обстоят, с точки зрения температурных измерений?

Думаю, всем известен тот факт, что, начиная с Pentium II и Celeron, Intel оборудует свои процессоры так называемым термодиодом, предназначенным для измерения температуры ядра (на самом деле никакой это не диод, а транзистор в диодном включении, расположенный в районе блока I/O процессора). В Сети бытует мнение, что результаты измерений, проведенных с помощью этого "диода" не точны и не пригодны в исследовательской практике. Так ли это? Нет, и еще раз нет!

Измерения температуры с помощью термодиода являются по своей сути дифференциальными. На практике используют соотношение, связывающее разность между напряжениями на переходе при быстром переключении диода из цепи с током N*I в цепь с током I

DV = (nkT/q)*ln N,

где DV — разность напряжений, n — фактор идеализации (non_ideality factor), k -постоянная Больцмана, q — заряд электрона. Так как n, k, q, N — константы, получаем совершенно линейную зависимость разности напряжений от температуры.

В "железе" это реализуется обычно таким вот образом.


Схематика температурного мониторинга Analog Devices, Inc.

Термодиод переключается между хорошо стабилизированными источниками тока N*I и I, результирующий сигнал проходит через фильтрующий конденсатор C1, далее проходит через дополнительный фильтр нижних частот и после этого поступает на вход усилителя для последующей передачи на вход АЦП. После АЦП (перед управляющей логикой и регистрами данных) может быть включен дополнительный цифровой фильтр, усредняющий результаты от 8 до 16 измерений. Внутри микросхемы в цепь термодиода включен также дополнительный диод для предотвращения проникновения шумовых сигналов с "земли".

Подобная схемная реализация практически полностью исключает влияние высокочастотных шумов, которые являются основным источником искажения сигнала. В результате ошибка измерений получается "односторонней" и постоянной: искажение от +1 °С до +4 °С привносит фактор идеализации, который отражает несколько большую величину ТКН (температурного коэффициента напряжения) у реального диода, чем ТКН идеализированного диода. Дополнительное искажение от +0.5 °С до +3 °С привносит активное сопротивление линий связи процессора и микросхемы мониторинга.

Да, измерение температуры ядра термодиодом является, строго говоря, неточным (систематическая ошибка до +7 °С). Но посмотрите, какой благоприятной для нас оказывается эта ошибка измерений! Во-первых, она постоянна, значит, открыта дорога к корректному сравнительному анализу результатов. И, во-вторых, получаемые значения температуры практически равны температуре самой горячей точки процессорного ядра (хотя Intel указывает в спецификациях величину junction offset до +4 °С, на самом деле, она занижена примерно в два раза). Как говорится, убили сразу двух зайцев: получаем корректный результат, причем достаточно близкий к максимальной температуре самой горячей точки процессорного ядра!

Вот и вся апологетика использования платформы Intel в качестве тестовой. Пока ей альтернативы нет. Но, когда получит распространение очередной процессор от AMD (Palomino), оборудованный термодиодом, тестовая платформа на его основе обязательно будет использоваться наряду с платформой Intel.

Ну, что же, рассмотрим теперь методику проведения тестовых испытаний.

Постановка эксперимента и обработка результатов

Нами используется два тестовых режима: "типичная пользовательская среда" и "CPUBurn". Типичная пользовательская среда — это некая усредненная модель "обыкновенного" поведения пользователя. Модель строится на программе, время от времени запускающей/закрывающей офисные и мультимедийные приложения. Поддерживается до 9 одновременно работающих задач. Один "заход" теста длится не менее 10 часов. В течение одного-двух "заходов" температура внешней среды поддерживается постоянной. Последующие пары "заходов" сопровождаются постепенным увеличением внешней температуры в среднем на 2 °С (в пределах от 28 °С до 40 °С).

CPUBurn — модель экстремальной тепловой нагрузки на процессор. Основывается на пакете утилит CPUBurn. Входящие в комплект утилиты burnp6 и burnmmx достаточно хорошо зарекомендовали себя и могут поспорить по величине генерируемой тепловой мощности даже со специализированной утилитой HIPWR от Intel. Методика проведения тестов аналогична первому тестовому режиму.

Обработка результатов тестов — вещь в нашем деле просто необходимая. Вот как она осуществляется для двух вышеупомянутых тестовых режимов:

CPUBurn. По совокупности результатов одного тестового "захода" рассчитывается среднее арифметическое значение, СКО (среднее квадратическое отклонение) результата и СКО среднего арифметического значения. Далее исключаются грубые погрешности измерений (по критерию Шарлье) и производится повторный расчет среднего арифметического и его СКО. Определяется доверительный интервал и выбирается максимальное значение из этого интервала. Все указанные манипуляции производятся над результатами остальных тестовых "заходов". Итогом является усреднение по совокупности максимальных достоверных результатов каждого теста (комплексный результат). На финальной стадии производится округление комплексного результата до целого в большую сторону.

Типичная пользовательская среда. Так как измеряемую температуру в течение этого теста нельзя даже условно считать постоянной, обработка результатов существенно упрощена. Для каждого тестового "захода" рассчитывается среднее арифметическое значение. Полученная совокупность результатов вновь усредняется. Итогом является некая средняя температура, которая вероятно преобладает во время типичной пользовательской активности (опять же, называем полученное значение комплексным результатом и округляем до целого в большую сторону).

В дальнейшем все комплексные результаты тестов сводятся в одну диаграмму, которая и публикуется в обзоре.

Заключение

Наша методика ни в коем случае не претендует на оригинальность и безупречность. Тем не менее, она основывается на прочной теоретической и практической базе, что и позволяет получать достоверные результаты и объективно сравнивать эффективность кулеров. Конечно, есть и недостатки: с нашими аппаратными средствами пока невозможно точно определить индивидуальную количественную характеристику кулеров — термическое сопротивление q (ввиду сложности процедуры измерения потребляемой процессором мощности). Однако в этом направлении ведутся изыскания, и с привлечением дополнительных аппаратных средств мы сможем порадовать вас не только достоверными значениями температур, но и экспериментально полученными значениями термосопротивлений. А пока ждем критических замечаний ;-)




Дополнительно