Азбука сисадмина 1: Алгоритм решения аппаратных проблем с ПК

Для начинающих администраторов малых ЛВС
1. Всё может сломаться
2. Всё, что может сломаться,
когда-нибудь ломается

Мёрфи


Некоторым людям платят деньги за то, чтобы компьютеры ломались реже и, если всё же сломаются, скорее возвращались в рабочее состояние. Обычно в небольших организациях их называют системными администраторами или запросто «кампутарщиками». И если в составе информационно-технического отдела (ИТО) системный администратор обычно занимается несколько другими делами, то когда он един в трёх ипостасях в малой сети, то надо и «железные» проблемы решать. Три ипостаси таковы:

  1. Основа всего — работающее оборудование, поэтому главный в ИТО тот, кто отвечает за аппаратное обеспечение («жестянщик»). Им читать эту статью бесполезно — тот, кто родился с отвёрткой вместо одного из пальцев, всосал тайное знание, намного превосходящее изложенное здесь, вместе со специальной молочной смесью для технарей.
  2. В современном мире одинокий ПК, не включённый в сеть, даже дома становится нонсенсом. Поэтому главный в ИТО, конечно, тот, кто отвечает за локальную сеть и коммуникации с внешним миром («сетевик»). Чаще всего под системным администратором понимается именно он, и тот, кто по-английски зовётся server guy. Правильный сисадмин не имеет дел с пользователями, он их не видит, и сидит в башне из чистейшего силикона, что-то читает и изредка отвлекается на работу. Им, конечно, данный материал не нужен, и не только потому, что они всё это давно знают, но и потому, что для решения глупых проблем с железом есть специально обученные люди.
  3. Компьютеры, даже соединённые в сеть, могут только показывать знач0чки на рабочем столе. А запускают эти знач0чки — программы. Поэтому главный в ИТО — программист. Это единственная специальность, имеющая устоявшееся и чёткое название. Более того, программистами часто называют всех сотрудников ИТО. Тут и говорить не о чем — программисты самые главные. Хотя бы потому, что понять их логику даже остальные сотрудники отдела не способны, не говоря о простых юзерах. Им эта статья будет абсолютно бесполезна. При желании, они сделают любой алгоритм намного лучше набросков какого-то жестянщика. Но — программисты не решают аппаратных проблем.

Этим людям, вскормленным смесью силиконовой смазки, термопасты, железных опилок и кремниевого порошка, имеющим ладони в форме мышки и по десять пальцев на каждой руке, видящих в темноте буквы на клавиатуре, думающих машинным кодом и иногда управляющих системными процессами силой мысли — им эта статья НЕ посвящается. Но ведь не все такие, правда? Некоторые только хотят вырасти…

Проблемы с ПК возникают постоянно, и кто-то должен их решать, и не важно, как его называют. И это пособие для начинающих. Нижеизложенная информация будет не лишней для домашних пользователей, которые начинают задумываться об устройстве «сердца цифрового дома».

Несмотря на то, что все знают эти простые правила, изложенными по порядку и в одном месте они нам не попадались, и мы решили восполнить пробел — может, кому-то пригодится. Пять правил — это заголовки, они слегка расшифрованы в соответствующих главах, а будучи применены по порядку составляют алгоритм, являющийся темой статьи. Подразумевается, что проблемы в работе вызваны именно аппаратной составляющей.

Правило номер ноль: не трогай то, что работает!!!

Это должно сидеть в голове так же прочно, как ядро, нулевое кольцо операционной системы сидит на железе. Стоит, работает — не трогай!

Следствия таковы:

  • Не надо прошивать BIOS или микропрограмму, которые дают поддержку функций, которые, скорее всего, не будут использоваться
  • Не надо идти в сервисное меню монитора в целях, «как он будет работать, если поменять это значение». Возможно, он не захочет работать вовсе
  • Не надо ставить непонятно откуда взятую программу, которая непонятно что делает. Открывать вложения в письмах, пришедших неизвестно откуда. Ходить на сайты, которые раздают бесплатно программу для взлома пластиковых карт. И так далее
  • Не надо ставить пользователям краденый Фотошоп. Мало того, что они замучают вопросами «как в нём убрать прыщики и очки», так они ещё при проверке лицензионности ПО покажут на того, кто поставил программу. В составе приобретённой работодателем ОС есть бесплатный и простой фоторедактор
  • Никогда не надо производить эксперименты на «боевых» серверах и пользовательских машинах. Для того у админа есть его машина, желательно не та же, на которой выполняется каждодневная работа, а отдельная. Только при полной уверенности в совместимости и безопасности программу стоит внедрять в пользовательский пакет
  • Никогда не надо менять (усиливать) конфигурацию рабочей машины пользователя и даже сервера без веских причин. Например, вместо наращивания оперативной памяти и мощности процессора иногда достаточно прочистить «автостарт» и отобрать у не в меру продвинутого юзера права локального администратора
  • Надо постоянно пользоваться антивирусами, структурировать права доступа, как можно более надёжно защищать внешние подключения, осторожно относится к пришедшей извне информации
  • И так далее, и тому подобное, тема неисчерпаема...

И так далее, и вроде нормально, но беда пришла в дом, и в разгар составления годового отчёта в кабинет врывается главбух с квадратными глазами и криком, что ВСЁ ПРОПАЛО!!!…

Первое правило: прежде чем тревогу бить, надо комп перегрузить

Реинкарнация сжигает карму, это самый старый способ решения проблем в зародыше и самый эффективный. В смысле что на этом этапе отсеивается довольно много непонятных и не повторяемых причуд. А так как они не повторяемые, то и не стоит на них заостряться.

Проблемы надо решать по мере их поступления.

Это тот этап, который обязательно должен решаться на уровне пользователя. При обращении за технической поддержкой правильный вопрос не «Перезагружались?» а «Сколько раз?». По порядку план действий такой:

  • Завершить «зависшее» приложение средствами ОС
  • Прекратить проблемный процесс через диспетчер задач
  • Перезапустить сеанс пользователя
  • Перезагрузиться средствами ОС
  • Кнопка «Reset»
  • Обесточивание ПК не менее чем на 30 секунд

При включении и выключении электротехники (а ПК та же электротехника, только сложная) происходят переходные процессы. В этот момент параметры питания могут отклоняться от номинальных достаточно значительно, и большая часть поломок техники происходит именно тогда. Паузу между отключением и последующим запуском надо выдержать именно для того, чтобы переходные процессы, происходящие при обеих процедурах, не накладывались друг на друга с взаимным усилением.

По большому счёту, обычному пользователю не обязательно знать все тонкости, для него достаточно двух вариантов. Кнопка на «морде» через ACPI в BIOS и в ОС должна быть настроена на «завершение работы ОС». Первый вариант — нажать её. Второй вариант, очень серьёзный — обесточить ИБП (у нас ведь стоят индивидуальные ИБП на каждом ПК, n’est- pas? ;-)) «После этого надо дать отдохнуть компьютеру хотя бы минуту, так как всё уже тревожно». Это должен знать каждый.

При обращении в службу технической поддержки пользователь должен сказать, на каком этапе загрузки после полного обесточивания процесс стал протекать не так, как обычно. И мы чётко слышим, что всё грустно. И «выхода в массы» не избежать. Есть, конечно, технологии активного менеджмента клиентских ПК без физического к ним доступа, по сети, через отдельный поток сетевого адаптера и выделенную аппаратную партицию. Но пока они есть только там, где построен коммунизм в отдельно взятой корпорации, и начинающих админов работать туда не приглашают. А если и приглашают, то как падаванов более опытных товарищей, а любое практическое обучение на порядки превосходит по эффективности любое чтение.

Поэтому с тихой грустью убедившись в обоснованности жалоб юзера на основании телефонной беседы и невозможности удалённого доступа к ПК программными средствами, покидаем уютное место и топаем «в народ».

Да, я очень ленив.
Но именно это заставляет меня быть эффективным.

Шаг второй: пересунем все шланги

Этот этап частично можно реализовать на рабочем месте пользователя. Вынуть и вставить на место все провода, подходящие к задней части системного блока и монитора. Когда с ними возникают проблемы, они не обязательно лежат рядом на полу, внешне всё может выглядеть вполне пристойно.

Как известно, злейший враг техники — уборщица. Она может протирать пыль с компьютера, двигать его компоненты для протирки стола под ними или махнуть шваброй неподалёку (как ей показалось). Однако работает это обычно, если «чёрный экран». Не помогло. Этот шаг — трёхуровневый, и во втором уровне несем «процессор» к себе на стенд.

Принеся на стенд, стоит попробовать, не вскрывая корпуса, включить ещё раз. Так отсеиваются проблемы, возникающие по вине периферии (в общем случае монитор — это тоже периферия) и электропитания. Снова мимо.

Только теперь вскрываем системный блок. Если он опечатан, или не опечатан, но на гарантии — вскрывать ничего не надо, у нас достаточно уверенности в неисправности, чтобы обратиться к провайдеру гарантийных (или постгарантийных) услуг. Но если гарантия закончилась, и это наша зона ответственности, аутсорсинг в обслуживании техники не применяется — тогда вскрываем.

Информация правит миром

Первым делом на третьем уровне обращаем внимание на главный компонент ПК — жёсткий диск. Замену остальных запчастей с большей или меньшей вероятностью пользователь не заметит, но пропажи рабочих текстов или фотографий детей он не заметить не может. И даже необходимость по новой настраивать рабочее окружение способна привести его в уныние. Поэтому — убеждаемся в целостности информации путём подключения винчестера к заведомо рабочему и поддерживающему именно эти диски стенду. Всё в порядке — отлично, дальше просто рабочие моменты.

  • При правильном подходе к комплектации парка техники достаточно установить в другую аналогичную (резервную) машину этот диск и вернуть «починенный» рабочий инструмент пользователю
  • При отсутствии аналогов ещё не всё потеряно, современные ОС в некоторых пределах способны «переезжать» на другое железо
  • И если нет похожей конфигурации, то надо восстановить из мастер-образа на другом жёстком диске типовое окружение пользователя на основе совместимой с этим вариантом «железа» ОС (ссылка в предыдущем пункте), после чего перенести в новую инсталляцию данные пользователя
  • Вы никогда не задумывались об автоматизации процесса дистрибуции типового пользовательского окружения, поскольку и слов таких не знаете? И в таком случае не потеряете ничего, кроме своего времени и времени работника. Если не угробите его данные в процессе переноса. Аккуратно поставьте систему при помощи дистрибутива, настройте её, инсталлируйте драйвера и приложения и опять же перенесите на новую машину пользовательские данные

Процесс занимает от часа до рабочего дня, в зависимости от объёма данных и мощности конфигурации, а также не в последнюю очередь от отлаженности его алгоритма. По истечении этого времени простой работника в конторе прекращается, он получает обратно свою машину и работает дальше, как ни в чём не бывало.

Если диск повреждён, то надо оценить находящиеся на нём данные и вероятность их восстановления. Скорее, даже не вероятность, а стоимость, поскольку на рынке есть предложения по восстановлению информации в почти любых ситуациях, но такие услуги весьма недёшевы. Свои силы в этом лучше недооценить, чем переоценить, при малейшем сомнении надо обращаться к специалистам.

Правильный подход — хранение данных пользователей и программ на выделенном сервере с использованием механизмов устойчивости к сбоям и постоянным резервированием, лучше не в одно место, и лучше в территориально распределённые хранилища. Но для начинающего админа небольшой конторы такие рекомендации звучат бредово. Потому можно попытаться реализовать решения из серии «голь на выдумку хитра», но они к теме данного материала не относятся и будут рассмотрены в следующей статье.

Итак, третий уровень, если жёсткий диск исправен. Но не до того, как в этом убедились, хотя соблазн велик. Передёргиваем все кабели внутри системного блока. Как бы ни казались они прикипевшими к месту, именно вынимаем из разъёмов все кабели, и интерфейсов, и питания, и вставляем на место. Пытаемся включить. Всё работает — замечательно, возвращаем винчестер на место и проводим тесты под нагрузкой не менее часа. Если не сложилось… Переходим к следующему шагу.

Шаг третий: модульная диагностика и ремонт заменой

В общем случае для реализации этого шага необходимо иметь стенд, то есть набор исправных комплектующих, полностью совместимых с неисправной машиной. В самом неблагоприятном случае — похожую по конфигурации рабочую машину другого сотрудника. Поскольку придётся менять один за другим компоненты ПК на заведомо исправные для локализации проблемы.

Порядок действий описан многократно и повсеместно, но повторение — мать учения. Почему речь не идёт о звуковых сигналах POST? Да потому, что они позволяют однозначно определить источник проблем ещё на рабочем месте пользователя и к этому моменту уже не актуальны. То есть, услышав один длинный писк и три коротких следом или повторяющийся длинный можно на месте решить проблему. К тому же эти сигналы не одинаковы у различных BIOS и могут быть весьма информативны, а могут и запутать. Рассматривать их здесь бессмысленно, надо принимать во внимание конкретику — читать руководства к системным платам.

Итак, передёргивание кабелей не помогло, но всё уже здесь, под руками. Следующий этап — полная разборка, извлечение из корпуса системной платы и сборка на стенде. Именно так, и никак иначе! Поскольку источником проблемы может быть болтик под материнкой, который вдруг, после двух лет безупречной работы вздумал туда закатиться.

При отсутствии условий удобнее всего положить антистатический пакет, в котором куплена какая-нибудь деталь, на пачку офисной бумаги и на этой подставке начать сборку. Пока в своём сокете остаётся процессор, потому что его замена — самое сложное действие. В первый от процессора слот ставится единственная заведомо рабочая планка памяти, при отсутствии встроенного видеоадаптера устанавливается внешний, самый простой и также заведомо рабочий, к нему монитор. Также стоит попробовать установить внешний видеоадаптер если есть подозрения в неисправности встроенного. Подсоединяется исправный блок питания и клавиатура. Всё, больше ничего для старта BIOS не требуется. Старт. Нет эффекта — замена процессора. Не помогло — замена материнской платы. У нас получился полностью исправный комплект из компонентов, не имеющих отношения к исходной неисправной машине. Если не включается — значит, что-то вы делаете неправильно или сломали в процессе переборки, и самое время обратиться к специалисту и слегка загрустить…

В большинстве случаев на этом этапе выявляется неисправный компонент, либо в процессе оказывается, что это был отсроченный второй шаг, и после переустановки того же процессора всё заработало. Теперь всё просто — меняем виновника аварии на рабочий аналог и отдаём машину на рабочее место.

Если базовая платформа заработала, то к ней по одному добавляются: исходные память, блок питания, жёсткий диск, и так далее. По одному компоненту за раз и с обязательным запуском системы после каждого шага.

Есть некоторые визуальные признаки, которые помогают на четвёртом шаге локализовать неисправность.

  • Здравый смысл подскажет, что дым и копоть, и даже лёгкий запах палёного не свойственны исправному узлу
  • Всем известно о вздувшихся конденсаторах на материнских и видеоплатах — они обычно не работают
  • Если не крутится вентилятор, лучше сначала запустить его, а потом искать дальше
  • Странные звуки винчестер обычно не издаёт
  • Надеемся, система не была разогнана? Этот вопрос тоже лучше решить на рабочем столе пользователя

Четвёртый шаг: ремонт неисправных компонентов, для начинающих не актуален

Те, кто чинят неисправные модули ПК, подобных статей не читают, и поэтому четвёртый шаг, а именно ремонт с помощью паяльника или специальных утилит, тут рассматривать не будем.

Ещё раз повторю

  • Прежде чем приступать к какому-либо действию, надо чётко оценить свои силы и возможности, и при неуверенности обратиться к специалисту
  • Лучше недооценить свои силы, чем переоценить
  • Надо всегда принимать во внимание оценку неудачной попытки, как в денежном выражении, так и в категориях потраченного времени, причём не только своего, но и того, чья работа будет прервана из-за неисправности инструмента
  • И главное — чинить что-то квалифицированно всегда проще, если перед этим кто-то не пытался чинить эту вещь неквалифицированно

Далее поговорим о простых путях обеспечения сохранности пользовательских данных.

Данный материал можно и нужно критиковать в конференции, НО только предметно и конструктивно. По результатам обсуждения он может быть переработан и дополнен.

Продолжение следует…




27 июля 2007 Г.

1:

1.
2. , ,
-

̸


, , , . . - () , , . :

  1. — , , («»). — , , , , .
  2. , , . , , , (). , , - server guy. , , , - . , , , , , , .
  3. , , 0 . 0 — . — . , . , . — . , , . . , - . — .

, , , , , , — . , ?

, - , , . . , .

, , , — , - . — , , , . , .

: , !!!

, , . , — !

:

  • BIOS , , , ,
  • , , . ,
  • , . , . , .
  • . , , , .
  • . , , , .
  • () . ,
  • , , ,
  • , , ...

, , , , Ѩ !!!…

: ,

, . . , .

.

, . ? ?. :

  • «»
  • «Reset»
  • 30

( , ) . , . , , , .

, , . ACPI BIOS ѻ. — . , — ( , nest- pas? ;-)) , . .

, , . , . . , , , , . , , . , , .

, .

, .
.

:

. , . , , .

, — . , ( ). , . . — , .

, , , . , ( — ) . .

. , , — , , ( ) . , , — .

— . , . . — . — , .

  • ()
  • , «»
  • , - ( ),
  • , ? , . . , ,

, , . , , .

, . , , , , . , , .

— , , . . , .

, , . , , . . , , , , . . — , . … .

:

, , . — . .

, — . POST? , . , . BIOS , . , — .

, , , . — , . , ! , , .

, - , . , — . , , , . . . , BIOS . . — . — . , . — , - ,

, , , . — .

, : , , , . .

, .

  • , ,
  • , ,
  • , ?

: ,

, , , , , .

  • - , ,
  • ,
  • , , , , , -
  • — - , -

.

, . .