Наверх
Меню
Новости
Статьи
twitter
Сети и коммуникации
30 июля 2007
11312
  Азбука сисадмина 1: Алгоритм решения аппаратных проблем с ПК  
 
1. Всё может сломаться
2. Всё, что может сломаться,
когда-нибудь ломается
Мёрфи


Некоторым людям платят деньги за то, чтобы компьютеры ломались реже и, если всё же сломаются, скорее возвращались в рабочее состояние. Называются они обычно в небольших организациях системными администраторами или запросто «кампутарщиками». И если в составе информационно-технического отдела (ИТО) системный администратор занимается обычно несколько другими делами, то когда он един в трёх ипостасях в малой сети, то надо и «железные» проблемы решать. Три ипостаси таковы:

1. Основа всего — работающее оборудование, поэтому главный в ИТО тот, кто отвечает за аппаратное обеспечение («жестянщик»). Им читать эту статью бесполезно — тот, кто родился с отвёрткой вместо одного из пальцев, всосал тайное знание, намного превосходящее изложенное здесь, вместе со специальной молочной смесью для технарей.
2. В современном мире одинокий ПК, не включённый в сеть, даже дома становится нонсенсом. Поэтому главный в ИТО, конечно же тот, кто отвечает за локальную сеть и коммуникации с внешним миром («сетевик»). Чаще всего собственно под системным администратором понимается именно он, а также тот, кто по-английски зовётся server guy. Правильный сисадмин не имеет дел с пользователями, он их вообще не видит и сидит в своей башне из чистейшего силикона, что-то читает и изредка отвлекается на работу. Им, конечно же, данный материал просто не нужен, и не только потому, что они всё это давно знают, но и потому, что для решения глупых проблем с железом есть специально обученные люди.
3. Компьютеры, даже соединённые в сеть, могут только показывать знач0чки на рабочем столе. А вот запускают эти знач0чки — программы. Поэтому главный в ИТО — программист. Это единственная специальность, имеющая устоявшееся и чёткое название. Более того, программистами часто называют всех сотрудников ИТО. В общем, тут даже и говорить не о чем — программисты самые главные. Хотя бы потому, что понять их логику даже остальные сотрудники отдела не способны, не говоря уже о простых юзерах. Им эта статья будет абсолютно бесполезна, при желании они сделают любой алгоритм намного лучше набросков какого-то жестянщика. Но — программисты не решают аппаратных проблем.

Всем этим людям, вскормленным смесью силиконовой смазки, термопасты, железных опилок и кремниевого порошка, имеющим ладони в форме мышки и по десять пальцев на каждой руке, видящих в темноте буквы на клавиатуре, думающих машинным кодом и иногда управляющих системными процессами силой мысли — им эта статья НЕ посвящается. Но ведь не все такие, правда? Некоторые только хотят вырасти…

Ладно, шутки в сторону. Проблемы с ПК возникают постоянно, и кто-то должен их решать, и неважно, как его называют. И это пособие для начинающих. К тому же нижеизложенная информация будет не лишней для домашних пользователей, которые начинают задумываться об устройстве «сердца цифрового дома».

Несмотря на то, что все знают эти простые правила, изложенными по порядку и в одном месте они мне не попадались, вот и решил восполнить пробел — может кому и пригодится. Собственно пять правил — это заголовки, они слегка расшифрованы в соответствующих главках, а будучи применены по порядку составляют тот самый алгоритм, являющийся темой статьи. Подразумевается, что проблемы в работе вызваны именно аппаратной составляющей.

Правило номер ноль: не трогай то, что работает!!!

Это должно сидеть в голове так же прочно, как ядро, нулевое кольцо операционной системы сидит на железе. Стоит, работает — не трогай!

Следствия таковы:

  • Не надо прошивать BIOS или микропрограмму, которые дают поддержку функций, которые скорее всего не будут использоваться
  • Не надо лезть в сервисное меню монитора в целях «как он будет работать, если поменять вот это значение». Возможно, он не захочет работать вовсе
  • Не надо ставить непонятно откуда взятую программу, которая непонятно что делает.
  • Открывать вложения в письмах, пришедших неизвестно откуда. Ходить на сайты, которые раздают бесплатно программу для взлома пластиковых карт. И так далее
  • Не надо ставить пользователям краденый Фотошоп. Мало того, что они замучают вопросами «как в нём убрать прыщики и очки», так они ещё при проверке лицензионности ПО запросто покажут на того, кто поставил программу. В составе приобретённой работодателем ОС есть бесплатный и простой фоторедактор
  • Никогда не надо производить эксперименты на «боевых» серверах и пользовательских машинах. Для того у админа есть его собственная машина, желательно не та же самая, на которой выполняется каждодневная работа, а отдельная. Только при полной уверенности в совместимости и безопасности программу стоит внедрять в пользовательский пакет
  • Никогда не надо менять (усиливать) конфигурацию рабочей машины пользователя и даже сервера без веских на то причин. К примеру вместо наращивания оперативной памяти и мощности процессора иногда достаточно прочистить «автостарт» и отобрать у не в меру продвинутого юзера права локального администратора
  • Ну и наконец не ковыряйте в носу при начальстве, мойте руки перед едой, будьте осторожны ночью на улице…. ОЙ! О чём это я? Ах да! Надо постоянно пользоваться антивирусами, структурировать права доступа, как можно более надёжно защищать внешние подключения, осторожно относится к пришедшей извне информации
  • И так далее, и тому подобное, тема неисчерпаема...

    Но вот допустим что всё вроде нормально, но беда всё же пришла в дом, и в разгар составления годового отчёта в кабинет врывается главбух с квадратными глазами и криком о том, что ВСЁ, естественно, ПРОПАЛО!!!!...

    Первое правило: прежде чем тревогу бить, надо комп перегрузить

    Реинкарнация сжигает карму, это самый старый способ решения проблем в зародыше и самый эффективный. В смысле что на этом этапе отсеивается довольно много непонятных и не повторяемых причуд. А так как они не повторяемые, то и не стоит на них заостряться.

    Проблемы надо решать по мере их поступления.

    Это тот этап, который обязательно должен решаться на уровне пользователя. При обращении за техподдержкой правильный вопрос не «Перезагружались?» а «Сколько раз?». По порядку план действий такой:

  • Завершить «зависшее» приложение средствами ОС
  • Прекратить проблемный процесс через диспетчер задач
  • Перезапустить сеанс пользователя
  • Перезагрузиться средствами ОС
  • Кнопка «Reset»
  • Обесточивание ПК не менее чем на 30 секунд

    При включении и выключении электротехники (а ПК та же самая электротехника, только сложная) происходят переходные процессы. В этот момент параметры питания могут отклоняться от номинальных достаточно значительно, и большая часть поломок техники происходит именно тогда. Паузу между отключением и последующим запуском надо выдержать именно для того, чтобы переходные процессы, происходящие при обеих процедурах, не накладывались друг на друга с взаимным усилением.

    По большому счёту, обычному пользователю знать все тонкости не обязательно, для него достаточно двух вариантов. Кнопка на «морде» через ACPI в BIOS и в ОС должна быть настроена на «завершение работы ОС». Первый вариант — нажать её. Второй вариант, очень серьёзный — обесточить ИБП (у нас ведь стоят индивидуальные ИБП на каждом ПК, n’est- pas? ;-)) «После этого надо дать отдохнуть компьютеру хотя бы минуту, так как всё уже тревожно». Это должен знать каждый.

    При обращении в техподдержку пользователь должен сказать, на каком этапе загрузки после полного обесточивания процесс стал протекать не так, как обычно. И вот мы чётко слышим, что всё грустно. И «выхода в массы» не избежать. Есть конечно технологии активного менеджемента клиентских ПК без физического к ним доступа, по сети, через отдельный поток сетевого адаптера и выделенную аппаратную партицию. Но пока они есть только там, где построен коммунизм в отдельно взятой корпорации, и начинающих админов работать туда не приглашают. А если и приглашают, то как падаванов более опытных товарищей, а любое практическое обучение на порядки превосходит по эффективности любое чтение.

    Поэтому с тихой грустью убедившись в обоснованности жалоб юзера на основании телефонной беседы и невозможности удалённого доступа к ПК программными средствами, покидаем своё уютное место и топаем «в народ».

    Да, я очень ленив.
    Но именно это заставляет меня быть эффективным.


    Шаг второй: пересунем все шланги

    Этот этап частично можно реализовать на рабочем месте пользователя. Просто тупо вынуть и вставить на место все провода, подходящие к задней части системного блока и монитора. Когда с ними возникают проблемы, они не обязательно валяются рядом на полу, внешне всё может выглядеть вполне пристойно.

    Как известно, злейший враг техники — уборщица. Она может протирать пыль с компьютера, двигать его компоненты для протирки стола под ними или просто махнуть шваброй неподалёку (как ей показалось). Однако работает это обычно в том случае, если совсем «чёрный экран». Не помогло. Этот шаг — трёхуровневый, и во втором уровне тащим «процессор» к себе на стенд.

    Принеся на стенд, стоит попробовать не вскрывая корпуса включить ещё раз. Так отсеиваются проблемы, возникающие по вине периферии (в общем случае монитор — это тоже периферия) и электропитания. Снова мимо.

    Только теперь вскрываем системный блок. Если же он опечатан, или не опечатан, но на гарантии — вскрывать ничего не надо, у нас достаточно уверенности в неисправности, чтобы обратиться к провайдеру гарантийных (или постгарантийных) услуг. Но вот если гарантия закончилась, и это наша зона ответственности, аутсорсинг в обслуживании техники не применяется — тогда вскрываем.

    Информация правит миром

    Первым делом на третьем уровне обращаем внимание на главный компонент ПК — жёсткий диск. Замену всех остальных запчастей с большей или меньшей вероятностью пользователь просто не заметит, но пропажи рабочих текстов или фотографий детей он не заметить не может. И даже необходимость по новой настраивать рабочее окружение способна привести его в уныние. Поэтому — убеждаемся в целостности информации путём подключения винчестера к заведомо рабочему и поддерживающему именно эти диски стенду. Всё в порядке — отлично, дальше уже просто рабочие моменты.

  • При правильном подходе к комплектации парка техники достаточно просто установить в другую аналогичную (резервную) машину этот диск и вернуть «починенный» рабочий инструмент пользователю
  • При отсутствии аналогов ещё не всё потеряно, современные ОС в некоторых пределах способны «переезжать» на другое железо
  • И уж если совсем нет похожей конфигурации, то надо восстановить из мастер-образа на другом жёстком диске типовое окружение пользователя на основе совместимой с этим вариантом «железа» ОС (ссылка в предыдущем пункте), после чего перенести в новую инсталляцию данные пользователя
  • Вы никогда не задумывались об автоматизации процесса дистрибуции типового пользовательского окружения, потому что и слов таких не знаете? И в таком случае не потеряете ничего, кроме своего времени и времени работника. Если не угробите его данные в процессе переноса. Аккуратно поставьте систему при помощи дистрибутива, настройте её, инсталлируйте все драйвера и приложения и опять же перенесите на новую машину пользовательские данные

    Процесс занимает от часа до рабочего дня, в зависимости от объёма данных и мощности конфигурации, а также не в последнюю очередь от отлаженности его алгоритма. По истечении этого времени простой работника в конторе прекращается, он получает обратно свою машину и работает дальше как ни в чём не бывало.

    Если диск повреждён, надо оценить находящиеся на нём данные и вероятность их восстановления. Скорее даже не вероятность, а стоимость, потому что на рынке есть предложения по восстановлению информации в почти любых ситуациях, но такие услуги весьма недёшевы. Свои силы в этом лучше недооценить, чем переоценить, при малейшем сомнении надо обращаться к специалистам.

    Правильный подход — хранение данных пользователей и программ на выделенном сервере с использованием механизмов устойчивости к сбоям и постоянным резервированием, лучше не в одно место, и лучше в территориально распределённые хранилища. Но для начинающего админа небольшой конторы такие рекомендации звучат бредово — он бы и женился на принцессе… да хто ж дасьт? Потому можно попытаться реализовать решения из серии «голь на выдумку хитра», но они к теме данного материала не относятся и будут рассмотрены в следующей статье.

    Итак, третий уровень, если жёсткий диск исправен. Но не до того, как в этом убедились, хотя соблазн велик. Передёргиваем все кабели внутри системного блока. Как бы ни казались они прикипевшими к месту, именно вынимаем из разъёмов все кабели, и интерфейсов, и питания, и вставляем на место. Пытаемся включить. Всё работает — замечательно, возвращаем винчестер на место и проводим тесты под нагрузкой не менее часа. Если не сложилось… Что ж, переходим к следующему шагу.

    Шаг третий: модульная диагностика и ремонт заменой

    В общем случае для реализации этого шага необходимо иметь стенд, то есть набор исправных комплектующих, полностью совместимых с неисправной машиной. В самом неблагоприятном случае — похожую по конфигурации рабочую машину другого сотрудника. Потому что придётся менять один за другим компоненты ПК на заведомо исправные для локализации проблемы.

    Порядок действий описан многократно и повсеместно, но повторение — мать учения. Почему речь не идёт о звуковых сигналах POST? Да потому, что они позволяют однозначно определить источник проблем ещё на рабочем месте пользователя и к этому моменту уже не актуальны. То есть услышав один длинный писк и три коротких следом или повторяющийся длинный можно прямо на месте решить проблему. К тому же эти сигналы не одинаковы у различных BIOS и могут быть весьма информативны, а могут и запутать. Рассматривать их здесь бессмысленно, надо принимать во внимание конкретику — читать руководства к системным платам.

    Итак, передёргивание кабелей не помогло, но всё уже здесь, под руками. Следующий этап — полная разборка, извлечение из корпуса системной платы и сборка на стенде. Именно так и никак иначе! Потому что источником проблемы может быть болтик под материнкой, который вдруг после двух лет безупречной работы вздумал туда закатиться.

    При отсутствии условий удобнее всего положить антистатический пакет, в котором куплена какая-нибудь деталь, на пачку офисной бумаги и на этой подставке начать сборку. Пока что в своём сокете остаётся процессор, потому что его замена — самое сложное действие. В первый от процессора слот ставится единственная заведомо рабочая планка памяти, при отсутствии встроенного видеоадаптера устанавливается внешний, самый простой и также заведомо рабочий, к нему монитор. Также стоит попробовать установить внешний видеоадаптер если есть подозрения в неисправности встроенного. Подсоединяется исправный блок питания и клавиатура. Всё, больше ничего для старта BIOS не требуется. Старт. Нет эффекта — замена процессора. Не помогло — замена материнской платы. Вот у нас и получился по идее полностью исправный комплект из компонентов, не имеющих отношения к исходной неисправной машине. Если не включается — значит, что-то Вы делаете неправильно или же сломали в процессе переборки, и самое время обратиться к специалисту и слегка загрустить…

    В большинстве случаев на этом этапе выявляется неисправный компонент, либо же в процессе оказывается, что это был отсроченный второй шаг, и после переустановки того же процессора всё заработало. Теперь всё просто — меняем виновника аварии на рабочий аналог и отдаём машину на рабочее место.

    Если же базовая платформа заработала, то к ней по одному добавляются исходные память, блок питания, жёсткий диск, и так далее. По одному компоненту за раз и с обязательным запуском системы после каждого шага.

    Есть некоторые визуальные признаки, которые помогают на четвёртом шаге локализовать неисправность.

  • Здравый смысл подскажет, что дым и копоть, и даже лёгкий запах палёного не свойственны исправному узлу
  • Всем известно про вздувшиеся конденсаторы на материнских и видеоплатах — они обычно не работают
  • Если не крутится вентилятор, лучше сначала запустить его, а потом рыть дальше
  • Странные звуки винчестер обычно не издаёт
  • Я надеюсь, система не была разогнана? Этот вопрос тоже лучше решить прямо на рабочем столе пользователя

    Четвёртый шаг: ремонт неисправных компонентов, для начинающих не актуален

    Те, кто чинят неисправные модули ПК, подобных статей не читают, и поэтому четвёртый шаг, а именно ремонт с помощью паяльника или специальных утилит, тут рассматривать не будем.
    Ещё раз повторю

  • Прежде чем приступать к какому-либо действию, надо чётко оценить свои силы и возможности, и при неуверенности обратиться к специалисту
  • Лучше недооценить свои силы, чем переоценить
  • Надо всегда принимать во внимание оценку неудачной попытки как в денежном выражении, так и в категориях потраченного времени, причём не только своего, но и того, чья работа будет прервана из-за неисправности инструмента
  • И главное — чинить что-то квалифицированно всегда проще, если перед этим кто-то не пытался чинить эту вещь неквалифицированно

    Далее поговорим о простых путях обеспечения сохранности пользовательских данных.

    Данный материал можно и нужно критиковать в конференции, НО только предметно и конструктивно. По результатам обсуждения он может быть переработан и дополнен.

    Продолжение следует...


  •   Источник: ixbt.com
     



    Поделиться с друзьями:


    Другие новости по теме
     
    Вы не авторизованный пользователь. Чтобы воспользоваться всеми возможностями сайта, зарегистрируйтесь.
     

    Комментарии

    Edd 30 июля 2007 15:42
    Про БП не изложено. БП с чрезмерно поплывшими характеристиками может сделать работу компьютера очень и разнообразно забавной. Понятно, что на стенде будет заведомо исправный БП, но потроха будут возвращаться в старый корпус, БП которого может быть "слегка заболевшим".
    Ещё один пункт про разъёмы (IDE, например). Один раз столкнулся с погнутым и утрамбованным в дно пином в разъёме винта (заметил с трудом). Хозяин машины слишком часто таскал винт в другие места и неаккуратно пользовался разъёмом. Рихтовка пина пинцетом восстановила работоспособность.
    Про USB разъёмы следовало бы написать. На некоторых планках ободок разъёма разрезной. Флешку или USB-кабель можно вставить так, что ободок погнётся и коротнёт на контакты, и не всегда это приводит к фейерверку - иногда просто не запускается машина. На стенде всё будет работать, а вот повторное подсоединение такой планки без визуальной проверки может оказаться фатальным для ЮМ.
    Можно было бы рекомендовать при проверке на стенде использовать "другие" шлейфы: встречал еле заметно ободранный от изоляции и почти прорезанный крайний проводник 80-ти пинового IDE-шлейфа (об острые кромки корпусного железа).
     
     
     
    Добавление комментария
    Ваше имя
    Ваш Email
    Код Включите эту картинку для отображения кода безопасности
    обновить код
    Введите код