+7 (812) 640 0 940многоканальный телефон
Курьер доставит ваш HDD/ноутбук/планшет/телефон в сервис

Знакомство с технологией самодиагностики дисков S.M.A.R.T.

Рубрика: Восстановление данных

Несмотря на важность таких критериев, как скорость работы или шумность диска, самым главным качеством HDD остаётся надёжность. И естественно, она тоже должна как-то измеряться и оцениваться. Уже почти 20 лет в качестве основного диагностического стандарта используется технология S.M.A.R.T. Как пишут в Википедии, S.M.A.R.T. (от англ. self-monitoring, analysis and reporting technology — технология самоконтроля, анализа и отчётности) — технология оценки состояния жёсткого диска встроенной аппаратурой самодиагностики, а также механизм предсказания времени выхода его из строя.

История S.M.A.R.T.

Появление технологии мониторинга состояния накопителей на жёстких магнитных дисках стало естественным ответом на возрастающие требования к их надёжности. Первая разработка в этой области была выпущена компанией IBM в 1992 году, и называлась PFA (Predictive Failure Analysis).

В 1994 году компаниями Compaq, Seagate, Quantum и Conner была разработана технология IntelliSafe, а уже в 1995 году на её основе появился стандарт технологии S.M.A.R.T.: Self-Monitoring, Analysis and Reporting Technology - "Технология самодиагностики, анализа и отчёта".

После этого их уже поддержали такие компании как IBM, Maxtor и Samsung. Hitachi приняла участие в развитии технологии S.M.A.R.T. уже на стадии разработки SMART II, первыми предложив методику полной самодиагностики накопителя (extended self-test). Сущность технологии описана в стандарте, называющемся «Information Technology - AT Attachment … - ATA/ATAPI Command Set» (Информационная технология - в приложении… - набор команд ATA/ATAPI). Вместо многоточия ставится номер стандарта. Наиболее новая ревизия стандарта-8, является только продолжением и дополнением стандартов 2, 4, 6 и 7. Раздел о S.M.A.R.T. есть в каждом из них.

Этот стандарт описывает принципы, на которых общаются между собой HDD и компьютер. В стандарте описаны только общие правила функционирования S.M.A.R.T., необходимые для совместимости всех жестких дисков со всеми компьютерами - остальные же функции в общедоступной документации не представлены, являются разработками компаний-производителей HDD (вендоров) и охраняются как коммерческая тайна.

Стандарты S.M.A.R.T.

Разберём, как трактует технологию S.M.A.R.T. стандарт АТА-АТАРI (далее курсивом выделены цитаты из стандарта ATA-ATAPI-8):

Назначением технологии S.M.A.R.T. является защита данных пользователя и минимизация вероятности их потери посредством предсказания деградации и/или выхода из строя устройства. Контролируя и сохраняя критические рабочие и калибровочные параметры, SMART устанавливает устройству возможность предсказания ближайшего времени деградации или отказа устройства.

Таким образом, S.M.A.R.T. обеспечивает компьютеру (хосту) возможность узнать о низкой надежности устройства, и предупреждает пользователя об этом, чтобы уменьшить риск потери данных.

Поддержка технологии S.M.A.R.T. указывается в ответе устройства на команду, подаваемую BIOS при опросе подключенных HDD.

Однако устройства, которые поддерживают пакетные команды (это, к примеру, DVD-ROM) не поддерживают S.M.A.R.T. так, как это делают HDD (пакетные устройства общаются с хостом посредством АТА команд, но как бы «обернутых» в оболочку из команд SCSI).

Устройства, поддерживающие пакетные команды, поддерживают S.M.A.R.T. в виде, определённом для таких устройств, с использованием пакетных команд.

Структура данных S.M.A.R.T.-устройства: функция S.M.A.R.T. - устанавливать информацию о надежности и состоянии устройства и хранить эту информацию в специализированных S.M.A.R.T.-структурах устройства. Набор хранимых устройством S.M.A.R.T.-данных может быть использован при запуске команды S.M.A.R.T. EXECUTE OFF-LINE IMMEDIATE (Смарт: немедленно перейти в режим off-line), если эта команда поддерживается устройством.

Такую команду может подавать BIOS (если включена опция отслеживания SMART в BIOS) при считывании информации о состоянии HDD из структуры SMART при запуске компьютера. Следует отметить, что, на самом деле, атрибутов SMART очень много, и они различны у разных вендоров. Пользователю доступна лишь относительно небольшая часть собранной HDD информации, которой, в прочем, вполне достаточно.

Режимы сбора данных в S.M.A.R.T.

Сбор текущих данных S.M.A.R.T. (on-line-режим): Сбор текущих данных S.M.A.R.T. не должен мешать нормальной работе устройства. Данные S.M.A.R.T., которые в настоящий момент собираются, или методы, которыми пользуется технология для сбора данных, могут отличаться от методов, используемых для хранения данных S.M.A.R.T. (типы таблиц и т.п.), и могут также отличаться от устройства к устройству.

On-line режим означает, что HDD производит сбор информации о параметрах чтения/записи во время обработки запросов операционной системы, дискретно записывая полученную статистику в таблицы S.M.A.R.T. Это не сказывается на скорости обработки команд накопителем.

Сбор данных в режиме off-line (накопитель активен, но не выполняет никаких действий по интерфейсу) Устройство может использовать режим off-line для сбора данных и проведения самотестирования. Такой режим работы S.M.A.R.T. может меняться от устройства к устройству. Собранные данные или методики сбора данных в этом режиме могут отличаться от методик, используемых при сборе текущих данных (режим on-line) для любого устройства и могут варьировать от устройства к устройству.

Off-line режим представляет собой самотестирование HDD, при котором устройство производит сканирование определенных областей магнитных пластин, оценивает работу механических частей, тестирует оперативную память и канал чтения/записи. Если вы слышите, как ваш жёсткий диск активно жужжит, в момент, когда у операционной системы нет активных задач - скорее всего, это означает идущее off-line сканирование.

Атрибуты S.M.A.R.T.

Атрибуты S.M.A.R.T. - это характеристики, которые используются при анализе состояния и запаса «живучести» накопителя.

Атрибуты вводятся производителем накопителя на основании собственного опыта производства и эксплуатации HDD. Предполагается, что с помощью этих атрибутов, можно предсказывать ухудшение рабочих характеристик накопителя или определить его дефектность. Каждый производитель имеет свой характерный набор атрибутов, и вносит изменения в этот набор в соответствии со своими собственными соображениями, никого об этом не уведомляя. Конечному пользователю остается только доверять мнению производителя. Значения атрибутов (value) используются для представления надежности отдельного показателя, относительно его эталонного значения. Каждый атрибут имеет собственное пороговое значение (threshold), оно необходимо для сравнения со значением атрибута и указывает на ухудшение рабочих характеристик или дефектность накопителя. Допустимое значение атрибута - относительное, и судить о его величине можно лишь сравнивая его с threshold. Высокое значение атрибута говорит о том, что параметр в порядке и имеет низкую вероятность ухудшения и выхода накопителя из строя. Соответственно, низкое значение атрибута говорит о том, что результат анализа параметра указывает на высокую вероятность его ухудшения или выхода накопителя из строя.

Производитель определяет числовое значение порогового атрибута анализируя результаты испытаний на надежность. Пороговое значение каждого атрибута указывает на нижнюю допустимую границу значения атрибута, до которой накопитель можно считать надежным.

Атрибут Worst - наихудшее значение атрибута за всю историю работы HDD - читается из логов S.M.A.R.T. и помогает понять, в каких условиях работал накопитель.

Атрибут Raw является текущим значением измеряемого параметра. Его размерность, в зависимости от типа параметра, может быть в «разах» (к примеру, количество парковок), градусах, часах и в других величинах (частота ошибок чтения и т.д.).

Продвинутый читатель может заметить, что мы привели не так уж много примеров атрибутов в статье. Это так. Многие программы отображают больше атрибутов, но хотим заверить вас, если изменится значение атрибута, к примеру, «Disk Shift» (смещение пакета дисков относительно оси шпинделя), то ваш диск - труп, и его нужно нести в сервис по восстановлению данных или выбрасывать. Все атрибуты используют только в специальных подразделениях компаний-производителей HDD, так называемых «Failure Analysis», где специалисты исследуют причины отказов дисков. Представленного же в этой статье набора атрибутов вполне достаточно для оценки состояния жесткого диска.

Лог S.M.A.R.T.

Узнать о проблемах в диском можно при загрузке компьютера. Функция контроля состояния S.M.A.R.T. встроена во все современные BIOS – ведь именно для этого и создавалась технология.

При включении компьютера, BIOS непременно известит о плохом состоянии HDD соответствующим сообщением. Проверить не выключена ли эта опция случайно и включить её обратно можно также через BIOS в строчке enable/disable SMART.

Однако BIOS лишь пишет bad или good. Выяснить, в чём именно проблема можно только с помощью специальной программы анализа атрибутов.

Приведём пример лога S.M.A.R.T. типичного, вполне исправного, HDD WD3200AAKS-00L9A0, открытого в программе Smart Vision от Ace Lab:

Log S.M.A.R.T.

Как видим, здесь приведены наиболее критичные для надежности HDD атрибуты. Это пример S.M.A.R.T. уже «повидавшего жизнь» диска. Его надежность на удовлетворительном уровне (не превышены атрибуты «1» и «5»), но подумать о неспешной замене стоит.

Рассмотрим каждый атрибут подробнее.

  • Частота ошибок чтения: насколько часто возникают ошибки при чтении секторов. Ухудшение значения этого атрибута может свидетельствовать о разрушении магнитного слоя, износе механических составляющих диска, о существенном превышении температуры.
  • Время раскрутки шпинделя: если двигатель медленно раскручивает пакет с магнитными пластинами, это может означать потерю мощности двигателя (следовательно, угрозу обрыва провода в обмотке) или увеличение сопротивления в гидродинамическом подшипнике (возникновение заусенца внутри корпуса подшипника, к примеру).
  • Количество включений шпиндельного двигателя: счетчик, по нему можно косвенно определить время и режим работы диска.
  • Количество переназначенных секторов: критически важный атрибут. Если ошибка чтения часто обратима, и может быть обусловлена условиями работы диска, то ухудшение атрибута «количество переназначенных секторов» явно свидетельствует о повреждении поверхности дисков. Переполнение таблиц дефектов – одна из наиболее часто встречающихся неисправностей HDD.
  • Частота ошибок позиционирования: ухудшение этого атрибута может указывать на превышение температуры или износ механических частей.
  • Время во включенном состоянии: время работы диска.
  • Количество повторных попыток запуска шпинделя: ухудшение атрибута может свидетельствовать об ухудшении состояния двигателя, механики или поверхности магнитных дисков.

    Важно. Одной из возможных причин сбоев при запуске могут быть проблемы при считывании сервометок. Электроника HDD управляет скоростью вращения магнитных пластин, считывая особые магнитные метки (сервометки) с поверхности. Если они считываются с перебоями, то HDD не может поддерживать необходимую скорость вращения пластин и останавливает двигатель. Также, с помощью сервометок, HDD определяет, где находятся головки чтения-записи. Так что сервометки имеют фундаментальное значение в работе HDD.
  • Количество попыток рекалибровки: ухудшение этого атрибута, чаще всего, говорит о том, то головки плохо считывают информацию с магнитных пластин.
  • Количество парковок БМГ: ещё один счетчик, чем ближе значение к порогу – тем старше диск.
  • Температура: в атрибуте отражён температурный режим работы HDD.
  • Количество операций переназначения секторов: критичный для работы параметр, однако в нем есть свой нюанс – у HDD есть список «подозрительных» секторов, информацию о которых он помещает в специальную таблицу до того, как система S.M.A.R.T. проведет их проверку. Секторы могут быть признаны годными. Но данные об этой операции отражаются в параметре.
  • Текущее количество нестабильных секторов: количество «подозрительных» секторов.
  • Атрибуты 198,199 и 200: их ухудшение однозначно свидетельствует о внешних проблемах, т.е. о неисправности кабелей, разъёмов и пр.

Функции S.M.A.R.T. - известные и предполагаемые

Поскольку производители тщательно скрывают информацию о структуре программ, составляющих систему S.M.A.R.T., доподлинно известной информации о работе этой подсистемы не так много, как хотелось бы.

Перечень функций, о которых можно сказать, что они присутствуют во всех HDD всех фирм, выглядит следующим образом:

  • Сбор информации о состоянии диска, ведение журналов ошибок.
  • Ведение счетчиков событий (количества включений, парковок, повторных запусков, срабатываний датчика удара и пр.)
  • Тестирование систем накопителя и поверхности магнитных пластин.

Однако на основании опыта специалистов по восстановлению данных есть все основания полагать, что у современных жёстких дисков S.M.A.R.T. не просто подсистема, а основа управляющей программы диска, которая умеет не только вести мониторинг состояния и тестировать HDD, но и, основываясь на собранных данных, предпринимать активные действия по приведению параметров устройства к допустимым значениям.

Возможно, что относительно долгой работой HDD (при современной-то плотности записи), мы обязаны именно технологии S.M.A.R.T, которая выступает в качестве настройщика, который подгоняет параметры чтения/записи под постоянно изменяющееся состояние среды, в которой работает устройство.


Если требуется восстановление данных, свяжитесь с нами по телефону: +7 (812) 640 09 40

Или оставьте запрос: