Восстановление данных . Причины неисправности RAID массива - HDD-INFO

Восстановление данных RAID массива 

Восстановление данных с RAID массивов.Восстановление данных с RAID массивов не является простой задачей. Несмотря на повышенную надежность RAID массивов и использование специальных жестких дисков, специально разработанных для работы в массиве, случается, что RAID перестает работать. 
 
 

 

  

Причины неисправности RAID массива :

Человеческий фактор.

Является основной причиной выхода из строя RAID массива и потери доступа к данных. Он проявляется в отсутствии необходимого контроля за работоспособностью сервера и анализа при появлении зависаний или заметного снижения скорости работы компьютера. 
Даже при использовании RAID систем, предусматривающих бОльшую надежность (5, 6 уровней) и позволяющих работать с одним или двумя неисправными жесткими дисками, зачастую не проводится мониторинг работоспособности каждого из дисков в массиве и его оперативная замена в случае отказа одного накопителя.


Плохое охлаждение дисков в RAID массиве.

Установка сервера в плохо вентилируемом помещении. Либо в помещении с повышенной температурой воздуха. Оседание большого количества пыли на самих жестких дисках и RAID контроллере внутри корпуса. Все это может привести к перегреву жестких дисков RAID массива.  Может выражаться в периодической нестабильной работой любого из жестких дисков (появление большого количества программных ошибок), либо прекращением работы одного или более дисков.

 

Использование разных жестких дисков

Установка (или замена неисправных дисков в RAID) HDD разных моделей с различной скоростью чтения и записи данных. Либо накопителей, не предназначенных для интенсивной работе в составе RAID. Происходит в основном при замене неисправных дисков в массиве на исправный другого производителя. Использование жестких дисков с сильно различающимися параметрами чтения-записи приводит к потере синхронизации всех дисков массива. Это может провоцировать резкое снижение производительности дискового массива и большое количество программных ошибок на всем логическом пространстве массива.

  

Сбой RAID контроллера

Дело в том, что даже при наличии избыточности, при работе, например, RAID массива 5 уровня без одного жесткого диска, некоторые RAID контроллеры успешно справляются с математической обработкой до первого выключения или перезагрузки сервера. После повторного включения дисковый массив может стать недоступен.
Возможны различные варианты выхода контроллера из строя :
- физическая неисправность контролера RAID массива (т.е. совсем не работает)
- логическая неисправность (сбой всех настроек контроллера).
- некорректная работа контролера (неправильная адресация данных RAID массива)
 

Проблемы с жесткими дисками в RAID массиве

Неприятным моментом являются внешне незаметные сбои жестких дисков. Накопитель не полностью теряет работоспособность, продолжая идентифицироваться и работать в составе RAID. В этом случае также резко возрастает количество программных ошибок. Резко возрастает нагрузка на контроллер рейда при контроле корректности чтения-записи сбойных жестких дисков и проверки контрольных сумм массива.
 
Самое важное !!! Не предпринимать никаких действий , которые подразумевают запись на жесткие диски массива.
Характерной ошибкой является попытка проинициализировать каждый из дисков массива, после чего переписываются заголовки накопителей и доступ к данным становится более трудным.
При неисправности RAID контроллера самостоятельных попытках провести восстановление RAID пользователи совершают следующие ошибки: не зная конфигурацию RAID массива, делают попытки восстановления массива , используя установки RAID контролера по умолчанию.
 

Восстановление данных с RAID массивов

© 2002-2020 : HDD-INFO - Лаборатория по восстановлению данных / Москва /          vk1   facebook1