Alexander A Manaeff -

 
 

LSI RAID. Один из дисков находится в состоянии "Degraded"

Обсуждения проблем с железом. Полезные советы по теме.

Модератор: UncleFather

LSI RAID. Один из дисков находится в состоянии "Degraded"

Сообщение UncleFather » 04 дек 2009 18:23, Пт

Проблема:
LSI RAID. Один из дисков находится в состоянии "Degraded"
Решение:
Если есть новый диск на замену:
  1. Выключаем сервер
  2. Отсоединяем сбойный диск
  3. Подключаем новый диск
  4. Включаем сервер. LSI RAID автоматически запускает Rebuild для нового диска
Если нового диска пока нет:
  1. Выключаем сервер
  2. Отсоединяем сбойный диск
  3. Включаем сервер. Ждем инициализации RAID дисков и сразу же после этого выключаем сервер
  4. Включаем сервер. LSI RAID автоматически запускает Rebuild для сбойного диска
Аватара пользователя
UncleFather
Site Admin
 
Сообщения: 1256
Зарегистрирован: 17 авг 2004 17:20, Вт

Re: LSI RAID. Один из дисков находится в состоянии

Сообщение UncleFather » 14 июл 2010 09:59, Ср

Перестроение (Rebuild) рейд-масства происходит в фоновом режиме, то есть во время ребилда компьютер нормально функционирует.
Проверено, в частности, на MB Asus P5BV/SAS (LSI 1068, RAID Level 1E).
Часть журнала контроллера:
Код: Выделить всё
ID = 14
SEQUENCE NUMBER = 1103
TIME = Not available
LOCALIZED MESSAGE = Controller ID:  0   Unexpected sense:   PD       =   0 - Unknown Sense Code,   CDB   =    0x28  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00     ,   Sense   =    0x70  0x00  0x04  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x80  0x8d  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00

ID = 13
SEQUENCE NUMBER = 1102
TIME = Not available
LOCALIZED MESSAGE = Controller ID:  0   Unexpected sense:   PD       =   0 - Unknown Sense Code,   CDB   =    0x28  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00     ,   Sense   =    0x70  0x00  0x04  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x80  0x8d  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00

ID = 12
SEQUENCE NUMBER = 1100
TIME = Not available
LOCALIZED MESSAGE = Controller ID:  0   Unexpected sense:   PD       =   0 - Unknown Sense Code,   CDB   =    0x28  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00     ,   Sense   =    0x70  0x00  0x04  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x80  0x8d  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00

После таких ошибок сервер мог зависнуть и отвечать только на пинги. Преходилось грубо перезагружать кнопкой.
По предыдущим записям журнала, было выявлено, что сбоит НЖМД на 0-й шине контроллера. Записи не сохранились, но в них была ссылка на диск 0х0.

PS: Нигде в описаниях не нашёл, но, по-видимому, «PD» указывает на номер шины сбойного диска. Так, запись с PD = 0:1 будет относиться к диску на первой шине, а PD = 0 - к диску на нулевой шине.
Аватара пользователя
UncleFather
Site Admin
 
Сообщения: 1256
Зарегистрирован: 17 авг 2004 17:20, Вт

Ошибки в журнале MegaRAID Storage Manager

Сообщение UncleFather » 13 ноя 2015 19:58, Пт

В журнале утилиты MegaRAID Storage Manager (от RAID контроллера LSI RAID) стали (не периодически, а время от времени) появляться события вида:
Controller ID: 0 Unexpected sense: PD
= -:-:2Unknown Sense Code, CDB = 0x28 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 , Sense = 0x70 0x00 0x04 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x80 0x8d 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00
Event ID:113
Generated On: Mon Jan 01 00:00:00 VET 3900

System Details---
IP Address: 10.0.0.10
OS Name: W2K3
OS Version: 5.02
Driver Name: LSI_SAS
Driver Version: 1.25.10.00

Image Details---
BIOS Version: 06.18.00.00
Firmware Package Version: 01.23.00.00.06.18.00.00
Firmware Version: 01.23.00.00
01.jpg


Такие сообщения являются предвестниками сбоя одного из жестких дисков RAID массива.

Номер шины, к которой подключен сбойный жесткий диск, можно определить по первым строкам сообщения:
Controller ID: 0 Unexpected sense: PD = -:-:2Unknown Sense Code...


В данном случае номер шины - 2. Не забываем, что отсчет шин начинается с 0, то есть это ТРЕТИЙ жесткий диск, считая по порядку.
Аватара пользователя
UncleFather
Site Admin
 
Сообщения: 1256
Зарегистрирован: 17 авг 2004 17:20, Вт


Вернуться в Железо

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 3

Alexander A Manaeff -
@Mail.ru .