Страница 1 из 1

LSI RAID. Один из дисков находится в состоянии "Degraded"

Добавлено: 04 дек 2009 17:23, Пт
UncleFather

Проблема:
LSI RAID. Один из дисков находится в состоянии "Degraded"
Решение:
Если есть новый диск на замену:

  1. Выключаем сервер

  2. Отсоединяем сбойный диск

  3. Подключаем новый диск

  4. Включаем сервер. LSI RAID автоматически запускает Rebuild для нового диска

Если нового диска пока нет:

  1. Выключаем сервер

  2. Отсоединяем сбойный диск

  3. Включаем сервер. Ждем инициализации RAID дисков и сразу же после этого выключаем сервер

  4. Включаем сервер. LSI RAID автоматически запускает Rebuild для сбойного диска


Re: LSI RAID. Один из дисков находится в состоянии

Добавлено: 14 июл 2010 08:59, Ср
UncleFather

Перестроение (Rebuild) рейд-масства происходит в фоновом режиме, то есть во время ребилда компьютер нормально функционирует.
Проверено, в частности, на MB Asus P5BV/SAS (LSI 1068, RAID Level 1E).
Часть журнала контроллера:

Код: Выделить всё

ID = 14
SEQUENCE NUMBER = 1103
TIME = Not available
LOCALIZED MESSAGE = Controller ID:  0   Unexpected sense:   PD       =   0 - Unknown Sense Code,   CDB   =    0x28  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00     ,   Sense   =    0x70  0x00  0x04  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x80  0x8d  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00 

ID = 13
SEQUENCE NUMBER = 1102
TIME = Not available
LOCALIZED MESSAGE = Controller ID:  0   Unexpected sense:   PD       =   0 - Unknown Sense Code,   CDB   =    0x28  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00     ,   Sense   =    0x70  0x00  0x04  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x80  0x8d  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00 

ID = 12
SEQUENCE NUMBER = 1100
TIME = Not available
LOCALIZED MESSAGE = Controller ID:  0   Unexpected sense:   PD       =   0 - Unknown Sense Code,   CDB   =    0x28  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00     ,   Sense   =    0x70  0x00  0x04  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x80  0x8d  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00  0x00

После таких ошибок сервер мог зависнуть и отвечать только на пинги. Преходилось грубо перезагружать кнопкой.
По предыдущим записям журнала, было выявлено, что сбоит НЖМД на 0-й шине контроллера. Записи не сохранились, но в них была ссылка на диск 0х0.

PS: Нигде в описаниях не нашёл, но, по-видимому, «PD» указывает на номер шины сбойного диска. Так, запись с PD = 0:1 будет относиться к диску на первой шине, а PD = 0 - к диску на нулевой шине.


Ошибки в журнале MegaRAID Storage Manager

Добавлено: 13 ноя 2015 18:58, Пт
UncleFather

В журнале утилиты MegaRAID Storage Manager (от RAID контроллера LSI RAID) стали (не периодически, а время от времени) появляться события вида:

Controller ID: 0 Unexpected sense: PD
= -:-:2Unknown Sense Code, CDB = 0x28 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 , Sense = 0x70 0x00 0x04 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x80 0x8d 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00
Event ID:113
Generated On: Mon Jan 01 00:00:00 VET 3900

System Details---
IP Address: 10.0.0.10
OS Name: W2K3
OS Version: 5.02
Driver Name: LSI_SAS
Driver Version: 1.25.10.00

Image Details---
BIOS Version: 06.18.00.00
Firmware Package Version: 01.23.00.00.06.18.00.00
Firmware Version: 01.23.00.00

01.jpg

Такие сообщения являются предвестниками сбоя одного из жестких дисков RAID массива.

Номер шины, к которой подключен сбойный жесткий диск, можно определить по первым строкам сообщения:

Controller ID: 0 Unexpected sense: PD = -:-:2Unknown Sense Code...

В данном случае номер шины - 2. Не забываем, что отсчет шин начинается с 0, то есть это ТРЕТИЙ жесткий диск, считая по порядку.