mercoledì 9 marzo 2011

Test Raid

Anzitutto, stiamo parlando di questa scheda qui:
$ lspci | grep RAID
00:1f.2 RAID bus controller: Intel Corporation 82801GR/GH (ICH7 Family) SATA RAID Controller (rev 01)

Ho avuto la bellissima idea di testare il raid (funzionante) dopo un'aggiornamento a "squeeze".
Spengo, distacco il cavo SATA da uno dei due HDD in mirror, accendo, tutto bene, spengo di nuovo e ripeto per l'altro dico, ancora tutto bene, nel mentre, le schermate di avvio della motherboard mostrano a video indicazioni "degraded" del raid.
Rimetto tutto a posto, riavvio, la motherboard mi dice che i dischi sono da "risincronizzare" (non ricordo il termine esatto), mi scrive che e` un'operazione che non puo` fare, devo farla da sistema operativo.
Una volta avviato il sistema, mi accorgo in effetti della presenza di un "nosync" nel raid dei due dischi.
E qui parte la mia cavolata (forse), vedo che per il "rebuild" del raid il comando e` "dmraid -R noemdelraid", lancio e va in "errore", analizzo velocemente la situazione, il raid ha perso completamente un disco, non convinto di tutto cio`, ho avuto la bellissima idea di riavviare il sistema.
Al riavvio del sistema, i messaggi della motherboard mi dicono che non c'e` un raid, che uno dei due dischi (il secondo ?) e` "unknown" e che l'altro e` "undefined".
Penso, decido e faccio un riavvio del computer tramite una 'knoppix' live, questa mi vede due dischi, ma ci dormo su e al mattino ho un dubbio, uno dovrebbe essere uno dei due del raid, ma l'altro e` il terzo disco, perche` questo pc ha 3 dischi, non due.
Comunque, poi verifichero` questi dischi "visti" dal sistema, ma adesso le vie del ripristino mi sembrano due e devo sceglierne una, tentare un ripristino da utility di motherboard, o tentare un ripristino software, di certo, la prima cosa da fare e` procurarmi un disco da almeno 400GB per salvare i dati di quel disco visto da knoppix (ho il backup, ma uno in piu` non fa` mai male).
Scrivendo e pensando al fatto che da 'knoppix' mi riconosce un raid degradato, penso che optero` per cercare di ripristinare la situazione da sistema operativo, guardando bene (poi ricontrollero`), i comandi dovrebbero essere:
"dmraid -R nomeraid /dev/disco"
il resto, spero, dovrebbe venire da se, cioe`, una volta ripristinata la cosa, la motherboard dovrebbe riconoscere il raid .. o no ?
Ho verificato, i dischi visti dalla "live" sono i due del raid, il terzo e` in LVM, quindi, posso pensare che abbiano perso la 'firma' di dischi in raid.
Ricapitoliamo:
  • /dev/sda1 e /dev/sda2 sembrano funzionare
  • il sistema (motherboard) non li riconosce (unknown e undefined)
  • dmraid vede solo uno dei due
  • il sistema (colpa della motherboard ?) non si avvia

Non so se ricordo/mi sono scritto proprio tutto, ma provo ad elencare i passi eseguiti per il ripristino del raid.
Tutte (o quasi) le operazioni/comandi sono state eseguite con la "Knoppix Live".

# dmraid -s
ERROR: isw: Could not find disk /dev/sdb in the metadata
ERROR: isw: wrong number of devices in RAID set "isw_iehdefhej_raid" [1/2] on /dev/sda
*** Group superset isw_iehdefhej
--> *Inconsistent* Subset
name   : isw_iehdefhej_raid
size   : 781416448
stride : 128
type   : mirror
status : inconsistent
subsets: 0
devs   : 1
spares : 0

# dmraid -r
ERROR: isw: Could not find disk /dev/sdb in the metadata
/dev/sda: isw, "isw_iehdefhej", GROUP, ok, 781422766 sectors, data@ 0

Forse dimentico qualcosa, ho lanciato il comando per la distruzione del raid:
# dmraid -x
ERROR: isw: Could not find disk /dev/sdb in the metadata
ERROR: isw: wrong number of devices in RAID set "isw_iehdefhej_raid" [1/2] on /dev/sda

About to delete RAID set isw_iehdefhej_raid

WARNING: The metadata stored on the raidset(s) will not be accessible after deletion
Do you want to continue ? [y/n] :y

Poi l'ho ricreato col comando:
# dmraid -f isw -C isw_raid --type 1 --disk "/dev/sda /dev/sdb"

Riavviando il sistema, nella schermata della motherboard e` ricomparso il raid, la 'knoppix' dice che si chiama "isw_b....", monto il raid tramite distro live e modifico/correggo il file "/etc/fstab".
Non resta che riavviare ..

Nessun commento:

Posta un commento