SW RAID na Linuxu

Tohle bude trošku odbornejší, ale teď jsme se bavili o sw RAIDu na Linuxu. Konkrétně o RAID1, tedy o zrcadlení disků. Setkal jsem se s jedním problémkem a tak se o něj podělím. Koho to zájímá, ať čte dál ;-).

Jednou když jsem vyměňoval jeden z dvou disků v Linuxovém RAID1 který se porouchal, tak jsem vypnul onen server, vyměnil disk za nový a opět zapnul. Nastartoval jsem do singlu a pomocí příkazu sfdisk naklonoval rozdělení prvního disku i na ten nový. Poté jsem pomocí příkazu raidhotadd postupně přidal všechny oddíly do jednotlivých polí. V "/proc/mdstat " jsem viděl, že se začalo jedno pole synchronizovat a ostatní čekaly ve frontě, až na ně přijde řada. A teď se dostávám k jádru pudla.

Po rebootu (neřešte prosím důvod tohoto pošetilého činu) už mi server nenaběhl, neboť nenašel root partišnu. Po startu Knoppixu jsem zjistil, že to pole které se před rebootem začlo obnovovat jede v pohodě a obnova pokračuje. Horší to bylo s těmi, které na obnovu čekaly. Ty nyní vypadaly, že místo aby se obnovila data z toho původního disku na ten nový, tak byl Linux tím rebootem tak zaskočen, že obnovil naopak ty prázdné oddíly na ty s daty. Výsledek byl, že xfs_restore provedl spoustu oprav, ale veškerá data byla v adresáři lost+found . Nejlepší řešení bylo vytvořit nový XFS a obnovit pomocí xfsrestore data ze zálohy. Měl jsem naštěstí vydumpované celé filesystémy.

No já jen aby se to nestalo i někomu z vás. Třeba byste neměli zálohu ;-)
Rada na závěr: zálohuj, zálohuj, zálohuj !!!

3 komentáře:

lister řekl(a)...

huh to jsou veci, nedavno jsem si nainstalil sw RAID 1, takze pri synchronizaci oddilu nerebootovat, predpokladam, ze to je doporuceni cislo 2. ktere nasleduje za doporucenim zalohovat :), jinak mam to na ext3, ale ten problem asi nebude souviset s xfs jako spis s mkraid nebo necim jinym s raidtools co jsi pouzil pro rekonstrukci ne?

Miloš řekl(a)...

Rekonstrukce probiha automaticky po pridani disku (oddilu) do raidu. A FS to opravdu nema nic spolecneho. Rebootovat pri synchronizaci muzes taky, ale jen pokud nemas zadne, ktere na rekonstrukci (synchronizaci) tepve cekaji. Tam je kamen urazu.

Miloš řekl(a)...

Dneska už se samozřejmě používá pro administraci polí "mdadm" ;-)