Záchrana a obnova dat z diskového pole RAID 1

RAID 1 je metoda ukládání dat, která zajišťuje zrcadlení dat na dvou nebo více pevných discích, což zvyšuje spolehlivost úložiště a odolnost vůči selhání jednoho disku. Je ideální pro kritické aplikace, databáze nebo ukládání důležitých souborů, ale má také několik nevýhod. RAID 1 zvyšuje náklady na úložiště kvůli duplikaci dat, což snižuje efektivní úložný prostor. Výkon zápisu může být nižší než u jiných RAID konfigurací, protože data musí být zapsána na oba disky současně. RAID 1 také nenabízí škálovatelnost kapacity ani výkonu, kterou mají jiné RAID konfigurace, jako je RAID 5 nebo RAID 6. Navíc RAID 1 nechrání data před jinými formami ztráty dat, jako jsou softwarové chyby, viry nebo uživatelské chyby, což zvyšuje důležitost pravidelných záloh.

Záchrana a obnova dat z diskového pole RAID 1

Technologie RAID (Redundant Array of Independent Disks - redundantní pole nezávislých disků) je běžným způsobem ukládání dat v odvětví IT, který je základem většiny firemních počítačů, serverů a úložných zařízení. Vyhlídka na katastrofickou ztrátu dat v důsledku selhání diskového pole RAID je jedním z nejzávažnějších problémů, se kterými se mohou uživatelé, malé firmy i podnikové organizace setkat.

Potřebujete obnovit data na RAID 1 diskovém poli? Poptat obnovu dat

Typické příčiny ztráty dat na zrcadleném poli RAID 1

Každá obnova dat z pole  RAID 1 je unikátní procedura, vycházející z typu pole, použitého souborového systému a povahy selhání pole. Existuje však několik společných příčin ztráty dat na diskovém poli.

Systémy RAID mohou být postiženy ztrátou napájení, cyklováním napájení a přepětím, které způsobí ztrátu dat. Obzvláště zranitelné jsou raid konfigurace RAID pracující v degradovaném stavu. Problémy s napájením mohou způsobit, že se do pole znovu začlení disky, které nejsou synchronizovány. V těchto případech mají naše týmy nástroje a odborné znalosti pro mapování dat a logickou rekonstrukci pole RAID s cílem získat požadovaná data.

Systémy RAID jsou konstruovány tak, aby odolaly selhání jednotlivých disků. Pokud je však pole RAID provozováno v degradovaném stavu, zvyšuje se zatížení zbývajících disků a tím i riziko dalších selhání disků. Další selhání disků může vést k selhání celého pole RAID 1. Disponujeme čistým prostředím a znalostmi potřebnými k obnově dat ze poškozených disků v kombinaci s logickými dovednostmi a nástroji pro obnovu a opravu souborových systémů ze rozpadlých nebo částečně obnovených systémů RAID.

Požár, voda, špína a další nečistoty způsobené přírodními katastrofami mohou okamžitě zničit kompletní RAID zařízení. Obnova souborových systémů z pole RAID postiženého přírodní katastrofou vyžaduje specializované zařízení, znalosti a nástroje pro dekontaminaci disků a logickou obnovu dat. MyBlueDay disponuje nejmodernějšími nástroji a čistými prostory pro bezpečnou obnovu fyzicky poškozených disků.


Proces obnovy dat v diskovém poli RAID 1

Většina postupů obnovy pro RAID servery a NAS zařízení sdílí stejné postupy, kromě případů, kdy jsou nakonfigurovány jako RAID 0 nebo JBOD (Just a Bunch Of Disks).

Diagnostika stavu diskového pole

Prvním krokem je detailní zhodnocení stavu každého disku v poli, výběr potenciálních náhradních disků a dílů, které by mohly být v případě potřeby vyměněny kvůli hardwarovému selhání, a stanovení ideální strategie pro obnovu dat z RAID pole. Během této fáze je také velmi důležitá úzká komunikace s IT oddělením zákazníka, protože jakékoliv informace, které nám mohou poskytnout, mohou výrazně urychlit a zjednodušit proces obnovy dat. V případě konfigurace RAID 1 v nejběžnějším rozložení 1+1 je vždy potřeba prověřit stav a konzistencí obou disků v poli. 

Proč je nezbytné zpracovat z pole Mirror 1+1 oba dva disky? Naučila nás praxe a zkušenosti. Pointa zrcadlení je jasná. Diskový a RAID řadič provádí v reálném čase synchronizaci dat na každý z disků. Co se však stane, začne-li jeden z disků generovat např. chyby neobnovitelného čtení (URE, z anglického Unrecoverable Read Error), nebo vadné sektory? Jak řadič provede mirroring ze zdravého disku na částečně poškozený? Kruciální otázka. Vše záleží na kvalitě a integrovaných funkcích RAID kontroleru. Realita je však taková, že veškeré entry a mid level RAID zařízení disponují nepříliš sofistikovanými řadiči s minimem funkcí chránící vaše data v případě selhání. Není tedy vůbec výjimečné, že v případě selhání pole RAID 1 obsahuje každý z disků jiná data. Který ovšem ta správná?

Obnova vadných HDD

Po provedené diagnostice každého disku v poli je potřeba vytvořit obraz (ideálně kompletní sektorovou kopii) každého disku na sekundární disk. Tímto způsobem se zabrání potřebě opakovaného čtení z původního, často degradovaného  disku. Předtím je ale nutné řešit eventuální hardwarové problémy s jednotlivými disky. Aby bylo možné z disku vytvořit ideálně bezchybnou bitovou kopii, je nutné takový HDD uvést do takového stavu, aby byl schopen v řízených podmínkách korektního čtení.  Během procesu diagnostiky, opravy a vytváření obrazů jednotlivých disků zjišťujeme, který disk selhal jako poslední - pokud selhaly dva disky, ten, který selhal jako poslední, bude obsahovat nejaktuálnější data. Zaznamenali jsme případy, kdy disky selhaly v odstupu několika měsíců, a proto je důležité zaznamenat tyto časové souslednosti, abychom měli k dispozici nejnovější a tedy nejrelevantnější disky pro obnovu.

Detekce konfigurace pole a jeho sestavení

Nyní máme k dispozici obrazy všech disků, nebo alespoň obraz jednoho chybějícího disku. Dalším úkolem je určit konfiguraci RAID pole a obnovit jej vhodným softwarem. Po dokončení tohoto úkolu lze data extrahovat na jiné zařízení. Během této fáze probíhá automatická kontrola konzistence obnovených dat, aby byly do obnovy zahrnuty pouze platné a funkční soubory.

Obnova RAID pole je technologicky i časově náročná, obzvlášť pokud není známa konfigurace diskového pole. Bez profesionální pomoci je šance na úspěšnou obnovu dat, zejména v případech, kdy jeden nebo více disků vyžaduje hardwarovou intervenci, minimální.

Bezpečnostní informace!
  • Nepokoušejte se spustit příkaz CHKDSK na poli RAID jako způsob, jak se pokusit vyřešit problémy, se kterými se potýkáte
  • Neměňte pořadí disků v diskovém poli.
  • Bylo by bezvýsledné pokoušet se obnovit pole RAID 5 nebo RAID 6 s více než jedním poškozeným diskem.
  • Byl-li spuštěn automatický rebuild RAID pole, nepřerušujte ho, neresetujte server.