Záchrana a obnova dat z diskového pole RAID

Stejně jako u jiných typů technologií i u polí RAID může dojít k selhání. Uložení identických dat na více různých místech představuje skvělý způsob ochrany informací. Nenechte se však zmást - žádný pevný disk ani jiný typu úložiště není nezničitelný. Ztráta dat a souborů související se selháním RAID diskového pole patří v oblastech, které využívají serverová řešení pro ukládání a distribuci dat mezi velmi frustrující a stresující situace. O ekonomické stránce věci se jistě není nutné zmiňovat. Obnova dat z RAID diskového pole patří u MyBlueDay do segmentu "emegrency", tzn. naši specialisté poskytují své služby v režimu 24/7.

Záchrana a obnova dat z diskového pole RAID

Technologie RAID (Redundant Array of Independent Disks - redundantní pole nezávislých disků) je běžným způsobem ukládání dat v odvětví IT, který je základem většiny firemních počítačů, serverů a úložných zařízení. Vyhlídka na katastrofickou ztrátu dat v důsledku selhání diskového pole RAID je jedním z nejzávažnějších problémů, se kterými se mohou uživatelé, malé firmy i podnikové organizace setkat.

Potřebujete obnovit data na RAID diskovém poli? Poptat obnovu dat

Typické příčiny ztráty dat RAID

Každá obnova dat z  RAID je jedinečná procedura, vycházející z typu pole, použitého souborového systému a povahy selhání pole. Existuje však několik společných příčin ztráty dat na diskovém poli.

Systémy RAID mohou být postiženy ztrátou napájení, cyklováním napájení a přepětím, které způsobí ztrátu dat. Obzvláště zranitelné jsou disky RAID pracující v degradovaném stavu, protože problémy s napájením mohou způsobit, že se do pole znovu začlení disky, které nejsou synchronizovány. V těchto případech mají naše týmy nástroje a odborné znalosti pro mapování dat a logickou rekonstrukci pole RAID s cílem získat požadovaná data.

Systémy RAID jsou konstruovány tak, aby odolaly selhání jednotlivých disků. Pokud je však pole RAID provozováno v degradovaném stavu, zvyšuje se zatížení zbývajících disků a tím i riziko dalších selhání disků. Další selhání disků může vést k selhání celého pole RAID. Disponujeme čistým prostředím a znalostmi potřebnými k obnově dat ze poškozených disků v kombinaci s logickými dovednostmi a nástroji pro obnovu a opravu souborových systémů ze rozpadlých nebo částečně obnovených systémů RAID.

Požár, voda, špína a další nečistoty způsobené přírodními katastrofami mohou okamžitě zničit kompletní RAID zařízení. Obnova souborových systémů z pole RAID postiženého přírodní katastrofou vyžaduje specializované zařízení, znalosti a nástroje pro dekontaminaci disků a logickou obnovu dat. MyBlueDay disponuje nejmodernějšími nástroji a čistými prostory pro bezpečnou obnovu fyzicky poškozených disků.

Proces obnovy dat diskového pole RAID

Většina postupů obnovy RAID a NAS zahrnuje stejné procesy, s výjimkou případů, kdy jsou nakonfigurovány jako RAID 0 nebo JBOD (Just a Bunch Of Disks).

Diagnostika stavu diskového pole

Prvním krokem je pečlivé vyhodnocení stavu každého z disků pole výběr  případných náhradních disků a dílů, které mohou být rezervovány pro použití v případě hardwarového selhání disku nebo disků v poli a zvolení ideální strategie obnovy dat z RAID. V této fázi také intenzivně komunikujeme s IT oddělením zákazníka. Veškeré informace, které nám může zadavatel poskytnout mohou výrazně urychlit a zjednodušit proces obnovy.

Obnova jednotlivých vadných HDD

Po provedené diagnostice každého z disků pole   je třeba provést obraz (ideálně kompletní sektorová kopie) z každého členského disku pole na jiný disk (to proto, aby se zabránilo obnově z původního média), samozřejmě je třeba nejprve vyřešit případné hardwarové problémy s jednotlivými disky. Již během procesu diagnostiky, opravy a vytváření obrazů jednotlivých disků zjišťujeme, který disk selhal naposledy - pokud selhaly dva disky, ten, který selhal jako poslední, bude obsahovat nejaktuálnější data - zaznamenali jsme případy, kdy disky selhaly s odstupem několika měsíců, proto je důležité zajistit tyto časové souslednosti, abychom měli k dispozici nejnovější, a tedy nejrelevantnější disky pro obnovu.

Detekce konfigurace pole a jeho sestavení

Nyní máme k dispozici obrazy disků buď všech členských (tzv. member) disků, nebo alespoň jen jednoho chybějícího. Dalším úkolem je určit konfiguraci RAID a svazek softwarově obnovit. Po dokončení tohoto úkonu lze data extrahovat na další zařízení. Během této fáze probíhá automatická kontrola konzistence obnovených dat tak, aby byly do obnovy zahrnuty pouze validní, funkční soubory.

Obnova RAID pole je náročná technologicky i časově, obzvláště, není-li známa konfigurace diskového pole.  Bez profesionální pomoci je však šance na úspěšnou obnovu dat, zejména v případech, kdy jeden nebo více disků vyžaduje hardwarovou intervenci, nevýznamná

Bezpečnostní informace!
  • Nepokoušejte se spustit příkaz CHKDSK na poli RAID jako způsob, jak se pokusit vyřešit problémy, se kterými se potýkáte
  • Neměňte pořadí disků v diskovém poli.
  • Bylo by bezvýsledné pokoušet se obnovit pole RAID 5 nebo RAID 6 s více než jedním poškozeným diskem.
  • Byl-li spuštěn automatický rebuild pole, nepřerušujte ho, neresetujte server.

V MyBlueDay  obnovujeme data z RAID v případě hardwarového i logického selhání na všech platformách

Provádíme obnovu data z jakékoli konfigurace pole RAID. Není-li konfigurace známa, jsme schopni ji detekovat. V roce 2022 máme dedikováno průměrně 100TB volných diskových kapacit pro okamžité využití při urgentním zásahu. Záchrana dat z RAID, probíhá  typicky z následujících typů diskových polí:

RAID 0 (striping = prokládání)

RAID 0 je použití libovolného počtu disků a jejich sloučení do jednoho velkého svazku. Tím se výrazně zvýší rychlost, protože čtete a zapisujete z více disků najednou. Jednotlivý soubor pak může využívat rychlost a kapacitu všech disků pole. Nevýhodou pole RAID 0 však je, že NENÍ redundantní. Ztráta kteréhokoli jednotlivého disku způsobí úplnou ztrátu dat. Tento typ pole RAID je mnohem méně spolehlivý než jediný disk.

V serverovém prostředí se jen zřídkakdy vyskytne situace, kdy byste měli použít pole RAID 0. Můžete jej použít pro mezipaměť nebo jiné účely, kde je důležitá rychlost a na spolehlivosti/ztrátě dat vůbec nezáleží. Neměl by se však používat k ničemu jinému. Jako příklad lze uvést 2,5% roční poruchovost disků, pokud máte pole RAID 0 se 6 disky, zvýšili jste roční riziko ztráty dat na téměř 13,5 %. 

RAID 1 (mirroring = zrcadlení)

Ačkoli RAID 1 dokáže mnohem složitější konfiguraci, téměř každý případ použití RAID 1 spočívá v tom, že dvojice identických disků shodně zrcadlí/kopíruje data rovnoměrně na všechny disky v poli. Smyslem pole RAID 1 je především redundance. Pokud dojde k úplné ztrátě disku, můžete stále fungovat na dalším disku.

V případě, že některý z disků selže, můžete vyměnit poškozený disk bez větších prostojů. RAID 1 vám také poskytuje další výhodu, kterou je vyšší výkon při čtení, protože data lze číst z kterékoli jednotky v poli. Nevýhodou je mírně vyšší latence zápisu. Vzhledem k tomu, že data je třeba zapisovat na obě jednotky v poli, budete mít k dispozici pouze kapacitu jedné diskové jednotky, zatímco budete potřebovat disky dva.

RAID 5/6 (Striping + Distributed Parity = prokládání + distribuovaná parita)

RAID 5 vyžaduje použití alespoň 3 disků (RAID 6 vyžaduje alespoň 4 disky). Využívá myšlenku RAID 0 a rozděluje data na více jednotek, aby se zvýšil výkon. Přidává však také aspekt redundance rozdělením paritních informací mezi disky. Na internetu existuje mnoho technických zdrojů, které vám podrobně vysvětlí, jak k tomu vlastně dochází. Stručně řečeno, u RAID 5 můžete přijít o jeden disk a u RAID 6 můžete přijít o dva disky, a přesto zachováte provoz pole a data.

RAID 5 a 6 vám zajistí výrazně vyšší výkon při čtení. Výkon zápisu však do značné míry závisí na použitém řadiči RAID. Pro RAID 5 nebo 6 budete zcela jistě potřebovat specializovaný hardwarový řadič. Důvodem je nutnost vypočítat paritní data a zapsat je na všechny disky. RAID 5 a RAID 6 jsou často dobrou volbou pro standardní webové servery, souborové servery a další systémy pro všeobecné použití, kde většinu transakcí tvoří čtení, a poskytují za vaše peníze dobrou hodnotu. Je to proto, že pro zvýšení rychlosti a redundance stačí zakoupit pouze jeden další disk pro RAID 5 (nebo dva další disky pro RAID 6).

RAID 5 nebo RAID 6 není nejlepší volbou pro prostředí s intenzivním zápisem, jako je databázový server, protože pomalejší zápis pravděpodobně degraduje celkový výkon pole. 

Stojí za zmínku, že v případě RAID 5 nebo RAID 6, v případě poškození jednoho nebo dvou disků, dojde k významnému snížení výkonu diskového pole tak, aby bylo možné udržel prostředí v provozu. Po výměně poškozeného disku bude nutné obnovit data z paritních informací. To si vyžádá značnou část celkového výkonu pole. Tyto doby obnovy (rebuild) se každým rokem stále více prodlužují. Důvod je zřejmý. Disky jsou stále větší a větší.

RAID 10 ( Mirroring + Striping = zrcadlení + prokládání)

RAID 10 vyžaduje alespoň 4 disky a je kombinací RAID 1 (zrcadlení) a RAID 0 (prokládání). Tím získáte vyšší rychlost i redundanci. Tato úroveň RAID je často doporučována, pokud hledáte rychlost, ale stále potřebujete redundanci. V konfiguraci se čtyřmi disky obsahují dva zrcadlené disky polovinu dat prokládaně a další dva disky zrcadlí druhou polovinu dat. To znamená, že můžete přijít o kterýkoli jednotlivý disk a pak případně i o druhý disk, aniž byste přišli o data. Stejně jako v případě RAID 1 budete mít k dispozici pouze kapacitu poloviny disků, ale dosáhnete vyššího výkonu při čtení a zápisu. Budete mít také k dispozici rychlou dobu obnovy diskového pole jako u RAID 1.