(Téměř) vše, co potřebujete vědět o poli RAID

RAID je zkratka pro Redundant Array of Inexpensive Disks (= redundantní pole levných disků). To znamená, že RAID je způsob logického spojení více disků do jednoho pole. Smyslem je, že tyto disky budou společně dosahovat rychlosti a/nebo spolehlivosti dražšího disku. Přesná rychlost a spolehlivost, které dosáhnete pomocí pole RAID, závisí na typu pole RAID, které používáte.

(Téměř) vše, co potřebujete vědět o poli RAID

V MyBlueDay poskytujeme profesionální službu obnova dat z RAID diskového pole  již téměř dvacet let, a přestože je RAID široce používanou technologií, způsob její implementace se s příchodem SSD disků (Solid State Drive) velmi změnil. Mnoho zákazníků se nás ptalo na RAID, co to je, jak funguje a jak z něj mohou získat co nejlepší spolehlivost a výkon. Proto jsem si řekl, že se podívám na příspěvky na blogu, které jsme v minulosti vydali, a vydám jejich aktualizovanou verzi, která bude zahrnovat moderní pokroky a snad i trendy do budoucnosti. 

Stručný přehled rozdílů rotačních disků HDD a elektronických SSD disků

Mechanické pevné disky (HDD) se obvykle volí v situacích, kdy je potřeba rychlosti a výkonu až na druhém místě za cenou. Vzhledem k fyzickým omezením a mechanické povaze mnoha vysokorychlostních pohyblivých částí, které jsou v nich obsaženy, mají disky HDD také relativně vysokou poruchovost ve srovnání s disky SSD. RAID má pomoci zmírnit oba tyto problémy, v závislosti na použitém typu RAID. Mechanický pevný disk má obvykle 2,5% pravděpodobnost selhání každý rok svého provozu. To bylo prokázáno mnoha zprávami a žádný konkrétní výrobce nebo model nemá dramatické odchylky od této 2,5% míry. Stručně řečeno, pokud si vážíte svých dat, budete muset zavést nějakou metodiku, která vám je pomůže ochránit před selháním disku. 

Disky SSD se obvykle volí v situacích, kdy rychlost a výkon mají přednost před úvahami o nákladech. Protože nemají žádné pohyblivé části, je schopnost zápisu i čtení dat na nich výrazně rychlejší než na HDD (nejméně 8-10× rychlejší.) A jejich míra selhání je zhruba 0,5 % během každého roku provozu, což výrazně snižuje riziko ve srovnání s rotujícím HDD.  

Vzhledem k dramatickému rozdílu mezi technologiemi HDD a SSD je důležité uvést, že některé implementace RAID, které jsou skvělé pro HDD, nejsou vhodné pro SSD a naopak. 

Chcete vědět jak ideálně nastavit své pole? On-line konfigurátor parametrů RAID

Jaké jsou typy pole RAID?

RAID 0 (striping = prokládání)

RAID 0 je použití libovolného počtu disků a jejich sloučení do jednoho velkého svazku. Tím se výrazně zvýší rychlost, protože čtete a zapisujete z více disků najednou. Jednotlivý soubor pak může využívat rychlost a kapacitu všech disků pole. Nevýhodou pole RAID 0 však je, že NENÍ redundantní. Ztráta kteréhokoli jednotlivého disku způsobí úplnou ztrátu dat. Tento typ pole RAID je mnohem méně spolehlivý než jediný disk.

V serverovém prostředí se jen zřídkakdy vyskytne situace, kdy byste měli použít pole RAID 0. Můžete jej použít pro mezipaměť nebo jiné účely, kde je důležitá rychlost a na spolehlivosti/ztrátě dat vůbec nezáleží. Neměl by se však používat k ničemu jinému. Jako příklad lze uvést 2,5% roční poruchovost disků, pokud máte pole RAID 0 se 6 disky, zvýšili jste roční riziko ztráty dat na téměř 13,5 %. 

RAID 1 (mirroring = zrcadlení)

Ačkoli RAID 1 dokáže mnohem složitější konfiguraci, téměř každý případ použití RAID 1 spočívá v tom, že dvojice identických disků shodně zrcadlí/kopíruje data rovnoměrně na všechny disky v poli. Smyslem pole RAID 1 je především redundance. Pokud dojde k úplné ztrátě disku, můžete stále fungovat na dalším disku.

V případě, že některý z disků selže, můžete vyměnit poškozený disk bez větších prostojů. RAID 1 vám také poskytuje další výhodu, kterou je vyšší výkon při čtení, protože data lze číst z kterékoli jednotky v poli. Nevýhodou je mírně vyšší latence zápisu. Vzhledem k tomu, že data je třeba zapisovat na obě jednotky v poli, budete mít k dispozici pouze kapacitu jedné diskové jednotky, zatímco budete potřebovat disky dva.

RAID 5/6 (Striping + Distributed Parity = prokládání + distribuovaná parita)

RAID 5 vyžaduje použití alespoň 3 disků (RAID 6 vyžaduje alespoň 4 disky). Využívá myšlenku RAID 0 a rozděluje data na více jednotek, aby se zvýšil výkon. Přidává však také aspekt redundance rozdělením paritních informací mezi disky. Na internetu existuje mnoho technických zdrojů, které vám podrobně vysvětlí, jak k tomu vlastně dochází. Stručně řečeno, u RAID 5 můžete přijít o jeden disk a u RAID 6 můžete přijít o dva disky, a přesto zachováte provoz pole a data.

RAID 5 a 6 vám zajistí výrazně vyšší výkon při čtení. Výkon zápisu však do značné míry závisí na použitém řadiči RAID. Pro RAID 5 nebo 6 budete zcela jistě potřebovat specializovaný hardwarový řadič. Důvodem je nutnost vypočítat paritní data a zapsat je na všechny disky. RAID 5 a RAID 6 jsou často dobrou volbou pro standardní webové servery, souborové servery a další systémy pro všeobecné použití, kde většinu transakcí tvoří čtení, a poskytují za vaše peníze dobrou hodnotu. Je to proto, že pro zvýšení rychlosti a redundance stačí zakoupit pouze jeden další disk pro RAID 5 (nebo dva další disky pro RAID 6).

RAID 5 nebo RAID 6 není nejlepší volbou pro prostředí s intenzivním zápisem, jako je databázový server, protože pomalejší zápis pravděpodobně degraduje celkový výkon pole. 

Stojí za zmínku, že v případě RAID 5 nebo RAID 6, v případě poškození jednoho nebo dvou disků, dojde k významnému snížení výkonu diskového pole tak, aby bylo možné udržel prostředí v provozu. Po výměně poškozeného disku bude nutné obnovit data z paritních informací. To si vyžádá značnou část celkového výkonu pole. Tyto doby obnovy (rebuild) se každým rokem stále více prodlužují. Důvod je zřejmý. Disky jsou stále větší a větší.

RAID 10 ( Mirroring + Striping = zrcadlení + prokládání)

RAID 10 vyžaduje alespoň 4 disky a je kombinací RAID 1 (zrcadlení) a RAID 0 (prokládání). Tím získáte vyšší rychlost i redundanci. Tato úroveň RAID je často doporučována, pokud hledáte rychlost, ale stále potřebujete redundanci. V konfiguraci se čtyřmi disky obsahují dva zrcadlené disky polovinu dat prokládaně a další dva disky zrcadlí druhou polovinu dat. To znamená, že můžete přijít o kterýkoli jednotlivý disk a pak případně i o druhý disk, aniž byste přišli o data. Stejně jako v případě RAID 1 budete mít k dispozici pouze kapacitu poloviny disků, ale dosáhnete vyššího výkonu při čtení a zápisu. Budete mít také k dispozici rychlou dobu obnovy diskového pole jako u RAID 1.

Kdy mám použít RAID?

RAID je velmi užitečný, pokud je pro vás nebo vaši firmu důležitá dostupnost a provozuschopnost. Zálohování vám pomůže pojistit se proti případné náhlé ztrátě dat. Obnova dat, například při mechanickém selhání disku, však může trvat mnoho hodi, a u komplikovaných stavů i dnů. Tyto zálohy mohou být staré několik hodin nebo dní, což vás může stát všechna data uložená nebo změněná od poslední zálohy. RAID umožňuje přečkat selhání jednoho nebo více disků bez ztráty dat a v mnoha případech i bez výpadku. 

RAID je také užitečný, pokud máte problémy s diskovým I/O tedy latencemi v přístupech, kdy aplikace čekají na disk, aby mohly provádět úlohy. Použití pole RAID vám poskytne dodatečnou propustnost, protože vám umožní číst a zapisovat data z více disků namísto pouze jednoho. Pokud navíc zvolíte hardwarový RAID, bude hardwarová karta RAID obsahovat dodatečnou paměť, která se použije jako mezipaměť, čímž se sníží zatížení fyzického hardwaru a zvýší celkový výkon diskového pole. 

Poznámka: Obecně nedoporučujeme používat hardwarovou kartu RAID pro svazky SSD, protože dodatečná mezipaměť není nutná kvůli rychlosti samotných disků SSD.

Jaký typ pole RAID mám použít?

  • Žádný RAID - vhodné, pokud jste schopni vydržet několikahodinový výpadek a/nebo ztrátu dat při obnově svých dat ze záloh.
  • RAID 0 - Dobrý, pokud jsou data nedůležitá a mohou být ztracena, ale výkon je kritický (například u pole použitého jako mezipaměť).
  • RAID 1 - Vhodné, pokud chcete levně získat další redundanci dat a/nebo rychlost čtení. Jedná se o dobrou základní úroveň pro ty, kteří chtějí dosáhnout vysoké dostupnosti dat nebo aplikací a zvýšit výkon zálohování.
  • RAID 5/6 - Vhodné, pokud máte např. webové servery, tedy prostředí s vysokou mírou čtení nebo extrémně velká pole úložišť jako jeden objekt. Při zápisech bude mít horší výkon než RAID 1. Pokud je vaše prostředí náročné na zápis dat nebo nepotřebujete více místa, než je na disku s RAID 1, je RAID 1 pravděpodobně efektivnější volbou.
  • RAID 10 - Dobré univerzální řešení, které poskytuje dodatečnou rychlost čtení a zápisu a také dodatečnou redundanci.

Softwarový RAID vs. hardwarový RAID?

Softwarový RAID

Softwarový RAID využije část výpočetního výkonu systému ke správě konfigurace RAID. Pokud chcete maximalizovat výkon systému, například při konfiguraci RAID 5 nebo 6, je při použití standardních pevných disků nejlepší použít hardwarovou kartu RAID. Důrazně se doporučuje, aby disky v poli RAID byly stejného typu a velikosti.

Hardwarový RAID

Hardwarový RAID vyžaduje speciální řadič nainstalovaný v serveru. Hardwarová karta RAID provádí veškerou správu pole (polí) RAID a poskytuje systému logické disky bez zátěže na straně samotného systému. Hardwarový RAID navíc může systému poskytnout mnoho různých typů konfigurací RAID současně. To zahrnuje poskytování pole RAID 1 pro spouštěcí a aplikační jednotku a pole RAID-5 pro velké úložné pole.

Co RAID neumí a nedělá?

  • RAID neznamená 100% spolehlivost. To nedokáže žádné zařízení. RAID je další nástroj v sadě nástrojů, který má pomoci minimalizovat prostoje a problémy s dostupností. Stále existuje riziko selhání karty RAID, které je však výrazně nižší než mechanické selhání jednotky HDD.
  • RAID nenahrazuje zálohování. Nic nemůže nahradit dobře naplánovanou a často testovanou implementaci zálohování!
  • RAID vás neochrání před poškozením dat, lidskou chybou ani bezpečnostními problémy. Může vás sice ochránit před selháním disku, ale existuje nespočet důvodů, proč zálohovat. Neberte tedy RAID jako náhradu zálohování. Pokud nemáte zavedené zálohování, nejste připraveni uvažovat o RAID jako o možnosti.
  • RAID nemusí nutně umožňovat dynamické zvětšování velikosti pole. Pokud potřebujete více diskového prostoru, nemůžete jednoduše přidat do pole další disk. Pravděpodobně budete muset začít od nuly a pole přestavět/reformátovat. 
  • RAID není vždy nejlepší volbou pro virtualizaci a vysokou dostupnost dat při selhání. Za těchto okolností se bude vhodnější zaměřit na řešení SAN.