Vadné sektory na disku
Vadné sektory na pevném disku představují jeden z nejzávažnějších problémů, který může vést k částečné nebo úplné ztrátě uložených dat. Tento článek vám poskytne komplexní přehled o tom, co vadné sektory vlastně jsou, jak vznikají, jakými symptomy se projevují, a především jak správně reagovat v případě, že má váš disk vadné bloky a díky nim jsou data na disku nedostupná.
Co jsou vadné sektory
Vadný sektor představuje samostatnou oblast na datovém médiu - magnetická plotna harddisku nebo NAND flash čip u SSD, paměťové karty nebo USB flash disku, kterou nelze spolehlivě přečíst ani na ni zapsat data.
Je důležité rozlišovat mezi terminologií u HDD a SSD. Zatímco u mechanických disků HDD hovoříme o sektorech, u SSD disků pracujeme s bloky a stránkami. SSD flash paměť je organizována do stránek (typicky 4–16 KB), které jsou seskupeny do bloků (256–512 KB). Tento rozdíl má zásadní dopad na způsob práce s daty a také na možnosti jejich obnovy.
Jak se vadné sektory typicky projevují?
Příznaky vadných sektorů jsou rozmanité a jejich intenzita závisí na rozsahu poškození. K nejčastějším symptomům mimo jiné patří:
- výrazné zpomalení operačního systému
- při přístupu ke konkrétním souborům nebo složkám systém "tuhne" a vše trvá velmi dlouho
- operační systém může zamrzat do té míry, že je nutný tvrdý restart
- spuštěné aplikace se mohou náhle ukončovat nebo je nelze spustit
- při kopírování souborů se objevují chybová hlášení, např. I/O chyby o nemožnosti přečíst určitý sektor
- při snaze o vytvoření zálohy trvá kopírování souborů extrémně dlouho a je velice pomalé
- externí disk se během práce odpojí
- vadné sektory mohou způsobit stav, kdy se externí disk tváří jako nenaformátovaný
U mechanických HDD se fyzické problémy často projevují zvukově. Klepání, cvakání, škrábání nebo pískání jsou jednoznačným signálem vážného hardwarového selhání, kdy je výskyt vadných sektorů jednou z možných závad (pokud disk klepe nebo vydává silné opakované divné zvuky, jde spíše o poškození čtecích hlav) . Naproti tomu SSD disky selhávají tiše, bez jakýchkoliv zvukových projevů, což může vést k opožděné detekci problému. Náhlé zmizení SSD disku ze systému nebo jeho označení jako neinicializovaného jsou typické příznaky kritického selhání SSD.
SMART diagnostika poskytuje cenné informace o stavu disku. U tradičních ATA/SATA disků je třeba věnovat pozornost především těmto atributům:
- Reallocated Sector Count (počet přemapovaných sektorů)
- Current Pending Sector Count (sektory čekající na přemapování)
- Uncorrectable Sector Count (neopravitelné sektory)
- UDMA CRC Error Count (chyby přenosu dat) a teplota provozu
U moderních NVMe SSD sledujeme tyto parametry:
- Percentage Used (procento využité životnosti)
- Data Units Read/Written (objem přečtených a zapsaných dat)
- Media and Data Integrity Errors (chyby integrity dat)
- Critical Warnings (kritická upozornění)
Je však nezbytné si uvědomit, že interpretace SMART hodnot se liší podle výrobce a modelu disku. To, co jeden výrobce označí jako kritickou hodnotu, může být u jiného výrobce v rámci normálního rozsahu. Proto by SMART diagnostiku měl vždy vyhodnocovat odborník se zkušenostmi s konkrétním typem disku.
Proč vadné sektory vznikají? Co je jejich příčina?
Vadné sektory u mechanických HDD
U mechanických pevných disků jsou hlavní příčinou vzniku vadných sektorů fyzické poškození způsobené mechanickými vlivy. Head-crash, tedy fyzický kontakt čtecí hlavičky s povrchem datové plotny, patří k nejzávažnějším selháním. K němu dochází jak ke zničení hlav, tak náhlému poškození povrchu datové plotny disku. Nejčastěji dochází ke vzniku vadných sektorů:
- při nárazech, otřesech nebo vibracích během provozu disku
- v prašném prostředí
- při přehřívání disku
- korozní procesy, které postupně degradují magnetickou vrstvu na plotnách
- při nesprávném napájení, vadný zdroj nebo nestabilní napětí v síti
- nesprávném ukončování - odpojování za běhu disku
Se stárnutím harddisku klesá jeho schopnost spolehlivého udržení magnetického záznamu. Magnetická vrstva na povrchu ploten postupně degraduje vlivem času, teplotních změn, vibrací a případné koroze, takže čtecí hlavičky musí z čím dál slabšího signálu rekonstruovat původní data. K tomu se přidává opotřebení mechanických částí (ložiska, raménko hlaviček) a možné stárnutí elektroniky řadiče, které může vést k chybám v komunikaci nebo řízení motorů a aktuátorů. Výsledkem je vyšší pravděpodobnost vzniku nových vadných sektorů i postupné rozšiřování existujících problémových oblastí.
Vadné sektory na polovodičovém SSD (nemechanický disk)
U SSD disků je hlavní příčinou opotřebení NAND flash paměťových buněk. Každá buňka má omezený počet programovacích a mazacích cyklů, které určují její životnost. SLC buňky vydrží přibližně 100 000 cyklů, MLC asi 10 000, TLC okolo 3 000 a nejlevnější QLC pouze 1 000 cyklů. Z tohoto důvodu moderní SSD využívají sofistikované algoritmy wear-leveling, které rovnoměrně rozkládají zápisy napříč všemi buňkami, a garbage collection pro optimalizaci využití dostupného prostoru.
Funkce over-provisioning, tedy rezerva určité části kapacity pro interní správu, pomáhá prodloužit životnost SSD. TRIM příkazy umožňují operačnímu systému informovat disk o blocích, které již nejsou používány a mohou být vymazány. Překročení teplotních limitů, ať už dlouhodobým přehříváním nebo prudkými teplotními změnami, může urychlit degradaci jak HDD, tak SSD. Výrobci stanovují provozní rozsah teplot, který by měl být dodržován.
Co určitě (ne)dělat, když má disk vadné sektory
Při zjištění vadných sektorů je kritické vyvarovat se určitých činností, které mohou situaci nenávratně zhoršit. Nikdy nespouštějte nástroj CHKDSK, fsck nebo podobné diagnostické utility na disku s podezřením na fyzické poškození. Tyto nástroje jsou navrženy pro opravu logických chyb souborového systému, nikoliv pro řešení hardwarových závad. CHKDSK může dokonce převést část vašich dat do souborů s příponou CHK, čímž výrazně komplikuje nebo prakticky znemožňuje smysluplnou obnovu dat pro běžného uživatele.
Stejně nebezpečné je použití funkcí jako zero-fill nebo "low-level format" na disk, u kterého se již objevují vadné sektory. Tyto operace systematicky přepisují celý povrch a mohou během krátké doby definitivně zničit zbytky čitelného záznamu. Problematické jsou i opakované pokusy o čtení vadných sektorů, které automaticky provádí operační systém nebo diagnostické utility – disk pak dlouho a opakovaně přeskakuje přes poškozenou oblast, hlavičky se k ní neustále vracejí a výrazně roste mechanická zátěž i riziko dalšího prohloubení poškození. Namísto nekonečných pokusů je vhodné disk co nejdříve vypnout a řešit situaci až po konzultaci se specializovanou laboratoří na záchranu dat.
Dopad výskytu vadných bloků na obnovu dat podle typu úložiště
Vadné sektory jako důsledek degradace jakéhokoliv paměťového média mají své charakteristiky právě podle typu úložiště na kterém vzniky. Jiné příčiny vzniku a důsledky jejich výskytu vidíme typicky u mechanických HDD s magnetickým záznamem na datovou plotnu a u polovodičových SSD se záznamem elektrickým.
Vadné bloky na mechanickém pevném disku HDD
U mechanických HDD disků s více plotnami a čtecími hlavičkami je často klíčové identifikovat, která konkrétní hlavička selhává, nebo čte obsah z povrchu, který vykazuje množství chyb. Profesionální záchrana dat využívá metodu čtení head-by-head, kdy se data kopírují postupně z jednotlivých datových ploten. Hlavičky nelze zaměňovat mezi jednotlivými povrchy, protože každá je přesně kalibrována pro svůj povrch. Head-map, tedy mapa hlaviček a jejich stavů, umožňuje cílené čtení pouze funkčními hlavičkami, čímž se minimalizuje riziko dalšího poškození.
Firmware pevného disku obsahuje adaptivní parametry, které řídí chování hlaviček při čtení. Manipulace s těmito parametry vyžaduje specializované hardwarové a softwarové nástroje, které nejsou běžně dostupné. Neodborný zásah do firmware může disk natrvalo znehodnotit.
Vadné bloky na disku SSD (solid state)
U SSD disků je integrována funkce Flash Translation Layer (FTL), která tvoří zásadní překážku pro klasickou záchranu dat. FTL je vrstva firmwaru, která překládá logické adresy bloků, které vidí operační systém, na skutečné fyzické adresy v NAND flash. Část mapy je pro rychlost uložena v interní DRAM, ale klíčová metadata jsou zároveň perzistentně ukládána do samotné flash paměti, takže disk po odpojení napájení neztratí informaci o tom, kde jsou data fyzicky uložená. Pokud se FTL nebo jeho metadata v důsledku výskytu neobnovitelných vadných sektorů poškodí, disk může být sice stále detekovatelný, ale logické adresy už neodpovídají reálnému rozmístění dat.
Zvláštní kategorii tvoří SMR disky (Shingled Magnetic Recording), u nichž jsou datové stopy na plotně částečně překryté jako šindele na střeše. Tato technologie umožňuje vyšší kapacitu, ale výrazně komplikuje zápis a přepis dat. Při změně jednoho bloku musí řadič často provést operaci typu read–modify–write nad celým pásmem překrývaných stop, což vede k velké vnitřní zátěži a citlivosti na jakékoliv chyby povrchu. Při vytváření sektorového obrazu disku (imagingu) se to projevuje velmi nestabilní rychlostí, dlouhými prodlevami a vyšší chybovostí při čtení z poškozených zón, a výsledkem je obvykle delší doba obnovy a nižší celková úspěšnost než u obdobných CMR disků.
Všechny pevné disky obsahují řídící software, tzv. firmware, který řídí jednotku pevného disku a který je součástí tzv, servisní oblasti disku. V rámci firmware je mmj. integrována funkce, která sleduje počet vadných sektorů, které pevný disk vykazuje. Když si koupíte jakýkoliv pevný disk, tak již obsahuje vadné sektory! Ty však byly přidány do "seznamu trvalých závad" (P-List) ve firmwaru. Harddisk tak ví, že se má těmto oblastem na plotně vyhnout. Firmware má dále modul nazvaný "přírůstkový seznam defektů" (G-List). Jedná se o seznam, do kterého se přidávají nové vadné sektory, v celém průběhu životnosti harddisku. HDD opět tyto sektory "přemapuje" a vadné oblasti disku již nepoužívá. Přemapování sektorů umožňuje tzv. rezervní fond sektorů. Pokud však dojde k náhlému a masivnímu výskytu vadných sektorů na disku, může dojít k selhání firmware v důsledku zaplnění přírůstkového seznamu G-List. Typicky se jedná o stav po pádu / otřesu disku.
Prevence a provozní doporučení
Prevence vzniku vadných sektorů začíná zajištěním stabilního napájení. Kvalitní zdroj s dostatečnou rezervou a s aktivní korekci účiníku (PFC) zajišťuje čisté napětí bez výkyvů a překmitů. Záložní zdroj (UPS) chrání před výpadky a přepětím ze sítě. Chlazení disku a proudění vzduchu kolem disků je stejně důležité – přehřátí výrazně urychluje degradaci všech komponent.
Pravidelný monitoring stavu disků pomocí nástrojů jako CrystalDiskInfo pro Windows, smartctl pro Linux nebo vendor-specifických utilit poskytuje včasné varování. Sledování teploty, počtu provozních hodin, SMART atributů a dalších parametrů umožňuje identifikovat problémy v raném stádiu, kdy je ještě čas na plánovanou výměnu disku.
Strategie zálohování dat 3–2–1 znamená tři kopie dat, na dvou různých typech médií, přičemž jedna kopie je umístěna mimo primární lokalitu. Stejně důležitá jako tvorba záloh je občasná kontrola jejich obnovitelnosti. Záloha, kterou nejde obnovit, je k ničemu.
Často kladené otázky k vadným sektorům na disku
-
Vadný sektor je oblast na povrchu disku (nebo blok u SSD), kterou zařízení nedokáže spolehlivě přečíst nebo zapsat, i když se o to opakovaně pokouší pomocí korekčních kódů (ECC). Na magnetických HDD k vadným sektorům dochází typicky vlivem mechanického opotřebení, otřesů, přehřívání nebo výrobních vad povrchu. U SSD mohou vadné bloky vznikat nadměrným množstvím přepisů, chybami v buňkách flash paměti nebo firmware. Výsledkem jsou chyby při čtení, zpomalení a případná ztráta dat uložených v těchto oblastech.
-
Typickým projevem vadných sektorů je výrazné zpomalení nebo zamrzání počítače při čtení nebo kopírování určitých souborů, dlouhé načítání adresářů, chyby typu CRC nebo hlášky o nemožnosti přečíst soubor. V diagnostice S.M.A.R.T. se často zvyšují hodnoty Reallocated Sectors, Current Pending Sector nebo Uncorrectable Sectors. Při testu povrchu disku (například pomocí nástrojů, které čtou disk sektor po sektoru) se v problémových oblastech objevují sektory s velmi dlouhou dobou odezvy nebo zcela nečitelná místa.
-
Soft vadné sektory jsou logické chyby – typicky jde o situaci, kdy jsou data v sektoru poškozená (například chybou přenosu, výpadkem napájení při zápisu), ale fyzický povrch je v pořádku. Někdy je možné je opravit opakovaným přepsáním nebo rekonstrukcí souborového systému. Hard vadné sektory jsou naopak důsledkem fyzického poškození povrchu disku nebo paměťové buňky u SSD. Takové sektory nelze spolehlivě používat, disk je většinou přemapuje do rezervní oblasti, nebo začne data v této oblasti trvale ztrácet.
-
Reallocated Sectors Count označuje počet sektorů, které disk už vyřadil z provozu a přemapoval na záložní oblast – jde o sektory, u kterých se prokázala chyba při čtení nebo zápisu. Current Pending Sector Count označuje sektory, které jsou podezřelé, protože je disk nedokázal spolehlivě přečíst, a čeká, zda se je podaří později přemapovat. Uncorrectable Sector Count znamená sektory, které se nepodařilo přečíst ani pomocí korekčních kódů. Rostoucí hodnoty těchto parametrů jsou varováním, že disk je v nestabilním stavu a je nutné data co nejdříve zálohovat nebo provést profesionální imaging.
-
Jednotlivé přemapované sektory se mohou u staršího disku objevit bezprostředně po náhodné události a několik let se nic neděje. Problém nastává, když počet vadných nebo pending sektorů začne růst, disk se zpomaluje a přibývají chyby při čtení. V takové chvíli už disk nelze považovat za spolehlivý. Pro důležitá data se obecně nedoporučuje dlouhodobě používat disk, u kterého SMART hlásí chyby povrchu – je lepší data včas přenést na nové médium.
-
Ne. CHKDSK a podobné nástroje opravují především logické chyby souborového systému – tabulky alokace, MFT, strukturu adresářů. Mohou některé problematické sektory označit jako nepoužitelné na úrovni souborového systému, takže se do nich nebudou ukládat další data. Fyzické vady povrchu disku však žádný software neodstraní. Navíc spuštění CHKDSK na disku s rozsáhlejšími vadnými sektory může způsobit, že dojde k mnohonásobnému čtení problémových oblastí a dalšímu zhoršení stavu, případně ke ztrátě části dat.
-
Programy, které slibují opravu vadných sektorů, ve skutečnosti často provádějí intenzivní čtení a přepisování povrchu disku, čímž nutí firmware disku, aby vadné sektory přemapoval. V praxi to znamená obrovskou zátěž pro médium, které je už v horším stavu, a vysoké riziko definitivní ztráty dat z postižených oblastí. Nízkoúrovňový formát v původním smyslu slova se u moderních disků neprovádí – běžně dostupné nástroje pouze přepisují obsah všech sektorů, čímž nevratně smažou data. Pokud jsou data důležitá, je vhodnější disk dále netrápit a řešit nejprve jejich záchranu dat.
-
Když disk narazí na vadný sektor, opakovaně se jej snaží přečíst s využitím korekčních kódů a interních mechanismů. To může trvat sekundy až desítky sekund na jediný sektor. Operační systém v tuto dobu čeká na odpověď a zdánlivě zamrzá – okno kopírování se nehne, aplikace nereagují. Pokud je vadných sektorů více, nebo jsou v oblasti, kde se nachází systémové soubory či důležitá data, může to vypadat jako kompletní zatuhnutí počítače.
-
U klasických HDD představují vadné sektory poškozená místa na magnetickém povrchu. I když jsou obtížně čitelná, existuje šance část dat z vadné oblasti postupně získat pomocí speciálního hardwaru a řízeného čtení. U SSD jde o vadné bloky buněk flash paměti. Jakmile je blok vyhodnocen jako nečitelný nebo přepsaný (například v kombinaci s TRIM a garbage collection), původní obsah je prakticky nedostupný. Záchrana dat z SSD s vadnými bloky je proto často výrazně limitovaná nebo nemožná, zejména po smazání nebo formátování.
-
Profesionální obnova dat z disku, který má vadné sektory obvykle začíná detailní diagnostikou disku, včetně vyhodnocení stavu povrchu, čtecích hlaviček a SMART parametrů. Následuje postupný imaging – vytváření kopie disku sektor po sektoru pomocí specializovaného hardwaru (PC-3000), který dokáže řídit rychlost čtení, počet opakování a přeskočení nejvíce poškozených oblastí. Data se nejprve kopírují z relativně zdravých oblastí a až poté se technik věnuje kritickým místům. Teprve z takto získaného obrazu se rekonstruuje souborový systém a obnovují jednotlivé soubory, aby se minimalizovalo další zatížení původního disku.
-
V první řadě je důležité disk dále zbytečně nezatěžovat – neprovádět opakované kopírování problematických souborů, nespouštět testy s intenzivním zápisem a vyhnout se experimentům s „opravnými“ nástroji. Pokud je disk ještě čitelný, má smysl co nejdříve zkopírovat nejdůležitější data, ideálně v pořadí podle priority, nikoliv abecedně. U disků, které výrazně zpomalují, zamrzají nebo už mají vysoké hodnoty chyb ve SMART, je bezpečnější obrátit se na specializovanou firmu, která provede řízený imaging a sníží riziko definitivní ztráty dat.
-
Vadným sektorům se nedá stoprocentně vyhnout, ale lze výrazně snížit riziko jejich vzniku. Důležité je kvalitní a stabilní napájení, dobré chlazení disku, vyhýbání se nárazům a otřesům (zejména u notebooků a externích disků), bezpečné odpojování USB disků a pravidelné aktualizace firmware u některých zařízení. Klíčové je také pravidelné zálohování – nejlépe na nezávislé médium nebo do cloudu. Pokud se vadné sektory objeví, kvalitní zálohy umožní zařízení bez stresu vyměnit a data jednoduše obnovit.
Slovníček pojmů
LBA (Logical Block Addressing) – Logické blokové adresování představuje schéma pro adresování jednotlivých sektorů nebo bloků na úložném zařízení pomocí celočíselného indexu.
512e / 4Kn – Formáty fyzických sektorů, kde 512e emuluje 512bajtové sektory na fyzických 4KB sektorech kvůli zpětné kompatibilitě, zatímco 4Kn využívá nativní 4KB sektory bez emulace.
P-List / G-List – Primární seznam závad vzniká během výroby a obsahuje oblasti, které nevyhověly výrobním testům. Přírůstkový seznam defektů se plní během životnosti disku a slouží pro přemapování nově vzniklých vadných sektorů.
TRIM – Příkaz, kterým operační systém informuje SSD o blocích, které již nejsou používány a mohou být fyzicky vymazány. Umožňuje efektivnější správu flash paměti a prodlužuje životnost SSD.
Over-provisioning – Rezervovaná kapacita na SSD, která není dostupná uživateli, ale slouží pro interní operace jako wear-leveling, garbage collection a náhradu opotřebených bloků.
TBW (Total Bytes Written) – Celkové množství dat, které lze na SSD zapsat během jeho životnosti. Typické hodnoty jsou stovky TB pro spotřební SSD a petabajty pro enterprise modely.
URE (Unrecoverable Read Error) – Neopravitelná chyba čtení, kdy disk není schopen přečíst data ani pomocí opakovaných pokusů a ECC kódů. Pravděpodobnost URE se zvyšuje s velikostí disku.
Head-map – Mapa stavů jednotlivých čtecích hlaviček u víceplochých HDD, která umožňuje identifikovat funkční a nefunkční hlavičky a provádět cílené čtení pouze zdravými elementy.
Závěr....
Vadné sektory na disku představují závažný problém, který vyžaduje okamžitou a správnou reakci. Klíčovým zjištěním je, že prevence a včasná detekce pomocí SMART monitoringu mohou zabránit ztrátě dat. V okamžiku, kdy se vadné sektory projeví, je nezbytné zastavit jakékoliv pokusy o samoopravy a vytvořit záložní obraz disku pomocí specializovaných nástrojů.
Pochopení rozdílů mezi HDD a SSD, mezi logickými a fyzickými chybami, a mezi různými typy úložných technologií je základem pro správné rozhodování. Moderní SSD s TRIM a hardwarovým šifrováním vyžadují odlišný přístup než tradiční mechanické disky. RAID systémy poskytují ochranu proti výpadkům, ale nejsou náhradou za řádné zálohy.
Pokud se váš disk projevuje symptomy popsanými v tomto článku, neváhejte jej vypnout a poradit se s odborníky na záchranu dat. Správná reakce v prvních okamžicích může rozhodnout o úspěchu či neúspěchu záchrany vašich dat. Profesionální diagnostika poskytne přesný odhad stavu disku a možností obnovy, často zdarma a bez závazků. Čas hraje klíčovou roli – každé další zapnutí poškozeného disku může zhoršit situaci a snížit šance na úspěšnou obnovu.
