Omówienie S.M.A.R.T.

W tym artykule chciałem przedstawić po kolei parametry "S.M.A.R.T." dysków twardych i omówić ich znaczenie, oraz ich wpływ na działanie dysków twardych. "S.M.A.R.T." monitoruje wiele parametrów dysku twardego, co pozwala mu na bieżąco oceniać stan urządzenia. Jest technologia raportowania parametrów dysku twardego potrzebnych do analizy jego stanu. Dzięki temu możemy monitorować co dzieje się z dyskiem twardym . Czy jest on w dobrym stanie, czy też występują problemy w jego pracy i należy w razie wystąpienia problemów zabezpieczyć ważne dane w systemie przez backup, przekopiowanie ich na zdrowy nośnik i czy szykować się na wymianę dysku. Każdy atrybut "S.M.A.R.T." posiada zestaw właściwości RAW, Threshold, Worst, Value. Wartość "Threshold" jest przypisana do konkretnego atrybutu. Kiedy wartość "RAW" spadnie poniżej progu, jest to monitorowane jako usterka. Niektóre atrybuty uważane są za krytyczne, a niektóre traktowane są tylko informacyjnie, nie muszą świadczyć o awarii dysku twardego.

Omówię teraz, co przedstawiają i oznaczają poszczególne właściwości:

1. Wartość RAW - RAW (Hex)

Wartości atrybutów - To na podstawie wyniku tego parametru atrybutu dowiadujemy się o obecnym stanie dysku. Pokazuje on surowy wynik, np. dla atrybutu nr 5 (Reallocated Sectors Count) jest to ilość realokowanych sektorów. Interpretacja należy już do użytkownika, który powinien wiedzieć jakie wartości konkretnych parametrów (wysokie/niskie) oznaczają sprawność/niesprawność danego dysku (model/producent/seria). Dane te można uzyskać na stronie producenta dysku twardego czy porównać z innymi danymi w sieci na temat danego dysku twardego.

2. Próg - Threshold

Jest to najniższy limit wartości różnych atrybutów. "S.M.A.R.T." porównuje wartości atrybutów z progami do identyfikacji awarii. Liczba określająca próg jest określana przez producenta urządzenia. Próg jest ustawiony fabrycznie przez producenta urządzenia i nie zmienia się. To graniczna wartość danego parametru, ustalona przez producenta, wyrażona w jednostkach przeliczonych. Im bardziej wartość "Current" zbliża się do "Treshold", tym gorzej.

3. Najgorsza - Worst

To najgorsza odnotowana wartość atrybutu, która wystąpiła do tej pory. (Najniższa odnotowana wartość "Value"). Pokazywana w jednostkach przeliczonych.

4. Bieżący - Value

Wartość może być przyjmowana 1-100, ale są atrybuty, które przyjmują inne wartości. Porównywane są wartości atrybutów z progami. Kiedy wartości atrybutów są większe niż progi, urządzenie działa normalnie. (Kiedy "Value" jest poniżej "Threshold" świadczy to o awarii, choć nie jest to warunek).

5. Wartość - Current

Tyle ile wynosi w obecnej chwili), jest to wartość przeliczona, jest porównywana do wartości kolumny "Treshold" . Im bardziej się zbliża, najczęściej malejąc, tym gorzej dla dysku twardego.

W praktyce, jeżeli dysk twardy posiada jakiekolwiek realokowane sektory, to z racji braku możliwości weryfikacji, czy są logiczne, czy fizyczne (realokację uznaje się za proces nieodwracalny) dla bezpieczeństwa lepiej uznać, że fizyczne, czyli, ze dysk jest uszkodzony. Jeżeli są tylko sektory niestabilne - należy zweryfikować jednoznacznie czy są sprawne, czy nie. Wartość surowa parametru Ilości Realokowanych Sektorów w prawie wszystkich dyskach wyjściowo wynosi 0 i rośnie w miarę degradacji dysku.

Kolejny problem, to problemy z zasilaniem i połączeniem kabla danych - będą one objawiać się uszkodzeniami logicznymi, problemami z rozruchem osi, błędami trybu "DMA", więc w przypadku tychże należy, zanim skupimy się na dysku, sprawdzić jego połączenia. Ewentualnie wymienić przewód połączeniowy dysk z płytą główną.

Warto mieć też świadomość, że oderwane fragmenty powierzchni magnetycznej talerza będą powodować dalsze uszkodzenia (gdy dysk już jest uszkodzony, to jego degradacja będzie już postępować) z ryzykiem uszkodzenia głowicy (wtedy dane odzyska już tylko w specjalistycznym laboratorium, które się tym specjalizuje, a koszt takiego odzyskiwania nie należy do tanich), urwana głowica może doprowadzić do tego (ramię rysujące talerz), że odzyskanie danych będzie mało udane i uda się je odzyskać w nieznacznym stopniu. Dlatego nie powinno się czekać z wymianą dysku w razie stwierdzenia poważnej usterki a wykonać backup ważnych danych jak najszybciej. Zalecane jest zresztą regularne wykonywanie kopii zapasowych w razie czego, nie tylko ze względu na awarię dysku twardego.

Przedstawię teraz, co oznaczają poszczególne parametry "S.M.A.R.T.":

(01) Read Error Rate

Oznacza wskaźnik odczytu błędów występujących podczas odczytywania danych z powierzchni dysku. Wartość, która nie równa się zeru, może oznaczać problemy z powierzchnią dysku, głowicami odczytu/zapisu lub z niezbyt dokładnie umieszczonymi głowicami na ścieżce zapisu. Napędy Seagate często wskazują na nieprzetworzoną wartość, która jest wysoka w nowych napędach, która jednak nie oznacza uszkodzenia.

Błąd krytyczny: Tak

(02) Throughput Performance

Ogólna przepustowość twardego dysku. Jeśli wartość atrybutu maleje, to prawdopodobnie zbliżają się problemy z dyskiem.

Błąd krytyczny: Nie

(03) Spin-Up Time

Przeciętny czas rozpędzenia talerzy dysku od wartości 0 obr/min. do pełnej prędkości (podawana w zależności od producenta w milisekundach lub sekundach).

Błąd krytyczny: Nie

(04) Start/Stop Mount (Number of spin-up times)

Liczba cykli start/stop dysku. Wartość "RAW" tego atrybutu jest liczbą cykli start/stop dysku.

Błąd krytyczny: Nie

(05) Reallocated Sectors Count

Liczba ponownie realokowanych (na nowo przydzielonych) sektorów. Gdy twardy dysk znajduje błąd zapisu lub odczytu, zaznacza sektor do ponownego przydzielenia i przesyła dane do specjalnie przeznaczonego obszaru (zapasowego). Proces znany też jako "remapowanie". Z tego powodu w nowych dyskach nie można odnaleźć "bad sektorów" ze względu na fakt, że nie są one wykrywane podczas sprawdzania powierzchni dysku. Wszystkie "bad sektory" są ukryte poprzez zastąpienie ich nowymi, z zapasowego obszaru. Gdy liczba ponownie przydzielonych sektorów wzrasta to prędkość odczytu i zapisu maleje (głowica dysku musi przesunąć się ponad obszar, w którym są przechowywane zapasowe sektory). Nieprzetworzona wartość zwykle oznacza liczbę złych sektorów, które zostały znalezione. Im większa wartość atrybutu, tym więcej sektorów ulega ponownemu przydzieleniu, co nie wróży niczego dobrego.

Błąd krytyczny: Tak

(06) Read Channel Margin

Rezerwa kanału podczas odczytu danych. Funkcja tego atrybutu nie jest objęta specyfikacją.

Błąd krytyczny: Nie

(07) Seek Error Rate

Częstotliwość błędów wyszukiwania głowic magnetycznych. W przypadku uszkodzenia systemu pozycjonowania, uszkodzenia serwa albo termicznej rozszerzalności dysku, ilość błędów wyszukiwania wzrasta. Większa ilość błędów wyszukiwania może oznaczać pogarszanie się stanu powierzchni dysku i podsystemu mechanicznego dysku.

Błąd krytyczny: Nie

(08) Seek Time Performance

Wydajność podczas wyszukiwania - gdy atrybut maleje, to oznacza, że zaistniał problem z podsystemem mechanicznym dysku.

Błąd krytyczny: Nie

(09) Power-On Hours (POH)

Wartość atrybutu (RAW) wskazuje na całkowitą liczbę godzin pracy dysku (w stanie zasilania). Wartość ta może być różna dla różnych producentów. Jeżeli wartość atrybutu zmniejsza się, może to być oznaką, że dysk zbliża się do swojego MTBF (średniej liczby godzin bezawaryjnej pracy, ustalonej przez producenta) - co nie oznacza, że po jej przekroczeniu dysk przestanie działać.

(10, 0A) Spin Retry Count (Spin-up retries)

Liczba prób rozpędzenia talerzy dysku. Atrybut ten przechowuje całkowitą liczbę prób rozpoczęcia rozpędzenia talerzy dysku (do osiągnięcia pełnej prędkości obrotowej). Wzrost wartości atrybutu oznacza problemy z podsystemem mechanicznym dysku np. zbliżającym się uszkodzeniem łożyska. .

Błąd krytyczny: Tak

(11, 0B) Recalibration Retries

Atrybut wskazuje na całkowitą liczbę żądań rekalibracji (pod warunkiem, że pierwsza próba nie powiodła się). Wzrost wartości atrybutu oznacza problemy w podsystemie mechanicznym twardego dysku.

Błąd krytyczny: Nie

(12, 0C) Power Cycle Count

Atrybut oznacza sumę pełnych cykli zasilania dysku.

Błąd krytyczny: Nie

(13, 0D) Soft Read Error Rate

ilość poprawionych błędów odczytu zgłoszonych do systemu operacyjnego.

Błąd krytyczny: Nie

(100) Erase/Program Cycles

Całkowita ilość cykli kasowania całej pamięci flash. Dyski SSD posiadają limit ilości zapisu do danej komórki pamięci. Konkretne wartości zależą od typu i producenta pamięci flash.

Błąd krytyczny: Nie

(103) Translation Table Rebuild

Dotyczy dysków SSD. Liczba zdarzeń w których wewnętrzne tablice adresów bloków zostały uszkodzone i następnie odbudowane. Wartość RAW tego atrybutu wskazuje rzeczywistą liczbę takich zdarzeń.

Błąd krytyczny: Nie

(170) Reserved Block Count

W dyskach SSD atrybut ten opisuje ilość rezerwowych komórek (bloków) pamięci flash. Wartość atrybutu wskazuje procent puli pozostałych do wykorzystania komórek. Wartość RAW w niektórych przypadkach zawiera rzeczywistą liczbę wykorzystywanych bloków rezerwowych.

Błąd krytyczny: Nie

(171) Program Fail Count

Ilość nieudanych zapisów do pamięci flash (dotyczy dysków SSD). Proces zapisu jest technicznie zwany "programowaniem pamięci flash", stąd pochodzi nazwa atrybutu (z ang. "program"). Gdy pamięć flash jest zużyta, dane nie mogą być w niej zapisywane i dana komórka pamięci jest możliwia tylko do odczytu. Wartość RAW pokazuje aktualną liczbę nieudanych zapisów.

Błąd krytyczny: Nie

(172) Erase Fail Count

Ilość nieudanych operacji kasowania komórek pamięci flash (dotyczy dysków SSD). Pełny cykl zapisu z pamięci flash składa się z dwóch etapów. Dane muszą być usunięte poprzez operację skasowania, następnie zapisane poprzez operację "zaprogramowania". Gdy pamięć flash jest zużyta, dane nie mogą być zapisywane i dana komórka pamięci zostaje komórką przeznaczoną tylko do odczytu. Wartość RAW pokazuje aktualną liczbę nieudanych operacji kasowania.

Błąd krytyczny: Nie

(173) Wear Leveller Worst Case Erase Count

Maksymalna liczba operacji kasowania wykonywana na pojedynczym bloku pamięci flash (dotyczy dysków SSD).

Błąd krytyczny: Nie

(174) Unexpected Power Loss

Dotyczy dysków SSD. Ilość niespodziewanych zaników zasilania, gdzie zasilanie zostało utracone przed wysłaniem komendy wyłączenia dysku. Żywotność dysków twardych w odniesieniu do takich wyłączeń jest dużo mniejsza niż w przypadku normalnego zamykania systemu. W dyskach SSD istnieje ryzyko uszkodzenia wewnętrznej tabeli stanów komórek pamięci podczas nagłego braku zasilania.

Błąd krytyczny: Nie

(175) Program Fail Count

Ilość nieudanych operacji zapisu komórek pamięci flash (dotyczy dysków SSD). Proces zapisu jest technicznie nazywany "programowaniem pamięci flash" stąd nazwa atrybutu (z ang. "program"). Gdy pamięć flash jest zużyta, dane nie mogą być zapisywane i dana komórka pamięci zostaje komórką przeznaczoną tylko do odczytu. Wartość RAW pokazuje aktualną liczbę nieudanych operacji zapisu.

Błąd krytyczny: Nie

(176) Erase Fail Count

Błąd krytyczny: Nie

(177) Wear Leveling Count

Maksymalna liczba operacji kasowania wykonana na pojedynczym bloku pamięci flash (dotyczy dysków SSD).

Błąd krytyczny: Nie

(178) Used Reserved Block Count

W dyskach SSD atrybut ten opisuje stan puli zużytych, rezerowowych komórek pamięci. Wartość atrybutu wskazuje procent puli zużytych komórek. Wartość RAW w niektórych przypadkach zawiera rzeczywistą liczbę wykorzystanych komórek rezerwowych.

Błąd krytyczny: Nie

(179) Used Reserved Block Count

W dyskach SSD atrybut ten opisuje stan puli zużytych, rezerwowych komórek pamięci. Wartość atrybutu wskazuje procent puli zużytych komórek. Wartość RAW w niektórych przypadkach zawiera rzeczywistą liczbę wykorzystanych komórek rezerwowych.

Błąd krytyczny: Nie

(180) Unused Reserved Block Count

W dyskach SSD atrybut ten opisuje stan puli dostępnych, rezerwowych komórek pamięci. Wartość atrybutu wskazuje procent puli pozostałych niezużytych komórek. Wartość RAW w niektórych przypadkach zawiera rzeczywistą liczbę niewykorzystanych komórek rezerwowych.

Błąd krytyczny: Nie

(181) Program Fail Count

Błąd krytyczny: Nie

(182) Erase Fail Count

Błąd krytyczny: Nie

(183) SATA Downshifts

Atrybut wskazuje jak często została zmniejszona prędkość transmisji SATA (z 6 Gbps do 3 lub 1,5 Gbps /z 3 Gbps do 1,5 Gbps) w celu prawidłowego przesłania danych. Jeśli wartość atrybutu maleje, można spróbować wymienić kabel SATA.

Błąd krytyczny: Nie

(184, B8) End-to-End error

Atrybut ten oznacza, że po przesłaniu przez bufor danych, ich parzystość nie jest zgodna (pomiędzy kontrolerem a twardym dyskiem).

Błąd krytyczny: Tak

(185, B9) Head Stability

Atrybut spotykany w dyskach Western Digital dotyczący stabilizacji głowicy.

Błąd krytyczny: Nie

(186, BA) Induced Op-Vibration Detection

Detekcja wibracji indukcyjnych. Atrybut spotykany w dyskach Western Digital.

Błąd krytyczny: Nie

(187, BB) Reported Uncorrectable Errors

Liczba błędów, które nie mogą być poprawione przy użyciu ECC.

Błąd krytyczny: Nie

(188, BC) Command Timeout

Liczba przerwanych operacji z powodu przerw w komunikacji z dyskiem twardym. Wartość tego atrybutu powinna być równa 0. Jeśli wartości są dużo powyżej 0, to prawdopodobnie zaistniały problemy z dostawą energii lub wystąpiły problemy z kablem IDE/SATA/etc.

Błąd krytyczny: Tak

(189, BD) High Fly Writes

Producenci dysków stosują czujniki wysokości głowic, które dostarczają dodatkowych informacji na temat przekraczania określonego zakresu pracy (wychylenia). Jeśli ten stan zaistnieje, to proces zapisu jest zatrzymywany a dane do zapisu zostają przepisane do bezpiecznego obszaru na dysku. Cecha ta jest zastosowana w większości napędów Seagate i niektórych napędach Western Digital.

Błąd krytyczny: Nie

(190,BE) Airflow Temperature

Temperatura przepływającego powietrza (dotyczy dysków WD)

Błąd krytyczny: Nie

(191, BF) G-sense error rate

Częstotliwość występowania błędów w wyniku oddziaływania przeciążenia. Atrybut dotyczy dysków wyposażonych w czujniki wykrycia przyśpieszenia i informuje o błędach pracy dysku w wyniku ich wystąpienia.

Błąd krytyczny: Nie

(192, C0) Power-off Retract Count

Ilość cykli zaparkowania głowic przy załączonym zasilaniu. Przy każdym wyłączeniu dysku głowice są parkowane w bezpiecznym miejscu. Ten atrybut zlicza ilość parkowań.

Błąd krytyczny: Nie

(193, C1) Load Cycle Count - Load/Unload Cycle Count

Ilość cykli zaparkowania/wyparkowania głowic ze strefy parkowania.

Błąd krytyczny: Nie

(194, C2) Temperature

Aktualna temperatura wewnątrz dysku

Błąd krytyczny: Nie

(195, C3) Hardware ECC Recovered

Ilość błędów naprawionych poprzez sprzętową korekcję błędów.

Błąd krytyczny: Nie

(196, C4) Reallocation Event Count

Liczba operacji dotyczących ponownego przydzielenia sektorów. Wartość atrybutu wskazuje na całkowitą liczbę prób przeniesienia danych z "bad sektorów" do zapasowego obszaru. Liczone są udane jak i nieudane próby.

Błąd krytyczny: Tak

(197, C5) Current Pending Sector Count

Liczba "niestabilnych" sektorów (oczekujących na ponowne przydzielenie z powodu błędu odczytu). Błędy odczytu danych w danym sektorze nie pozwalają na ponowne przydzielenie sektora.

Błąd krytyczny: Tak

(198, C6) Uncorrectable Sector Count

Całkowita liczba niekorygowalnych błędów przy zapisywaniu lub odczytywaniu sektora. Wzrost wartości atrybutu wskazuje na wady powierzchni dysku lub wystąpieniem problemów innych problemów odczytu związanych z podsystemem mechanicznym dysku.

Błąd krytyczny: Tak

(199, C7) UltraDMA CRC Error Count

Liczba błędów transferu danych w trybie UltraDMA.

Błąd krytyczny: Nie

(200, C8) Write Error Rate / Multi-Zone Error Rate

Częstość błędów zapisu. Atrybut określa liczbę błędów wynikających z zapisu danego sektora.

Błąd krytyczny: Nie

(201, C9) Soft Read Error Rate (Off-track errors Mount)

Liczba błędów wynikająca z próby zapisu danych poza ścieżką zapisu.

Błąd krytyczny: Tak

(202, CA) Data Address Mark errors

Ilość błędów mechanizmu korekcji błędów.

Błąd krytyczny: Nie

(203, CB) Run Out Cancel (ECC Errors count)

Liczba błędów ECC

Błąd krytyczny: Nie

(204, CC) Soft ECC Correction

Liczba błędów poprawionych przez programową korekcję błędów.

Błąd krytyczny: Nie

(205, CD) Thermal Asperity Rate (TAR)

Liczba błędów wynikających z powodu zbyt wysokiej temperatury

Błąd krytyczny: Nie

(206, CE) Flying Height

Parametr odnotowujący nieprawidłową wysokość głowicy ponad powierzchnią dysku. Jeśli wysokość jest zbyt niska, to wzrasta prawdopodobieństwo uszkodzenia głowicy. Gdy wysokość jest zbyt wysoka to wzrasta prawdopodobieństwo błędu zapisu lub odczytu.

Błąd krytyczny: Nie

(207, CF) Spin current

Ilość energii wymaganej do rozkręcenia talerzy dysku.

Błąd krytyczny: Nie

(208, D0) Spin buzzes count

Liczba prób rozkręcenia talerzy dysku do uzyskania ich nominalnej prędkości obrotowej.

Błąd krytyczny: Nie

(209, D1) Offline Seek Performance

Określenie sprawności podczas operacji wyszukiwania w trybie offline.

Błąd krytyczny: Nie

(210, D2) Vibration During Read

Ilość odnotowanych wibracji podczas odczytu danych.

Błąd krytyczny: Nie

(211, D3) Vibration During Write

Ilość odnotowanych wibracji podczas zapisu danych.

Błąd krytyczny: Nie

(212, D4) Shock During Write

Ilość odnotowanych zdarzeń związanych z przeciążeniem dysku na wskutek wstrząsu podczas zapisu danych.

Błąd krytyczny: Nie

(220, DC) Disk Shift

Przesunięcie talerzy od osi. Przesunięcie najczęściej jest wynikiem upadku/uderzenia dysku.

Błąd krytyczny: Nie

(221, DD) G-Sense Error Rate

Częstość występowania błędów podczas zanotowanego przeciążenia. Atrybut ten przechowuje wskazania czujnika przyśpieszenia i podaje całkowitą ilość błędów występujących jako efekt przeciążeń (upuszczenie dysku, etc).

Błąd krytyczny: Nie

(222, DE) Loaded Hours

Łączny czas pracy akuratora głowic magnetycznych podczas normalnego działania.

Błąd krytyczny: Nie

(223, DF) Load/Unload Retry Count

Łączny czas pracy akuratora głowic magnetycznych podczas operacji odczytu/zapisu/pozycjonowania.

Błąd krytyczny: Nie

(224, E0) Load Friction

Łączny czas użycia akuratora głowic spowodowany oporem na wskutek tarcia części mechanicznych dysku podczas pracy.

Błąd krytyczny: Nie

(225, E1) Load/Unload Cycle Count

Łączna liczba cykli zaparkowania/powrotu głowic ze strefy parkowania.

Błąd krytyczny: Nie

(226, E2) Load 'In'-time

Całkowity czas działania akuratora głowic magnetycznych.

Błąd krytyczny: Nie

(227, E3) Torque Amplification Count

Liczba prób wyrównania rozbieżności w szybkości obrotowej talerza(y)

Błąd krytyczny: Nie

(228, E4) Power-Off Retract Mount

Ilość włączeń dysku twardego.

Błąd krytyczny: Nie

(230, E6) GMR Head Amplitude lub Drive Life Protection Status

Amplituda drgań głowic (GMR-head) w czasie pracy (różnica pomiędzy typowym drganiem roboczym a maksymalnym odnotowanym). W przypadku nośników SSD może informować o przekroczeniu dopuszczalnych norm eksploatacji. Gdy wartość tego atrybutu nie jest maksymalna, dysk pracuje w trybie ochronnym, co oznacza, że, zużywa się znacznie szybciej, niż przewiduje jego producent. Dane te nie sygnalizują nagłej awarii, ale wskazują na trudne warunki, w jakich działa dysk co powoduje jego szybsze zużywanie się.

Błąd krytyczny: Nie

(231, E7) Temperature

Temperatura dysku.

Błąd krytyczny: Nie

(232, E8) Available Reserved Space

Atrybut wykorzystywany w dyskach SSD pokazuje pozostałą ilość rezerwowej pamięci (przeznaczonej na podmianę uszkodzonych sektorów). Wartość ta z czasem spada z poziomu 100 do 0.

Błąd krytyczny: Nie

(233, E9) Media Wearout Indicator

Przybliżony okres czasu "życia" pamięci flash (dotyczy dysków SSD).

Błąd krytyczny: Nie

(240, F0) Head Flying Hours

Czas w którym głowica jest ustawiana.

Błąd krytyczny: Nie

(241, F1) Total LBA-s Written

Całkowita liczba zapisanych sektorów (dotyczy dysków WD).

Błąd krytyczny: Nie

(242, F2) Total LBA-s Read

Całkowita liczba odczytanych sektorów (dotyczy dysków WD).

Błąd krytyczny: Nie

(250, FA) Read Error Retry Rate

Liczba błędów odczytu z dysku.

Błąd krytyczny: Nie

(254, FE) Free Fall Protection

Liczba wykrytych przez czujnik przyśpieszenia przeciążeń

Błąd krytyczny: Nie

Na jakie parametry zwracać uwagę w dla dysków SSD

Jeśli chodzi o dyski SSD to znacznie mniejsze jest ryzyko wystąpienia awarii, którą można przewidzieć na podstawie parametrów "S.M.A.R.T., gdyż nie mają one części mechanicznych, które z czasem ulegają zużyciu. W przypadku takiego rodzaju dysków warto zwrócić uwagę na takie parametry jak :

E7 – SSD Life Remaining / SSD Life Left (D) – wyznacza ilość pozostałego życia dysku, na początku ma wartość 100 i z czasem spada coraz niżej, a przy wartości 0 może oznaczać bliski koniec przydatności nośnika do użycia.
F1 – Life Time Writes / Lifetime Writes from Host (E) – określa wartość zapisanych/odczytanych danych wyrażoną w gigabajtach. Dzięki temu możemy dość jasno określić, czy nasz dysk obejmuje gwarancja, gdyż producenci podają przeważnie wartość TBW, czyli liczbę terabajtów danych zapisanych na nośniku, po przekroczeniu której wygasa gwarancja.
F2 – Lifetime Reads from Host (F) - liczba odczytanych danych w gigabajtach (najczęściej) od początku użytkowania dysku.
E6 - Drive Life Protection Status - dla dysków SSD może informować o przekroczeniu dopuszczalnych norm eksploatacji. Gdy wartość tego atrybutu nie jest maksymalna, dysk pracuje w trybie ochronnym, co oznacza, że, zużywa się znacznie szybciej, niż przewiduje jego producent. Dane te nie sygnalizują nagłej awarii, ale wskazują na trudne warunki, w jakich działa dysk co powoduje jego szybsze zużywanie się.

Wartości "F1" i "F2" mają bardzo duże znaczenie w przypadku gwarancji dysków SSD, producenci dysków czesto podają zapisy typu 7 lat gwarancji lub np 300 TBW, gdzie 300 TBW w skrócie bardzo częstoj oznacza liczbę terabajtów zapisanych na dysku.

Uwagi końcowe

Dla dysków SSD ważna jest opcja TRIM, jest ona bardzo waż na dla wydajności dysku, dlatego należy sprawdzic czy system poprawnie ja wykrył i aktywował ta usługę. Aby to zrobić uruchamiamy "Wiersz poleceń" w systemie lub "PowerShell". "Wiersz poleceń" możemy uruchomić przez jednoczesne naciśnięcie klawisza "Win + R" i w pole uruchamiania wpiisanie "cmd" lub "PowerShell". Dalej wpisujemy komende do sprawdzenia usługi TRIM:

fsutil behavior query disabledeletenotify

Zatwierdzamy ją klawiszem "Enter". Jeśli w pierwszej linijce pojawi się wartość "0", to TRIM jest aktywny jak w przykładzie moim. Jeżeli zamiast tego zobaczymy wartość "1" to opcja jest nieaktywna. W takim przypadku należy aktywować funkcje TRIM, zrobimy to, wpisując komendę:

fsutil behavior set disabledeletenotify 0

Zatwierdzamy ją klawiszem "Enter".

Druga linijka, zaczynająca się od "ReFS", dotyczy obsługi TRIM dla dysków pracujących głównie z systemami Linux:

ReFS DisableDeleteNotify = 0 (Disabled) - włączona

ReFS DisableDeleteNotify is not currently set - wyłączona

Nie dotyczy ona użytkowników Windows. Możemy ją również aktywować, ale aby ona zadziałała, musimy uruchomić "Wiersz Poleceń lub "PowerShell" jako Administrator systemu i wpisując z komendę:

fsutil behavior set disabledeletenotify ReFS 0

Zatwierdzamy ją klawiszem "Enter".

Aby uruchomić "PowerShell" jako admin możemy kliknąć "Start" w systemie Windows 10 p. p. myszki i wybrać opcje "Program Windows PowerShell (Administrator)" Z kolei "Wiersz Poleceń" uruchomimy jako "Administrator" naciskając na klawiaturze "Win +R" i zamiast potwierdzać "Enter", wciskamy klawisze "Ctrl+Shift+Enter”.

Wyjaśnię tutaj jeszcze, co to jest w ogóle funkcja TRIM (atrybut polecenia ATA Data Set Management Command). Pozwala ona na wysłanie informacji z systemu operacyjnego do kontrolera dysku SSD o zwolnieniu danego sektora (np. poprzez usunięcie pliku, którego dane były umieszczone w danym sektorze). Polecenie TRIM informuje dysk SSD, które bloki danych nie są już używane i pozwala na ich ponowne zapełnienie danymi. Pomaga to ustabilizować wydajność i kondycję dysku SSD wraz z upływem czasu.

Funkcja TRIM ma jeszcze jedną uboczną funkcję, ale bardzo przydatną. Jej włączenie uniemożliwia dostęp do wcześniej usuniętych danych. Nie jest o skuteczna metoda na zabezpieczenie przed odzyskiwaniem danych z nośnika SSD, czasami da się odzyskać kilka procent zawartości nośnika SSD, więc jeśli chcemy bardziej uniemożliwić odzyskiwanie danych np. w razie sprzedaży dysku SSD to lepiej jeszcze skorzystać z dodatkowych narzędzi jak np. "Secure Erase" itp. Nie mniej dla mniej istotnych danych jest wystarczająca.

" S.M.A.R.T. "nie jest standaryzowany, producenci twardych dysków korzystają z własnych algorytmów i mogą ustawić różne progi dla różnych atrybutów. Może to być przyczyną wprowadzania ich użytkowników w błąd, szczególnie tych, którzy posiadają dyski różnych producentów i je ze sobą porównują. Dlatego zawsze starajmy się porównywać dane z takich samych dysków twardych, czyli tego samego producenta i tego samego modelu. Należy pamiętać, że system "S.M.A.R.T." nie jest wyrocznią, nie jest doskonały, o czym wspomniałem już na wstępie artykułu i nie potrafi przewidywać zdarzeń, które mogą wystąpić w przyszłości. Potrafi mierzyć wartości szeregu parametrów, które mogą mieć wpływ na wydarzenia w przyszłości związane z kondycją naszego dysku twardego. System też nie uchroni nas przed uszkodzeniami mechanicznymi, jak i awarią elektroniki dysku twardego, które mogą wystąpić nagle, bez żadnych wcześniej sygnalizowanych objawów. Praktyka pokazuje też, że nierzadko oprogramowanie diagnostyczne wyświetla status dysku jako prawidłowy, a dysk po pewnym czasie zaczyna działać nieprawidłowo albo nagle przestaje działać w ogóle. Jednak bardzo często dokładna analiza poszczególnych atrybutów "S.M.A.R.T. "dysku pokazuje, że ich wartości są podejrzanie wysokie, a mimo to oprogramowanie diagnozujące nie zgłasza żadnych problemów, nie widać żadnego statusu ostrzeżeń, że dzieje się cos złego z dyskiem twardym. Dlatego ważną kwestią jest własna obserwacja wartości poszczególnych atrybutów. Dokładna analiza zmian newralgicznych atrybutów, wymienionych w artykule jako "krytyczne", pozwala na wcześniejsze wykrycie ewentualnego uszkodzenia dysku i ograniczenie ryzyka utraty danych. Wymienione w tekście atrybuty mają mniejszy lub większy wpływ na ocenę stanu dysku. Te mniej istotne zostały oznaczone jako błędy niekrytyczne. Istotną czasem rzeczą są powiązania pomiędzy atrybutami, które często są ignorowane. Szczególnie w przypadku kiedy program diagnostyczny pokazuje, że z dyskiem twardym jest wszystko "OK". Zdarza się wtedy, że dwie lub więcej wartości atrybutów dysku zbliża się do progów granicznych, jednakże uszkodzenie nie jest wykrywane, ponieważ żadna z wartości nie osiągnęła wymaganego poziomu progowego, co nie wywołuje alarmu w oprogramowaniu diagnostycznym, o czym już wspomniałem w tekście. Głównym i najbardziej istotnym problemem dysków twardych HDD są "Bad Sektory". Pojawienie się ich i zwiększająca się z czasem ich liczba zazwyczaj nie wróży niczego dobrego. Ich obecność możemy odczytać w programie diagnostycznym (Reallocated Sectors Count i Reallocation Event Count) lub dokonując testu powierzchni dysku twardego. Co już omówiłem w tekście. Czasami pojawienie się nawet jednego do kilku "Bad Sektorów" powoduje już problemy z działaniem dysku twardego jak freezy czy błędy z uruchamianiem aplikacji. Często też w takim przypadku program diagnostyczny pokazuje status dysku twardego jako "OK" i wartość "Reallocated Sectors Count". W nowych dyskach parametry "S.M.A.R.T." stale też analizuje powierzchnie dysku podczas standardowych operacji odczytu i zapisu danych. Jeśli znajdzie obszary sprawiające problemy. Może to być jeden lub więcej sektorów, w których dane są trudne do odczytania lub zapisania, stara się wtedy odczytać te dane i skopiować je do obszaru zapasowego dysku. To pierwotne miejsce zostaje właśnie wtedy zaznaczone jako "Bad Sektor" i dalsze próby zapisu czy odczytu w tym miejscu są przekierowywane do obszaru zapasowego. Gdy operacja jest zakończona, obszar zaznaczony jako "Bad Sector" jest już niedostępny dla użytkownika systemu operacyjnego. Nawet formatowanie dysku twardego nie wykaże problemów, ponieważ nieprawidłowy obszar nie jest już używany. Operacja ta nazywana jest potocznie relokacją lub remapowaniem sektorów. Może się zdarzyć, że relokacja dopiero nastąpi podczas formatowania pełnego dysku twardego. Ważnym atrybutem jest też temperatura dysków twardych, w jakiej pracują. Większość dysków twardych nie posiada zabezpieczenia przed przegrzaniem, a są wrażliwe na wysokie temperatury. Dlatego producenci dysków ograniczają maksymalną temperaturę operacyjną do 50' C -55' C. Czujniki temperatury dysków twardych nie należą do najdokładniejszych, różnica pomiędzy wykrytą a prawdziwą temperaturą może wynosić nawet kilka stopni. Dlatego też w sytuacji, gdy dyski pracują w warunkach, gdzie panuje wysoka temperatura, warto skorzystać z zewnętrznego termometru i sprawdzić, czy temperatura na powierzchni obudowy dysku nie przekracza wartości granicznych dla danego dysku twardego. Niektóre kontrolery/sterowniki dysków twardych nie dostarczają wartości progowych "S.M.A.R.T." lub są one równe zeru. Twarde dyski połączone z takimi kontrolerami uniemożliwiają wykonanie prawidłowego odczytu danych "S.M.A.R.T." Możliwe są też sytuacje, kiedy dostarczona informacja jest niekompletna. Nie wpływa to bezpośrednio na stan dysku, lecz wyświetlona informacja w programie diagnostycznym może być nieprawidłowa. Podobna sytuacja ma miejsce w przypadku prób odczytania danych w dyskach zewnętrznych podpinanych do komputerów przez złącza USB. Tylko niektóre z zastosowanych układów pozwalają na odczyt tych danych, głównie w dyskach znanych marek. W tego typu przypadkach zwracamy uwagę na wykorzystywane w analizie danych "S.M.A.R.T." oprogramowanie. Bardziej zaawansowane programy do analizy dysków twardych wyświetlają ostrzeżenia, gdy wykryte zostaną kontrolery, które posiadają opisane wyżej ograniczenia.

Zródła:

Własne doświadczenia.
Internet,
https://pl.wikipedia.org/wiki/S.M.A.R.T._(informatyka),
http://www.korepetycjenowysacz.edu.pl/parametry-smart-dysku-twardego-odczyt-i-opis/.

Artykuł na licencji Uznanie autorstwa-Użycie niekomercyjne-Na tych samych warunkach 3.0 Polska (CC BY-NC-SA 3.0 PL)

Omówienie S.M.A.R.T.

Omówienie wartości i progów

(01) Read Error Rate

(02) Throughput Performance

(03) Spin-Up Time

(04) Start/Stop Mount (Number of spin-up times)

(05) Reallocated Sectors Count

(06) Read Channel Margin

(07) Seek Error Rate

(08) Seek Time Performance

(09) Power-On Hours (POH)

(10, 0A) Spin Retry Count (Spin-up retries)

(11, 0B) Recalibration Retries

(12, 0C) Power Cycle Count

(13, 0D) Soft Read Error Rate

(100) Erase/Program Cycles

(103) Translation Table Rebuild

(170) Reserved Block Count

(171) Program Fail Count

(172) Erase Fail Count

(173) Wear Leveller Worst Case Erase Count

(174) Unexpected Power Loss

(175) Program Fail Count

(176) Erase Fail Count

(177) Wear Leveling Count

(178) Used Reserved Block Count

(179) Used Reserved Block Count

(180) Unused Reserved Block Count

(181) Program Fail Count

(182) Erase Fail Count

(183) SATA Downshifts

(184, B8) End-to-End error

(185, B9) Head Stability

(186, BA) Induced Op-Vibration Detection

(187, BB) Reported Uncorrectable Errors

(188, BC) Command Timeout

(189, BD) High Fly Writes

(190,BE) Airflow Temperature

(191, BF) G-sense error rate

(192, C0) Power-off Retract Count

(193, C1) Load Cycle Count - Load/Unload Cycle Count

(194, C2) Temperature

(195, C3) Hardware ECC Recovered

(196, C4) Reallocation Event Count

(197, C5) Current Pending Sector Count

(198, C6) Uncorrectable Sector Count

(199, C7) UltraDMA CRC Error Count

(200, C8) Write Error Rate / Multi-Zone Error Rate

(201, C9) Soft Read Error Rate (Off-track errors Mount)

(202, CA) Data Address Mark errors

(203, CB) Run Out Cancel (ECC Errors count)

(204, CC) Soft ECC Correction

(205, CD) Thermal Asperity Rate (TAR)

(206, CE) Flying Height

(207, CF) Spin current

(208, D0) Spin buzzes count

(209, D1) Offline Seek Performance

(210, D2) Vibration During Read

(211, D3) Vibration During Write

(212, D4) Shock During Write

(220, DC) Disk Shift

(221, DD) G-Sense Error Rate

(222, DE) Loaded Hours

(223, DF) Load/Unload Retry Count

(224, E0) Load Friction

(225, E1) Load/Unload Cycle Count

(226, E2) Load 'In'-time

(227, E3) Torque Amplification Count

(228, E4) Power-Off Retract Mount

(230, E6) GMR Head Amplitude lub Drive Life Protection Status

(231, E7) Temperature

(232, E8) Available Reserved Space

(233, E9) Media Wearout Indicator

(240, F0) Head Flying Hours

(241, F1) Total LBA-s Written

(242, F2) Total LBA-s Read

(250, FA) Read Error Retry Rate

Na jakie parametry zwracać uwagę w dla dysków SSD

Uwagi końcowe

Właściciel strony Andrzej Świech