Monitoratge de discs durs amb SMART

Última actualització: octubre de 2018

Cap a l'any 1996 els fabricants de discs durs van especificar i incorporar als discs SMART (Self-Monitoring, Analysis and Reporting Technology systems). Permet monitoritzar l'estat dels discs per tal d'avisar-nos quan estan a punt de petar i poder canviar-los a temps a abans de perdre informació.

A Linux el paquet smartmontools és el que ens permet manegar-nos SMART i ens proveeix de smartctl que és una mena de client d'SMART i de smartd que es un dimoni que podem deixar corrents per a que ens avisi de seguida que detecti algun problema, per correu electrònic, p.e. si volem.

En aquesta plana només explicaré breument com fem servir smartctl (als exemples suposem que volem testejar el disc /dev/sda):

    • Informació general del disc: smartctl -i /dev/sda
    • Activem l'SMART pel disc (si no estava activat amb anterioritat): smartctl -s on /dev/sda (-s off per a desactivar)
    • Veure l'estat de salut del disc: smartctl -H /dev/sda

Podem efectuar varis tipus de tests al disc, els normals seran long i short:

    • Test curt: smartctl -t short /dev/sda
    • Test llarg: smartctl -t long /dev/sda
    • Veure en quin estat està el test (en curs o bé el resultat un cop acabat): smarctl -l selftest /dev/sda
    • Informació detallada: smartctl -a /dev/sda

Tenim una eina gràfica que ens permet fer totes aquestes operacions i ens ajuda a interpretar la infomació resultant dels test. Aquesta eina es diu GSmartControl (https://gsmartcontrol.sourceforge.io/home/)

Interpretant la informació que ens proporciona smart

Per veure l'estat d'un disc, fem smartctl -a /dev/sda (substituirem /dev/sda pel nostre disc a comprovar). Ens fixarem en aquest valors:

Attribute Description

SMART 5 Reallocated Sectors Count

SMART 187 Reported Uncorrectable Errors

SMART 188 Command Timeout

SMART 197 Current Pending Sector Count

SMART 198 Uncorrectable Sector Count

Si aquests 5 atributs tenen un valor més gran que zero, hay motius per preocupar-se per la salut del disc, i toca investigar.

També ens fixarem en aquest atribut:

SMART 10 Spin_Retry_Count

Si tenim aquí un valor més gran de 30, podem preveure que els disc fallarà de manera inminent durant les properes hores.

Tags: disc dur, hdparm, smart, hard drive