Monitoratge de discs durs amb SMART
Última actualització: octubre de 2018
Cap a l'any 1996 els fabricants de discs durs van especificar i incorporar als discs SMART (Self-Monitoring, Analysis and Reporting Technology systems). Permet monitoritzar l'estat dels discs per tal d'avisar-nos quan estan a punt de petar i poder canviar-los a temps a abans de perdre informació.
A Linux el paquet smartmontools és el que ens permet manegar-nos SMART i ens proveeix de smartctl que és una mena de client d'SMART i de smartd que es un dimoni que podem deixar corrents per a que ens avisi de seguida que detecti algun problema, per correu electrònic, p.e. si volem.
En aquesta plana només explicaré breument com fem servir smartctl (als exemples suposem que volem testejar el disc /dev/sda):
- Informació general del disc: smartctl -i /dev/sda
- Activem l'SMART pel disc (si no estava activat amb anterioritat): smartctl -s on /dev/sda (-s off per a desactivar)
- Veure l'estat de salut del disc: smartctl -H /dev/sda
Podem efectuar varis tipus de tests al disc, els normals seran long i short:
- Test curt: smartctl -t short /dev/sda
- Test llarg: smartctl -t long /dev/sda
- Veure en quin estat està el test (en curs o bé el resultat un cop acabat): smarctl -l selftest /dev/sda
- Informació detallada: smartctl -a /dev/sda
Tenim una eina gràfica que ens permet fer totes aquestes operacions i ens ajuda a interpretar la infomació resultant dels test. Aquesta eina es diu GSmartControl (https://gsmartcontrol.sourceforge.io/home/)
Interpretant la informació que ens proporciona smart
Per veure l'estat d'un disc, fem smartctl -a /dev/sda (substituirem /dev/sda pel nostre disc a comprovar). Ens fixarem en aquest valors:
Attribute Description
SMART 5 Reallocated Sectors Count
SMART 187 Reported Uncorrectable Errors
SMART 188 Command Timeout
SMART 197 Current Pending Sector Count
SMART 198 Uncorrectable Sector Count
Si aquests 5 atributs tenen un valor més gran que zero, hay motius per preocupar-se per la salut del disc, i toca investigar.
També ens fixarem en aquest atribut:
SMART 10 Spin_Retry_Count
Si tenim aquí un valor més gran de 30, podem preveure que els disc fallarà de manera inminent durant les properes hores.
Tags: disc dur, hdparm, smart, hard drive