disques-durs-supports-de-stockage.md 3.9 KB

% Disques durs supports de stockage

Interpréter la sortie de smartctl

Instructions données par ChatGPT

L’attribut Raw_Read_Error_Rate est souvent source de confusion, car il est interprété différemment selon le constructeur du disque. Voyons ça en détail :

  1. Structure de la ligne

ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 082 064 044 Pre-fail Always - 169987968

•   ID# 1 → C’est l’attribut S.M.A.R.T. standardisé pour les erreurs de lecture.
•   VALUE (82) → Valeur “normalisée” entre 1 et 100/200, fournie par le fabricant. Plus haut = meilleur.
•   WORST (64) → La plus mauvaise valeur atteinte dans l’historique.
•   THRESH (44) → Seuil en dessous duquel le disque est considéré en panne imminente.
•   TYPE Pre-fail → Signifie que si l’attribut franchit le seuil, le disque est considéré comme risqué pour la fiabilité.
•   RAW_VALUE (169987968) → Compteur brut. Son interprétation dépend du constructeur (Seagate, WD, Toshiba, etc.).

  1. Interprétation • Ici, la valeur actuelle est 82, le pire atteint est 64, et le seuil critique est 44. 👉 Comme 82 > 44, le disque n’a pas franchi la limite de sécurité fixée par le fabricant. • Le RAW_VALUE (169987968) n’est pas un nombre “d’erreurs brutes” simples : • Chez Seagate, ce nombre est souvent un compteur interne de tentatives et de corrections, pas directement une erreur fatale. Même un disque neuf peut avoir des valeurs RAW très élevées. • Chez Western Digital, cet attribut est parfois inutilisé ou toujours fixé à zéro.

En résumé, il ne faut pas interpréter le RAW_VALUE comme “170 millions d’erreurs”, mais comme une donnée interne dont l’échelle est spécifique au firmware.

  1. Comment savoir si c’est inquiétant ? • Ce qui compte réellement, c’est que la VALUE (82) reste au-dessus du THRESH (44). • Si vous voyez la valeur baisser régulièrement au fil des semaines/mois, le disque peut être en dégradation. • À court terme, avec 82 vs 44, le disque est encore jugé sain.

  1. Vérifications complémentaires utiles • Regarder aussi les attributs : • 5 Reallocated_Sector_Ct (secteurs réalloués) • 197 Current_Pending_Sector (secteurs instables en attente) • 198 Offline_Uncorrectable (secteurs non corrigibles)

👉 Ce sont eux qui sont les indicateurs les plus fiables d’un disque en train de faillir.

✅ Interprétation pour votre cas : Votre disque est considéré sain du point de vue du constructeur : Raw_Read_Error_Rate est dans une plage normale, et la valeur est au-dessus du seuil critique. Le chiffre brut impressionnant est normal, surtout sur des disques Seagate.

Voulez-vous que je vous donne un petit script (en Bash ou Python) qui surveille automatiquement les attributs critiques S.M.A.R.T. (5, 197, 198) et vous alerte si ça se dégrade ?

Interprétation des erreurs SMARTCTL

Voir cette page: fichier local

Source: https://techoverflow.net/2016/07/25/how-to-interpret-smartctl-messages-like-error-unc-at-lba/

RAID5

enlever un disque défectueux en diminuant l'espace du filesystem

How to remove 1 disk from a raid-5 mdadm array? - Unix & Linux Stack Exchange

Récupérer les données avec ddrescue

À suivre partiellement (jusqu'avant le montage de l'image) : Using ddrescue Command to Recover Data from Failing Disks

Montage de l'image: https://askubuntu.com/a/195310/138954