Récupération de données NAS et SAN : ce qu’il faut savoir pour restaurer vite, bien et en toute sécurité

Dans les entreprises, collectivités et administrations, la centralisation du stockage est un formidable accélérateur de collaboration : on partage des fichiers, on héberge des bases de données, on simplifie les sauvegardes et l’administration. Deux grandes familles dominent ce paysage : le NAS (Network Attached Storage) et le SAN (Storage Area Network). Le point commun : ils mutualisent des volumes de données critiques. La différence : ils ne se conçoivent pas, ne s’exploitent pas, et la récupération de données serveur ne se fait pas de la même manière.

Quand un incident survient (panne de disque, corruption logique, sinistre, attaque par rançongiciel), les bons réflexes font toute la différence. Avec une approche méthodique (diagnostic, identification de la configuration, clonage, reconstruction RAID, éventuelle intervention en salle blanche), la récupération est souvent possible, y compris sur des environnements complexes. L’objectif de cet article : vous donner une vision claire, orientée résultats, afin de maximiser vos chances de restauration tout en limitant les risques d’aggravation.

NAS et SAN : deux solutions de stockage en réseau, deux philosophies

Avant de parler récupération, il est utile de replacer NAS et SAN dans leur logique : l’un est plutôt orienté partage de fichiers, l’autre volumes hautes performances. Cette distinction a un impact direct sur la façon dont les données sont organisées (et donc sur la façon de les reconstituer après incident).

Le NAS : un serveur autonome orienté partage de fichiers

Un NAS est un dispositif de stockage connecté au réseau, généralement administré via une interface web. Il sert principalement à stocker et partager des fichiers (documents, images, projets, archives), avec des fonctionnalités pensées pour la simplicité d’exploitation et l’accès multi-utilisateurs.

Gestion centralisée: configuration et supervision via interface web.
Accès simultané: plusieurs postes clients peuvent travailler sur les mêmes partages.
Droits d’accès: lecture seule, lecture / écriture, groupes, permissions par dossier.
Résilience: intégration de systèmes RAID (selon les modèles et configurations).
Maintenance facilitée: remplacement possible de disques en hot-swap (sur modèles compatibles) sans immobiliser l’ensemble du réseau.
Sauvegardes: planification et gestion centralisées (selon l’outil et la stratégie en place).

En pratique, un NAS est souvent le “coffre-fort” des fichiers de l’organisation : quand il devient inaccessible, l’activité peut se retrouver fortement ralentie. Bonne nouvelle : en cas de panne, les données restent fréquemment récupérables, à condition d’éviter les écritures et manipulations hasardeuses.

Le SAN : une architecture hautes performances pour des volumes critiques

Un SAN est une architecture réseau de stockage, et non un simple appareil. Il permet de présenter des ressources de stockage comme des “disques” ou “volumes” aux serveurs, via des protocoles conçus pour la performance et la disponibilité.

Selon les environnements, un SAN peut s’appuyer sur :

iSCSI (transport sur réseau IP).
Fibre Channel (réseau dédié haute performance).
FCoE (Fibre Channel over Ethernet).

Les bénéfices typiquement recherchés avec un SAN sont particulièrement attractifs pour la virtualisation, les bases de données, les applications métiers et les infrastructures multi-serveurs :

Très hautes performances grâce aux protocoles et à l’architecture.
Scalabilité: ajout de baies, de tiroirs, de disques, extension de capacité.
Environnements hétérogènes: interconnexion de serveurs de différents systèmes (selon conception).
Haute disponibilité: redondance matérielle, tolérance aux pannes, chemins multiples.
Gestion centralisée: sauvegarde, restauration, reprise d’activité, selon l’écosystème.

En récupération de données, le SAN demande souvent une analyse plus “architecturale” : on ne parle pas seulement d’un système de fichiers, mais aussi de volumes logiques, de LUN, de masquage, de zoning, et parfois de plusieurs couches de virtualisation.

NAS vs SAN : comparaison rapide (utile en contexte de récupération)

Lorsque l’on cherche à restaurer des données, la question n’est pas uniquement “quel disque est en panne ?” mais aussi “comment les données sont-elles découpées, distribuées et présentées aux serveurs ?”. Voici une synthèse pratique.

Critère	NAS	SAN
Nature	Dispositif autonome de stockage en réseau	Architecture réseau de stockage
Usage principal	Partage de fichiers (répertoires, projets, documents)	Volumes / LUN pour serveurs (VM, bases de données, applications)
Administration	Souvent via interface web (gestion simplifiée)	Plus “infrastructure” : zoning, LUN masking, multipathing
Performance	Très bonne selon réseau et disques, orientée fichiers	Très élevée, pensée pour charges critiques et I/O intensives
Redondance	Souvent RAID, parfois réplication selon modèle	RAID en baie, redondance matérielle, haute disponibilité
Récupération	Analyse RAID + système de fichiers (et métadonnées NAS)	Analyse RAID + LUN + zoning / masquage + couches logiques

Pourquoi les pertes de données arrivent malgré le RAID et la redondance

Le RAID et la redondance sont d’excellents alliés pour la continuité de service, mais ils ne remplacent ni une stratégie de sauvegarde solide, ni une réaction appropriée en cas d’incident. En pratique, NAS et SAN peuvent subir des défaillances similaires à tout système de stockage.

Incidents typiques rencontrés sur NAS et SAN

Pannes mécaniques: têtes de lecture, moteur, usure, chocs, défaillance progressive.
Pannes électroniques: carte PCB, contrôleur, surtension, composants endommagés.
Pannes logiques: corruption du firmware, tables de partition, métadonnées, système de fichiers.
Sinistres: inondation, incendie, foudre, surchauffe, incident en salle serveurs.
Origine humaine: erreur de manipulation, reformatage accidentel, mauvaise opération de maintenance.
Cyberattaque: chiffrement par rançongiciel, compromission de comptes, suppression malveillante.

Ce qui est encourageant : dans beaucoup de scénarios, les données ne “disparaissent” pas instantanément. Elles deviennent inaccessibles ou incohérentes, ce qui laisse une fenêtre d’intervention. La clé est de préserver l’état des supports et d’éviter de déclencher des écritures (rebuild RAID, resync, vérifications destructrices, réinstallation).

La récupération de données : une démarche structurée (et très technique)

Pour un NAS ou un SAN, une récupération efficace repose sur la compréhension précise de la configuration réelle au moment de la panne. On ne se contente pas de “brancher un disque” : on doit reconstituer la logique de distribution des données, surtout en présence de RAID.

Étape 1 : diagnostic et collecte des informations clés

Le diagnostic sert à répondre à une question simple : qu’est-ce qui est cassé, et qu’est-ce qui est encore exploitable ? Pour cela, on identifie notamment :

Le type de RAID et ses paramètres (par exemple block size, distribution des blocs, rotation de parité, ordre des disques).
Le rôle de chaque disque (présence de disques “membres”, “hot spare”, disques exclus, etc.).
Le système de fichiers et ses métadonnées (côté NAS, selon la configuration).
Pour un SAN : les LUN (Logical Unit Number), le LUN masking, le zoning, et la manière dont les volumes sont présentés aux serveurs.

Cette phase est déterminante, car une “mauvaise hypothèse” (ordre des disques inversé, mauvais niveau RAID, mauvais décalage) peut conduire à une reconstruction incohérente, voire à dégrader des chances de récupération si des écritures sont effectuées.

Étape 2 : sécurisation par clonage (copie disque à disque)

Une règle d’or en récupération : on travaille sur des copies, pas sur les originaux. La pratique standard consiste à :

Réaliser une copie de chaque disque sain.
Réaliser un clone des disques endommagés (avec gestion des secteurs instables selon l’état du support).

Le clonage est un investissement gagnant : il protège les originaux d’une dégradation supplémentaire et permet de répéter les tentatives de reconstruction sans risque physique sur les supports sources.

Étape 3 : reconstruction logique (RAID, volumes, LUN) et extraction

Une fois les supports sécurisés, la récupération implique généralement :

La reconstruction du RAID en respectant l’ordre des lecteurs, la symétrie des données et les paramètres exacts.
Pour le SAN : la reconstitution de la couche volume (LUN) et de la configuration associée (selon le contexte).
L’extraction des fichiers ou des données applicatives, puis des contrôles de cohérence.

Le bénéfice d’une approche structurée est double : on augmente le taux de récupération et on réduit le temps perdu en essais non maîtrisés.

Étape 4 : intervention en salle blanche (si panne matérielle)

Quand un disque présente une panne mécanique (par exemple une défaillance des têtes de lecture), une intervention peut nécessiter un environnement contrôlé, typiquement une salle blanche. L’objectif : manipuler les composants internes sans contamination par des particules, ce qui pourrait aggraver la situation.

Cette étape n’est pas systématique : elle concerne surtout les pannes physiques. En cas de panne logique, une récupération peut parfois se faire sans intervention matérielle, ce qui accélère le délai.

Ce qu’il faut faire immédiatement en cas de perte de données (réflexes qui augmentent le taux de réussite)

Le meilleur levier de réussite n’est pas un “outil miracle”, mais une décision simple : stopper les actions qui écrivent sur le stockage. En environnement RAID, chaque tentative peut modifier les métadonnées, compliquer la reconstruction et réduire les chances de succès.

Checklist d’urgence : les bons gestes

Arrêter l’activité sur le NAS ou le SAN dès la détection d’un comportement anormal (inaccessibilité, bruits suspects, volumes manquants, lenteurs extrêmes, erreurs SMART, alertes contrôleur).
Préserver l’état: conserver les disques et supports tels quels, sans réorganisation.
Documenter: noter les messages d’erreur, les voyants, la configuration visible (nombre de disques, slots, modèle, niveau RAID déclaré, dernière action effectuée).
Isoler en cas de suspicion de rançongiciel: limiter la propagation en coupant les accès réseau concernés (selon procédures internes).

À éviter absolument (pour protéger vos chances de restauration)

Ne pas réinitialiser le serveur ou la baie “pour voir si ça repart”.
Ne pas tenter de reconfigurer ou reconstruire le RAID à l’aveugle.
Ne pas formater un disque membre du RAID défaillant.
Ne pas réinstaller un système d’exploitation sur un serveur impliqué si cela touche les volumes.
Ne pas intervertir les disques (l’ordre physique / logique est une information précieuse).

Dans un système RAID, “faire un test” peut déclencher des écritures de métadonnées. Préserver l’état initial est souvent le geste le plus rentable pour une récupération rapide et complète.

Focus technique : RAID, LUN et système de fichiers, les trois piliers de la récupération

Pour rester factuel et utile, voici les éléments qui conditionnent le plus la réussite d’une récupération sur stockage mutualisé. L’idée n’est pas de transformer vos équipes en laboratoire, mais de comprendre pourquoi un diagnostic précis est indispensable.

RAID : performance et continuité, mais reconstruction sensible

Dans la majorité des NAS et de nombreuses baies SAN, les disques sont agrégés en RAID. La reconstruction doit respecter la configuration exacte, notamment :

Le niveau RAID (RAID 0, 1, 5, 6, 10, variantes constructeur).
La taille de bloc (souvent appelée stripe size ou block size).
La distribution des données et la rotation de la parité (pour RAID 5 / 6).
L’ordre réel des disques (qui n’est pas toujours l’ordre des baies physiques).

Un point important, orienté bénéfice : même si un RAID est en échec, il reste fréquemment possible de reconstituer l’ensemble à partir des disques (ou de leurs clones), tant que l’on évite les opérations destructrices.

LUN (SAN) : la “carte” des volumes à retrouver

En SAN, les données sont souvent exposées aux serveurs via des LUN. On doit alors identifier :

Quels serveurs voyaient quelles LUN (et à quel moment).
Les règles de LUN masking (qui a le droit de voir quoi).
Le zoning (segmentation logique dans le tissu Fibre Channel, le cas échéant).

Cette cartographie est un accélérateur : bien reconstruite, elle permet de cibler rapidement les volumes prioritaires (par exemple une base de données, un datastore de virtualisation, un volume applicatif critique).

Système de fichiers : l’organisation finale des données

Qu’il s’agisse d’un NAS (partages) ou d’un volume présenté par un SAN (vu comme un disque local par un serveur), le système de fichiers est l’étape finale qui rend les fichiers exploitables. En récupération, l’objectif est de retrouver des structures cohérentes (répertoires, noms, dates, permissions si applicable) et d’extraire les données avec un maximum d’intégrité.

Rançongiciel, chiffrement et restauration : clarifier ce qui est possible

Les attaques par rançongiciel visent souvent les stockages centralisés, car l’impact opérationnel est immédiat. Une réponse efficace combine confinement, préservation des preuves, et stratégie de restauration.

Récupération après rançongiciel : ce qui aide réellement

Stopper les écritures et isoler le stockage réduit le volume de données chiffrées.
Disposer de sauvegardes hors ligne ou immuables (quand elles existent) accélère le retour à la normale.
Une analyse méthodique permet de déterminer si certaines zones n’ont pas été touchées, ou si des versions antérieures peuvent être exploitées (selon la politique de snapshots et de sauvegardes).

Chiffrement natif : l’importance de la clé

Lorsque le chiffrement est activé au niveau du NAS ou d’un dossier partagé, la récupération peut rester envisageable si la clé de chiffrement (ou le fichier de clé associé) est disponible. Sans cette clé, les données chiffrées ne sont généralement pas exploitables, car le chiffrement est conçu précisément pour empêcher toute lecture non autorisée.

Message orienté action : conserver et sécuriser les clés (et tester leur restauration) est un investissement à très fort retour, car il conditionne la capacité à récupérer en cas d’incident majeur.

Délais : à quoi s’attendre selon la nature de la panne

Le temps de récupération dépend moins du volume de données que de la nature de la défaillance, du nombre de disques impliqués, et de la complexité RAID / SAN. Sans promettre de délais universels, on observe couramment :

Panne logique (corruption, erreur, reformatage) : la récupération peut parfois être menée en 24 à 72 heures, selon le cas et la complexité.
Panne mécanique (un ou plusieurs disques en défaut) : le processus peut nécessiter plusieurs jours ouvrés, notamment si une intervention en salle blanche et une reconstruction RAID sont nécessaires.

Ce qui accélère presque toujours : une réaction rapide, l’arrêt des écritures, et la conservation de tous les supports dans leur état d’origine.

Histoires de réussite : ce qui fait la différence sur le terrain

Sans entrer dans des cas sensibles ou des détails identifiants, voici des scénarios typiques où une approche rigoureuse apporte des résultats très concrets.

Cas 1 : NAS en mode dégradé, reconstruction évitée à temps

Une équipe IT détecte une alerte disque sur un NAS en RAID avec tolérance de panne. Le réflexe courant serait de lancer immédiatement une reconstruction avec un disque neuf. Ici, l’équipe choisit de geler l’activité et de faire analyser la situation avant toute reconstruction. Résultat : le diagnostic met en évidence des secteurs instables sur un second disque, qui auraient pu faire échouer la reconstruction. En passant par une sécurisation (clonage) puis une reconstruction contrôlée, les données sont restaurées avec un impact minimisé sur l’activité.

Cas 2 : SAN et volumes critiques, cartographie LUN priorisée

Suite à une panne d’accès à plusieurs volumes, l’enjeu est de remettre en route en priorité la production applicative. La récupération est accélérée en identifiant rapidement les LUN critiques et leur rôle (base de données, volumes applicatifs, datastores). En priorisant l’extraction et la restauration des volumes indispensables, l’organisation retrouve une capacité opérationnelle progressive, au lieu d’attendre une restauration “tout ou rien”.

Cas 3 : NAS inaccessible après incident système, données récupérées depuis les disques

Après un incident logiciel (mise à jour interrompue, corruption), le NAS ne démarre plus correctement. Les données restent sur les disques, mais l’interface n’est plus accessible. En contournant la couche système du NAS et en travaillant à partir des disques (et de leurs clones), il devient possible d’extraire les données sans dépendre du redémarrage du service.

Préparer l’avenir : les bonnes pratiques qui rendent la récupération plus simple

La récupération de données est souvent possible, mais la meilleure stratégie reste de réduire le temps d’indisponibilité et la complexité d’intervention. Voici des pratiques à fort impact, particulièrement adaptées aux environnements NAS et SAN.

Mettre en place une stratégie de sauvegarde réaliste et testée

Multiplier les copies selon la criticité (au minimum : sauvegarde locale + copie externe).
Tester régulièrement la restauration (un backup non testé est une hypothèse, pas une garantie).
Définir des objectifs RPO et RTO adaptés : quantité de données acceptable à perdre, et délai acceptable de remise en service.

Documenter la configuration (un gain énorme en situation de crise)

Conserver l’inventaire : modèles, numéros de disques, slots, schéma RAID.
Pour le SAN : documentation des LUN, zoning, masquage, chemins d’accès.
Centraliser les procédures d’urgence : qui fait quoi, dans quel ordre, et comment isoler une attaque.

Surveiller les signaux faibles

Alertes SMART, erreurs de lecture, reconstructions fréquentes, latences inhabituelles.
Températures anormales, ventilation insuffisante, historique d’incidents électriques.
Évolution des performances applicatives corrélée au stockage.

Ces mesures ne rendent pas les incidents impossibles, mais elles transforment une crise brutale en un événement maîtrisé, avec une récupération plus rapide et plus prédictible.

Résumé opérationnel : le plan d’action en 60 secondes

Cessez immédiatement toute écriture sur le NAS ou les volumes SAN concernés.
Ne lancez pas de reconstruction RAID, de réinitialisation ou de formatage.
Conservez l’ordre des disques et documentez la situation (messages, logs, voyants, actions récentes).
Privilégiez une approche par clonage avant toute manipulation de récupération.
Faites diagnostiquer la configuration réelle (RAID, LUN, système de fichiers) pour une reconstruction fiable.

NAS et SAN sont des piliers de la performance et de la collaboration. En cas de panne, une réaction disciplinée et une méthode de récupération structurée permettent souvent de transformer un incident stressant en succès de restauration, avec un retour à l’activité rapide et des données préservées.