Abysse Tech

HiTech 4 All

backup

Comment définir une politique de Backup et Stockage de données

by

Bien à travers cet article, je souhaite vous sensibiliser sur l’importance de vous occuper de la sécurité de vos données. Généralement quand on touche à l’informatique d’un point de vue personnel on est très rarement confronté à des drames de perte de données et au boulot on a généralement une équipe qui s’en occupe. La raison du désintérêt du backup perso est que le volume de données est plus faible (généralement un disque dur externe + son ordi windows 500GB / 1 TB) et du coup on a aussi une probabilité de perte de données faible. Mais cela arrive !

Le CD étant complétement dépassé et n’étant pas un support fiable dans le temps, faire des backups de 700MB est obsolète et inadapté.

Mais alors quelle option choisir et pour quel budget ?

Ici, je suis dans une situation un peu plus batarde car la maison c’est aussi mon lieu de travail donc je combine données perso et données pro sensibles.

Du coup je vous partage mon processus de réflexion sur la protection de mon infrastructure et vous révéler ainsi une méthodologie de réflexion extensibles à des infrastructures plus conséquentes ou moindre.

La première phase consiste à identifier les risques classés par probabilité :

1) Risque électrique (surtension, orage)

2) Panne de disque dur

3) Hack (format c: –force par ex.)

4) Mauvaise Manipulation (effacement inopportun)

5) Panne d’un contrôleur RAID

6) Cambriolage

7) Incendie / Inondation

8) Risques Cataclysmiques -> Guerre nucléaire – EMP – Météorite

Bon, une protection de niveau 8 n’a que très peu de sens à l’échelle personnelle. Cela concerne principalement les banques, les gouvernements et les multinationales. Aussi, un réflexe humain mais stupide et de penser que l’on puisse évacuer les disques durs en cas d’incendie / inondation. Nous sommes ici dans la prévention et non dans l’hypothétique possibilité de faire quelque chose à l’instant T.

La deuxième étape consiste à définir les catégories de données que vous possédez, leur tailles et une évolution de stockage sur le moyen terme: Pour définir l’évolution, il faut définir le besoin usuel et le ménage possible.

A. Multimédia

1) Films (copie de DVD) -> 837 GB

2) Séries (copie de DVD) -> 639 GB

3) Clips Youtube / Tutoriels / Documentaires -> 58 GB

4) Fichiers Audio (copie de CD) -> 160 GB

5) Images / Photo -> 40 GB

6) Jeux -> 193 GB

Total : 1.927 GB

Evolution : 4 TB

B. Bureautique

1) Documents (PDF – Ebooks – Documents perso) -> 54 GB

2) Bureautique / Web Elements / OS -> 412 GB

Total : 466 GB

Evolution : 500 GB

C. Professionnel

1) Projet Alpha : 6.62 GB

2) Autres Projets : 71 GB

3) Sauvegardes BDD : 500 MB

4) Fichiers Outlook : 14.6 GB

Total : 292 GB

Evolution : 1 TB

D. Utilisation Courante : (données stockées sur les ordinateurs)

1) PC Alpha : 182 GB OS + 176 GB Backup

2) PC Beta : 54.4 GB OS + 0 GB Backup

Total : 412 GB

Evolution : 1 TB

Total De données : 3 TB

Total Evolution : 6.5 TB

Malheureusement, ce total n’inclut pas la redondance nécessaire pour prévenir des risques cités plus haut.

La troisième étape constitue de définir les risques acceptables en fonction des types de données. Par exemple, je ne vais pas investir dans un bunker en cage de faradet pour m’isoler des ondes electro magnétiques avec un système de plantations en rotation jour / nuit pour production d’oxygène et de nourriture pour palier à bombe H juste pour protéger mes données multimédias.

Voici un établissement de la criticité des données avec l’échelle suivante :

Perte Pénible mais acceptable -> + Perte Difficilement acceptable -> ++ Perte IMPOSSIBLE sauf cataclysme -> +++

A -> +

B -> +

C -> +++

D -> ++

Ensuite on va faire le listing du matériel utile à disposition afin de pouvoir apporter les modifications mesurées à notre infrastructure. Pas question ici, de lister les vieux HDD de 8 à 40 GB.

1) Un NAS 2 Baie avec deux HDD de 1TB.

2) Un boitier USB 2 Baies avec un HDD de 1TB et un HDD de 2TB

3) Un boitier Multimédia avec 1 HDD de 1 TB

4) Un boitier USB / eSata 4 baies sans HDD

5) Ordinateur Alpha : 1 SSD 500 GB + 1 HDD 500 GB

6) Ordinateur Beta : 1 HDD 250 + 1 HDD 500 GB

7) Un HDD IDE 320 GB

8) 1 Compte Dropbox 3GB

9) XXX GB sur serveur en ligne

Total Espace Physique : 8 TB

Bien, les totaux globaux sont juste à titre indicatif et ne sont pas du tout représentatifs de ce que l’on a réellement besoin car ils excluent la redondance et le backup.

Il est important ici de distinguer ces deux termes, la redondance de données n’est pas un backup mais est un solide processus pour la conservation de données tolérante à une faute matérielle. Devant le coût et la faible praticité de faire des backups manuels de chacun des groupes de données, je vais donc opter pour du RAID pour l’ensemble des données avec un backup et / ou backup online et sécurisé pour les données capitales professionnelles.

Voici la répartition des pertes acceptables et les solutions pour les pertes non acceptable vis à vis des risques mentionnés plus haut :

1) Risque électrique (surtension, orage) -> Protection à partir du Niveau + : Les systèmes de stockages sont reliés à des para-surtenseurs et / ou onduleurs. (cela coûte environ 15€ pour des parasurtenseurs classiques)

2) Panne de disque dur -> Protection à partir du niveau + : Réplication et ou backup de données.

3) Hack + format c: –force -> Protection à partir du niveau + : Scan Antivirus hebdomadaire avec 3 différents logiciels + Isolation des système de stockage / backup des ordinateurs par mise en réseau. Utilisation d’un machine virtuelle pour toute activité à risque (type test d’un .exe dont on ne connait pas l’éditeur).

Ici, on va aller plus loin pour le niveau +++ avec une encryption des données avec truecrypt et une redondance accrue. (backup + RAID)

4) Mauvaise Manipulation -> Protection à partir du niveau ++ : avec la mise en place d’un backup et non d’une réplication. Certains NAS permet de protéger contre une mauvaise manipulation avec l’ajout d’une corbeille (donc suppression de données uniquement possible en deux temps).

5) Panne d’un controleur RAID -> Protection à partir du niveau ++. Le backup manuel ou planifié permet d’éviter l’utilisation d’un contrôleur RAID.

6) Cambriolage -> Protection à partir du niveau +++ : Backup Online

7) Incendie / Inondation -> Protection à partir du Niveau +++ : backup online des données critiques et professionnelles.

8) Guerre nucléaire – EMP – Météorite -> Solution backup online sur un continent différent ce qui ne sera pas le cas, car je doute que mes entreprises soient utiles à la reconstruction d’un pays -> faillite, ou alors je meurs dans le process de toute façon.

Après toutes ces analyses préliminaires voici en conclusion comment je vais mettre en place le stockage en pratique. La sécurité minimale sera une sécurité de niveau 3.

Dans la mesure où je souhaite externaliser mon stockage, j’ai donc 3 boitiers utile.

1) Le Boitier USB / eSata 4 baies :

Ce boitier permet la mise en service d’un ensemble en JBOD (concaténation de données), en RAID 10 (deux grappes de 2 disques durs en RAID 0), en RAID 3 (3 disques utiles et 1 disque permettant la restauration de la perte d’un disque), ou en RAID 5 (4 disques utiles et 25% de chaque disque pour restaurer les données). Pour rappel voici un listing des tolérances de pannes :

JBOD : 0 -> si un disque claque, les données de ce disque sont perdus. Les autres disques sont récupérables.

RAID 0 : 0 -> si un disque claque , les données de tout les disques sont perdus

RAID 1 : 1 -> Tolérance de panne de 1 disque. Temps de reconstruction modéré.

RAID 3 : 1 -> Tolérance de panne de 1 disque (pas celui servant à la reconstruction). Temps de reconstruction lent.

RAID 10 : 2 -> Tolérance de panne jusqu’à 2 disques (si situés sur la même grappe.). Temps de reconstruction Rapide

RAID 5 : 1 -> Tolérance de panne de 1 disque. Temps de reconstruction Lent.

Ainsi, pour optimiser le ratio coût VS espace disponible VS flexibilité VS évolutivité je vais opter pour un ensemble de 4 disques dur de 2TB en RAID qui va me donner un espace utile de 6 TB avec une tolérance de panne de 1 disque. Cet ensemble sera utilisé pour le stockage multimédia + bureautique.

Cet ensemble ne sera pas backupé afin de limiter les lectures / écritures sur les disques et de réduire le risque de panne.

2) Le NAS 2 baies de 1TB :

Ce NAS sera la pièce centrale du stockage vu qu’il inclut un port USB + un port eSata.. Il permet de mettre une barrière de sécurité et d’isolation de tout les stockages en branchant les deux autres boitiers dessus. Aussi, il est possible de créer des petites de sauvegardes incrémentales directement. Avec sa rétention de données il sera donc utilisé pour la sauvegarde des fichiers professionnels et des projets en RAID 1. Avec un backup automatique vers un stockage online sécurisé. (serveur sous Owncloud).

3) Boitier USB 2 baies de 1TB.

Configuration en disques standalone pour stockage divers et variés afin de créer un backup de données multimédia de types importantes (photos / éléments bureautique importants).

4) Dual Disques sur les ordinateurs.

Utilisation de la fonction Backup de windows afin d’avoir un backup à jour en permanence avec une sauvegarde quotidienne et une retention de 48 heures afin de ne pas exploser le volume stockage.

5) Boitier IDE + DD de 320GB.

Hébergement de la machine virtuelle de test. Afin de limiter les cycles lectures écritures sur les disques principaux et ainsi de limiter leur usure.

6) boitier multimedia

Démantelé pour extraire le disque de 1TB.

7) Compte Dropbox / GoogleDrive :

Utilisé pour le backup de BDD émanant de serveur Windows (utilisation strictement professionnelle) Ou fichiers nécessitant une collaboration de partenaires pro.

8) Serveur Owncloud

Un petit serveur dédié en RAID 1 avec une distribution Owncloud afin de gérer les backups de type critique (fichiers pro). Les données jugées extremenent sensibles sont cryptés sur des containers encryptés avec truecrypt. L’upload initial s’effctuera sur un créneau horaire à définir à l’avance avec une compression du volume de donnée en multiple archives pour réduire le temps d’upload. La division en multiple archive permet d’éviter de recommencer l’upload si au bout de 48 heures de transfert internet coupe.

9) Coffre Ignifugé et dissimulé.

Un coffre contenant des clefs USB d’archives de fichiers extrêmement critique (logins de serveurs par exemple) donc à laisser offline reste à être considéré. On peut imaginer aussi un trou à l’arrière du coffre caché derrière un mur pour faire passer des câbles et y laisser des stockages actifs et que l’on ne peut pas arracher pour se protéger du cambriolage.

10) Un chien de Garde !

Allez pour finir sur une douce note humoristique (quoique..), le chien de garde + clef USB offline vous assure une protection de niveau 6 !! Ici un dogue argentin féroce de 45 KG veille sur mon installation informatique depuis des années. Ce fut la raison d’ailleurs du choix de la race lorsque j’étais étudiant et habitait dans des quartiers sensibles à loyers modérés où les cambriolages faisaient légion. Infra inviolée à l’époque du coup malgré sa réputation de caverne d’alibaba ;).

Enfin, je souhaiterais aborder un point qui n’a pas été couvert dans cet article car les données évoquées n’en ont que très peu l’utilité. Il s’agit d’une sauvegarde avec rétention de X jours, qui permet de stocker X versions différentes d’un fichier. C’est la sauvegarde la plus efficace dans la mesure où elle vous permet de restaurer à différents points (idéal pour un site web, ou pour votre OS Windows qui le fait par défaut). Il y a d’autres types et termes de sauvegardes qui n’ont pas lieu d’être dans cet article (LVM, machine virtuelle et snapshot, baremetal, blocs…) que l’on abordera dans des articles futurs et qui sont plus adaptés sur des serveurs.

Voili voilou! J’espère que cet article vous aura apporté quelque chose en matière de politique de stockage avec l’identification des risques et des solutions à considérer. Il y a matière à subjectivité en termes de solution choisie vis à vis des types de données bien entendu. Beaucoup opteront à raison pour du backup manuel classique au lieu de systèmes RAID qui ne sont pas des backups proprement parlé mais peuvent tout de même offrir confort et sécurité relative.

Les mesures à déployer dépendent bien entendu de l’espace de stockage requis VS le coût que cela requiert à sécuriser VS la valeur que l’on donne à nos données.

Étiquettes : , , , , , , , , ,

Leave A Comment