Reçois gratuitement une formation complète

sur le référencement !


Reçois tout de suite un livre de 45 pages pour tout savoir sur le référencement et sur l'écriture d'article pour le référencement
Valider la politique de confidentialité

Qu'est-ce que la technologie RAID et laquelle choisir ?

Ecrit par Benoit Thibaudeau dans Boite à outils | 0 commentaires |

Dans l'article du 13 mars de cette année, qui traite des technologies de disques HDD et SSD, j'ai abordé à plusieurs reprises, mais sans trop détailler, le stockage des données avec la technologie RAID.

Mais, comme le troisième article, qui sortira après celui que vous êtes en train de lire, va traiter du stockage de vos données sur des serveurs NAS, il est préférable que je prenne un peu de temps pour expliquer ce que la technique RAID.

Alors, n'en déplaise aux puristes et je sais qu'il y en a parmi vous 😉 , je vais faire simple, très simple voir très très simple, pour être compris par tout le monde, même sans connaissance en informatique, par ce que si je commence à détailler ce qu'est la "parité tournante", je pense que je vais perdre une très grande partie de mes lecteurs. Mais je descendrais suffisamment dans les détails pour que vous puissiez comprendre de quoi il retourne et que la lecture du prochain article sur les serveurs NAS, ne vous pose pas de problème.

Qu'est-ce que la technique RAID

Que veut dire RAID ? : "Redundant Arrays of Inexpensive Disks" en anglais dans le texte ... Ok en Français ? Regroupement Redondant de Disques Peu Onéreux ... Mais franchement RRDPO c'est moins mémorisable que RAID, non ? 😉

Le RAID est un ensemble de techniques de "virtualisation du stockage" des données réparties sur plusieurs disques durs.

AH !!! Je vous ai vu tiquer sur "Virtualisation du stockage", ne vous en faites pas vous allez comprendre ensuite.

Le but de cette technique de stockage est d'améliorer les performances d'accès aux données et/ou la sécurité les données en assurant une sauvegarde de ces dernières en cas de défaillance d'un disque du système.

La perte de données informatique pour des particuliers peut déjà être déjà très préjudiciable, mais pour une entreprise c'est vital. Croyez-moi, en tant que photographe, si je devais perdre mes 25 dernières années de photos, ma société ne s'en remettrait pas ... moi non plus d'ailleurs.

Les disques durs sont des supports fiables. Mais une panne est toujours possible. Si vous possédez un seul disque vous avez 3% de risque qu'il tombe ne panne la première année. Si vous avez 7 disques vous avez 7% de risque d'en perdre un dès la première année et vous avez quasiment 100% de risque d'en perdre un dans les quatre premières années.

La technique RAID apporte une sécurité à bas coût. Elle fut conçue pour être applicable sur des supports bon marché, à moindre frais. D'ailleurs, sachez que si vous possédez plusieurs disques sur votre ordinateur, vous pouvez utiliser "certains RAID" selon le système d'exploitation (O.S. pour opérating system) que vous utilisez, directement sur votre ordinateur (Windows, MAC, Linux, VMS, ...).

La technique RAID est assurée par une "couche logiciels" du système d'exploitation de votre serveur NAS ou ordinateur ou par une "couche matériel", une carte contrôleur. Ce serveur peut être un appareil dédié ou simplement votre propre ordinateur s'il contient plusieurs disques.

Il existe plusieurs techniques RAID (RAID 0, RAID 1, RAID 3, RAID 5, RAID 6, ...) et chaque type de RAID à son utilité et ses propres performances. On peut aussi combiner des techniques RAID ensemble.

Mais avant d'aller plus loin, comme j'ai bien senti que vous avez déjà rencontrez des problèmes de compréhension sur "virtualisation du stockage" ou encore "couche de logiciels", voyons très simplement et rapidement les différentes couches qui constitues votre ordinateur.

Pourquoi mon ordinateur a des couches ?!?!

Comme vous le savez, le logiciel que vous utilisez pour traiter vos photos, aller sur Internet, ou encore jouer en ligne, n'est pas développé par le même éditeur de logiciels que celui qui a fait votre système d'exploitation (O.S.). Windows, MAC, Android, Linux, Unix, VMS, ... sont tous des systèmes d'exploitation (O.S.), avec lesquelles on fait "tourner" des logiciels tel que Google Chrome, Photoshop, Word, Excel ... et la liste contient des milliers de logiciels.

Pour pouvoir fonctionner ensemble et simplifier les choses, chaque logiciel et O.S. à ses tâches qui lui sont propres. On appelle ça une "répartition par couches" que l'on représente comme le graphique qui suit :

Que montre ce graphique ?

Il montre que depuis le matériel (souris, écran, disques dur, carte mémoire, ...), jusqu'à l'utilisateur, on a placé des "couches" applicatives. Le but principal de ces couches de logiciels est de simplifier l'utilisation de l'ordinateur. Chacune d'entre elles à des échanges avec la couche supérieure et inférieure. En gros chaque couche fait l'interface entre sa couche supérieure et sa couche inférieure exactement comme le ferait un traducteur entre deux personnes ne parlant pas la même langue. Et chaque couche apporte aussi ses propres fonctions.

Par exemple, penons l'opération qui nous intéresse dans cet article. En tant qu'utilisateur, vous allez demander à votre logiciel de sauvegarder votre travail. En fait ce n'est pas lui qui va placer votre fichier sur le disque. L'application, ou le logiciel si vous préférez, via des API que lui propose l'O.S., va demander à ce dernier (Windows, Mac, ...) de sauvegarder le fichier sur le disque. Et bien ce n'est toujours pas lui qui va le faire. Via les fameux "pilotes" que met à jour régulièrement votre système d'exploitation, ce dernier va demander au contrôleur disque (dans la partie matériel informatique) de stocker se fichier sur le disque.

Pourquoi utiliser cette structure de couches logicielles et matérielles ?

En effet, on pourrait imaginer un système ou on passe du disque à l'utilisateur avec un gros système qui contiendrait tout ce qui est nécessaire.

Ce système par couches, permet d'être beaucoup plus modulable, beaucoup plus évolutif et permet aussi de répartir les tâches pour une optimisation des performances. Un exemple très concret va vous le montrer. Comme je vous l'expliquais dans l'article précédent sur les technologies HDD et SSD des disques, les deux technologies ne stockent pas du tout les données de la même façon sur le support physique. Mais en fait Windows, ou MAC ne le savent pas du tout, c'est invisible pour le système d'exploitation. Entre l'O.S. et le disque, il y a une carte contrôleur de disque. Elle peut être intégrée à la carte mère ou être une carte à part entière si le système contient plusieurs disques. Cette carte contrôleur va se charger de gérer les disques sans que l'O.S. n'ait même accès aux disques.

Du coup si j'ai deux disques durs sur mon ordinateur et que j'en change un en passant d'une technologie HDD à SSD ... mon O.S. ne se rend même pas compte du changement de technologie et les logiciels encore moins, car il y a deux couches (minimum) entre eux et les disques.

Où est installée la couche de logiciels RAID

Maintenant que vous avez compris le système de couches logicielles et matérielles, vous allez facilement tout comprendre.

La couche logicielle RAID, va être installée entre le système d'exploitation et la carte contrôleur des disques dur. En gros Windows, MAC, ... n'a plus accès au contrôleur de disques. Maintenant l'O.S. échange avec "le RAID" et la couche logiciels RAID fait suivre au contrôleur de disques.

Par exemple, quand j'utilise le RAID 1, dont le but est de copier chaque fichier qu'on lui fournit sur 2 disques en même temps pour sécuriser les données, l'O.S., déjà ne voit qu'un seul disque virtuel (le RAID lui en montre un seul ... "virtualisation du stockage" vous vous souvenez ? ). Quand l'O.S. demande, à sauvegarder le fichier sur le disque dur qu'il voit, la couche de logiciels RAID, va doubler cette demande, vers les deux disques physiques.

Quel RAID dois-je utiliser ?

Comme je vous le disais plus haut, il existe plusieurs techniques de RAID. Mais avant de choisir le type de RAID, sachez que la gestion du RAID peut être logiciels (software) ou matériel (Hardware). Dans ce second cas, il vous faut acheter une carte dédiée ou alors un serveur RAID. Les deux (logiciels et matériels) ont des avantages et des inconvénients.

Si vous choisissez la version logiciel, c'est simple à mettre en place puisque la plupart des O.S. proposent une gestion des disques en RAID. Cela ne vous coûtera rien puisque votre O.S. le propose déjà, il suffira de le configurer. Le seul coût, sera d'acheter les disques pour les mettre dans votre PC. C'est aussi simple que de partitionner un disque. Si vous avez 3 disques par exemple, il est possible de monter 2 disques en RAID et garder le 3ème hors de la "grappe". Cela permet par exemple de garder le disque avec l'O.S. et le cache sans RAID, ce qui ne sert à rien sur un disque SSD et monter 2 disques HHD en RAID.

Pour les RAID 0 et RAID 1, cela ne pose pas de problème. Par contre, comme c'est l'O.S. de votre ordinateur, qui calcul la parité (RAID 5,6, ...) cela prendra des ressources CPU et risque de ralentir votre système. Avec 2 ou 3 disques et un bon CPU cela sera minime, mais avec beaucoup de disques, ou sur un matériel moins performant, cela risque d'entrainer des baisses de performances de votre système.

Je vous joins un graphique avec une étude faites avec des disques SSD uniquement :

Vous avez, sans aucun doute ompris que pour la version matérielle de la gestion du RAID, les avantages deviennent des inconvénients et l'inverse. Avec une carte contrôleur RAID vous n'aurez aucune baisse de performance, car c'est elle qui gère tout, par contre c'est plus cher. Cela peut aller de 400€ à 4000€ selon ce que vous recherchez.

Pour faire déjà se premier choix il y a plusieurs choses à prendre en compte :

  • Si vous avez moins de 10 disques et un bon PC, utiliser la version logiciel
  • Si vous sollicitez déjà beaucoup votre CPU (compilation, vidéo, 3D, ...) utilisez une carte contrôleur ou un serveur RAID
  • Si vos disques sont très sollicités (beaucoup de lectures/écritures) le calcule de parité va consommer beaucoup de ressources CPU, autant le déléguer à une carte contrôleur ou un serveur RAID.
  • La dernière est plus une question d'utilisation. Si vous ne laissez pas votre ordinateur allumé, les disques ne sont plus visibles sur le réseau de votre société ou de la maison. Si vous éteignez votre ordinateur en partant à l'extérieur, vous ne pourrez plus accéder à vos disques. Dans ce cas le mieux est le serveur RAID dédié.

Les systèmes d'exploitation et la gestion du RAID

  • Microsoft Windows 10 gère le RAID 0, 1 et 5 logiciel
  • Microsoft Windows XP gère le RAID 0 et 1 logiciel, et peut gérer le RAID 5 moyennant une petite adaptation5.
  • Microsoft Windows 2003 Server gère logiciellement le RAID 0, 1, et 5.
  • Mac OS X gère logiciellement le RAID 0, 1, et la concaténation.
  • Le noyau Linux (>=2.6) gère logiciellement le RAID 0, 1, 4, 5, 6, et 10, ainsi que les combinaisons de ces modes.

Les RAIDS standards

Pour monter un RAID entre plusieurs disques il est obligatoire que les disques aient tous la même capacité. Même si le RAID pourra gérer une différence de capacité de stockage, cela nuira aux performances. Les constructeurs de serveurs RAID, conseillent même des disques de mêmes capacités et de même marque pour avoir non seulement les même capacités de stockage, mais aussi le même taux de transfert pour ne pas risquer de diminuer les performances du système RAID.

RAID 0 ▬ agrégation par bandes

  • Un RAID fait pour la performance.
  • minimum 2 disques durs dans votre "grappe de disques" (array).
  • Le taux d'utilisation des disques 100%

Le RAID 0 est de l'agrégation par bandes (stripping). En gros le RAID répartie les données de façon égale entre les disques de la grappe. Le but principal du RAID 0 est la performance en écrivant la moitié de chaque fichier sur 2 disques séparés (il divise par le nombre de disque dans la grappe). Les disques durs étant les goulots d'étranglement de nos ordinateurs pour la vitesse d'accès à nos données, cela permet d'écrire en parallèle sur chaque disque une partie du fichier et diminue le délais d'écriture et de lecture des données par 2 ou plus selon le nombre de disques dans la grappe du RAID. C'est surtout utile pour les systèmes qui ont énormément d'accès disque.

  • Les avantages : on garde 100% de capacité de stockage des disques. Il n'y a un gain de performance. Le RAID divise les données en blocs et les répartis de façon égale sur les disques. Un fichier d'1Gb est divisé en 2 blocs de 500MB répartie sur chaque disque si le RAID contient 2 disques.
    .
  • Inconvénients : en cas de panne d'un disque, vous perdez la totalité des données de vos disques puisque la moitié de chaque fichier est sur chaque disque. Généralement le RAID 0 est combiné à un autre RAID, comme on va le voir plus bas.

RAID 1 ▬ Copie miroir

  • Ce RAID est fait pour la sécurité des données.
  • Minimum 2 disques durs dans votre grappe
  • Taux de stockage est maximum de 1/2 par rapport à la taille des disques.

Le RAID 1 est appelé mirroring, car l'ensemble des données est copié simultanément sur tous les disques de la grappe. Si vous avez 2 disques, vous avez 2 copies de vos fichiers, si vous avez 3 disques, 3 copies ...

Les avantages, sont que vous n'avez plus à vous soucier des sauvegardes, puisque c'est fait dès que vous ajoutez, modifiez, ou supprimez des données sur un disque par copie sur les autres. L'autre avantage est que si un disque tombe en panne, vous ne perdez aucune donnée puisqu'elles sont aussi sur les autres disques de la grappe. Remplacez rapidement le disque endommagé. Si vous avez plus de 2 disques dans votre grappe, il suffit qu'un seul des disques tienne le coup, vous pouvez perdes les X disques de la grappe -1.

Inconvénient : vous avez au maximum la moitié de la capacité de stockage de vos disques, puisque sur 2 disques tout est doublé. Donc avec 2 disques de 10To vous n'avez pas 20To de stockage, mais 10To. Mais avec 4 disques de 10To chacun, vous avez toujours 10To de stockage au lieu de 40To, car vos fichiers sont copiés 4 fois, mais une forte sécurité.

Ce type de RAID est donc très coûteux en disque. Mais en le combinant à un autre RAID, on perd moins de stockage.

RAID 5 ▬ Disques avec parité

  • Il associe sécurité des données et performance.
  • minimum 3 disques durs
  • Le taux de stockage est de (Nombre de disque - 1) x Tailles des disques.

C'est un mixte entre le RAID 0 et le RAID 1. C'est sans aucun doute le RAID le plus utilisé. Comme pour le RAID 0 les données de chaque fichier sont divisées et réparties sur plusieurs disques pour accélérer le temps d'accès disque, et copié 2 fois.

Les avantages : si vous perdez un disque de votre grappe, vous ne perdez pas de données. Il est possible de reconstruire les données avec les disques qui restent, comme pour le RAID 1. Comme le RAID 0, il divise les fichiers pour les écrire sur plusieurs disques, ce qui permet un gain de performance des opérations de lecture/écriture des données.

La taille de stockage, comme je l'ai mis plus haut est de (N-1) x S, où N est le nombre de disques de la grappe et S la taille des disques. Ce qui donne par exemple avec 3 disques de 6To un stockage réel, non pas de 18To, mais 12To. Un autre exemple pour 5 disques de 6To, cela donne un stockage réel des données de 24To au lieu des 30To que représente la taille des disques de la grappe. En gros, plus vous avez un nombre de disques important dans la grappe, moins vous perdez de place.

Par contre, le temps nécessaire pour reconstruire la grappe en cas de perte d'un disque dur est assez long. Il m'est arrivé de perdre un disque sur une grappe de 4 disques de 12To. Il a fallu 120 heures, oui oui, vous avez bien lu, 5 jours complets pour récupérer les données. C'est dans les normes par rapport à ce qu'annonce les constructeurs, 10h/To. C'est le temps nécessaire pour recalculer la parité de la répartition des segments de fichiers sur les disques restants. Il est possible de continuer à utiliser les données des disques pendant la reconstruction de l'array, mais vous constaterez un ralentissement.

Il faut savoir aussi que les disques durs ont un taux d'erreur de lecture/écriture (URE). Les constructeurs donne un taux d'erreur moyen de 10^14bits, soit une erreur tous les 12,5TB. Ce qui veut dire qu'il y a un risque de reconstruction avec des erreurs, même si ce risque est minime. Le calcul est simple :

  • "P" est la probabilité de reconstituer l'array.
  • "N" le nombre de disque
  • "S" la taille des disques (size)
  • On a la formule de calcul : P = (1-10-14)8 x 109 x N x S

RAID 6 ▬ Disques avec double parité

  • associe performance avec une double sécurité
  • 4 disques minimum
  • Le taux de stockage par rapport à la taille des disques est de (Nombre de disques - 2) x Taille des disques

Le RAID 6 est une évolution du RAID 5, qui permet de sécuriser l'intégrité des données en dupliquant les données, non pas 2 fois, mais 3 fois. Du coup le système peut supporter jusqu'à la défaillance de deux disques durs. Le système fonctionne de la même façon que le RAID 5 avec la seule différence de tripler les données sur les disques au lieu de les doubler.

Le RAID 6 sécurise plus les données, mais c'est au détriment du stockage. Avec le même nombre de disques qu'en RAID 5, le RAID 6 propose une place de stockage moins grande. Il est aussi moins performant en écriture du fait d'un calcul de la parité plus complexe.

La combinaison de RAID sur plusieurs niveaux

Comme je vous le disais plus haut sur le RAID 0, je le trouve dangereux, car il est fait pour la performance et accélérer l'accès aux données, par contre il n'offre aucune sécurité des données et si vous perdez un disque vous perdez toutes vos données. Mais on peut le combiner avec un autre niveau de RAID pour pallier à ce problème.

RAID 01 ▬ agrégation par bandes et copie miroir

  • Performance et sécurité des données à faible niveau
  • Minimum 4 disques
  • l'espace utilisable est (nombre de disques x capacité des disques) /2

Ce type de combinaison de RAID est peu utilisé. La sécurité est relativement faible puisque la défaillance d'un disque entraine la perte des données de toute la grappe. Par exemple si le disque 1 est défectueux, comme les données sont partagées entre le disque 1 et le 2, ce dernier est aussi inopérant. Il faut donc vite remplacer ce disque avant qu'un disque de la grappe jumelle (disque 3 et 4) ne vienne à faire défaut, sans quoi, toutes les données sont perdues.

Au niveau du stockage, il coute assez cher, puisque la capacité de stockage des données ne correspond qu'à la moitié de la capacité des disques.

RAID 10 ▬ copie miroir et agrégation par bandes

  • Performance et sécurité
  • Minimum 4 disques
  • Capacité de stockage (Nombre de disque x capacité des disques)/2

Ici on inverse les opérations par rapport au RAID 01. On commence par les splitter les données en deux, et ensuite on les duplique.

Cette combinaison de RAID n'offre pas plus de capacité de stockage que la précédente. Par contre, elle offre un plus, au niveau de la sécurité des données. Tant que les deux disques d'une grappe ne sont pas défectueux, on peut récupérer les données. Contrairement à la combinaison du RAID01 qui ne support la défaillance que d'un disque, ici deux disques peuvent être défectueux ou plus exactement 1 dans chaque grappe du cluster du RAID.

RAID 50 ▬ Disques avec parité & agrégation par bandes

  • Performance et grande sécurité pour les données
  • minimum de 6 disques
  • Capacité de stockage (Nombre de disque - nombre de grappes) x Taille des disques

Tout comme le RAID 5, la combinaison RAID 50 est très utilisée pour les grappes avec de nombreux disques. Les grappes sont des RAID 5 que l'on strippe ensuite en RAID0.

Du fait que c'est d'abord un RAID 5, il faut minimum 3 disques par grappe. Mais on peut en mettre 4 ou plus. Par exemple avec 12 disques, on peut soit, faire 4 grappes de 3 disques, soit 3 grappes de 4 disques. Le gain en espace de stockage n'est pas le même.

  • Dans le premier cas on consacre l'équivalent 1/3, soit un disque sur trois dans chaque grappe pour le calcul de la parité, soit 4 disques sur 12.
  • Dans le second cas, avec 4 disques par grappe, on ne perd plus 1/3, mais 1/4 des disques, soit l'équivalent de 3 disques sur les douze. MAIS !!

Mais dans les deux cas, la sécurité des données n'est pas la même.

  • Dans le premier cas, de 4 grappes de 3 disques, permet de perdre jusqu'a 4 disques défaillants,
  • alors que le second cas, ne permet que 3 disques défaillants.

C'est à vous de choisir entre plus de place et moins de sécurité, ou l'inverse.

RAID 60 ▬ Disques avec double parité & agrégation par bandes

  • Le meilleur compromis entre performance et sécurité des données
  • minimum 8 disques
  • Capacité de stockage (Nombre de disque- (2 x nombre de grappes)) x Taille des disques

Comme on l'a vu avec le RAID 6, ici la différence est le nombre de copies qui n'est pas doublé, mais triplé, permettant de perdre deux disques par grappe au lieu d'un seul.

En contrepartie on perd plus de place de stockage.

Pour aller plus loin

J'espère que cet article vous a éclairé sur ce qu'est un RAID et comment vous pouvez l'utiliser par rapport à vos besoins.

Personnellement, du fait des quantités de disques dont j'ai besoin, de ma façon de travailler en nomade pendant mes voyages et déplacements, j'ai opté pour un serveur RAID. Cette configuration me donne accès à mes fichiers de n'importe où dans le monde et ne consomme pas de ressource sur mon ordinateur déjà très solicité par les logiciel de retouche de photo et de montage vidéo qui sont déjà très consommateurs de ressources.

Pour le RAID, j'ai deux RAID 50 avec 16 disques (2x(2 grappes de 4 disques)), ce qui est un bon compromis puis que cela sécurise mes données et ne me coûte que 20% des ressources disques pour la distribution par parité et l'aggrégation par bande.

Je vous donne rendez-vous pour le prochain article sur le choix d'un serveur RAID, mais en attendant, si vous avez des questions ou remarques n'hésitez pas à laisser un commentaire.


L'article vous a-t-il aidé ?

Votre vote : 0 étoile(s)
Tags: , , , , ,

Portrait de Benoit Thibaudeau
Benoit Thibaudeau
1971-11-02
2020-01-12
Webmaster

Après une courte carrière en tant que cryptographe, j'ai été team leader chez un éditeur de logiciel qui créé des systèmes décisionnels pour les banques et les télécoms dans le monde entier.

Puis j'ai évolué vers architecte de système informatique, ce qui m'a amené à concevoir des systèmes parmi les plus gros d’Europe avec une visibilité sur les 10 prochaines années.

En parallèle j'étais chargé de la formation des employés de la société et de celle des clients, ce qui m'a appris beaucoup en ce qui concerne la dispense de cours.

Durant ma période en Irlande j’ai eu la chance de travailler, plusieurs mois, en étroite collaboration avec Google Irlande, ce qui m’a appris énormément sur le référencement.

Enfin, j’ai souhaité au bout de 15 ans d’arrêter de voyager tout le temps dans le monde entier, je me suis donc mis à mon compte et aujourd’hui je vis de mon activité.

Benoît Thibaudeau

Les conseils Internet : www
Pour me contacter :
Mr. Benoit Thibaudeau
27 bis rue Louis Rolland
92120 Montrouge,
Haut de Seine - FRANCE
Les stages photo : www
Cours photo sur Internet : cours
Le blog de tuto photo : Blog
Le site dream photos : www
Le blog dream photos : Blog

Laisser une réponse

Votre adresse email ne sera pas publiée.

Vous pouvez utiliser ces HTML balises et attributs: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Afficher
Cacher
error

Vous aimez ce blog? Passez le mot :)