Quand je me suis installé en tant que photographe, j'ai donc cherché une solution pour stocker et sauvegarder mes données avec 4 critères primordiaux à respecter :
- Une sauvegarde la plus fiable possible,
- La possibilité de perde un minimum voir perdre aucune donnée en cas de défaillance matériel (disque, serveur, ...),
- Une solution évolutive au fur et à mesure de mes besoins,
- La solution la moins onéreuse possible.
Heureusement mes 15 années d'expertise en la matière, m'ont permis de trouver très rapidement une solution qui me convient et qui répond à ces quatre critères. Une solution que je vous présente en fin d'article et qui correspondra aux petites structures manipulant énormément de données comme moi. La solution que j'ai choisi, en plus d'être moins cher que la plupart de solution du marché, me fait économiser plus de 800€/an grâce aux services qu'elle me rend, comme je vous l'explique en fin d'article.
Je vous propose aussi dans cet article de voir quelques serveurs NAS fiables et solides, de 2 à 12 disques selon vos besoins.
Quels sont vos besoins en stockage et de sauvegarde de vos données ?
Avant de vous lancer dans un achat, je vous conseille de bien réfléchir à ce dont vous avez besoin, non seulement aujourd'hui, mais pour les 5 à 8 prochaines années. Il est important de vous projeter dans l'avenir pour ne pas acquérir une solution de stockage et de sauvegarde de vos données qui ne conviendra pas à vos besoins dans les prochaines années.
Les solutions de stockages évoluent assez vite et il est important de faire le bon choix. Certains choix pourront être corrigés facilement, mais d'autres vous coûteront chers si vous devez changer de solution technique.
Pour répondre à cette question, sur vos besoins, prenez en compte plusieurs critères :
Quelle quantité de données avez vous actuellement ?
Rien de plus facile, il suffit de regarder l'occupation de vos disques et plus précisément des répertoires où vous stockez vos données.
Quelles sont les données vitales, qu'il ne faut surtout pas perdre et qu'elle est leur taille ?
Il ne sert à rien de sauvegarder l'applicatif plusieurs fois. Par exemple si se sont des logiciels que vous n'avez pas développez vous même, en cas de perte, il suffira de les installer à nouveau. Par contre il faut sauvegarder les données générer avec ces logiciels.
Sur mes sites Internet sous WordPress, il faut que je sauvegarde les bases de données, mais sauvegarder les répertoires wordpress que je n'ai pas modifié, ou le répertoire des plugins, ne me sert à rien. En cas de défaillance du disque où se trouve ses fichiers, je téléchargerais la dernière version de wordpress* pour l'installer de nouveau. Par contre il faut que je sauvegarde le dossier où se trouve le design de mon site que j'ai développé ou modifié et le répertoire de téléchargement des fichiers (images, ...). Même sauvegarder le répertoire des plugins** que j'utilise ne sert à rien.
Je vais supposer que vos données sont stockées dans des répertoires bien structurés (sinon c'est peut-être la bonne occasion pour mettre de l'ordre). Placez vous simplement sur le ou les répertoires "père(s)" de la hiérarchie des répertoires à sauvegarder, faites un clic sur le bouton droit et sélectionnez propriété, une fenêtre vous donnera le nombre de fichiers du répertoire et ses sous-répertoires et la taille du tout. N'oubliez pas les répertoires des utilisateurs comme "Mes documents", "téléchargement", ...
Faites la même choses sur les répertoires où sont installés les logiciels et notez aussi la quantité.
[nota]
* Attention seule la dernière version de WordPress est disponible au téléchargement, donc ce conseil ne vaut que si vous utilisez la dernière version. Je vous renvois vers l'article Pourquoi créer une plateforme de test pour votre site Internet pour plus de détails.
** Par contre notez la liste des plugins. Le paramétrage de ces derniers est stocké dans votre base de données que vous sauvegardez, il faudra juste installer la même liste de plugins si vous perdez les données de votre site.[/nota]
Comment vont évoluer vos données et leur quantité dans les 5 à 8 prochaines années ?
Maintenant que vous connaissez la liste des données à sauvegarder, celles des répertoires de l'applicatif et leur taille, il va encore falloir répondre à quelques questions :
La sensibilité des données, leur taux d'utilisation et leur fréquence de sauvegarde.
La sensibilité est de plusieurs niveaux et propre à chacun, mais je vous donne mon classement. Je les classe selon leur sensibilité et leur taux d'utilisation :
- Très sensible : Ces données sont vitales pour ma société (mes photos en tant que photographe, les vidéos de mes cours en ligne, les PDF des cours, ma compta, mes mails, ...)
- Sensible : se sont des données importantes, mais que je ne manipule pas souvent ou qui représentent un minimum de perte (les fichiers applicatifs que j'ai modifié sur mes sites par exemple, ou le fichier de travail de la photo que je suis en train de modifier)
- Importante : se sont des données qui vont m'handicaper si je les perds, mais que je peux récupérer ailleurs. Leur perte ne sera pas trop préjudiciable, juste du temps perdu. (mon disque système contenant Windows, mes logiciels, les pinceaux photoshop, ...)
- Sans importance : des data que j'ai ... Mais je ne sais plus pourquoi 😉 Sérieusement, les données que j'ai récupéré d'internet pour une utilisation temporaire, ou ce genre de données.
Vous avez vu que je classe la sensibilité des données par rapport à leur importance vitale et leur taux d'utilisation (création/modification/suppression). Journalier, hebdomadaire, mensuel, annuel, ...
De là va découler le point qui nous intéresse leur fréquence et la quantité de sauvegarde. Plus une données est vitale et plus je la modifie souvent et plus je dois la sauvegarder sur minimum 2 supports le plus rapidement possible. Alors qu'une donnée sensible, mais que je modifie peut (le design de mon site), j'ai besoin de la sauvegarder moins souvent. Une données qui évolue régulièrement, comme les bases de données de mes sites qui évoluent tous les jours, doivent être, non seulement sauvegardées tous les jours, mais aussi, sur plusieurs supports pour être certain de pouvoir les restaurer en cas de besoin et avec un versionning pour garder un historique sur une période.
Trois derniers critères à prendre en compte pour évoluer la quantité de stockage nécessaire pour les prochaines années. Le temps de conservation de chaque donnée, faut il une gestion de versions, combien de copies de sauvegarde voulez-vous pour chaque donnée. Par exemple quand je travaille avec des clients sur des maquettes, je conserve les différentes versions livrées. Et pour le temps de conservation, contractuellement, je m'engage à conserver les photos de mes clients entre 2 et 10 ans. Du coup combien cela concerne de données, combien de place.
- Les données très sensibles sont sauvegardées en temps réel sur 2 RAID 50 chez moi,
- Les données sensibles sont aussi sauvegardées sur 2 RAID, mais seulement 1 fois tous les X périodes (jour, semaine, mois, année, ...)
- Les données importantes sont sauvegardées sans versionning et une fois toutes les X périodes (moins souvent que les données précédentes)
- Les données sans importance, n'ont qu'une sauvegarde et une fois par mois.
Maintenant que vous avez ça, essayez de calculer, par mois et par années combien cela représente de données en plus ? Du coup le calcul est simple :
Le stock des données [prendre en compte la rotation selon le temps de conservation des données] + ((la quantité en plus tous les ans) x 5 à 8 ans.)
Maintenant, on peut se projeter sur la solution à envisager.
Ce qu'il faut retenir
- Faites la liste des données exhaustives à stocker et notez leur taille
- Classez les par niveau de sensibilité.
- Estimez les fréquences de sauvegarde des données
- Estimez la quantité de stockage pour les sauvegardes (nombre de copies, versionning, ...)
- Estimez la progression de stockage nécessaire en plus par an
- Calculez où vous en serrez dans 5 à 8 ans.
Quels sont les critères à prendre en compte pour choisir une solution ?
La fiabilité de la sauvegarde de vos données
Paradoxalement, plus l'être humain veut conserver des données et moins il sait le faire dans le temps et dans la fiabilité. Les hommes de Cro-Magnon nous on fait parvenir leurs œuvres peintes, il y a 20.000 ans, dans la grotte de Lascaux. On retrouve des traces d'écriture de l’Égypte antique sur des monuments vieux de 10 à 4.000 ans. Alors qu'un livre ne dure que quelques centaines d'années au mieux et un support numérique de 5 à 10 ans .... et oui ... de plus de 20.000 ans à 5 ans 😉
C'est une chose à prendre en compte. "L'espérance de vie" des supports de stockage et de sauvegarde de vos données. L'espérance de vie des disques HDD de qualité est de 10 ans. Mais sachez que vous avec 4% de risque que votre disque tombe en panne la première années. Si vous avez 7 disques, vous avez 7% de risque d'en perdre un la première année et 100% de risque d'en perdre un dans les quatre premières années.
L'espérance de vie des supports SSD est différente. Tout dépend de l'utilisation que vous en faite. Plus on utilise (écrire/effacer) un SSD plus il s'use. Par contre un SSD que l'on n'utilise pas, à une période de conservation des données de 200 ans environ.
A ça il faut ajouter le taux d'erreur d'écriture des disques, comme on l'a vu dans l'article Quel disque dur choisir HDD ou SSD ? Pour les disque HDD il est de 1^14bits soit tous les 11,9TB et pour les support SSD il est de 1^16bits soit tous les 1195TB. Il faut le prendre en compte, car en cas de perte de disque, si vous possédez énormément de données, il y en aura forcément de défectueuses lors de la restauration , même si cela reste infinitésimale. Vous trouverez la formule de calcul pour estimer vos risques de perte de données dans l'article sur les disques HDD et SDD cité juste au dessus.
Enfin prenez en compte la rapidité de sauvegarde. Il y a des moyens accessibles pour des sauvegardes et des restaurations à chaud des données. Entendez par la que l'on peut sauvegarder les données et le restaurer sans stopper le système. La technique la plus abordable est le RAID, comme je l'ai détaillé dans l'article complet qui lui est dédié : Qu’est-ce que la technologie RAID et laquelle choisir ?.
La disponibilité de vos données
Ça c'est un critère plus personnel. Que ce soit pour votre société pour pour les données familiales, chacun aura des exigences personnelles d'accès à ses données.
Si votre micro-entreprise est localisée chez vous et que vous accédez à vos données uniquement de chez vous et aux heures où vous travaillez, vous n'aurez pas besoin de la même solution qu'une personne avec un bureau distinct de son domicile et/ou qui voyage avec la nécessité d'accéder à ses données de n'importe où dans le monde.
Selon votre besoin, la solution de sauvegarde et de stockage de vos données sera très différente. Certains serveurs NAS, toujours connectés au réseau, allumer 24h/24 et proposant un serveur VPN pour un accès sécurisé à vos données, vous permettront d'accéder de partout dans le monde à vos disques, contrairement au stockage dans votre PC et des sauvegardes sur un disque externe qui ne seront visibles que lorsque votre PC sera allumé et souvent, uniquement sur votre réseau local.
Il faut aussi que vous sachiez si une ou plusieurs personnes auront accès à vos données. Durant mes années dans l'ingénierie informatique, j'ai passé 15 ans à voyager dans le monde entier. J'avais l'ordinateurs portables les plus sécurisé du bureau Français, déjà parce que je suis parano, du fait de mon expérience en tant que cryptographe 😉 mais aussi parce qu'il me permettait de disposer d'un accès complet au réseau de ma société de n'importe où dans le monde. Même mon poste de téléphone fixe me suivait, puisqu'il arrivait sur mon ordinateur portable.
Chaque utilisateur doit avoir son accès personnalisé et son espace disque, ainsi que l'accès aux parties "publiques" de votre stockage.
C'est un point important et encore une fois je vous renvois vers le RoadMap de votre société pour savoir si vos besoins vont devoir évoluer dans les prochaines années.
Maintenant d'un point de vu familiale, vous pouvez envisager l'achat d'un serveur NAS de 2 à 4 disques que vous branchez à votre boxe et que tous les appareils verront comme disques partagés sur le réseau domestique. Idem pour les entrepreneurs travaillant chez eux.
Le coût des solutions de sauvegarde
Attaquons le nerd de la guerre. Si comme moi, vous possédez une petite entreprise, vous n'avez pas forcément des millions à mettre dans une solution de sauvegarde. On veut donc le meilleur rapport qualité/prix avec le plus de sécurité possible, car la perte de données peut coûter cher de nos jours. Les méthodes de sauvegardes n'ont pas toutes le même coût.
Comme on l'a vu dans l'article précédemment cité, les disque SSD sont 5 fois plus rapides, ont une espérance de vie d'environ 200 ans (et ça s'améliore) s'ils sont peu utilisé, ils consomment jusqu'à 60% d'électricité en moins que les disques HDD et sont silencieux contrairement à ces derniers, sont beaucoup plus robuste aux chocs.
MAIS, parce qu'il y a un MAIS, la capacité des stockages sur un "disque" SSD est 6 fois moindre par volume que sur un disque HDD et surtout le stockage des données sur SSD coûtent encore 7 fois plus cher sur sur disque HDD !!!
C'est malheureusement quelque chose qui bride l'utilisation des supports SSD. Le coût d'une sauvegarde sur un disque dur HDD est en moyenne de 0.03$/Go (0.028€) et sur les supports SSD 0.2$/Go (0.18€) . Alors exprimé en centime comme ça, ça peut paraitre minime, mais on parle d'une différence de 643%. Quand on arrive à 50To de stockage de données, cela représente une différence de presque 7800€ et de 15.600€ pour un stockage de 100To entre un stockage sur SSD et HDD.
Le but de la sauvegarde est de copier plusieurs fois la même donnée sur plusieurs disques, ce qui fait augmenter le coût de stockage (doubler ou tripler). On verra plus bas que ce qui coûte le plus cher c'est l'achat des disques. Plus vous aurez à stocker un nombre important de données et moins le coup du serveur stockant vos données ne sera important en proportion du prix des disques.
Pour vous donner une idée, pour mon cas, je peux stocker actuellement jusqu'à 140To de données sur 163To de disque pour un coup de 0.05$/Go (0.046€) de données (donc pour les 140To de data). Je vous laisse calculer le coût que cela fait. Des disque HDD en sata III de qualités comptez entre 400€ et 450€ les 10To. Prenez des Disques HDD interne prévu pour les serveurs NAS, car ce sont les plus solide. 2 exemples :
Pensez aussi au coût de de l'évolution de votre solution. Si vous prenez une solution de stockage qui n'est pas évolutive, il faudra changer votre solution où la faire évoluer à grands frais. C'est pour cela qu'il faut penser à l'évolution de votre système dans les prochaines années.
Les solutions de stockage du cloud. L'avantage est que vos données se trouvent dans un data center sécurisé, toujours alimenté et disponibles non stop. Mais déjà vous ne savez pas à qui vous "donnez" accès à vos données et ça a un prix. Comptez de 0.15€/an/Go pour les petites quantités (50Go) à 0.11€/an.Go pour les plus gros stockages (500Go) ... et en gros pas loin du tarif d'un stockage sur SSD. Il faut compter un coût 392% à 535% plus cher que de stocker vos données chez vous sur disque HDD.
Ce qu'il faut retenir
- Pensez à la fiabilité de votre stockage et sauvegarde de données en prenant en compte,
- la durabilité des support, un changement fréquent revient à cher,
- les erreurs disques qui peuvent couter cher en cas de restauration corrompue des données,
- la rapidité d'accès au données.
- Pensez d'où et quand vous aurez besoin d'accéder à vos data.
- Enfin le coût du support qui peu varier du simple à plus de 6 fois plus,
Et pensez à l'évolution de votre solution.
Qu'est ce qu'une solution de sauvegarde doit proposer ?
Les fonctions principales sont évidemment le stockage, mais aussi le partages des données et la sécurisation de ces dernières. Mais d'autres solutions, de plus en plus puissantes proposent de plus en plus de services.
Au niveau matériel, il y a trois possibilités envisageables
- Stocker ses disques dans son boitier d'ordinateur s'il le permet (selon le boitier et le nombre de disques)
- Acheter un serveur NAS
- Assembler un ordinateur avec les caractéristiques d'un serveur NAS
Chacune de ses configurations matériel a des avantages et des inconvénients que je détaille plus bas.
Le stockage des données
Plusieurs solutions s'offrent à vous. Vous connaissez maintenant la quantité de données que vous allez collecter pour les 5 à 8 prochaines années. Vous avez identifié les données que vous allez sauvegarder 1 ou 2 fois (donc entre 2 et 3 copies pour les données). Faites le calcul du nombre de To de stockage dont vous aurez besoin d'ici à 5 ou 8 ans.
C'est cette données jumelée à une autre, qui va déterminer votre choix quant à la solution retenue. L'autre données est votre besoin d'accès à vos données. Local ? Mondial ? pendant les heures de bureau ? 24h/24 ?
Le but d'une solution de sauvegarde est de regrouper tous les disques au même endroit. Ensuite c'est son évolutivité. Vous pouvez très bien prévoir d'acheter une solution pouvant contenir 8 ou 10 disques, ne commencer qu'avec 2 disques dedans et en ajouter au fur et à mesure de vos besoins. Ensuite pourquoi ne pas prévoir une extension pour évoluer si besoin et à moindre coups.
La sécurisation des données
Il y a 20 ans, il nous fallait plusieurs disques durs que l'on ajoutait dans notre PC au fur et à mesure. La gestion des sauvegardes se faisait par logiciel ou ... quand on y pensait. 😉
Moi qui travaillais sur les plus gros clusters d'Europe à l'époque, j'ai dû intervenir à plusieurs reprises suite à des crashs de contrôleurs disques, des disques saturés et des erreurs humaines qui ont coûté des millions d'euro pour rattraper les données perdues. Une culture trop longtemps ignorée en France, mais enfin réellement prise au sérieux depuis quelques années, la sécurisation de nos données. Le but de votre stockage est de proposer cette protection sur deux niveaux :
Sécurisation de l'accès à vos données
Vous pouvez tout a fait crypter vos disques durs, ce qui fait que même lors d'un cambriolage, il sera impossible de lire le contenu des disques volés. Par contre cela ralenti (mais très légèrement) l'accès aux données qui sont décodées puis cryptées à chaque lecture et écriture. Le cryptage peut se faire soit par logiciel, soit par matériel.
La sécurisation se fait aussi par l'accès aux données via un utilisateur et un mot de passe
Vous pouvez créer des utilisateurs avec, pour chacun, son espace disque (dont vous pouvez limiter la taille) ainsi que des espaces disques partagés pour tous les utilisateurs, ce qui convient à l'exploitation en réseau pour une société où les comptables doivent avoir accès à des données à accès restreints et par contre doivent aussi avoir accès aux documents standards accessibles à tous, comme le règlement interne de la société ou la quantité des stocks.
Mais cela convient aussi à une famille où l'on partage les films, les photos et la musique, mais pas les documents sensibles ou pour créer un espace personnel aux enfants pour les documents de leurs études
L'accès à distance via Internet est aussi sécurisé évidemment par mot de passe que vous y accédiez par FTP, interface WEB ou autre et le tout englobé dans un tunnel VPN privé. Il vous suffira d'installer un client VPN sur votre ordinateur qui se connectera au serveur VPN de votre solution de stockage.
La sécurisation par duplicata des données
Avec une configuration en RAID5 et une capacité de disque de128To de disque vous aurez environ 85To de stockage, car vos fichiers seront copiés plusieurs fois sur vos disques
L'avantage majeur d'une technique de sauvegarde en RAID1 ou RAID5, par rapport à une multitude de disques durs gérés séparément, est la sauvegarde en temps réel de vos données sur plusieurs disques durs
Si vous avez 2 disques durs de 12To dans votre serveur de backup, vous n'avez pas 24To mais 12To de stockage. Avec seulement 2 disques, on monte les disques en RAID1 (ou disques miroir). Cela signifie que lorsque vous copiez une donnée sur un disque de la grappe du RAID, elle est automatiquement copiée sur le second disque.
Le RAID1 est géré de façon totalement transparente pour vous et il met à jours les fichiers lors de la création, la suppression ou la modification des ces derniers.
Vous disposez d'une sauvegarde en temps réel au cas ou un des deux disques dur tombe en panne, l'autre contient les mêmes données.
En cas de panne d'un des 2 disques durs, je vous conseille fortement de le remplacer rapidement pour garder la fonction de sauvegarde en temps réel.
Vous n'avez plus à vous soucier de programmer vos sauvegardes, elles se font automatiquement à chaque modification, ajout ou suppression de fichier et en temps réel
Si vous placez 3 disques durs ou plus dans votre grappe de disques de sauvegarde, je vous conseille d'utiliser la configuration RAID5. Les données sont réparties sur les différents disques. Comme le précédent, ce système vous permet de ne pas perdre de données si un des disques durs tombe en panne. Mais au lieu de perdre 50% des capacités de stockage, vous en perdrez 33%. Il faudra le remplacer rapidement pour conserver toutes les fonctions du RAID5. Si vous avez 4 disques de 12To, vous n'aurez pas 48To d'espace de stockage, mais 36To (24To en RAID1)
Pour plus de détails sur ce qu'est la technique de sauvegarde RAID, je vous renvoie vers l'article dédié à cette technique : Qu’est-ce que la technologie RAID et laquelle choisir ?
Le partage des données
C'est bien de sauvegarder ses données, de les sécuriser, mais encore faut-il pouvoir y accéder. C'est un des points que vous devrez étudier, même si souvent on peut le faire évoluer, mais de quelles fonctions de partage des données avez vous besoin.
Comme on peut sauvegarder toutes sortes de données, aussi bien votre comptabilité, que vos vidéos, ou encore les photos de vacances ou les photos du dernier meeting de la société, voici quelques fonctions que peut proposer un serveur de sauvegarde :
- d'un système d'exploitation léger, mais regroupant des fonctions pouvant être connectées à plusieurs protocoles réseaux (pc et windows, MAC, ou Linux et donc Android [android est construit sur un noyau Linux]). Il peut aussi communiquer avec votre Tv, votre tablette ou votre smartphone.
- Un serveur multimédia (vidéo, musique, photos)
- Un serveur de téléchargement (torrent, newsgroup, direct download, …)
- Un serveur FTP permettant le transfert de fichiers via un logiciel de tel que FileZilla
- Station de surveillance (avec des caméras IP par exemple)
- Serveur de sauvegarde (Time Machine ou autre)
- Serveur iTunes
- Cloud personnel
- Hébergement de sites Web (majoritairement apache)
- Serveur d’impression,
- Un serveur VPN,
- Un serveur Mail…
Votre solution de sauvegarde, vous permettra peut-être d'accéder à vos disques depuis partout dans le monde via une interface graphique protégée dans un tunnel VPN. Votre serveur de sauvegarde peut devenir votre DropBox privé (ftp), votre Netflix maison (serveur média), voir votre serveur WEB (apache) pour héberger votre site internet* et on peut même installer un serveur mail pour votre société et avec la sauvegarde de vos mails en local chez vous ce qui peut vous permettre d'envoyer vos newsletters sans surcoût et sans limite d'envois, si et seulement si votre F.A.I. vous offre une ip fixe. (En France, seul Orange ne propose pas d'IP fixe à ses abonnées).
Votre serveur NAS peut permettre aussi, le télétravail en se connectant au réseau de la société via un VPN sécurisé et toutes ses fonctions. On voit l'importance de bien choisir notre serveur de sauvegarde.
[nota]
* Je ne vous conseille pas d'héberger votre site Internet chez vous. Un data center sera toujours plus fiable avec une quadruple alimentation électrique, une surveillance 24h/24 et un accès Internet avec un débit bien plus élevé que chez vous. Je n'ai que les maquettes de mes sites internet sur mon serveur NAS, pour le développement et mes tests.
[/nota]
Les services que proposent certains serveurs NAS
L'expression est lâchée "Serveur NAS". Beaucoup imaginent de suite une machine avec un rack proposant des baies de disques. Pour ceux qui ne seraient pas ce que c'est, en voici 2 exemples. Un serveur NAS pouvant accueillir 2 disques maximum à gauche et un autre pouvant accueillir jusqu'à 8 disques.