mardi , 20 octobre 2020

Comment améliorer votre plan de reprise après sinistre avec le cloud ?

Mis à jour le:

Le cloud computing a rendu la reprise après sinistre meilleure et moins chère. Voici ce que vous devez savoir sur la façon d’intégrer le cloud dans votre plan de reprise après sinistre.

Un sinistre peut survenir à tout moment. Il peut interrompre la livraison de vos applications logicielles à vos clients ainsi que la continuité de votre entreprise.

Qu’il s’agisse d’une panne de votre réseau, d’une catastrophe naturelle ou d’un bug dans votre code, les temps d’arrêt peuvent interrompre votre entreprise. En effet, ils peuvent entraîner une perte de temps, de clients et de revenus.

C’est pourquoi avoir un plan de reprise après sinistre (DR) est si important.

pourquoi avoir un plan de reprise après sinistre (DR)

Les méthodes traditionnelles de reprise après sinistre sont extrêmement coûteuses et longues.

Mais avec le cloud computing, la création de l’infrastructure de sauvegarde nécessaire pour assurer une restauration rapide et efficace est plus facile et plus rentable que jamais.

Jetons un coup d’œil à la méthode de récupération après sinistre à l’ancienne. Ensuite, nous allons voir la comparaison de la reprise après sinistre basée sur le cloud ainsi que les étapes à suivre pour intégrer le cloud à votre plan de DR.

Comment se passait la reprise après sinistre ?

Les approches traditionnelles de reprise après sinistre

Les approches traditionnelles de reprise après sinistre impliquaient une duplication hors site des données et de l’infrastructure. Donc, s’il arrivera quelque chose de catastrophique à votre centre de données principal, vous pouvez rapidement basculer vers le centre de données de sauvegarde pour réactiver les applications critiques.

Ce centre de données dupliquées demande, bien sûr, un travail en double.

Cela peut comprendre au minimum :

  • Installations et immobilier pour héberger l’infrastructure informatique
  • Personnel de gestion et de sécurité de ces installations
  • Une capacité de serveur suffisante pour stocker toutes les données et répondre aux exigences de mise à l’échelle de vos applications
  • Personnel d’assistance technique pour l’entretien de l’infrastructure
  • Connectivité Internet avec suffisamment de bande passante pour alimenter vos applications
  • Infrastructure réseau telle que pare-feu, routeurs, commutateurs et équilibreurs de charge

C’est beaucoup de choses à gérer et beaucoup d’argent à dépenser. En effet, ce centre de données dupliqué est dédié uniquement pour la sauvegarde et ne sera pas utilisé la plupart du temps.

En fait, vous espérez que votre centre de données de sauvegarde ne sera jamais utilisé du tout.

À quel point est-il inutile ?

Les avantages de l’utilisation du cloud pour la reprise après sinistre

Avantages d'utiliser cloud pour la reprise après sinistre

De plus en plus d’entreprises adoptent le cloud pour la reprise après sinistre.

Selon Zetta, 50 % des entreprises utilisent des solutions de reprise après sinistre basées sur le cloud. La sauvegarde est la 2e application de cloud computing la plus utilisée, et la reprise après sinistre en 7e.

Applications basées sur cloud les plus utilisées
Les applications cloud les plus utilisées – avec l’aimable autorisation de Zetta

En effet, le cloud computing offre de nombreux avantages par rapport aux approches traditionnelles de reprise après sinistre. Voici certains de ces avantages :

Gain de temps et d’argent

Tout ce que vous avez dû construire et gérer pour vous préparer à une catastrophe – le deuxième centre de données, le personnel supplémentaire, les serveurs et d’autres infrastructures – tout disparaît.

Les fournisseurs de cloud ne vous facturent que si leurs services sont utilisés. Ainsi, au lieu d’engager tous les coûts susmentionnés nécessaires à la création et à la maintenance de centres de données en double, vous ne paierez qu’une fraction de ces coûts lors de la sauvegarde de vos applications dans le cloud.

Et si jamais une catastrophe ne se produit, vos coûts seront encore moins élevés.

Vous avez plusieurs options où sauvegarder vos données critiques

Lorsque vous utilisez le cloud pour la reprise après sinistre, vous pouvez choisir un des centres de données de votre fournisseur cloud. Il sera utilisé pour sauvegarder votre application.

L’emplacement de sauvegarde doit être géographiquement éloigné de votre centre de données. Ceci, pour réduire le risque de perdre l’application en ligne ainsi que la copie sauvegardée lors du même incident.

Supposons, par exemple, que votre entreprise utilise des logiciels de sécurité, que votre siège social soit à Paris et que la plupart de vos clients se trouvent en France. Vous avez donc construit un centre de données à proximité de vos bureaux pour exécuter votre logiciel.

Si vous avez construit un centre de données de sauvegarde, il est peut être dans une autre partie de la France à quelques centaines de kilomètres du centre de données. En effet, vos clients ne sont pas loin, et il est suffisamment proche pour entretenir et gérer.

Mais que se passe-t-il si une énorme tempête couvre tout le pays et met hors service vos deux centres de données ?

Si vous avez utilisé Amazon Web Services pour la reprise après sinistre, vous pouvez choisir de sauvegarder votre application dans leur centre de données en Irlande, ou encore plus loin à Mumbai ou à Singapour.

Emplacements des centres de données des fournisseurs cloud
Emplacements des centres de données pour Azure, AWS et Google Cloud. Avec l’aimable autorisation d’Atomia

Si vous voulez, vous pouvez même utiliser plusieurs fournisseurs cloud dans différents emplacements pour sauvegarder vos applications. (Plus d’informations à ce sujet plus tard).

Dans le cloud, vous disposez de nombreuses options pour héberger votre sauvegarde. Cela va augmenter la résilience de vos applications en évitant les catastrophes régionales.

Facile à mettre en œuvre avec une grande fiabilité

Les solutions de récupération après sinistre sont relativement faciles à installer dans le cloud, particulièrement par rapport à l’installation de votre propre centre de données en double.

Vous n’avez pas besoin d’acheter et de déployer des serveurs de sauvegarde, des lecteurs et des disques.

Au contraire, vous pouvez facilement et instantanément déployer une solution de stockage dans le cloud comme Amazon S3 pour sauvegarder vos données.

Vous pouvez même hiérarchiser votre sauvegarde avec des solutions de stockage de données à plus long terme comme Amazon Glacier pour réduire encore plus les coûts.

De plus, il est beaucoup plus facile de restaurer rapidement votre infrastructure si votre application est sauvegardée dans le cloud.

Plus besoin de transporter et de restaurer des copies de sauvegarde pour remettre votre application en marche. Lorsque vous utilisez le cloud pour la reprise après sinistre, vous pouvez accéder à toutes vos données via Internet beaucoup plus rapidement et facilement.

La reprise après sinistre est tout simplement beaucoup plus facile dans le cloud.

Évolutivité

Évolutivité
Rising Bar Graph

Les services cloud peuvent être mis à l’échelle facilement pour répondre à la demande selon les besoins.

Dans la reprise après sinistre traditionnelle, vous deviez vous assurer que la capacité du serveur dans votre centre de données en double était suffisante pour répondre à la demande.

Et si ce n’était pas le cas, la performance de l’application serait lente voire très lente.

Avec le cloud, la mise à l’échelle est facile, rapide et plus rentable. Ce qui garantit à vos clients une expérience utilisateur exceptionnelle, même en cas de sinistre.

Concevoir un plan de reprise après sinistre dans le cloud

Vous connaissez maintenant les avantages de l’utilisation du cloud pour la reprise après sinistre. Alors, qu’est-ce qui va se passer maintenant ?

Il est important d’avoir un plan de reprise après sinistre complet et bien testé et d’y intégrer le cloud. Voici comment en concevoir un.

1) Auditez votre infrastructure et évaluez vos risques

Auditez votre infrastructure et évaluez vos risques

Les premières étapes de la création d’un plan de reprise après sinistre consistent à faire l’inventaire de vos actifs informatiques. Il faut aussi évaluer les risques qui pourraient les menacer.

Vous devez avoir une bonne idée de toute l’infrastructure informatique dont votre entreprise dispose. Il faut également le nombre de chaque équipement, leur valeur ainsi que leur emplacement.

Il faut savoir quelles applications accèdent à quelles données et à quelle fréquence. Combien de données vous avez et où elles sont toutes stockées ?

Évaluez ensuite le risque potentiel de tous vos actifs.

Les risques peuvent prendre différentes formes.

Les risques sur site comprennent:

  1. les incendies,
  2. les pannes de courant,
  3. les cyberattaques,
  4. etc.

Les catastrophes naturelles telles que les ouragans, les tremblements de terre, les inondations et d’autres calamités peuvent affecter des zones géographiques entières.

Puis, les événements régionaux ou mondiaux sont moins probables mais encore pires. Ce sont, par exemple, les épidémies, les effondrements économiques et les attaques terroristes pouvant affecter des régions ou des nations entières.

Lorsque vous avez une bonne compréhension des actifs susceptibles d’être à risque et des événements susceptibles d’avoir un impact négatif sur votre entreprise, vous pouvez mieux concevoir un plan de reprise après sinistre pour atténuer ces risques.

2) Effectuer une analyse d’impact sur l’entreprise

Impact sur l'entreprise

L’étape suivante consiste à effectuer une analyse d’impact sur l’entreprise. Cela vous aidera à mieux comprendre les seuils sous lesquels votre entreprise peut fonctionner après une catastrophe.

Votre équipe de reprise après sinistre doit déterminer deux paramètres clés :

  • Objectif de délai de récupération (RTO)
  • Objectif de point de récupération (RPO)

Ces deux paramètres sont beaucoup plus importants pour planifier les préparatifs nécessaires pour la reprise après une catastrophe.

Objectif de délai de récupération (RTO)

Le RTO est la durée maximale acceptable pendant laquelle votre application peut être hors ligne avant d’avoir un impact sérieux sur vos opérations commerciales.

Bien que les temps d’arrêt soient toujours douloureux, ils peuvent affecter certaines entreprises plus durement que d’autres.

Par exemple, si votre entreprise opère dans le fonds d’investissement spéculatif et gère une plateforme de négociation d’actions à haute fréquence, une catastrophe peut arrêter votre activité.

Vous ne pouvez pas réaliser un seul échange pendant la panne de votre logiciel. En d’autres termes, votre entreprise cesse essentiellement de fonctionner.

Dans ce cas, vous devez définir votre Objectif de délai de récupération ou RTO sur 15 minutes ou moins. Pour cela, vous devrez investir massivement dans votre plan de reprise après sinistre afin d’obtenir une récupération complète dans ce court laps de temps.

D’un autre côté, supposons que vous exécutez un espace de coworking. Votre logiciel d’adhésion est certainement important. Mais en cas de catastrophe, vous pouvez trouver des solutions alternatives telles que demander à vos membres de se connecter manuellement pour l’enregistrement dans l’un de vos bureaux.

Ainsi, vous pourriez définir votre RTO sur une semaine. Vous n’aurez pas à investir autant de ressources dans la reprise après sinistre, car vous aurez suffisamment le temps de vous disposer des ressources de sauvegarde dont vous avez besoin après le sinistre.

Comprendre votre RTO est très important. Cette durée est directement liée à la quantité de ressources dont vous avez besoin pour investir dans votre plan de reprise après sinistre.

Objectif de point de récupération (RPO)

Le RPO est défini comme la durée maximale acceptable pendant laquelle des données peuvent être perdues de votre application à cause d’un incident majeur.

Pour vous aider à déterminer votre RPO, posez ces deux questions :

  1. Combien de données puis-je me permettre de perdre en cas de catastrophe ?
  2. Combien de temps peut s’écouler avant que toutes ces données ne soient perdues ?

La réponse à la question n° 2 est votre RPO ou Objectif de point de récupération.

Le RPO vous informe sur la fréquence à laquelle vous devez sauvegarder vos données.

Dans le cas du fonds d’investissement spéculatifs de trading à haute fréquence, votre RPO peut ne durer que 5 minutes en raison de la nature intensive en données et de haute conformité de votre entreprise.

Si votre société utilise un co-working space, votre RPO peut être défini sur quelques jours. Il est toujours important de sauvegarder les données de vos membres. Mais, ces données ne sont pas sensibles au facteur temps.

Alors, dépenser beaucoup d’argent en reprise après sinistre pour répondre à un petit RPO n’en vaudra sans doute pas la peine.

Pour plus d’informations sur RTO, RPO et leurs différences, lisez ces articles de Druva et Advisera.

Ratio coût RTO/RPO
Ratio coût RTO/RPO – avec l’aimable autorisation de Google Cloud

3) Concevez votre plan de reprise après sinistre ou DR en fonction de votre RTO et RPO

Maintenant que vous savez quels actifs protéger et quels sont vos RTO et RPO, vous pouvez concevoir un système pour répondre à vos objectifs de reprise après sinistre.

Vous trouverez ci-dessous quelques approches que vous pouvez mettre en œuvre pour votre plan de reprise après sinistre. Celles-ci ne s’excluent pas mutuellement, et vous pouvez certainement combiner quelques approches pour atteindre votre RTO.

Sauvegarde et restauration

Sauvegarde et restauration

Si vous avez un RTO et un RPO relativement longs, vous pouvez créer un simple plan de sauvegarde et de restauration pour la reprise après sinistre.

Cela implique la réplication de vos données sur site dans un service de stockage cloud comme Amazon S3 ou Azure Storage.

Assurez-vous que votre fournisseur cloud dispose d’un service gratuit qui vous permet de transférer efficacement vos données dans le cloud. Ainsi, vous pouvez accéder rapidement à ces données.

La sauvegarde n’est que la moitié du processus.

En cas de catastrophe, vous devrez aussi rétablir vos données rapidement pour éviter des temps d’arrêt prolongés.

Pour cela, vous devez surtout comprendre le processus que vous et votre fournisseur cloud utiliserez pour restaurer vos données et vos systèmes aussi rapidement que nécessaire.

Approche de Pilot Light ou veilleuse

Vous vous êtes déjà demandé à quoi sert la veilleuse de votre appareil de chauffage ? Moi non plus.

Quoi qu’il en soit, la veilleuse est une petite lampe qui reste constamment allumée. Grâce à cette lampe, vous pouvez démarrer immédiatement le radiateur pour chauffer votre maison.

En ce qui concerne la DR, la veilleuse est une version minimale de votre environnement informatique. Elle fonctionne dans le cloud et peut être immédiatement activée en cas d’urgence.

Vous pouvez utiliser le cloud pour héberger les éléments les plus critiques de votre application. En cas de catastrophe, vous pouvez déployer rapidement en utilisant ces éléments pour restaurer entièrement votre application.

L’option Pilot Light vous permet de récupérer beaucoup plus rapidement vos systèmes que l’approche de sauvegarde et de restauration. En effet, vous avez déjà l’élément fondamental de votre environnement prêt à être déployé à tout moment.

La mesure dans laquelle construire votre infrastructure Pilot Light dépend de votre RTO.

En général, les éléments comprennent la réplication des données dans le cloud, des serveurs préconfigurés prêts à être lancés à tout moment et éventuellement le stockage des packages d’installation ou des informations de configuration. Vous pouvez aussi configurer des instances de base de données supplémentaires pour la résilience des données.

Lorsque le moment est venu pour la récupération, vous pouvez démarrer rapidement vos serveurs cloud préconfigurés, acheminer votre trafic vers ces serveurs et mettre à l’échelle ces serveurs si nécessaire.

Option Pilot Light DR
Option Pilot Light DR – avec l’aimable autorisation d’AWS (téléchargement PDF)

Warm Standby ou reprise de secours semi-automatique

Le Warm Standby implique la création d’une copie simplifiée de votre environnement pleinement fonctionnel dans le cloud.

Cette approche accélère encore plus la récupération, car vous disposerez d’une copie de votre environnement, bien que contractuelle, exécutée constamment dans le cloud.

Vous pouvez configurer quelques serveurs virtuels de faible capacité et quelques bases de données cloud pour dupliquer vos données sur site de manière régulière.

Si votre environnement sur site tombe en panne, vous pouvez augmenter la capacité de vos machines virtuelles, équilibrer la charge entre elles et diriger votre trafic vers elles.

Vous pouvez aussi mettre à l’échelle vos bases de données pour vous assurer que votre environnement peut gérer l’augmentation de la charge.

Warm Standby
Warm Standby – avec l’aimable autorisation d’I2M

Réplication complète dans le cloud

La réplication complète est la solution qui permet de reprendre le plus rapidement. Cette approche vous permet en effet d’avoir plusieurs environnements fonctionnant activement sur site et dans le cloud.

Dans ce cas, vous devez répliquer complètement votre environnement sur site dans le cloud. Ensuite, vous devez répartir le trafic entre les deux environnements.

Si une catastrophe entraîne la mise hors ligne de votre environnement sur site, vous pouvez acheminer tout votre trafic vers votre configuration cloud. Puis, vous pouvez aussi mettre à l’échelle de manière appropriée.

Bien que cette approche vous aide à atteindre un RTO court, elle peut être beaucoup plus coûteuse que les options mentionnées ci-dessus. Cela dit, votre environnement cloud sera toujours en cours d’exécution. Le coût dépendra fortement de la quantité d’infrastructure cloud déployée et de la quantité de trafic qui y est acheminée.

Réplication complète pour la reprise après sinistre
Réplication complète pour la reprise après sinistre – avec l’aimable autorisation de Google Cloud

Option multi-cloud

Si toute ou une partie de votre environnement est déjà dans le cloud, il peut être judicieux d’utiliser un autre fournisseur cloud comme option de récupération après sinistre.

Certes, les fournisseurs cloud ont des méthodes de sauvegarde dans leurs propres environnements, telles que la division de leur infrastructure en différentes zones de disponibilité.

Toutefois, aucun fournisseur cloud n’est parfait, et les temps d’arrêt arrivent à tout le monde.

En utilisant deux fournisseurs cloud différents, votre infrastructure peut être plus résiliente, car il n’y a aucune dépendance entre les services.

Le multi-cloud a ses avantages et ses inconvénients, alors assurez-vous que cela en vaut la peine.

4) Sélectionnez votre fournisseur cloud

fournisseurs cloud

Après avoir défini l’approche que vous devez adopter pour atteindre vos objectifs de reprise après sinistre, l’étape suivante consiste à choisir un fournisseur cloud qui peut vous aider à y parvenir.

Si vous avez un RTO long et que vous utilisez l’option de sauvegarde et de restauration, votre décision pourrait principalement se résumer au coût de stockage et de transfert de données.

Si vous avez besoin d’un certain niveau de réplication de l’environnement, vous devez prendre en compte quelques autres facteurs lors de l’évaluation des fournisseurs cloud. Ce sont notamment :

  • La fiabilité
  • La rapidité de la récupération
  • La convivialité
  • La simplicité en termes de configuration et de récupération
  • L’évolutivité
  • La sécurité et la conformité

Vous pouvez choisir parmi de nombreuses sociétés de cloud proposant l’option de reprise après sinistre.

Les grands fournisseurs de services cloud comme AWS, Microsoft Azure, Google Cloud et IBM ont tous des options de reprise après sinistre.

Il y a aussi plusieurs petites sociétés moins connues qui concentrent une grande partie de leurs efforts pour fournir une reprise après sinistre en tant que service (DRaaS) de qualité. Ce sont Sungard, BlueLock, iLand et bien d’autres.

Vous devez évaluer plusieurs fournisseurs cloud proposant le DR et capables de fournir tout ce dont vous avez besoin à un coût correspondant à votre budget.

5) Configurez votre infrastructure Cloud pour la reprise après sinistre

Configuration de l'infrastructure cloud reprise après sinistre

Maintenant que vous avez un partenaire cloud proposant le DR, vous pouvez travailler ensemble pour mettre en œuvre votre conception et configurer votre infrastructure de reprise après sinistre.

Là, il y a un certain nombre de problèmes logistiques à considérer. La complexité dépendra surtout de l’approche de la reprise après sinistre que vous sélectionnez.

Quelle quantité de chaque composant d’infrastructure aurez-vous besoin ?

Comment allez-vous copier vos données dans le cloud ?

Quelle est la meilleure façon de mettre en œuvre l’authentification des utilisateurs et la gestion des accès ?

Quels systèmes de sécurité et de conformité devrez-vous mettre en place ?

Quelles mesures de contrôle pouvez-vous intégrer pour minimiser la probabilité d’événements de catastrophe ?

Votre instance DR doit être créée pour répondre à vos spécifications RTO et RPO. Cela permet de garantir que votre technologie sera opérationnelle dès que nécessaire après une catastrophe.

6) Documentez votre plan de récupération

Documentez votre plan de récupération

Lorsqu’une catastrophe se produit, vous ne voulez pas laisser les tâches importantes au jugement de chacun. C’est pourquoi il est impératif de documenter votre plan de récupération de la manière la plus détaillée possible.

Chaque membre de votre personnel doit connaître son rôle exact dans le déploiement de l’infrastructure de reprise après sinistre dans le cloud.

  1. Qui est responsable de contacter le fournisseur cloud ?
  2. Qui est responsable de l’exécution du script de déploiement ?
  3. Qui va acheminer le trafic Web vers les serveurs cloud ?

Les responsabilités de tout le personnel doivent être claires.

Puis, les instructions de déploiement doivent être aussi précises et concrètes que possible.

La définition des tâches telles que « Acheminer le trafic vers les serveurs cloud » n’est pas précise. Il faut bien décrire les étapes telles que « Créer un enregistrement A qui pointe vers l’adresse IP 84.276.110.217 ».

Un document complet et détaillé de votre plan de reprise après sinistre est important pour garantir que votre plan est exécuté correctement en cas de catastrophe.

7) Testez régulièrement votre plan

Testez régulièrement votre plan

Une fois que vous avez créé et documenté votre plan, il est important de le tester régulièrement pour vous assurer qu’il n’y a pas de points faibles.

Bien que votre plan soit parfait sur le papier, vous devez l’exécuter dans le monde réel pour découvrir à quel point il est vraiment robuste.

Votre premier test se passera probablement mal. Une grande partie de votre personnel ne saura pas quoi faire. Les processus ne marcheront pas et la communication sera interrompue. Ce sera une catastrophe.

C’est une bonne chose, car vous serez en mesure de combler les failles et de mieux vous préparer en cas de catastrophe réel.

Plus votre plan de reprise après sinistre est complexe, plus il est important de le tester souvent.

Les tests complets de la reprise après sinistre doivent être exécutés au moins tous les trimestres. Vous pouvez prendre des instantanés hebdomadaires ou quotidiens de votre infrastructure de sauvegarde pour vous assurer que tout fonctionne correctement.

Netflix a développé un outil appelé Chaos Monkey. Ce dernier introduit fréquemment des pannes simulées dans leur architecture AWS afin qu’ils puissent s’assurer que leur plan de reprise après sinistre fonctionne à toute épreuve.

Puis, il y aura toujours des changements dans votre entreprise qui rendront les tests encore plus importants. Les employés peuvent changer tout comme les rôles de chaque personnel, et les processus peuvent être modifiés.

En testant souvent votre plan de reprise après sinistre, vous serez parfaitement préparé à toute situation d’urgence.

Conclusion

Une catastrophe peut survenir à tout moment. Serez-vous prêt à réagir rapidement et efficacement ?

Un plan de reprise après sinistre complet vous y aidera. Le cloud computing peut surtout vous aider à mettre en œuvre facilement ce plan pour augmenter la fiabilité et la flexibilité tout en économisant du temps et de l’argent.

De plus en plus d’entreprises de toutes tailles migrent vers le cloud pour leur reprise après sinistre, et il est maintenant clair pourquoi.

Avez-vous déjà connu une catastrophe ? Que pensez-vous de l’utilisation du cloud pour la reprise après sinistre ? Nous aimerions connaître votre avis dans les commentaires ci-dessous.

Aina Strauss
Les derniers articles par Aina Strauss (tout voir)

À lire aussi

Qu’est-ce que le SaaS ? Un Guide Complet

Mis à jour le: 9 mars 2020 Saviez-vous qu’environ 51 % des entreprises adoptent le …

Share via
Copy link
Powered by Social Snap