Duquesne Group Duquesne Group

English version
Recherche et Analyse

Pour éclairer les décideurs dans le domaine de la Continuité d'Activité et de la Sécurité de l'Information, Duquesne Group propose ses analyses et réflexions issues de ses réalisations concrètes en clientèle. Observation critique du terrain par nos experts, contacts permanents avec les principaux acteurs du domaine et expérience vécue dans nos missions de conseil sont nos principales sources. Contactez-nous pour en savoir +
French version
Research

To support decision makers in the management and optimisation of information systems, Duquesne Group delivers in-depth analyses of information technologies, their implementations and their markets. Our research is based on critical observation of the market by our analysts and their on-going contacts with the vendor community, together with hands-on, practical experience from our consulting work. Contact us to find out more


Plans de Continuité informatique : peut-on encore leur faire confiance ?


Le splendide isolement des plans de continuité informatiques touche à sa fin. Emmanuel Besluau, notre expert en continuité d'activité de l'entreprise, explique pourquoi.



Plans de Continuité informatique : peut-on encore leur faire confiance ?
Les plans de continuité informatiques ou PCIT sont des dispositifs de continuité qui concernent l'informatique. Certaines démarches d'entreprise les mettent à part de l'approche PCA ; il fut un temps où cela était faisable, voire recommandé.

Toutefois, la complexité des systèmes informatiques rend cet isolement de plus en plus problématique à une époque où les métiers en font un usage intensif. Des difficultés apparaissent de plus en plus, qui posent véritablement la question : peut-on se reposer vraiment sur un PCIT ? n'y aurait-t-il pas des problèmes en cas de vrai sinistre ?

S'appuyant sur des exemples concrets, cet article évoque quelques raisons de se poser des questions et présente cinq défis à affronter pour gagner en confiance...

Une situation de plus en plus complexe

Les Plans de Continuité d'Activité (PCA) dits 'informatiques' ou PCIT sont des dispositifs techniques et organisationnels permettant de faire face au mieux à une panne ou un sinistre portant sur les moyens informatiques.

Concrètement ils regroupent des moyens redondants, des systèmes de copie-miroir ou de cluster de serveurs, des contrats de secours à distances, etc. avec procédures associées.

Malheureusement, les exploitations informatiques ont connu de nombreuses évolutions ces vingt dernières années qui ont compliqué la donne.

Ces évolutions se sont superposées, car en informatique il est très rare que l'on pratique la politique de la 'table rase' en installant un nouveau système qui remplace totalement le précédent.

En conséquence, les entreprises font face à une accumulation de systèmes différents, plus ou moins récents et devant cohabiter ensemble. On peut couramment trouver deux ou trois générations successives.

Non seulement ces systèmes doivent vivre ensemble, mais ils doivent s'échanger des données en permanence, car ils se partagent des informations de référence qui bougent.

Parler de PCA (ou PCIT) dans ce contexte devient de plus en plus difficile et présente de nombreux défis.

Défi N°1 : l'ancienneté

Dans les PCA informatiques que nous étudions, nous constatons fréquemment un phénomène de 'glaciation' si l'on peut dire : un PCA a été figé à un moment donné et ne bouge plus :

  • tel dispositif technique n'est valable que pour le mainframe ; or des dizaines (voire centaines) de serveurs sont apparus en salle sans qu'on y prenne garde, ils ne sont couverts par aucun dispositif

  • pour la reprise après sinistre, seules deux ou trois machines (certes centrales il y a dix ans) sont prises en compte dans un contrats de secours à distance, les autres sont oubliées...

  • les sauvegardes qui sont faites et sorties du site sont exclusivement celles du mainframe ou de quelques gros serveurs Unix ; les autres machines sont sauvegardées de manière très variable et les données ne sont pas sorties.

Le défi N°1 est de bien faire évoluer les PCIT, autrement dit de vérifier que les moyens qui sont résilients ou repris rapidement sont bien à jour et correspondent bien aux besoins des applicatifs et des métiers.

Défi N°2 : l'isolement de l'IT des métiers n'est plus tenable

Et nous tombons immédiatement sur le deuxième défi qui correspond à un vrai challenge :

  • les matériels qui bénéficient du PCIT correspondent-ils aux applications critiques ?

  • connaît-on les applications critiques ? et ce sur quoi elles tournent ?

  • le déroulement d'un Plan de reprise IT est-il convenable ? permet-il de redémarrer les métiers critiques ?

Très souvent la réponse à ces questions est NON !

Et pourtant des tests (de PCIT) sont faits qui donnent parfaitement satisfaction, voici un exemple de constat, face auquel il faut être critique :

  • Constat : "nous avons pu redémarrer la partition mainframe en quatre heures...cela démontre le bien-fondé de notre PCIT".

  • Critique : oui mais les 250 serveurs Unix et Wintel non redémarrés ? ils ne servent à rien ? dans la réalité, l'utilisateur a besoin du mainframe et de 36 de vos 250 serveurs en moins de quatre heures !

Le défi N°2 est de coupler en permanence le PCIT avec le besoin du métier.

En 2013 un PCIT ne peux s'auto-justifier : il a besoin de connaître les exigences des métiers et de les satisfaire.

Défi N°3 : le casse-tête des sauvegardes utilisables

Voici encore un enjeu d'importance !

La cohabitation mentionnée plus haut amène bien évidemment à une multiplication de solutions diverses, exemples :

  • le mainframe fait ses sauvegardes d'une certaine manière sur ses cartouches tous les soirs

  • les serveurs Unix ont leur méthode à eux dans la nuit, avec un autre logiciel sur d'autres cassettes

  • certains applicatifs (sur Unix par exemple) ont aussi leur propre manière de sauvegarder leurs données

  • les serveurs Windows font encore autrement, certains ne produisent pas de cassette car les données restent sur disques

  • certains font des sauvegardes totales, d'autres différentielles (ie : de ce qui a changé), journalières, hebdomadaires etc...

Lorsque les tests de PCA sont définis, faites-les transverses : ne cherchez plus à redémarrer un moyen, cherchez à relancer une application et à reconstituer ses données ! C'est une autre approche mais il est nécessaire de l'introduire.

Défi N°4 : penser architecture de continuité

Cela nous amène naturellement au défi de l'architecture technique à mettre en place : penser architecture de continuité.

Lorsque les études d'architecture et les choix qui en découlent sont faits, il faut absolument intégrer la parade au sinistre, ce qui peut amener à repenser les choix :

  • penser aux métiers et donc aux applications qui doivent redémarrer ensemble : traiter les de manières similaires sur leur plate-formes cibles

  • identifier les 'données qui vont ensemble' conserver les avec des cycles de sauvegardes compatibles, sur des "points propres" de reprise communs

  • s'il y a des échanges nombreux entre systèmes, avoir une plate-forme d'échange qui gouverne l'ensemble et sait ce qui a été envoyé, reçu, avec acquittement ou pas...

Défi N°5 : quel sinistre pare-t-on ?

Enfin, il est indispensable de se souvenir de ce point : il n'y a pas de PCA ou PCIT dans l'absolu, il n'y a que des PCIT pour faire face à des sinistres bien identifiés.

Tel PCIT a prévu de parer une panne de machine, il le fait bien, mais face à une panne de salle il est inopérant : il faut le savoir !

Tel autre encore a prévu une panne de salle pour certaines machines qui basculent alors très vite dans une autre salle du même site : c'est bien, mais face à une panne de site (ie les deux salles) il n'y a pas de parade dans ce cas : sachons le.

Ces deux exemples illustrent le défi N°5 : toujours se souvenir de ce que l'on pare avec tel ou tel PCIT. Il n'y a pas de PCIT absolu, il n'y a que des PCIT relatifs à un sinistre donné. Cela amène à la lucidité et aussi à l'humilité.

Toute direction générale devrait s'enquérir de la situation de son PCIT avec cette approche.

Moralité : les PCIT doivent être au service des métiers

Plutôt que de redémarrer (ou faire continuer) des moyens pris dans leur ensemble, l'approche PCA/PCIT doit redémarrer les métiers prioritaires.

Pour ce faire, les moyens à privilégier sont multiples (un sous-ensemble de ce qu'il y a en salle) et gérés en différents lieux (en interne, chez un prestataire, dans le cloud) et ne se laissent pas enfermer dans un PCIT de moyens techniques.

Pour relever les cinq défis précédents, il faut avoir une vue des activités à privilégier en cas de sinistre et un lotissement des moyens en conséquence.

Le PCIT éclate en multiples plans tous au service des activités critiques de l'entreprise.
Emmanuel Besluau
Mercredi 2 Janvier 2013

Home Home    Mail Mail    Print Print    Zoom + Zoom +    Zoom - Zoom -    Share Share


Dans la même rubrique :
< >

Mercredi 5 Octobre 2016 - 17:48 Attention : un SMCA n'est pas un PCA !


Duquesne Research Newsletter