Duquesne Group Duquesne Group

English version
Recherche et Analyse

Pour éclairer les décideurs dans le domaine de la Continuité d'Activité et de la Sécurité de l'Information, Duquesne Group propose ses analyses et réflexions issues de ses réalisations concrètes en clientèle. Observation critique du terrain par nos experts, contacts permanents avec les principaux acteurs du domaine et expérience vécue dans nos missions de conseil sont nos principales sources. Contactez-nous pour en savoir +
French version
Research

To support decision makers in the management and optimisation of information systems, Duquesne Group delivers in-depth analyses of information technologies, their implementations and their markets. Our research is based on critical observation of the market by our analysts and their on-going contacts with the vendor community, together with hands-on, practical experience from our consulting work. Contact us to find out more


Votre PCA/PRA est-il effectivement opérationnel ?


Souvent lors de nos missions nous croisons des situations contrastées : la conception de l'infrastructure est bonne, la technologie est en place. Le PCA est crédible.

Toutefois, il manque des points de procédures et de consigne...et surtout, il y a peu d'ancrage dans le réel.

S'il y avait un sinistre que se passerait-il réellement ?



Votre PCA/PRA est-il effectivement opérationnel ?

Une bonne conception au début

Les ingénieurs en charge de la définition de l'infrastructure ont bien monté les mécanismes qui conviennent avec par exemple :

  • une répartition des traitements en clusters actif-actif
  • des baies de stockage dupliquées, avec divers mécanismes
  • des snapshots et prises d'image et sauvegardes

Lorsque ces projets arrivent en production, le principal est testé et la transition avec l'existant se fait progressivement. Bref, tout se déroule convenablement.

Par ailleurs, dans un louable souci de documentation, des procédures sont écrites, des consignes réalisées et conservées.

Les responsables informatiques considèrent qu'ils sont dotés alors d'un PCA correct et en général ils n'ont pas tort...même si la vision métier et utilisateur peut sembler un peu lointaine, mais c'est un autre sujet.

Quelques années plus tard...

Lorsque l'infrastructure évolue, elle change progressivement et par parties. Ces changements sont là encore très souvent proprement faits. Mais trop souvent l'effet sur le PCA/PRA est malgré tout peu étudié et les procédures et consignes peu réactualisées.

A côté de cela, les applications évoluent aussi ; certaines modifient des paramètres qui en cas de reprise seraient très importants, dans le domaine des échanges de fichiers ou des travaux planifiés par exemple. Les effets peuvent être plus graves : certaines procédures du PCA/PRA ne conviennent plus du tout.

Les sauvegardes se font mais se passent de plus en plus mal...qui doit s'en préoccuper ? Les cartouches sont conservées sur le site...est-ce bien ?

Bref, l'infrastructure et l'applicatif s'éloignent progressivement de la pratique décrite dans les PRA/PCA qui ne correspond plus à la réalité. Cela se fait subrepticement.

Et les risques ?

Les PCA mis en place dans les années 1990-2010 s'appuyaient très souvent sur des approches de répartition des risques sur deux sites assez proches.

Les risques inhérents à ces sites (inondations, zone Seveso, etc.) sont loins des considérations des responsables : "on choisit ces sites parce que ce sont nos sites." Point.

Les nouvelles considérations des années 2010 modifient la donne. Les communes commencent à réaliser des Plans Communaux de Sauvegardes, les départements publient leur Dossier Départemental des Risques Majeurs, les responsables d'établissement découvrent alors les réalités des risques encourus.

"Si nous devions construire notre centre informatique aujourd'hui, nous n'aurions pas le droit de le mettre là" rapportait récemment un chef de centre.

Le problème est que le Plan de continuité, lui, s'appuie sur deux salles de ce même centre...c'est même son principe structurant.

Le diable se cache dans les détails !

Dernier point important : l'opérationnel est souvent mis au second plan, mais en cas de sinistre il faut savoir exactement quoi faire. Si on le découvre petit à petit, cela ne va pas !

Or, des questions comme celles-ci sont souvent sans réponse claire :

  • qui décide d'activer le PCA/PRA ? et comment active-t-on le PCA/PRA ?
  • s'il n'y a plus de courant : que fait-on réellement ? nous avons une heure d'autonomie, qui réagit si la coupure dépasse "un certain temps" (combien d'ailleurs)
  • comment savoir quelle partie de la salle est coupée ?
  • dans cette partie de salle, quels matériels sont en arrêt ?
  • quels sont les serveurs critiques ? à privilégier ? et qui le sait ?
  • qui peut intervenir pour lancer ce qu'il faut sur les machines ?
  • les outils et consoles réseau sont inondés, puis je aller en salle opérer sur les commutateurs ?
  • le secours est sur l'autre salle et elle aussi est inondée : que dois-je faire ?
  • j'ai un contrat de secours chez tel prestataire : comment l'activer ? et quels délais ? où est le contrat ?
  • avons nous un centre de crise ? où ? comment l'activer ?
  • ma console de surveillance m'inonde de messages, je suis débordé, elle est inexploitable !
  • où est la liste des experts de telle application ? et de tel OS ?

Décrire les responsabilités ... et tester

On le voit avec ces exemples, un système en cluster actif/actif seul est loin de constituer un PCA/PRA.

Il faut aussi des procédures, des responsables, des règles, des listes de contacts, bref tout un mode opératoire à dérouler en cas de sinistre. Le "ça va marcher tout seul" est loin d'être vérifié en cas de sinistre !

Il convient donc de structurer tout cela en décrivant :

  • qui est responsable de quoi en cas de sinistre ? et s'il est absent ?
  • quelles sont les principales missions des gens en place ?
  • comment sommes-nous informés de ce qui se passe ?
  • qui représente quoi dans la cellule de crise ? qui prévenir ?
  • que faire ? dans quel ordre ?
  • que peut-on arrêter ?
  • qui représente les métiers vitaux ?

Ces points et d'autres doivent être l'objet de réflexions, de clarifications et être spécifiés dans les Plans.
Ensuite, il faudra réaliser des test de diverses ampleurs, avec un impact réduit sur l'existant, afin de vérifier et d'améliorer l'efficacité de ces Plans.
Emmanuel Besluau
Dimanche 20 Septembre 2015

Home Home    Mail Mail    Print Print    Zoom + Zoom +    Zoom - Zoom -    Share Share


Dans la même rubrique :
< >

Mercredi 5 Octobre 2016 - 17:48 Attention : un SMCA n'est pas un PCA !


Duquesne Research Newsletter