Duquesne Group Duquesne Group

English version
Blog des experts

Les avis et les commentaires exprimés dans les blogs sont ceux des experts individuels. Ils ne représentent pas nécessairement l'opinion du cabinet. Contactez-nous pour en savoir +
French version
Blogs

In these blogs, individual experts freely express their own opinions and comments. They do not necessarily reflect the opinion of the firm. Contact us to find out more


PCA : comment améliorer les tests

Quelques conseils issus de la Norme


Beaucoup d'entreprises considèrent avec raison que les tests et exercices de PCA sont indispensables et y consacrent une bonne part de leur budget PCA.

Les bonnes pratiques et la norme ISO22301 apportent un plus indéniable en clarifiant le rôle des tests.

Revue de détail en se référant à la norme.



droits DR
droits DR

Que teste-t-on en réalité ?

Ce point est très important : pour les opérationnels, il est utile de vérifier régulièrement que l'on pourrait redémarrer tel serveur ou remettre en état de marche telle machine dans un temps raisonnable.

Pour cela on "fait comme si" il y avait une panne et on essaie au plus vite de remettre en état tel ou tel moyen. Tout le monde s'y met sur une demie-journée et on valide tant bien que mal que "s'il fallait le faire on y arriverait".

La norme ISO 22301 de système de management de la continuité d'activité, dit : "l'organisation doit procéder à des exercices et des tests de ses procédures de continuité d'activité afin de s'assurer qu'elles sont cohérentes avec ses objectifs de continuité d'activité."

On voit immédiatement une grosse différence : la norme ne demande pas de tester "qu'on y arrive" mais de tester que les procédures sont cohérentes avec les objectifs de continuité.

Il faut donc des procédures à tester ! Or, combien de tests se font à-la-va-vite, avec des experts en système D sans aucune procédure ?

Amélioration donc : écrivons des procédures et testons-les !

Quels sont donc les objectifs de nos tests ?

Souvent, cette question que nous posons lors de nos missions de conseil reçoit une réponse très orientée moyens techniques, du genre :

"nous vérifions que tel serveur redémarre en quatre heures" ou encore : "nous testons que ce routeur bascule tout seul sur son secours".

Or ; que dit la norme ? Citons l'ISO 22301 :

L'organisation doit mener des exercices et test qui sont cohérents avec le périmètre et les objectifs du SMCA.

Il est clair que l'objectif du SMCA (Système de Management de la Continuité d'Activité) est de redémarrer ou continuer les métiers critiques de l'entreprise. Cela va bien au-delà du redémarrage de moyens.

Il faut donc prévoir de démontrer un redémarrage métier incluant certes des serveurs (mais pas tous), mais aussi des personnels (lesquels ?) et des postes de travail (comment ?). Cela change le type de test à réaliser.

Deuxième amélioration donc : organisons des tests et exercices impliquant mieux les métiers prioritaires.

Non aux tests irréalistes !

L'autre jour, un de nos clients annonce : "aujourd'hui nous testons la bascule du serveur X sur son secours", et sur le parking, il nous donne des détails avant de monter dans son bureau.

Nous lui demandons dans quel cas il aurait en vrai à faire cette bascule et il nous répond : "par exemple en cas d'inondation du site".

Or dans ce cas, il ne pourrait ni se garer ni aller dans son bureau ! Le test est pour le moins incomplet ! Il faudrait voir et tester comment on peut faire ce redémarrage quand on ne peut pas se rendre sur le site à cause de l'eau !

C'est exactement ce que dit la norme ISO 22301 :

(Les tests) reposent sur des scénarios appropriés qui sont bien planifiés avec des buts et des objectifs clairement définis

Troisième amélioration : donnons du réalisme à nos tests qui doivent se rapprocher du sinistre réel à craindre.

Quelle assurance avons-nous avec nos tests ?

Très souvent cette question fait un peu froid dans le dos : nous savons que si les bonnes personnes sont là le jour du sinistre, nous devrions pouvoir redémarrer tel serveur ou ouvrir tel emplacement de bureaux à peu près dans les temps.

Mais nous sommes à contrario presque sûrs que si les bonnes personnes ne sont pas là, cela ne sera pas possible ou durera beaucoup plus longtemps.

D'où l'idée de faire un jour un test sans les bonnes personnes ce qui d'ailleurs oblige à documenter et procédurer ce qui est fort salutaire (voir point 1 plus haut).

En généralisant, on peut affirmer qu'il est intéressant de varier les situations des tests, afin de découvrir les faiblesses et les améliorer.

La norme ne dit pas autre chose : "cumulés au fil du temps, les exercices et tests valident l'ensemble de ses dispositions en matière de continuité d'activité, en impliquant les parties concernées."

Quatrième amélioration : ne testons pas uniquement un cas que l'on sait marcher ; varions les scénarios !

Ne faisons pas Tchernobyl !

Cette catastrophe nucléaire fut provoquée par des tests en vraie grandeur sur une centrale dont les sécurités avaient été désactivées.

Les tests ne doivent pas être risqués ; ils ne doivent pas mettre à mal l'exploitation normale. L'impact du test doit être limité et surtout décidé !

Nous voyons encore trop souvent des équipes qui font des tests d'arrêt violents et peu préparés, avec des conséquences imprévisibles.

Que dit la norme ? Elle est très claire : "les tests minimisent le risque de perturbation des opérations".

L'époque du grand test d'interruption totale est révolue, dans notre monde à la technicité complexe, le risque est trop grand.

Cinquième amélioration : faisons des revues de risque avant les tests pour assurer qu'ils sont acceptables.

Les tests doivent produire des enseignements

Rien de pire qu'un test qui s'est mal passé et dont on ne tire aucune leçon, aucune idée d'amélioration des dispositifs de continuité !

Un tests est là pour découvrir ce qui ne va pas ou n'irait pas en cas de sinistre ; il est donc indispensable de trouver des faiblesses et de les résoudre par des plans d'action.

Ce point est souvent vu autrement et certains considèrent qu'un bon test ne découvre rien...

La norme insiste : "les tests permettent de produire, après les exercices, des rapports formalisés contenant les résultats, des recommandations et des actions pour mettre en œuvre des améliorations"

Amélioration : lors des tests recherchons les défauts et autres points à améliorer, mettons en place des observateurs avec cette mission.

Le PDCA cher à la norme

Enfin, si l'on se conforme à l'ISO 22301, celle-ci produit deux autres obligations salutaires :

les tests sont revus dans le cadre d'une promotion de l'amélioration continue : l'idée est que l'on peut toujours améliorer les choses et qu'il ne faut pas "s'endormir sur ses lauriers"...c'est le PDCA Plan Do Check Act que nous commentons dans d'autres articles.

les tests sont menés à des intervalles planifiés et lorsque des changements significatifs interviennent au sein de l'organisation ou dans l'environnement dans lequel elle opère.

Suivre ces deux règles représente une amélioration effective.

L'ensembles des textes ci-dessus cités en caractères gras constitue le texte de la norme sur les tests chapitre 8.5.

S'y conformer progressivement semble un objectif efficace d'amélioration des tests de PCA en entreprise et donc du PCA lui même.
Emmanuel Besluau
Samedi 5 Janvier 2013

Home Home    Mail Mail    Print Print    Zoom + Zoom +    Zoom - Zoom -    Share Share


Articles du même auteur :

Halte aux PCA bidons ! - 19/01/2014

1 2