Duquesne Group Duquesne Group

English version
Blog des experts

Les avis et les commentaires exprimés dans les blogs sont ceux des experts individuels. Ils ne représentent pas nécessairement l'opinion du cabinet. Contactez-nous pour en savoir +
French version
Blogs

In these blogs, individual experts freely express their own opinions and comments. They do not necessarily reflect the opinion of the firm. Contact us to find out more


Faut-il payer plus cher pour avoir un bon PCA ?


Il est couramment admis que si l'on veut résister aux sinistres, il faut en payer le prix.
Bien des responsables informatiques font des choix de systèmes haut de gamme pour leurs équipements informatiques. Ils alignent les systèmes résilients et les Euros...
Est-ce vraiment la seule solution ?



Faut-il payer plus cher pour avoir un bon PCA ?

Résilience intrinsèque ou reprise planifiée ?

L'activité de l'entreprise repose sur des hommes compétents et des moyens techniques efficaces.

Focalisons-nous sur les moyens techniques ; de deux choses l'une en cas de sinistre :
  • Soit les moyens résistent au sinistre, car ils sont doublés, quadruplés et mis à l'abri du redoutable SPOF (point unique de défaillance), on parle alors de résilience des moyens.
  • Soit ils sont détruits par le sinistre et leur remplacement est prévu hors zone sinistrée : c'est la reprise planifiée.

Ces deux alternatives constituent le dilemne du décideur : acheter résilient ? ou prévoir une organisation de la reprise ?

On peut aussi compliquer le raisonnement en remarquant que certains sinistres s'ils sont très étendus vont venir à bout du système le plus résilient : un cluster sur deux sites proches sera victime de la même inondation si les deux sites sont au même niveau...

Il faut choisir

Une alternative se présente, étudions-en les termes :

L'approche résiliente : elle consiste en informatique à prévoir des serveurs à tolérance de panne, à mettre des systèmes en cluster, à dupliquer des données, à faire des copies miroirs synchrones, bref à déployer une technologie complexe et sophistiquée pour faire en sorte que le sinistre épargne une partie suffisante des moyens.

L'approche reprise : l'accent est mis sur le plan de reprise. Il s'agit de prévoir un déroulement coordonné de tâches permettant de reconstruire des moyens suffisants en un temps acceptable après la perte des moyens normaux.

Si l'on caractérise ces approches on peut dire que la résilience :
  • est coûteuse à l'achat
  • est coûteuse en maintenance
  • exige des compétences techniques
en revanche, elle permet des redémarrages très rapides.

La reprise quant à elle :
  • exige une organisation et planification sans faille
  • est économe à l'achat et en maintenance
  • nécessite le recours à des services externes
en revanche elle ne convient pas aux exigences de délai les plus fortes.

Le décideur a donc deux orientations possibles -et non exclusives- investir dans des systèmes coûteux d'un côté ou planifier une reprise en intégrant des services de reprise d'un autre côté.

Il faut "doser"

L'approche résiliente coûte cher mais est très efficace pour un bon nombre de sinistres. Elle permet des temps de remise en marche très rapides. On la réserve donc aux applications qui en valent le coup.

L'approche reprise est moins onéreuse, plus lente mais elle sait s'accomoder de bien des sinistres et permet de faire face à presque tout avec efficacité.

Il faut donc choisir les deux approches avec le bon dosage.

Il est clair que certaines applications dicteront un choix de machines résilientes mais que pour faire face à tout sinistre, il n'y a rien de mieux que l'approche reprise.

Il existe toutefois des erreurs à ne pas faire...et des pièges à éviter.

Le piège du maillon faible

En continuité d'activité, si une activité repose sur une chaîne d'éléments techniques, c'est le maillon le plus faible qui dictera son manque de fiabilité à l'ensemble.

Il est assez fréquent de voir des architectures techniques bien conçues à l'origine et fiables devenir beaucoup plus fragiles avec l'ajout de serveurs complémentaires qui ne sont pas de bon niveau.

Les architectures n-tiers donnent souvent de tels exemples : le serveurs de données est un cluster de continuité (genre HACMP) convenable, mais il est doublé de serveurs d'application simple de type x-86 sans bascule.

Dans telle autre architecture, des serveurs très fiables (genre mainframe) doivent échanger des fichiers vitaux via une plate-forme d'échange fort peu solide...

Dans cette situation de maillon faible, la solution peut consister à baisser la résilience des maillons forts et à prévoir un plan de reprise. On économisera probablement de l'argent. Elle peut aussi être de hausser la résilience du faible au niveau de celle du fort. On généralise la logique à tous, au risque d'en oublier.
:

Le piège "ceinture et bretelles sans pantalon"

Autre situation classique : un système central est doté de tous les moyens -coûteux- de résilience. Ce système était autrefois le seul dans l'entreprise et sa disponibilité devait être élevée.

Depuis dix ans, les applicatifs importants de l'entreprise ont évolué et résident sur des systèmes plus fragiles qui ne sont pas l'objet de l'attention que mériteraient les applications qu'ils hébergent.

Le mainframe bénéficie de "ceinture et bretelle" alors que les applicatifs sensibles l'ont subrepticement quitté. Le Plan de reprise, lui, est testé chaque année et ne correspond plus du tout à la réalité de l'exploitation.

La nécessité de surveiller le dispositif de continuité

Les anecdotes et remarques qui précèdent attirent des commentaires :

Il faut connaître les applications qui sont critiques et gérer cette connaissance dans la durée.

Il faut envisager toute la chaîne de production avec une vision industrielle de service pour affecter là où il le faut la bonne approche résilience ou facilité de reprise.

Enfin, il faut savoir réellement ce qui est nécessaire : faut-il un retour à la normale en zéro seconde ? si oui, il va falloir investir et éviter le maillon faible !

Est-ce qu'une reprise en trois heures est acceptable ? Si oui, quelle économie ! Mais dimensionnons bien tout pour cela.

Trier les exigences pour adapter les moyens, gérer cela sur le long terme, c'est la sagesse de l'économie de la continuité d'activité.
Emmanuel Besluau
Lundi 13 Septembre 2010

Home Home    Mail Mail    Print Print    Zoom + Zoom +    Zoom - Zoom -    Share Share


Articles du même auteur :

Halte aux PCA bidons ! - 19/01/2014

1 2