Les pannes survenues dans les datacenters d’OVH l’année dernière, notamment celle des installations P19 de Paris en juin et celle des structures de Strasbourg et Roubaix en novembre, ont laissé des souvenirs amers dans la mémoire des responsables de ces entreprises. Les services ont été interrompus pendant plus de 24 h sur certains sites.

Un mini dégât des eaux et un système de communication défectueux pour Paris

La panne du 29 juin du P19 parisien d’OVH a été causée par deux incidents. Le premier est l’inondation de l’une des baies EMC par un écoulement de liquide de refroidissement depuis le dispositif de « watercooling », une innovation mise en place par ce spécialiste de l’hébergement de baie informatique. Ce système était destiné à rafraîchir des équipements à proximité de cette baie qui, selon les responsables, était au mauvais endroit en raison d’un malheureux concours de circonstances.

Outre le dégât des eaux, un autre événement a aggravé la situation. Le dispositif d’alerte servant à prévenir les responsables en cas de problèmes de ce type a été mis à jour. Or, l’opération a provoqué un bug. 11 minutes se sont écoulées avant que les techniciens n’arrivent sur les lieux. Conséquence : les quelque 50 000 sites connectés sur P19 ont subi une interruption des services qui a dépassé 24 h pour certains.

Les pertes, les travaux de réfection et les « indemnisations » des clients auront coûté plusieurs millions d’euros à OVH. Les mesures prises pour prévenir d’autres catastrophes n’ont toutefois pas suffi à éviter celle de novembre.

Panne de courant pour Strasbourg, panne de réseau optique pour Roubaix et POP down dans toute l’Europe

Le 09 novembre 2017 a été un jour funeste pour OVH. Sur Strasbourg, les 2 arrivées de courant d’EDF qui alimentaient les centres d’hébergement strasbourgeois SBG1 et SBG4 ont lâché. Manque de chance, les 2 chaînes de groupe électrogène censées prendre le relais ont également refusé de démarrer. Le souci d’électricité a toutefois été assez rapidement résolu.

Le même jour, à quelques heures de la catastrophe électrique, le réseau optique d’OVH effectuant l’interconnexion entre Roubaix et Gravelines avec les POP est lui aussi tombé en panne. Résultat : tous les liens optiques 100 Gb qui relient Roubaix à Londres, Bruxelles, Francfort, Amsterdam ainsi qu’aux sites Telehouse 2 et GlobalSwitch de la région parisienne sont restés muets et aveugles.

Quoi qu’il en soit, tout au long de cette sinistre journée, Octave Klaba s’est efforcé de tenir les utilisateurs et les clients d’OVH au courant de l’évolution de la situation par des tweets, un moyen comme un autre de rassurer ces derniers.