Logo - Les Affaires
Logo - Les Affaires

Facebook: une erreur dans une tâche de routine a causé la panne

auteur-576|Publié le 06 octobre 2021

Facebook: une erreur dans une tâche de routine a causé la panne

Les systèmes de Facebook sont conçus pour détecter de telles erreurs, mais dans ce cas, un bogue dans l’outil d’audit l’a empêché d’arrêter correctement la commande. (Photo: La Presse Canadienne)

Londres — La panne mondiale qui a mis Facebook et ses autres plateformes hors ligne pendant des heures plus tôt cette semaine a été causée par une erreur lors de la maintenance de routine, a déclaré la société.

Santosh Janardhan, vice-président de l’infrastructure de Facebook, a déclaré dans un article de blogue que la panne de Facebook, Instagram et WhatsApp n’a pas été «causée par une activité malveillante, mais par une erreur de notre part».

Le problème est survenu alors que les ingénieurs effectuaient de la maintenance quotidienne sur le réseau fédérateur de Facebook: les ordinateurs, les routeurs et les logiciels de ses centres de données à travers le monde ainsi que les câbles à fibres optiques qui les relient.

«Au cours de l’une de ces tâches de maintenance de routine, une commande a été émise dans le but d’évaluer la disponibilité de la capacité mondiale, ce qui a involontairement interrompu toutes les connexions de notre réseau fédérateur, déconnectant efficacement les centres de données de Facebook dans le monde», a déclaré M. Janardhan mardi.

Les systèmes de Facebook sont conçus pour détecter de telles erreurs, mais dans ce cas, un bogue dans l’outil d’audit l’a empêché d’arrêter correctement la commande, a expliqué M. Janardhan.

Ce changement a également déclenché un deuxième problème qui a aggravé les choses en rendant impossible l’accès aux serveurs de Facebook, même s’ils étaient opérationnels.

Les ingénieurs se sont empressés de résoudre le problème sur place, mais cela a pris du temps en raison des couches de sécurité supplémentaires, a précisé M. Janardhan. Les centres de données sont «difficiles d’accès, et une fois à l’intérieur, le matériel et les routeurs sont conçus pour être difficiles à modifier même lorsque vous y avez un accès physique».

Une fois la connectivité rétablie, les services ont repris progressivement pour éviter les pics de trafic qui auraient pu provoquer d’autres pannes.