Ile Maurice: Sites et plateformes de paiement durement touchés

Le mardi 18 novembre, à 15 h 10, le réseau du géant informatique Cloudflare – un service protégeant les sites web contre toutes les formes d’attaques tout en optimisant les performances – a connu une panne majeure. Pour les utilisateurs d’internet tentant d’accéder aux sites web utilisant Cloudflare, cette panne s’est présentée sous la forme d’une page d’erreur indiquant un problème au sein du réseau Cloudflare.

Initialement soupçonnée d’être une cyberattaque (DDoS hyperscalaire), la panne provenait d’une simple erreur de configuration : une modification des permissions dans une base de données a généré un fichier de fonctionnalité deux fois plus gros que la normale. Ce fichier, ensuite diffusé sur l’ensemble du réseau, a dépassé la limite prévue par le logiciel, provoquant sa défaillance et la coupure des services.

Avant 15 h 20, le volume d’erreurs 5xx était normal. Le pic puis les variations qui ont suivi traduisent ainsi les dysfonctionnements liés à ce fichier surdimensionné, entrecoupés de phases de rétablissement pour une erreur interne. Cet aspect inhabituel était dû au fait que le fichier de configuration était régénéré toutes les cinq minutes par une requête exécutée sur un cluster ClickHouse en cours de mise à jour.


Suivez-nous sur WhatsApp | LinkedIn pour les derniers titres

Les erreurs ont persisté jusqu’à l’identification de la cause, vers 18 h 30. La résolution a consisté à stopper la génération et la diffusion du fichier défectueux, puis, à réinjecter manuellement un fichier de configuration valide dans le système de distribution. La longue traîne visible sur le graphique correspond aux derniers redémarrages de services, alors que des services restants commençaient à se dégrader à leur tour. Le nombre d’erreurs 5xx est finalement revenu à son niveau normal à 21 h 06.

En ce qui concerne les mesures de correction et de suivi, Matthew Prince, cofondateur et Chief Executive Officer de Cloudflare, a expliqué que l’entreprise va renforcer ses procédures internes. Il a notamment détaillé quatre axes de travail : «Renforcer le processus d’ingestion des fichiers de configuration générés par Cloudflare, activer davantage de kill switch mondiaux pour les fonctionnalités, éliminer la possibilité que des opérations de vidage de la mémoire ou d’autres rapports d’erreur submergent les ressources système, et examiner les modes de défaillance à la recherche de conditions d’erreur dans tous les modules de proxy principaux.»

Parmi les principaux services touchés par la panne figuraient notamment X (anciennement Twitter), ChatGPT, Spotify, Canva, Uber et Dropbox, ainsi que le site de l’agence de notation Moody’s, entre autres plateformes majeures.

À Maurice, de nombreux sites web, de même que plusieurs plateformes de paiement, sont restés indisponibles pendant une large partie de l’après-midi. Les services touchés comprenaient le CDN et les services de sécurité de base, Turnstile, Workers KV, le tableau de bord Cloudflare, Email Security et Access. Il est à noter qu’il s’agit de la panne la plus grave qu’ait connue Cloudflare depuis 2019. Parallèlement, les systèmes reposant sur la blockchain – à l’instar de Bitcoin ou d’Ethereum – n’ont pas été affectés, relançant le débat sur la résilience qu’offre la décentralisation des services internet.

source

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Scroll to top
Close