Le géant de l’e-commerce héberge plus de 50 millions de sites internet sur ses serveurs. Quand une panne survient, la plupart des plates-formes en ligne sont inaccessibles. Explications. La gigantesque panne de ce lundi 20 octobre nous rappelle à quel point les services en ligne peuvent être affectés par une panne qui ne touche qu’une seule plate-forme. Car beaucoup l’oublient, Amazon n’est pas que la plate-forme d’e-commerce la plus populaire en Occident, c’est aussi et avant tout l’une des plus gros géants du web. Mine de rien, les Amazon Web Services héberge plus de 50 millions de sites internet – soit moins de 6% du web, mais plus de 53% des 10 000 sites / services les plus populaires de la planète. On estime que cela représente entre 30 à 40% du trafic internet mondial. Parmi les gros clients d’Amazon, on citera des services comme PlayStation, Disney+, Amazon Prime Video, Netflix, mais également Snapchat et des jeux très populaires comme Fortnite ou Roblox. Principal atout de la plate-forme : une évolutivité des ressources allouées qui séduit les plates-formes. Pas besoin d’infrastructures disproportionnées pour gérer les pics d’utilisation pour une plate-forme de streaming un vendredi soir ou une plate-forme d’e-commerce un jour de soldes, Amazon ajuste automatiquement les serveurs à la demande. L’entreprise propose également plus de 200 services à la demande avec un modèle où le client paye à l’usage. C’est ce qui lui a permis de dominer le marché du cloud depuis 2006. Alors forcément, le jour où il y a une panne, c’est tout le web qui chavire. Une erreur sur les DNS des serveurs peut rendre inaccessibles la majorité des services et plates-formes les plus utilisées, parfois pendant plusieurs heures. Les pannes de ce type sont heureusement peu nombreuses. L’infrastructure d’Amazon est assez robuste, l’entreprise disposant de centre de données répartis partout sur la planète pour garantir la continuité de ses services. Le plus souvent, une panne survient localement, suite à une défaillance matérielle – un serveur qui saute, un problème d’alimentation. L’accès aux services peut alors être affecté localement, dans un pays ou une région seulement. Les gros soucis, comme ceux de ce matin, sont généralement liés à des erreurs de protocoles DNS, qui peuvent interrompre totalement les services – on parle alors d’une panne mondiale. C’est assez rare. En 2017, une erreur humaine avait ainsi causé une panne globale de plusieurs heures, lors d’une mise à jour des serveurs.