Eine Störung traf rund 2.000 Unternehmen. Über acht Millionen Menschen meldeten laut Berichten technische Probleme und Ausfälle.
In einer ausführlichen Darstellung auf der eigenen Website schreibt Amazon Web Services (AWS), ein Fehler in der Automatisierungssoftware habe eine Kettenreaktion ausgelöst. Der Cloud-Dienst fiel diese Woche aus: Online-Banking, eine Regierungswebsite, soziale Medien und Essenslieferdienste waren stundenlang lahmgelegt.
Ursache war, dass Kundinnen und Kunden (darunter auch Unternehmen wie Signal) keine Verbindung zu DynamoDB herstellen konnten, dem System zur Speicherung von Kundendaten.
Nach Angaben von AWS lag „ein verborgener Defekt im automatisierten DNS-Management des Dienstes“ vor.
DNS ist so etwas wie das Telefonbuch des Internets. Es übersetzt Webseitennamen wie www.amazon.com in maschinenlesbare IP-Adressen, damit Computer sich im Netzwerk finden.
Doch das automatisierte DNS-System von AWS löschte die DNS-Einträge für den regionalen Endpunkt. Dadurch kam keine Verbindung zu DynamoDB und anderen Diensten zustande.
Der Fehler behob sich nicht automatisch. Techniker mussten eingreifen.
Betroffen waren viele zentrale AWS-Dienste in der Region Nord-Virginia, wo Amazon einen Hauptsitz hat. Zwar beseitigte AWS die Störung binnen weniger Stunden. Die Gesamtauswirkungen auf Websites und Apps dauerten jedoch 14,5 Stunden. Mehr als acht Millionen Menschen meldeten Probleme.
Zu den betroffenen AWS-Kunden zählten Signal, Roblox, Snapchat sowie die Website der britischen Steuer- und Abgabenbehörde. Laut Downdetector, einem Dienst, der Internetausfälle beobachtet, waren etwa 2.000 Websites betroffen.
Der Vorfall rückte Europas große Abhängigkeit von einem einzigen Cloud-Anbieter in den Fokus und auch Europas eigene Cloud-Ambitionen.