Den stora it-jätten AWS, som ägs av Amazon, har avslöjat vad som orsakade den omfattande driftstörningen som slog ut allt från banktjänster till uppkopplade sängar.
En enda detalj slog ut jättens tjänster – miljontals drabbades


Mest läst i kategorin
Ett litet fel fick enorma konsekvenser.
Bugg i mjukvaran slog ut stora delar av internet
En bugg i ett automatiseringsprogram var den bakomliggande orsaken till den flera timmar långa driftstörningen hos Amazon Web Services (AWS) som fick omfattande globala konsekvenser, skriver The Guardian.
Felen ledde till att tusentals webbplatser och applikationer som använder AWS tjänster slogs ut.
Enligt en lång redogörelse från AWS berodde händelseförloppet på ett flertal samverkande faktorer.
Kärnproblemet var en ”latent defekt inom tjänstens automatiserade DNS-hanteringssystem” som gjorde att kunder inte kunde ansluta till DynamoDB, AWS databassystem där kunddata lagras.
DynamoDB hanterar hundratusentals DNS-poster och använder automatisering för att övervaka systemet.
Syftet är att säkerställa att poster uppdateras frekvent, att extra kapacitet läggs till vid behov, att maskinvarufel hanteras och att trafik distribueras effektivt.
Källor: Uppemot 30 000 får gå från Amazon
Den amerikanska e-handelsbjässen Amazon ska minska arbetsstyrkan med uppemot 30 000 personer, rapporterar nyhetsbyrån Reuters.
Felet: En tom DNS-post
Den direkta orsaken till problemet var en tom DNS-post för datacentret US-East-1 i Virginia, USA, skriver Ars Technica. Buggen misslyckades med att reparera sig själv automatiskt, vilket krävde manuell operatörsintervention.
I detalj handlade det om en ”race condition” – ett fel där ett system blir beroende av en specifik timing eller sekvens av händelser som är utom utvecklarnas kontroll.
Felet uppstod när två komponenter i DynamoDB:s DNS-hanteringssystem, DNS Planner och DNS Enactor, arbetade samtidigt.
När den ena Enactor-komponenten, som hade blivit kraftigt försenad, tillämpade en gammal plan, skrev den över en nyare plan. Samtidigt raderade en annan process, som rensade gamla planer, den just tillämpade gamla planen.
Denna radering av den aktiva planen ledde till att alla ip-adresser för den regionala slutpunkten omedelbart togs bort. Systemet lämnades i ett inkonsekvent tillstånd som hindrade framtida uppdateringar.
Robotarna tar över jobb från Amazons anställda
Att hantera tunga paket håller på att bli ett robotgöra. Snart är det fler robotar än människor på Amazons lager.
Ekonomiska konsekvenser och lärdomar
Felet varade i cirka 15 timmar och 32 minuter, och enligt nätverksunderrättelseföretaget Ookla mottog deras tjänst DownDetector över 17 miljoner rapporter om störda tjänster från 3 500 organisationer globalt.
De tre länder med flest rapporter var USA, Storbritannien och Tyskland. Tjänster som Snapchat, Roblox, Signal, Duolingo, banktjänster och Ring påverkades.
För privatpersoner märktes det tydligt; till exempel kunde kunder till företaget Eight Sleep, som tillverkar smarta sängar, inte justera sängen eller temperaturen via sin app eftersom sängen inte kunde ansluta till internet.

Företagets vd, Matteo Franceschetti, bad om ursäkt till kunderna och rullade ut en uppdatering som tillät användare att styra sängens kritiska funktioner via Bluetooth vid framtida avbrott.
En föreläsare i databehandling och informationssystem vid University of Melbourne, Dr Suelette Dreyfus, menar att avbrotten visar hur beroende världen har blivit av enstaka felkällor på internet.
”Det är inte bara AWS – de är den största molnleverantören med omkring 30 procent av marknaden – utan molnet som helhet, vilket i princip bara är tre företag”, sade hon.
Hon menar att internet ursprungligen var utformat för att vara motståndskraftigt, men att den motståndskraften delvis har förlorats genom beroendet av en handfull teknikjättar.
Ookla lyfte fram att US-East-1 är AWS äldsta och mest använda nav. Regional koncentration innebär att även globala appar ofta förankrar viktig data där. När ett regionalt beroende faller sprids effekterna över hela världen eftersom många ”globala” system vid något tillfälle dirigerar trafik via Virginia.
Som en omedelbar åtgärd har Amazon stängt av automatiseringssystemen för DynamoDB DNS Planner och DNS Enactor globalt medan de arbetar med att åtgärda felet och lägga till skyddsåtgärder. Tekniker arbetar även med ändringar i andra tjänster för att förbättra stabiliteten.
Miljontals kronor försvinner – det nya fusket med AI-kvitton
AI har öppnat dörren för en ny typ av ekonomiskt fusk där anställda använder bildgeneratorer för att snabbt skapa bluffkvitton.
Missa inte:
Han vill införa tiggeriförbud – för miljardärer. News 55
Tung profil lämnar X efter bara tio månader. Dagens PS
Fyndade bil till vrakpris – nu kan köparen bli rik. E55

Åsa Wallenrud är en driven och erfaren motorjournalist med en stark passion för bilvärlden och teknik, gärna i kombination. Arbetat med varumärken som TV4 Nyhetsmorgon, Facit, M3, Lilla Gumman, Hem och Villamässor, Blocket, Byt Bil mfl. Har du en bra historia? Maila mig [email protected]

Åsa Wallenrud är en driven och erfaren motorjournalist med en stark passion för bilvärlden och teknik, gärna i kombination. Arbetat med varumärken som TV4 Nyhetsmorgon, Facit, M3, Lilla Gumman, Hem och Villamässor, Blocket, Byt Bil mfl. Har du en bra historia? Maila mig [email protected]










