50 neglebitende timer

Foto: Atea

IT er vår viktigste infrastruktur. Da det sviktet i over to døgn i forrige uke fikk vi kjenne på vår egen sårbarhet. Og bra er det, hadde jeg nær sagt. For det kunne vært verre. Jeg ba derfor Kjartan Dannatt og Trygve Solli om å fortelle litt om dramaet som utspant seg fra onsdag til fredag, og forklare oss hva som skjedde.

Trygve, kan du fortelle hvordan det begynte da dere fikk første varsel?

Klokken 17:45 på onsdag sviktet en sentral lagringsenhet hos vår samarbeidspartner, Atea. Det er i og for seg ikke en katastrofe, men det spesielle med dette var at den oppsatte sikkerhetsmekanismen, kjent som redundansen, også var skadelidende. Dette medførte at mange av våre tjenester var utilgjengelig for kunder og brukere.

Mest kritisk var det for ark.no som midt i koronatiltakene på Østlandet allerede hadde 50 stengte butikker i tillegg. Men også Smart Vurdering, deler av Rettsdatas tjenester og VPN for alle Gyldendals ansatte ble påvirket av dette.

Vi hadde full intern beredskap sammen med Atea og Pearl onsdag kveld og så på alternative løsninger for å få systemene våre opp så raskt som mulig, samtidig som det ble utfør arbeid med feilretting av det berørte datasenteret.

Det endte med at veien tilbake til normal drift ble lettere med feilretting på datasenteret enn det ville blitt dersom vi hadde implementert alternative løsninger. Våre ressurser på huset ble etter hvert brukt til å kvalitetssikre tjenestene etter hvert som de ble gjenopprettet. Alle sentrale tjenester var oppe igjen fredag kveld, og helgen ble brukt til etterarbeid og opprydding.

Kjartan, kan du si noe om hva vi har lært av denne episoden? Er det noe gyldendøler kunne gjort annerledes?

Denne episoden var ikke knyttet til noe angrep fra utsiden, og vi har heller ingen grunn til å tro at data er tapt eller kompromittert. Sånn sett var det ikke noe den vanlige medarbeideren kunne påvirke.

For oss som jobber med IT og sikkerhet til daglig var dette en stresstest som ga oss en pekepinn om at vi trenger enda mer robuste løsninger i fremtiden. Dette er jo ingen ny tanke, for vi øver på beredskap med jevne mellomrom. Men koronasituasjonen og den økende digitaliseringstakten for våre tjenester gjør at vi må bedre sikre at de kritiske løsningene må være operative ved uforutsette hendelser som denne.

Vi er i ferd med å evaluere hendelsen med våre eksterne partnere i tillegg til at vi evaluerer egen responstid, ressursbruk og løpende kommunikasjon med alle deler av organisasjonen. Jeg vil gjerne takke alle medarbeidere for at beredskapsgruppa fikk ro til å jobbe i disse hektiske dagene.

Da er det min tur å takke dere i beredskapsgruppa og de noen-og-førti ansatte rundt i organisasjonen som arbeidet dag og natt og inn i helgen med å sikre våre digitale tjenester og den verdifulle dataen vi har ansvar for. Jeg opplevde hele tiden at dere med det tekniske ansvaret håndterte dette på en rolig og profesjonell måte som ga tillit. At dere også ga god informasjon underveis skapte trygghet i organisasjonen i en kritisk fase. Imponerende spør du meg.

Da kan vi kollektivt trekke en lettelsens sukk og se fram til enda mer hardføre IT-løsninger i fremtiden.

God helg!

Arne