Opsio - Cloud and AI Solutions
NOC-drift

Hanterad felsökning och incidenthantering 24/7, NOC som tjänst

Produktionsincidenter respekterar inte kontorstid. 76 procent av allvarliga avbrott startar utanför 9 till 17, och de första 15 minuterna avgör om det blir en kort hicka eller ett flera dagar långt krisrum. Opsios hanterade felsökning och incidenthantering 24/7 driver en NOC bemannad av certifierade ingenjörer som bekräftar P1-incidenter inom 15 minuter, påbörjar åtgärder inom en timme och äger incidenten genom grundorsaksanalys, åtgärd och eftergenomgång.

Över 100 organisationer i 6 länder litar på oss

<15min

P1-bekräftelse

<1h

P1-åtgärd startad

24/7

NOC-täckning

99,95%

MTTR-förbättring

AWS Advanced Tier
Microsoft Azure Expert MSP
Google Cloud Partner
ITIL 4
ISO 20000
ISO 27001

Part of Cloud Solutions

Därför behöver ert företag hanterad felsökning och NOC dygnet runt

När ett produktionssystem fallerar klockan 02 en lördag är skillnaden mellan en fem-minutersstöt och ett fem-timmars avbrott om någon övervakar, om den personen har kompetensen att triagera snabbt och om denne har mandat att agera. De flesta interna IT-team har alla tre mellan 9 och 17 på vardagar. Utanför dessa timmar förändras svaren. 76 procent av allvarliga produktionsincidenter startar nattetid, helger eller helgdagar, precis när intern täckning är som tunnast. Hanterad felsökning fyller det gapet med en NOC som aldrig sover. Opsios NOC som tjänst drivs från ett ISO 27001-certifierat leveranscenter med follow-the-sun-modell över flera tidszoner. Varje larm bekräftas av en mänsklig ingenjör, inte en chattbot, inom minuter. P1-incidenter utlöser ett aktivt krisrum inom 15 minuter med rätt specialister på linjen, AWS, Azure, GCP, nätverk, databas, applikation, beroende på vad som är trasigt. Åtgärder startar inom en timme, med fullständigt ansvar för incidenten till återställning och eftergenomgång.

Triagering struktureras med ITIL-anpassade allvarlighetsnivåer. P1 är affärskritiskt avbrott eller allvarlig försämring, P2 är betydande påverkan med arbetsalternativ, P3 är icke-blockerande problem och P4 omfattar förfrågningar och mindre avvikelser. Varje nivå har ett eget SLA för bekräftelse, åtgärd och lösning. Vi publicerar faktisk prestanda mot dessa SLA månadsvis, med ekonomiska krediter om vi missar våra egna mål.

Utöver ren responshastighet ligger värdet av hanterad felsökning i utredningsdjupet. Vem som helst kan köra en ping-kontroll och eskalera. Våra ingenjörer går längre: logg-korrelation mellan applikation-, infrastruktur- och nätverkslager, paketinsamling och analys där det krävs, kernel-inspektion på Linux- och Windows-värdar, rekonstruktion av AWS CloudTrail och Azure Activity Log samt EDR-telemetri-genomgång när incidenten har en säkerhetsdimension. Målet är inte bara att återställa tjänsten utan att förstå varför den fallerade och förhindra samma fel två gånger.

Vanliga felsökningsutmaningar vi löser: täckningsgap nattetid och helger utan formell jourrotation, larmtrötthet där verkliga incidenter missas i bruset, eskaleringskedjor som tar slut hos juniora ingenjörer utan mandat att agera, grundorsaksanalys som stannar vid första rimliga orsak istället för den verkliga och eftergenomgångar som aldrig leder till uppdaterade runbooks eller härdande åtgärder. Om något av dessa mönster känns igen ersätter NOC som tjänst dem med disciplinerad incidenthantering.

Varje uppdrag omfattar runbook-utveckling för de 20 mest troliga incidentscenarierna, integration med er befintliga observabilitetsstack, Datadog, New Relic, Dynatrace, Grafana, CloudWatch, Azure Monitor, samt kvartalsvis incidenttrend-genomgång med ledningen. Oavsett om ni behöver förstärka ett mindre internt team utanför kontorstid, helt outsourca Tier 1 och Tier 2-drift eller skala en befintlig NOC-förmåga till 24/7-täckning så passar tjänsten in i er driftmodell istället för att ersätta den.

24/7 NOC-övervakningNOC-drift
P1/P2/P3-triagering och allvarlighetsklassningNOC-drift
GrundorsaksanalysNOC-drift
IncidentåtgärdNOC-drift
Eftergenomgång och runbook-uppdateringarNOC-drift
Integration med observabilitetsstackNOC-drift
AWS Advanced TierNOC-drift
Microsoft Azure Expert MSPNOC-drift
Google Cloud PartnerNOC-drift
24/7 NOC-övervakningNOC-drift
P1/P2/P3-triagering och allvarlighetsklassningNOC-drift
GrundorsaksanalysNOC-drift
IncidentåtgärdNOC-drift
Eftergenomgång och runbook-uppdateringarNOC-drift
Integration med observabilitetsstackNOC-drift
AWS Advanced TierNOC-drift
Microsoft Azure Expert MSPNOC-drift
Google Cloud PartnerNOC-drift

Hur Opsio jämförs

FörmågaInternt teamOutsourcad helpdeskOpsio specialist-NOC
24/7-täckningKräver 5+ heltidare✅ Ofta inkluderat✅ Inkluderat
P1-bekräftelse-SLABästa förmåga30-60 minuter< 15 minuter
FlermolnskompetensBeror på personal❌ Vanligen nej✅ AWS, Azure, GCP
GrundorsaksanalysOm kompetens finns❌ Omstart och eskalera✅ Strukturerad fem-varför
Runbook-utvecklingOfta saknas❌ Ingår inte✅ Topp 20 scenarier
EftergenomgångarInkonsekvent❌ Ingår sällan✅ Inom 48 timmar
Typisk årskostnad6-12 MSEK (5+ FTE)0,5-1,8 MSEK0,4-3 MSEK

Leverans av tjänster

24/7 NOC-övervakning

Kontinuerlig övervakning över moln, nätverk, applikation och databas med ingenjörsbemannad täckning varje timme på dygnet. Larm integreras från Datadog, New Relic, Dynatrace, Grafana, CloudWatch, Azure Monitor, PRTG och Nagios. Varje larm granskas av en mänsklig ingenjör före eskalering, vilket eliminerar det falsklarmsbrus som lamslår interna team.

P1/P2/P3-triagering och allvarlighetsklassning

ITIL-anpassade triageringsbeslut inom minuter efter att larmet tagits emot. P1-incidenter utlöser omedelbart krisrum med specialistingenjörer och intressentnotifiering. P2 och P3 följer definierade svars-SLA. Allvarlighetsklassningen är dokumenterad och spårbar, med kvartalsvis kalibrering mot verksamhetspåverkan.

Grundorsaksanalys

Flerlagersutredning över applikationsloggar, infrastrukturmått, nätverkspaketinsamling, molnleverantörens aktivitetsloggar, EDR-telemetri och databasplanering. Ingenjörerna jagar den verkliga grundorsaken istället för första rimliga orsak, med strukturerad fem-varför-analys på varje P1 och P2-incident.

Incidentåtgärd

Direkt åtgärdsmandat inom överenskommet omfång: omstart av tjänster, failover-triggning, skalningsåtgärder, konfigurationsrullbakåt, DNS-ändringar, brandväggsregler och nödpatchningar. Åtgärder utanför omfång eskaleras till namngivna ägare hos er med full kontext bifogad. Varje åtgärd loggas för regelefterlevnad och eftergenomgång.

Eftergenomgång och runbook-uppdateringar

Varje P1 och P2-incident utlöser en skuldfri eftergenomgång inom 48 timmar, med dokumenterad grundorsak, bidragande faktorer, återställningsåtgärder och förebyggande rekommendationer. Runbooks uppdateras omedelbart så att samma fel går snabbare att återställa nästa gång. Kvartalsvis trendanalys identifierar systematiska mönster.

Integration med observabilitetsstack

Vi integrerar med er befintliga observabilitetsinvestering istället för att tvinga byte av verktyg. Stöd för Datadog, New Relic, Dynatrace, Grafana, Splunk, Elastic, CloudWatch, Azure Monitor och Google Cloud Operations Suite. Larmdirigering, deduplicering och berikning konfigureras för er miljö.

Redo att komma igång?

Få er kostnadsfria NOC-analys

Det här får ni

24/7 NOC-övervakning med mänsklig bekräftelse under 15 minuter
P1/P2/P3-triagering anpassad till ITIL-allvarlighetsklassning
Grundorsaksanalys över moln, nätverk, app och databas
Direkt åtgärd inom överenskommet omfång med full ändringslogg
Eftergenomgångar inom 48 timmar efter P1 och P2-incidenter
Runbook-utveckling och kontinuerlig härdning för 20 scenarier
Integration med Datadog, New Relic, Dynatrace, ServiceNow, Slack
Månatliga SLA-prestandarapporter med kreditavstämning
Kvartalsvis incidenttrendsgenomgång med ledning
Revisionsklart incidentunderlag för DORA, NIS2 och patientdata
Opsio är vår partner för IT-drift och cybersäkerhet, en avgörande del av vår verksamhet. Vi rostar 12 miljoner koppar kaffe per dag och har därför höga krav på tillgänglighet och tillförlitlighet för att leverera bästa möjliga kvalitet till våra kunder. Vårt partnerskap med Opsio är centralt för att vi ska lyckas med den funktionen.

Magnus Norman

IT-chef, Löfbergs

Prissättning och investeringsnivåer

Transparent prissättning. Inga dolda avgifter. Offert baserad på omfattning.

Onboarding och runbook-utveckling

100 000–400 000 SEK

Engångskostnad

Mest populär

24/7 NOC-tjänst

30 000–500 000 SEK/mån

Nivåindelad efter miljöstorlek

Forensik vid större incident

30 000–100 000 SEK

Tillval, per uppdrag

Transparent prissättning. Inga dolda avgifter. Offert baserad på omfattning.

Frågor om prissättning? Låt oss diskutera era specifika behov.

Begär offert

Hanterad felsökning och incidenthantering 24/7, NOC som tjänst

Kostnadsfri rådgivning

Få er kostnadsfria NOC-analys