Analytisk epidemiologiske undersøkelser: Planlegging, gjennomføring og analyse

Sist endret 17.12.2018

Referanser til kapittel 3-13, og til avsnitt innen disse kapitlene, henviser til metodekapitlene i den nettbaserte Utbruddshåndboka, Veileder i oppklaring av sykdomsutbrudd som skyldes smitte fra næringsmidler eller dyr. Ved referanser internt i dette dokumentet er det brukt egen nummerering.

Hovedpunkter

Analytisk epidemiologi brukes for å teste hypoteser om smittekilden ved hjelp av intervju med friske og syke personer i utbruddspopulasjonen.
Dette kapittelet beskriver i detalj metodene for planlegging, gjennomføring, statistisk analyse og tolkning av retrospektive kohortundersøkelser og kasus-kontroll-undersøkelser.
Kohortundersøkelser er velegnet ved lokale utbrudd som rammer en liten, lukket populasjon.
Kasus-kontrollundersøkelser brukes ved større utbrudd i en åpen populasjon, og blir som regel utført av nasjonale myndigheter.

A Utarbeiding av spørreskjemaet og gjennomføring av intervjuene

Utarbeiding av spørreskjemaet og gjennomføring av intervjuene utføres hovedsakelig etter de samme prinsippene som beskrevet for hypotesedannende pilotintervju i en egen bakgrunnsartikkel. Der diskuteres også fordeler og ulemper ved personlig intervju, postlagt spørreskjema og nettbaserte systemer:

Pilotintervjuet: Gjennomføring og tolkning

Det er likevel en rekke viktige egenskaper ved analytisk epidemiologiske undersøkelser som skiller dem fra pilotintervjuer:

Spørreskjemaet bygger på noen få, spesifikke hypoteser om smittekilden.
Spørreskjemaet må tilpasses hvert enkelt utbrudd og er mest mulig kortfattet. Det kan ikke brukes et standardskjema, slik det er vanlig ved pilotintervjuene.
Intervjueren må følge spørreskjemaet nøye, dersom intervjuet foretas ansikt til ansikt eller over telefon.
Alle intervjupersonene skal behandles likt. Det er ikke tillatt med individuell tilpasning.
Det er ikke tillatt med improvisasjon under intervjuet.
Intervjueren må ikke avsløre hypotesene (avsnitt E.3 nedenfor).
Intervjueren må ikke muntlig eller med kroppsspråk oppmuntre eller belønne positive svar fra pasientene om antatte risikofaktorer (avsnitt E.3 nedenfor).
Intervjueren må ikke oppmuntre eller belønne negative svar fra kontrollpersonene om antatte risikofaktorer.
Hvis pasienter og kontroller er matchet (avsnitt C.3 nedenfor), er det en fordel at hver enkelt pasient og dennes matchete kontroller blir intervjuet av samme person.
Det er sjelden aktuelt med prøvetaking hjemme hos pasientene, slik at fordelene ved å intervjue i hjemmet blir mindre enn ved pilotintervjuer.

B Retrospektive kohortundersøkelser

Ved utbrudd som rammer en begrenset, ”lukket” populasjon (f. eks. et selskap, et hotell, en barnehage eller en sykehusavdeling – en kohort), vil det ofte være mulig og ønskelig å intervjue alle personer som var til stede, både syke og friske (figur 10.3, avsnitt 10.2). I slike situasjoner kan man ofte få tilgang til lister over alle måltider og matvarer som er servert for populasjonen (menyer). I så fall intervjues personene med utgangspunkt i denne listen. I noen utbrudd kan det være aktuelt å intervjue et tilfeldig utvalg av populasjonen, fordi det ikke lar seg gjøre å intervjue alle. Kohortundersøkelse kan likevel gjennomføres, men færre intervju vil gi redusert statistisk styrke.

Det er laget en mal for spørreskjema som kan brukes ved kohortundersøkelser. Skjemaet er tilgjengelig i Word-format, slik at det kan lastes ned og tilpasses det aktuelle utbruddet:

I en retrospektiv kohortundersøkelse intervjues hele utbruddspopulasjonen eller et representativt utvalg av den (figur 10.3, avsnitt 10.2):

Man vet ikke a priori hvem som er kasus og hvem som ikke er det, og har dermed ingen kontroll over hvor mange kasus som blir rekruttert. Spørsmål om symptomer er inkludert i spørreskjemaet, og det er først etter at skjemaet er besvart at man, ved hjelp av kasusdefinisjonen, kan avgjøre hvem som er kasus.
Ved å kartlegge symptomer hos hver deltager (type, debut, varighet) som ledd i intervjuene, kan ulike kasusdefinisjoner (mulige, sannsynlige og verifiserte kasus) brukes under analysen (kapittel 6). Kasusdefinisjonen kan revideres og analysen kan gjentas i løpet av undersøkelsen, etter hvert som flere kasus blir verifisert.
Hvis det er tvil om en person er et kasus (for eksempel personer med uspesifikke symptomer), må vedkommende ekskluderes fra den endelige analysen.
Hvis populasjonen er liten, bør om mulig alle intervjues. Dermed unngår man utvalgsfeil (avsnitt E.3 nedenfor).
Hvis populasjonen er stor, kan et utvalg intervjues. Utvalgsfeil kan forebygges ved å velge deltagere tilfeldig fra populasjonen. Systematiske feil kan likevel oppstå, blant annet ved at personer som har vært eksponert for den antatte smittekilden, er mer villige til å delta, for eksempel fordi en mistenkt smittekilde er omtalt i massemediene (avsnitt E.3 nedenfor).
Hvis et utvalg av populasjonen intervjues, kan man risikere at antall kasus som blir rekruttert, er for lavt til å gi tilstrekkelig statistisk styrke i analysen.
Kohortundersøkelser kan være ressurskrevende når populasjonen er stor.
En fordel med kohortundersøkelser er at man kan beregne antall syke i populasjonen og dermed angrepsrater (”attack rate”), fordi hele utbruddspopulasjonen (eller et utvalg) intervjues. Ved å sammenligne angrepsrater for hver enkelt eksponering, kan relativ risiko beregnes. Relativ risiko er et mer nøyaktig mål for økt risiko enn odds ratio (avsnitt E nedenfor).

C Kasus-kontroll-undersøkelser

Ved utbrudd i en stor, ”åpen” populasjon (f. eks. hele kommunen eller hele landet) må man begrense intervjuene til et utvalg kasus og kontrollpersoner fra utbruddspopulasjonen, fordi det er praktisk umulig å intervjue alle (figur 10.4, avsnitt 10.2). Hvis man som alternativ velger å gjennomføre en retrospektiv kohortundersøkelse basert på et tilfeldig utvalg av populasjonen (avsnitt B, foran), vil antallet kasus som regel bli for lavt til å oppnå tilstrekkelig statistisk styrke, unntatt i utbrudd der anslagsraten er svært høy.

I en kasus-kontroll-undersøkelse intervjues utvalgte kasus og kontroller (figur 10.4, avsnitt 10.2):

Undersøkelsen krever en på forhånd gjennomtenkt strategi for å definere og velge ut kasus og kontroller. Man må formulere en fastlagt kasusdefinisjon og deretter bestemme hvordan intervjuobjektene skal velges. Denne kasusdefinisjonen behøver ikke være identisk med den man benyttet for å beskrive utbruddet (kapittel 6). Man kan for eksempel begrense undersøkelsen til voksne personer, eller til pasienter som er registrert de siste ukene (avsnitt C.1, nedenfor). Kontrollene må uansett velges fra samme populasjon som pasientene. Denne populasjonen kalles kildepopulasjonen.
Undersøkelsen er sårbar for utvalgsfeil (avsnitt E.3 nedenfor).
Man vet a priori hvem som er kasus og hvem som er kontrollpersoner, og har dermed full oversikt over hvor mange kasus som blir rekruttert.
Hvis det er tvil om en person er et kasus (for eksempel personer med uspesifikke symptomer), må vedkommende ekskluderes fra undersøkelsen.
Antall studieobjekter kan begrenses til et antall som er tilstrekkelig for å sikre nødvendig statistisk styrke. Ved utbrudd i en åpen populasjon er derfor kasus-kontroll-undersøkelser som regel mindre resurskrevende enn kohortundersøkelser.
En ulempe ved kasus-kontroll-undersøkelser er at man ikke kan beregne antall syke i utbruddspopulasjonen og dermed heller ikke angrepsrater for hver eksponering. Relativ risiko må derfor estimeres ved hjelp av odds ratio, som sammenligner andelen eksponerte blant henholdsvis kasus og kontrollpersoner (avsnitt E, nedenfor). For sjeldne sykdommer (der mindre enn 5 prosent av populasjonen er affisert) er odds ratio et godt estimat for relativ risiko, hvilket er tilfelle i de fleste utbrudd der kasus-kontroll-undersøkelser er aktuelle. Uansett er hovedformålet å avsløre smittekilden i utbruddet, ikke å oppnå et mest mulig korrekt estimat for risiko.

C.1 Valg av pasienter og kontroller i kasus-kontroll-undersøkelser

I kasus-kontroll-undersøkelser velges pasienter og kontrollpersoner etter følgende grunnleggende regler:

Alle pasienter som oppfyller kasusdefinisjonen, skal ideelt sett ha samme sjanse til å delta i undersøkelsen.

Hensikten med denne regelen er blant annet å redusere sjansen for at eksponering for aktuelle smittekilder påvirker muligheten til å bli inkludert i undersøkelsen. Regelen kan best ivaretas ved at samtlige pasienter intervjues. Hvis dette ikke er mulig, bør man trekke et tilfeldig utvalg eller systematisk utvalg (for eksempel hver femte pasient).

De fleste utbrudd er små. I praksis må man derfor ofte bruke de personene man kan få tak i. Ved utbrudd som har pågått i flere uker, kan det være nødvendig å begrense intervjuene til pasienter som nylig har vært syke, fordi disse husker best hva som ble spist og hva de har gjort. Man lager i så fall en mer begrenset kasusdefinisjon som gjelder bare for kasus-kontroll-undersøkelsen (se foran).

Oppsporing av pasienter er omtalt i avsnitt 8.5. (I retrospektive kohortundersøkelser ivaretas prinsippet om ”samme sjanse til deltagelse” ved å intervjue hele utbruddspopulasjonen eller et tilfeldig utvalg av den, som beskrevet i avsnitt B, foran).

Pasientene skal ha den sykdommen som studeres

Dette høres selvfølgelig ut, men kan likevel være et problem. For eksempel, i et utbrudd av salmonellose i en populasjon der det samtidig opptrer mye diarésykdom av andre årsaker, kan det være nødvendig å ekskludere fra undersøkelsen alle pasienter som ikke har en laboratorieverifisert diagnose. Dersom man tar sjansen på å inkludere mulige eller sannsynlige tilfeller som ikke er verifisert, vil dette øke den statistiske styrken, men samtidig vil gyldigheten (validiteten) av resultatene kunne reduseres. I verste fall kan en reell sammenheng bli oversett. (En grundig diskusjon av kasusdefinisjoner finnes i kapittel 6).

I praksis må man imidlertid også her ofte fravike de ideelle kravene, fordi det i mange utbrudd bare er et begrenset antall verifiserte kasus til rådighet, og fordi nødvendigheten av å handle raskt medfører at man ikke har tid til å vente på at ytterligere kasus blir verifisert. Følgende fremgangsmåte kan brukes: 1) Foreta intervjuene så snart som mulig før personene glemmer viktig informasjon, selv om diagnosen foreløpig ikke er verifisert, 2) inkluder sannsynlige kasus i den primære analysen, 3) ekskluder sekundært personer som ikke tilfredsstiller kasusdefinisjonen, 4) gjenta analysen med verifiserte kasus.

Kontrollpersonene skal ikke ha den sykdommen som studeres

I praksis kan dette ofte oppnås ved å ekskludere alle personer som har eller nylig har hatt samme type symptomer som pasientene, men som ikke tilfredsstiller kasusdefinisjonen. Kontrollene må derfor i likhet med pasientene svare på spørsmål om de har hatt symptomer forenlig med den aktuelle sykdommen.

Formålet er å øke den statistiske styrken ved å sammenlikne pasientene bare med personer som ikke er smittet. (Ved noen utbrudd har man ikke tid eller mulighet til å fastslå om kontrollpersoner også er smittet, for eksempel fordi dette krever en laboratorieundersøkelse, som ved hepatitt A. Da kan man likevel velge kontrollpersoner tilfeldig fra utbruddspopulasjonen, men det kan være nødvendig å velge noen flere kontroller for å oppnå samme statistiske styrke. Ellers er gjennomføringen og analysen den samme).

Kontrollpersonene skal være representative for kildepopulasjonen

Kontrollpersonene skal representere bakgrunnsnivået av eksponering i den samme populasjonen som pasientene kommer fra, og dermed være et grunnlag for sammenligning med pasientene. Dette medfører at kontrollpersonene må velges fra den populasjonen der utbruddet foregår (utbruddspopulasjonen, avsnitt 8.2); de må ha vært til stede der det skjedde. Personer som ikke tilhører denne populasjonen, har ikke hatt mulighet til å bli eksponert for smittekilden. Dersom disse inkluderes som kontroller, vil det føre til at risikofaktorer overestimeres.

Hvis pasientene er valgt fra en kildepopulasjon som utgjør en undergruppe av utbruddspopulasjonen, må også kontrollene velges fra den samme kildepopulasjonen. For å sikre at kontrollene er representative, bør de velges tilfeldig, slik at alle har like stor sjanse for å bli inkludert. Metoder for valg av kontroller er omtalt i avsnitt C.2 nedenfor.

Grunnleggende regler i kasuskontrollundersøkelser:

Alle pasienter som oppfyller kasusdefinisjonen, skal ha samme mulighet til å bli inkludert
Pasientene skal ha den sykdommen som studeres
Kontrollpersonene skal ikke ha denne sykdommen
Kontrollpersonene skal være representative for kildepopulasjonen

C.2 Metoder for valg av kontrollpersoner i kasus-kontroll-undersøkelser

Tilfeldig fra Folkeregisteret: Ved utbrudd som rammer en stor populasjon, er den beste løsningen å velge kontrollpersonene tilfeldig fra utbruddspopulasjonen ved hjelp av Folkeregisteret. Dette sikrer at alle potensielle kontroller har samme sjanse til å bli valgt (se foran). Dermed forebygges utvalgsfeil. Folkeregisteret finnes på Folkehelseinstituttet, i kommuneadministrasjonen og på sykehuset i kommunen. Hvis et slikt register ikke er tilgjengelig, kan én av følgende prosedyrer anvendes:
Tilfeldig fra den nettbaserte telefonkatalogen: Velg kontroller fra telefonkatalogen på nettet, for eksempel ved hjelp av søkerutinene på www.1881.no. Pass på at bare medlemmer av utbruddspopulasjonen velges.
Tilfeldig fra pasientens nabolag: Velg kontroller ved å gå fra dør til dør i nabolaget til hver pasient, for eksempel slik: For annenhver pasient, gå enten oppover eller nedover gaten et antall husnummer bestemt på forhånd og spør etter aktuelle kontroller der. I blokkbebyggelse kan etasjer og nummer på leilighetene brukes.
Fra samme legepraksis: Be legen til hver enkelt pasient nominere potensielle kontrollpersoner fra sin praksis, blant personer med andre symptomer enn pasientene i utbruddet.
Blant pasientens venner: Be pasienten nominere kontroller blant sine bekjente. Selv om denne metoden er enkel å gjennomføre, kan den redusere muligheten til å påvise risikofaktorer, fordi det er mer sannsynlig at venner har vært eksponert for de samme faktorene enn personer valgt tilfeldig fra hele populasjonen.

Gjenta prosedyren inntil det nødvendige antall kontroller er funnet, uansett hvilken av metodene ovenfor som brukes.

C.3 Matching av pasienter og kontroller

I en del kasus-kontroll-undersøkelser velger man med hensikt kontrollene slik at de er lik pasientene med hensyn på én eller flere egenskaper. Dette kalles ”matching”. Aktuelle variabler for matching er aldersgruppe, kjønn og bosted. For eksempel kan man for hver pasient velge to eller flere kontrollpersoner med samme kjønn, fra samme aldersgruppe og bosatt i samme kommune som pasienten, eller i en nabokommune.

Hensikten med matching er primært å unngå en skjev fordeling mellom pasienter og kontroller med hensyn til variablene nevnt ovenfor, og dermed sikre en balansert sammenligning. Dette er spesielt aktuelt dersom antall kasus og kontroller er lavt. Matching kan også være en måte å redusere muligheten for konfundering (avsnitt E.3 nedenfor). Det er intuitivt forståelig at en tenåring fra Alta ikke nødvendigvis kan sammenlignes med en førtiåring fra Oslo. Matching er derfor et lett forståelig og tiltalende prinsipp.

Hvis man i stedet for å matche velger kontrollene tilfeldig fra hele utbruddspopulasjonen, vil de demografiske gruppene som dominerer i populasjonen også dominere blant de utvalgte kontrollene. En eventuell skjevfordeling som da måtte oppstå, kan kontrolleres ved hjelp av flervariabel (multivariabel) analyse (avsnitt E, nedenfor), men dette kan være problematisk i utbruddsoppklaring, fordi antallet studieobjekter som regel er lavt. I små datasett, som i et utbrudd, kan det være nødvendig å begrense antall variabler i flervariabelanalysen for å kunne påvise uavhengige risikofaktorer. Dette kan gjøres ved å matche.

I mange utbrudd vet man i utgangspunktet at sykdommen er ulikt fordelt i populasjonen, for eksempel at sykdommen er hyppigere i visse geografiske områder eller aldersgrupper enn i andre, og det er derfor ikke nødvendig å demonstrere dette ytterligere ved en analytisk epidemiologisk undersøkelse. Formålet med utbruddsoppklaringen er å identifisere smittekilden som var årsak til utbruddet.

Det er imidlertid en del ulemper forbundet med matching, som ikke vil bli omtalt her. Bruk av matching bør diskuteres med personer som har kompetanse innen utbruddsoppklaring. Slik kompetanse finnes blant annet ved Folkehelseinstituttet.

C.4 Eksempler

Shigella i issalat (1994)
I løpet av forsommeren 1994 ble flere europeiske land, inkludert Norge, Sverige og Storbritannia, rammet av et utbrudd med shigellose. I Norge registrerte MSIS et økende antall meldinger om Shigella sonnei -infeksjon fra en rekke av landets fylker i løpet av de to første ukene i juni. Langt de fleste pasientene hadde ikke reist utenlands i tiden før sykdommen. På samme tid mottok Statens næringsmiddeltilsyn rapporter fra i alt 15 kommunale tilsyn over hele landet som beskrev lokale utbrudd med gastroenteritt. I noen tilfeller ble importert issalat mistenkt for å være smittekilden på bakgrunn av epidemiologiske undersøkelser utført ved ulike kommunale tilsyn, særlig ved Næringsmiddeltilsynet i Midt-Rogaland. Selv om alle forsøk på å isolere Shigella var forgjeves, viste epidemiologiske undersøkelser av lokale utbrudd at importert spansk issalat var den mest sannsynlige smittekilden. Denne konklusjonen ble senere støttet av en landsdekkende kasus-kontroll-undersøkelse utført ved Folkehelseinstituttet og av tilsvarende undersøkelser i Storbritannia og Sverige. Den mistenkte salaten viste seg å inneholde et høyt antall termotolerante koliforme bakterier, blant annet E. coli-stammer med antibiotikaresistensmønstre som tidligere ikke var beskrevet i Norge. I løpet av utbruddet ble tusenvis av nordmenn og et ukjent antall konsumenter i andre land eksponert ikke bare for Shigella, men også for antibiotikaresistensgener, antagelig som følge av hygienesvikt tidlig i produksjonskjeden for salaten. (Kapperud G et al. J Clin Microbiol 1995; 33: 609-14).

EHEC i morrpølse (2006)
Våren 2006 ble Folkehelseinstituttet varslet om at tre barn var innlagt på Ullevål sykehus med nyresvikt (HUS). Bakteriologiske og serologiske undersøkelser viste etter hvert at sykdommen var forårsaket av E. coli O103. Utbruddsstammen hadde en særegen DNA-profil som klart skilte den fra andre O103-isolater. I alt ble 18 pasienter identifisert i løpet av utbruddet. Alle unntatt én var småbarn, hvorav ti utviklet HUS. Folkehelseinstituttet gjennomførte fortløpende pilotintervjuer av foreldrene. En rekke hypoteser ble dannet, og disse ble testet i en kasus-kontroll-undersøkelse som inkluderte de seks første pasientene og atten kontroller valgt fra Folkeregisteret. Resultatene førte til at mistanken på dette tidspunktet ble rettet mot kjøttdeig produsert av Gilde. En omfattende undersøkelse ble satt i gang for om mulig å påvise bakterien i kjøttdeig, - uten resultat. Samtidig ble det identifisert stadig flere pasienter, til tross for at kjøttdeigen var trukket fra markedet. Etter pilotintervjuer med flere pasienter, ble mistanken rettet mot en annen matvare: morrpølse, produsert ved en bedrift i Sogndal. En ny kasus-kontroll-undersøkelse støttet mistanken, og utbruddstammen ble isolert fra en uåpnet pakke morrpølse. Etter at morrpølsene ble trukket fra markedet, ble det ikke registrert flere sykdomstilfeller. Systematisk sporing i produksjonskjeden viste at sauekjøtt var den eneste av en lang rekke ingredienser i pølsene som inneholdt bakterien. (Schimmer B et al. Outbreak of haemolytic uraemic syndrome in Norway: update. Eurosurveillance Weekly 11 (4), 2006).

Salmonella i ruccola-salat (2004)
I 2004 opptrådte på nytt et internasjonalt utbrudd forårsaket av salat, denne gangen ruccola-salat produsert i Italia. Også i dette utbruddet ble smittekilden identifisert ved hjelp av en kasus-kontroll-undersøkelse utført ved Folkehelseinstituttet (Nygård et al. Foodborne Pathogen Dis 2008; 5: 165-73).

D Hvor mange pasienter og kontrollpersoner er nødvendig?

Et vanlig spørsmål er hvor mange pasienter og kontrollpersoner man trenger for å kunne påvise statistisk holdbare forskjeller i en analytisk epidemiologisk undersøkelse, enten det dreier seg om kohort- eller kasus-kontroll-studier. Sannsynligheten for å kunne påvise en slik forskjell kalles statistisk styrke og er avhengig av følgende faktorer:

Antall pasienter
Antall kontrollpersoner
Størrelsen på risikoen
Hvor vanlig eksponeringen er (eksponeringsfrekvensen)
Ønsket signifikansnivå (vanligvis 95 prosent)

Siden størrelsen på risikoen og eksponeringsfrekvensen ikke er kjent på forhånd, er det vanskelig å anslå hvor mange pasienter og kontrollpersoner man trenger. Den statistiske styrken kan økes ved å øke antall kontroller, men langt mer effektivt er det å øke antall pasienter. Dette kan gjøres ved aktiv oppsporing (avsnitt 8.5). Selv 10-20 pasienter kan imidlertid være tilstrekkelig til å påvise statistisk holdbare forskjeller, særlig dersom anslagsraten er svært høy (nesten alle som spiste den kontaminerte maten ble syke, mens ingen ble syke blant dem som ikke spiste den). Men, små undersøkelser med få pasienter og kontroller er spesielt sårbare for systematiske feil og feil som skyldes tilfeldigheter.

I utbrudd med lav anslagsrate kan en del av kontrollpersoner ha vært eksponert uten å bli syke. Risikoen knyttet til eksponeringen vil være tilsvarende lav, noe som vil kreve intervju med flere pasienter og kontroller for at risikoen skal kunne påvises.

Tommelfingerregler:

Jo flere kasus og kontroller, desto større er sjansen for å påvise sammenhenger
Det er mer effektivt å øke antall kasus enn antall kontroller
Hvis det er flere enn 50 kasus, er én kontroll per kasus tilstrekkelig
Hvis det er færre enn 50 kasus, velg 2-4 kontroller per kasus
Mer enn fire kontroller per kasus bidrar forholdsvis lite til å øke statistisk styrke

E Statistisk analyse

Både kohortundersøkelser og kasus-kontroll-undersøkelser krever statistisk analyse av opplysningene som er samlet inn, for å identifisere risikofaktorer. Analysen består av:

Deskriptiv analyse med validering av data
Bruk av deskriptiv statistikk for å danne hypoteser om smittekilder, er beskrevet i kapittel 8. Denne bakgrunnsartikkelen handler imidlertid om å teste hypoteser som allerede er dannet. På dette stadiet i etterforskningen er det gjennomført en rekke detaljerte intervjuer av pasienter og kontrollpersoner, og deskriptiv analyse består i å lage oversikter over informasjonen som er innhentet under intervjuene.

Informasjonen som er innhentet, gjør det mulig å kartlegge konsekvensene av utbruddet ved å lage oversikter over sykdommens kliniske manifestasjoner (symptomenes art, rekkefølge og varighet), og utbruddets samfunnsøkonomiske konsekvenser (legebesøk, behandling, innleggelse i sykehus, tapte arbeidsdager ved fravær fra eget arbeid eller på grunn av sykt barn o.l.). Det er laget et eget spørreskjema som man kan buke for å kartlegge samfunnsøkonomiske konsekvenser av sykdommen (se avsnitt 9.3).

Oppklaringsarbeidet kan bidra til grunnleggende kunnskap om sykdommen og smittestoffet som forårsaket utbruddet (se innledningskapitlet i Utbruddshåndboka).

Analysene gjør det også mulig å avgjøre hvor representative pasienter og kontrollpersoner er for utbruddspopulasjonen, slik at validiteten av resultatene kan vurderes. Dette kan gjøres ved sammenligne fordelingen av demografiske variabler (alder, kjønn, bosted) i utbruddspopulasjonen og blant intervjuobjektene. I en kasus-kontroll-undersøkelse sammenlignes pasientene som er intervjuet, med alle verifiserte pasienter i utbruddet, mens kontrollpersonene sammenlignes med populasjonen de er hentet fra (kapittel C, foran). I en kohortundersøkelse sammenlignes intervjuobjektene med hele kohorten (kapittel B, foran).

Deskriptive analyser bidrar også til validering av konsistens og kvalitet på dataregistreringene, blant annet ved at åpenbare feilregistreringer og inkonsekvent koding av opplysninger avsløres.
Univariabel analyse.
Univariabel analyse utføres for hver matvare og andre eksponeringer som er inkludert i spørreskjemaet, og for eventuelle kombinasjoner av slike eksponeringer. Det kan være nødvendig å kombinere matvarer som inneholder samme bestanddel eller som er produsert samme sted, i bredere variabler for å avdekke statistisk signifikante sammenhenger med sykdommen. I retrospektive kohortundersøkelser sammenlignes angrepsrater blant eksponerte og ikke-eksponerte, og relativ risiko beregnes. Ved kasus-kontroll-undersøkelser sammenlignes pasienter og kontrollpersoner for å avsløre forskjeller i eksponering ved hjelp av odds ratio. Fremgangsmåten er vist i figur 1 nedenfor. For å avgjøre om eventuelle forskjeller kan tillegges betydning, bør konfidensintervaller og p-verdier beregnes.
Multivariabel analyse.
Til slutt bør det utføres flervariabelanalyser for å undersøke om de identifiserte risikofaktorene er forbundet med økt risiko uavhengig av hverandre. For eksempel blir en del næringsmidler ofte konsumert samtidig, blant annet kylling og salat, røkelaks og eggerøre, flyndrefilet og remulade, kjøttkaker og kålstuing, o.l. I en univariabel analyse kan slike matvarer begge fremstå som risikofaktorer, selv om bare den ene er smittekilden. Dette fenomenet kalles konfundering eller effektblanding (avsnitt E.3). Multivariabel analyse kan avsløre slike forhold og avgjøre hvilken matvare som er ansvarlig for utbruddet.

Figur 1. Beregning av relativ risiko og odds ratio

I figur 1 er pølser brukt som eksempel. Tilsvarende analyser må utføres for alle eksponeringer som undersøkes.

Hvis RR (eller OR) er klart større enn 1, og dette støttes av konfidensintervallet, styrker resultatet hypotesen at pølser var smittekilden.
Hvis RR eller OR ikke er klart forskjellig fra 1, er det på dette grunnlag ikke dekning for å mene at pølser var smittekilden. Man kan forledes til å tro at betydningen av pølser som smittekilde dermed er ugjendrivelig avkreftet. Men, det er ikke nødvendigvis tilfelle. Forklaringen kan snarere være at risikoen ikke er særlig høy, eller at det er for få pasienter og kontroller til å påvise en statistisk signifikant sammenheng. Undersøkelsen har ikke tilstrekkelig statistisk styrke. Det kan være nødvendig å gjenta analysen etter at flere pasienter er rekruttert, for å kunne avdekke om denne faktoren er forbundet med økt risiko.

Uansett resultat er identifikasjon av smittekilden ikke bare avhengig av analytisk epidemiologiske undersøkelser. Det er nødvendig å foreta en kritisk gjennomgang av all informasjon og samtlige resultater før det er tilrådelig å trekke en endelig konklusjon (se avsnitt 10.3).

Ved beregning av konfidensintervaller får vi et uttrykk for hvor mye vi kan stole på den verdien som er beregnet for relativ risiko eller odds ratio. Konfidensintervallet består av en øvre og en nedre grense som sier innen hvilket intervall den reelle verdien av relativ risiko (eller odds ratio) ligger, som regel med 95 prosent sannsynlighet. Hvis både øvre og nedre grense er større enn 1, er det grunnlag for å mene at eksponeringen er forbundet med økt risiko for å bli syk.

E.1 Dataprogrammer

Det finnes en rekke dataprogrammer som kan brukes til registrering og analyse av data fra analytisk epidemiologiske undersøkelser. Enkelte av disse kan fritt lastes ned fra Internett. Her er to eksempler:

EpiData
EpiData består av to programmer: 1) EpiData Entry som kan brukes til registrering og dokumentasjon av opplysninger blant annet fra spørreskjema, og 2) EpiData Analysis som utfører statistiske beregninger, inkludert deskriptiv statistikk, lager tabeller, grafer og diagrammer, og gjør det mulig å foreta behandling av data, for eksempel omkoding og opprettelse av nye variabler. EpiData tilbyr også rutiner for å planlegge undersøkelser og lage spørreskjema. Programmene kan lastes ned gratis fra www.epidata.dk.

OpenEpi
I programmet OpenEpi finnes en rekke muligheter for å planlegge og analysere data fra epidemiologiske undersøkelser. Programmet kan ikke brukes til registrering av opplysninger fra spørreskjema; informasjonen må være sammenstilt på forhånd. Programmet inneholder en statistikk-kalkulator for analyse av data som i figur 1. Det er ikke nødvendig å laste ned programmet; alle beregninger kan gjøres på nettet. Gå inn i programmet på www.openepi.com, velg «Two by Two Table» i menyen, Velg «Enter New Data», sett inn tall i tabellen og trykk «Calculate». Da får du beregnet relativ risiko (risk ratio) og odds ratio med 95 prosent konfidensintervaller. Programmet regner også ut p-verdier som tester null-hypotesen at sykdommen ikke har noen sammenheng med det næringsmiddelet du undersøker. Vi er indoktrinert til å tro at dersom p er mindre eller lik 0,05, så er alt bra.

Flervariabelanalyser kan utføres i statistikkprogrammer som for eksempel EpiData, Stata eller SPSS

E.2 Begrensninger ved analytisk epidemiologi

Analytisk epidemiologi kan ikke brukes dersom:

alle i utbruddspopulasjonen ble syke (angrepsraten er 100 prosent), slik at det ikke er noen friske kontrollpersoner å sammenligne med (B=D=0 i figur 1),
alle var eksponert for samtlige aktuelle risikofaktorer, for eksempel ved at alle tilstedeværende spiste av alle rettene som ble servert, slik at det ikke er noen ikke-eksponerte kontrollpersoner å sammenligne med (C=D=0 i figur 1), eller
det er for få pasienter eller kontrollpersoner tilgjengelig, slik at det ikke er mulig å påvise statistisk holdbare (signifikante) forskjeller.

I enkelte utbrudd der alle i utbruddspopulasjonen har vært eksponert for smittekilden, kan det likevel være mulig å påvise en sammenheng mellom eksponering og sykdom, hvis det for eksempel viser seg at de syke har spist eller drukket større mengder av det kontaminerte næringsmidlet enn de friske (dose-respons-sammenheng).

En samlet oversikt over begrensinger og utfordringer ved analytisk epidemiologi finnes i kapittel 10.2. Systematiske feil (bias) og konfundering er diskutert nærmere i avsnitt E.3 nedenfor.

E.3 Statistisk sammenheng – årsakssammenheng – bias - konfundering

Det er viktig å understreke at de statistiske sammenhenger som en analytisk epidemiologisk undersøkelse eventuelt påviser, ikke nødvendigvis gjenspeiler en årsakssammenheng. De kan også skyldes:

Statistiske tilfeldigheter; sannsynligheten for at en faktor som ikke er årsak til utbruddet, påvises ved en ren tilfeldighet, øker med antall faktorer som analyseres.
Systematiske feil i planlegging, gjennomføring eller analyse av undersøkelsen ("bias"), eller
Konfundering (effektblanding, se nedenfor).

Små undersøkelser er spesielt sårbare for systematiske feil og feil som skyldes tilfeldigheter.

Tilfeldige og systematisk feil (bias)

Feil og unøyaktigheter er uunngåelig i en epidemiologisk undersøkelse; epidemiologi er ingen eksakt vitenskap. Resultatene er blant annet avhengige av at personene som intervjues, faktisk husker hva de spiste og gjorde for flere dager, av og til uker, siden - noe de fleste synes er vanskelig. Dette vil ikke medføre store problemer, hvis unøyaktighetene er tilfeldig fordelt mellom deltagerne i undersøkelsen.

Det er imidlertid viktig å forebygge systematiske feil som er skjevt fordelt mellom intervjupersonene på en slik måte at de fører til feilaktige konklusjoner. I verste fall kan dette medføre at smittekilden ikke blir oppdaget eller at feil smittekilde utpekes.

Systematiske feil i planlegging, gjennomføring eller analyse, som kan føre til feilaktig konklusjon, kalles bias. Her er noen eksempler:

Utvalgsfeil

De fleste utvalgsfeil kan forebygges ved å følge de grunnleggende reglene for valg av intervjupersoner skissert i avsnitt B og C, foran. Utvalgsfeil kan imidlertid likevel oppstå, selv om disse reglene etterleves. En vanlig årsak er at pasienter eksponert for den mistenkte smittekilden har større sjanse enn andre til å bli inkludert i undersøkelsen. Grunnen er som regel at mistanken har vært offentliggjort, noe som kan føre til at:

personer som husker at de har vært eksponert for den smittekilden de vet mistenkes, er mer tilbøyelige til å oppsøke lege,
legene tar oftere prøver fra dem enn fra andre, eller
de er mer motivert til å delta i en intervjuundersøkelse.

Klassifikasjonsfeil

Systematiske feil kan også oppstå dersom pasienter eller kontroller er feilklassifisert, det vil si at enkelte pasienter ikke er reelle kasus, eller at kontroller i virkeligheten er udiagnostiserte kasus (se avsnitt B og C i dette kapittelet om forholdsregler for å unngå klassifikasjonsfeil). Skjevheter kan dessuten forekomme dersom man utilsiktet inkluderer sekundærtilfeller eller tilfeller som tilhører det endemiske bakgrunnsnivået av sykdommen (se avsnitt 10.2).

Informasjonsfeil

Også for denne typen feil er en vanlig årsak at deltagerne i undersøkelsen er kjent med hvilken smittekilde som mistenkes, enten gjennom massemediene eller fordi intervjueren røper hypotesene. Dette kan føre til at:

personer som ikke har vært syke (kontrollene), er tilbøyelige til å undertrykke og underrapportere at de virkelig har vært eksponert for den kilden de vet mistenkes,
personer som har vært syke (kasus), er tilbøyelige til å rapportere at de har vært eksponert, til tross for at de ikke har vært det. Dette kan skje ubevisst og betyr ikke at de lyver med overlegg.

Intervjueren kan skape eller forsterke slik selektiv hukommelse ved å:

oppmuntre og belønne positive svar fra pasientene angående antatte risikofaktorer, for eksempel ved kroppsspråk, minespill eller ved at de spør mer inngående,
oppmuntre og belønne negative svar fra kontrollene, eller
tolke eller notere svarene forskjellig, ubevisst eller med overlegg.

En fremgangsmåte for å kvalitetssikre informasjonen og motvirke denne typen informasjonsfeil, er å sørge for at spørreskjemaet til en kasus-kontroll-undersøkelse inneholder flere beslektete produkter (for eksempel flere typer salater eller flere merker kjøttvarer), ikke bare den maten det er knyttet mest mistanke til. Dermed unngår man å røpe hvilke produkter man mistenker; mange pasienter er tilbøyelig til å svare bekreftende dersom de kjenner hypotesene, selv om de ikke har spist den aktuelle maten (se foran). (Dette kan sammenlignes med politiets vitneavhør der de konfronterer vitnene med bilder av flere personer som ligner hverandre, og ber dem utpeke forbryteren). I en kohortundersøkelse er dette ivaretatt ved at spørreskjemaet inneholder alle matvarer på menyen.

Hukommelsesfeil

En annen type systematisk feil kan oppstå fordi pasientene husker bedre hva de har spist, enn kontrollpersonene. Mange pasienter som har gastroenteritt, er klar over at sykdommen kan skyldes mat eller vann. De har derfor tenkt etter hva de spiste før sykdommen startet. De er tilbøyelige til å mistenke det siste måltidet, matvarer de selv oppfatter som risikoprodukter, eller mulige smittekilder som er avslørt. Selv om de ofte tar feil, har de uansett aktivert hukommelsen.

Kontrollene har på sin side ikke aktivert hukommelsen på samme måte og er uforberedt på spørsmålene om hva de spiste, ofte for flere uker siden. Dette gjelder både ved kasus-kontroll og kohort-undersøkelser. Denne forskjellen i erindring kan forsterkes dersom en del pasienter har gjennomgått et pilotintervju, eventuelt også et påfølgende oppfølgingsintervju, der intervjueren har bedt dem memorere alt de kan ha spist før sykdommen.

Her er noen mulige fremgangsmåter:

Én strategi er å utelukket pasienter som har gjennomgått et pilotintervju, fra en kasus-kontroll-undersøkelse. Men, de vil likevel huske bedre enn sine kontroller, rett og slett fordi de har vært syke. De fleste utbrudd er små, og antallet kasus som ikke har vært gjennom et pilotintervju, kan være så lavt at den statistiske styrken reduseres betydelig, samtidig som faren øker for at feil smittekilde utpekes ved en statistisk tilfeldighet når det er få deltagere i undersøkelsen. Fordelen ved å innsnevre antall pasienter på denne måten, må derfor veies opp mot ulempene.

For å gi kontrollpersonene bedre sjanse til å huske, kan de intervjues for perioden like før de fyller ut spørreskjemaet, mens pasientene som før intervjues om perioden før sykdommen deres startet. Denne fremgangsmåten kan bare brukes dersom omsetningen og konsumet av de mistenkte smittekildene antas å være den samme i de de to periodene. Det kan for eksempel dreie seg om mat som ofte spises i forbindelse med høytider som jul, påske, 17. mai, eller i den væravhengige grillsesongen. Hvis utbruddet fant sted i en slik periode, vil en rekke matvarer bli feilaktig identifisert som smittekilder dersom kontrollpersonene intervjues for en periode da konsumet av slike sesongavhengige matvarer er redusert.

En tredje mulighet er å velge kontrollene blant pasienter med gastroenteritt forårsaket av et annet agens. Slike kontroller kan velges tilfeldig fra MSIS, blant personer som ble syke omtrent samtidig som pasientene i utbruddet, eventuelt matchet med pasientene (for eksempel samme aldersgruppe, samme kjønn og bosatt i samme geografiske område som pasientene de matches med). I likhet med pasientene må de intervjues om eksponeringer i perioden før sykdommen deres startet. Dersom pasientene i utbruddet ikke har vært utenlands i tiden før de ble syke, må kontrollene velges blant personer som er angitt smittet Norge. Denne metoden eliminerer ikke hukommelsesfeil skapt av pilotintervjuer. Dersom smittekilden er en matvare eller drikkevare som også er knyttet til andre gastroenteritter, vil den bli underestimert med denne strategien.

Konfundering - effektblanding

Konfundering kan oppstå dersom effekten av to faktorer som er forbundet, ikke er skilt fra hverandre. Enkelte faktorer kan fremstå som risikofaktorer i analysen, selv om de ikke har noe med årsaken å gjøre, fordi de er assosiert med den virkelige smittekilden. For eksempel, dersom to matvarer ofte serveres samtidig, vil tilsynelatende begge være forbundet med økt risiko for bli syk, til tross for at bare den ene er kontaminert. Slike faktorer kalles konfundere. I en del studier kan konfundering forebygges under planleggingen av undersøkelsen, for eksempel ved å matche pasienter og kontroller (avsnitt C.3). Multivariabel analyse er et viktig redskap for å sortere slike effekter (se foran).

Årsakssammenheng

Sannsynligheten for at en årsakssammenheng foreligger, og at man virkelig har lykkes i å identifisere smittekilden, øker dersom:

Resultatene er i samsvar med andre undersøkelser, for eksempel laboratoriefunn, inspeksjoner eller sporing (intern konsistens, avsnitt 10.3).
Sammenhengen er i samsvar med kjent kunnskap om sykdommen og agens (biologisk og teknologisk plausibilitet - ekstern konsistens, avsnitt 10.3).
Alternative smittekilder er vurdert og forkastet, og sammenhengen er enkel, uten å kreve ytterligere premisser eller ikke-verifiserte forutsetninger.
Risikoestimatet er høyt.
Sammenhengen er signifikant i en multivariabel analyse.
Smittekilden som er identifisert, kan forklare flesteparten av sykdomstilfellene (de fleste pasientene rapporterer slik eksponering).
Det kan påvises en dose-respons-sammenheng, for eksempel ved at risikoen øker med hvor mye man har spist av en mistenkt matvare eller rett.

E.4 Enkelte utfordringer ved tolkning av analysen

En rekke av pasientene i utbruddet mener bestemt at de ikke har vært eksponert for den kilden du mistenker, for eksempel en matvare eller rett

Mulige forklaringer:

De har glemt at de spiste matvaren.
De har spist den uten å ha lagt merke til det (for eksempel en spesiell type salat som inngår i en salatblanding med mange andre bestanddeler).
Hvis pasienten er et barn kan vedkommende har spist matvaren hos besteforeldre, i barnehage eller hos venner, uten at foreldrene er klar over det.
De har spist en annen matvare som er blitt krysskontaminert av den matvaren du mistenker.
De har spist en annen matvare som er blitt kontaminert fra samme kilde som den maten du mistenker, for eksempel fra samme smittebærende person eller samme kontaminerte kjøkken- eller produksjonsmiljø.
Pasientene det gjelder har hatt lengre inkubasjonstid enn de øvrige. De har spist den ansvarlige matvaren i dagene før perioden som dekkes av intervjuet.
De er sekundærtilfeller som er smittet direkte eller indirekte av andre i utbruddet, men har ikke selv vært eksponert for smittekilden (avsnitt 8.6). Dette er spesielt aktuelt for agens som lett smitter sekundært.
Pasientene tilhører det endemiske bakgrunnsnivået av sykdommen og er ikke en del av utbruddet, selv om de tilfredsstiller kasusdefinisjonen.
Matvaren du mistenker er ikke årsaken til utbruddet. Sammenhengen påvist i analysen skyldes statistisk tilfeldighet, systematisk feil eller konfundering (avsnitt E.3). Du har ikke lykkes i å finne årsaken til utbruddet.

Analysen viser at flere enn én matvare eller andre eksponeringer er relatert til økt risiko for sykdommen

Mulige forklaringer:

Matvarene er kontaminert fra samme kilde, for eksempel fra samme smittebærende person eller samme kontaminerte kjøkken- eller produksjonsmiljø.
Matvarene inneholder samme kontaminerte ingrediens eller råvare.
Det har foregått krysskontaminering under tilberedning eller omsetning.
Konfundering: Det er bare én matvare som er smittekilden, men denne blir ofte eller alltid servert eller spist sammen med andre varer (avsnitt E.3). Det kan også skyldes kostholdsvaner: Personer som spiser en spesiell matvare, kan være tilbøyelig til også å spise en annen matvare, som ikke er smittekilden (for eksempel ruccola-salat og tomater). Bruk multivariabel analyse for å undersøke om du kan sortere effektene.

Analysen avslører at én eller flere matvarer eller andre eksponeringer er relatert til redusert risiko for sykdommen

Mulige forklaringer:

Menyeffekt: Mange menyer er slik at man velger mellom forskjellige retter (for eksempel på en restaurant eller ved et koldtbord). De som tilfeldigvis spiser retter som ikke inneholder den kontaminerte matvaren, har gjort et valg som gjør at de ikke blir eksponert for smittekilden. Slike retter vil derfor fremstå som "beskyttende" i analysen.
Det er teoretisk mulig at enkelte matvarer kan ha en reell beskyttende effekt, for eksempel ved at de inneholder stoffer som virker bakteriehemmende.

Ingen statistisk holdbare sammenhenger blir påvist i analysen

Mulige forklaringer:

Det er for få pasienter og kontroller i undersøkelsen (avsnitt E.2).
Du kan ha glemt å spørre om noe.
Hypotesene dine er feil.

Analytisk epidemiologiske undersøkelser: Planlegging, gjennomføring og analyse

Hovedpunkter

A Utarbeiding av spørreskjemaet og gjennomføring av intervjuene

B Retrospektive kohortundersøkelser

C Kasus-kontroll-undersøkelser

C.1 Valg av pasienter og kontroller i kasus-kontroll-undersøkelser

Grunnleggende regler i kasus­kontroll­undersøkelser:

C.2 Metoder for valg av kontrollpersoner i kasus-kontroll-undersøkelser

C.3 Matching av pasienter og kontroller

C.4 Eksempler

D Hvor mange pasienter og kontrollpersoner er nødvendig?

Tommelfingerregler:

E Statistisk analyse

E.1 Dataprogrammer

E.2 Begrensninger ved analytisk epidemiologi

E.3 Statistisk sammenheng – årsakssammenheng – bias - konfundering

E.4 Enkelte utfordringer ved tolkning av analysen

Endringshistorikk

Grunnleggende regler i kasuskontrollundersøkelser: