Årsak
Publisert
Systematiske oversikter over studier om årsak (eller etiologi) undersøker sammenhengen mellom eksponering for sykdomsfremkallende, beskyttende eller helsefremmende faktorer, og sykdom eller andre helserelaterte utfall.
Introduksjon
Systematiske oversikter over studier om årsak (eller etiologi) undersøker sammenhengen mellom eksponering for sykdomsfremkallende, beskyttende eller helsefremmende faktorer, og sykdom eller andre helserelaterte utfall. Vi kan omtale disse ulike gruppene av årsaksfaktorer som risikofaktorer, beskyttelsesfaktorer og helsefremmende faktorer. Noen årsaksfaktorer er stabile (f.eks. genetiske faktorer), mens andre varierer over tid (f.eks. metabolske faktorer som blodtrykk, blodsukker og kolesterolnivå, miljøfaktorer som luftforurensning og hetebølger, psykososiale forhold som familieforhold og sosialt nettverk, samt sosioøkonomiske forhold som arbeid og inntekt). Noen årsaksfaktorer er det mulig å påvirke, i alle fall i prinsippet.
Av etiske og praktiske grunner kan vi sjelden gjøre eksperimenter for å undersøke effekten av mulige årsaksfaktorer. Epidemiologiske studier av årsak sammenlikner eksponerte med ikke eksponerte individer. Slike sammenlikninger kan gjøres i kohortstudier der de eksponerte og ikke eksponerte personene følges over tid. Andre tilnærminger er kasus-kontroll-studier, tverrsnittsstudier, økologiske studier og mendelsk randomisering (1). Kasuskontrollstudier sammenlikner eksponering blant de som har sykdommen eller utfallet vi er interessert i (kasus) og de som ikke har det (kontroll). Tverrsnittsstudier undersøker deltakerne på et gitt tidspunkt. Forekomst av utfallet blant eksponerte og ikke eksponerte kan sammenliknes som i en kohortstudie. Alternativt kan odds for å være eksponert sammenliknes mellom gruppene med og uten sykdom, som i en kasuskontrollstudie. Instrumentvariabelanalyse innebærer at man undersøker en faktor som er assosiert med eksponeringen man er opptatt av, men ikke med forvekslingsfaktorer som kan påvirke utfallet på andre måter enn via eksponeringen. Mendelsk randomisering er eksempel på instrumentvariabelanalyse, der man bruker genetiske faktorer som instrumenter.
Trinnene i en systematisk oversikt om årsak
Framgangsmåten for å lage en systematisk oversikt om årsak følger de samme trinnene som i en systematisk oversikt om andre kjernespørsmål. Innholdet i trinnene skiller seg hovedsakelig når det gjelder hvordan vi formulerer spørsmålet, hvordan vi identifiserer mulige forvekslingsfaktorer, hvilke verktøy vi bruker for å vurdere risiko for systematiske skjevheter, og hvordan vi sammenfatter og vurderer tilliten til resultatene fra inkluderte studier. Vi beskriver disse trinnene nærmere i dette kapittelet.
Formulere spørsmål og skrive prosjektplan
Bygge team
Før vi formulerer spørsmålet vil vi avklare hvilken kompetanse som trengs i teamet. Det er viktig å ha med fagpersoner med klinisk og epidemiologisk kompetanse som kan bidra til å identifisere mulige forvekslingsfaktorer og vurdere måling av eksponering. Det kan også være nyttig å ha med statistiker allerede i diskusjoner om spørsmålsformulering, fordi de statistiske analysene kan være komplekse.
Formulere spørsmål
Når vi skal utarbeide en systematisk oversikt over spørsmål om årsak kan vi gjerne starte med et bredt forskningsspørsmål, men vi bør etter hvert snevre inn spørsmålet for å sikre at spørsmålet er klart og oppgaven gjennomførbar. Vi kan altså ha en litt mer fleksibel prosess enn når vi utarbeider systematiske oversikter over randomiserte og ikke-randomiserte studier (eller observasjonsstudier) om spørsmål om effekt av intervensjoner (1).
Vi bruker formatet PECO når vi formulerer spørsmål om årsak (2):
P – Populasjonen det gjelder
E – Eksponeringen det gjelder
C – Kontrollgruppen som eksponeringsgruppen skal sammenlignes med
O – Utfall (outcome) vi er interessert i
Vi kan utarbeide presise definisjoner for eksponering og utfall, men hvis ingen av studiene bruker disse definisjonene vil vi ikke kunne svare på forskningsspørsmålet. Det kan derfor være nødvendig å gjøre kartleggingssøk for å finne relevante studier, og for eventuelt å tilpasse forskningsspørsmålet og ordbruk/terminologi til de tilgjengelige studiene.
Skrive prosjektplan
Når vi skriver prosjektplanen (protokollen) er det viktig at vi tenker gjennom mulige forvekslingsfaktorer og andre systematiske skjevheter. Forvekslingsfaktorer kan påvirke resultatet hvis gruppene er forskjellige utover eksponeringen(e) vi studerer. Forvekslingsfaktorer er faktorer som er assosiert både med eksponering og utfall. Systematiske skjevheter knyttet til seleksjon av deltakere og måling av eksponering og utfall (seleksjonsskjevhet, klassifikasjonsskjevhet og måleskjevhet) er særlig aktuelt i studier om årsak.
Søke etter litteratur
Kapittelet Søke etter litteratur beskriver hvordan vi gjennomfører systematisk litteratursøk også når vi skal svare på spørsmål om årsak og vi derfor søker etter ikke-randomiserte studier. Indekseringen av studier om eksponering er mangelfull, og det kan derfor være vanskelig å gjennomføre gode litteratursøk (1). Det finnes foreløpig ikke filtre som treffsikkert kan identifisere slike studier i elektroniske databaser (3,4).
Velge ut studier
Her kan vi følge beskrivelsen i kapittelet Velge ut studier.
Det er ikke noe standardsvar på spørsmålet om spesielle studiedesign eller metodologisk kvalitet skal styre inklusjon av studier (1).
Vurdere inkluderte studier
Det neste trinnet i en systematisk oversikt er at vi vurderer risikoen for systematiske skjevheter i de studiene vi har inkludert. Dette er beskrevet i kapittelet Vurdere inkluderte studier.
Det eksisterer flere ulike verktøy/sjekklister for å vurdere risiko for systematiske skjevheter i studier om årsaks- og risikofaktorer. De fleste studier om årsaksfaktorer er ikke-randomiserte studier (observasjonsstudier) som undersøker assosiasjon mellom mulige årsaks- eller risikofaktorer (eksponeringer) og aktuelle utfall, ofte kohortstudier eller kasuskontrollstudier.
ROBINS-E
ROBINS-E, Risk Of Bias In Non-randomized Studies of Exposure, er et verktøy for å vurdere risiko for systematiske skjevheter i ikke-randomiserte oppfølgingsstudier (kohortstudier) om effekt av eksponering på et utfall (5). Vurderingene er knyttet til risiko for vesentlige systematiske skjevheter, altså systematiske skjevheter som kan påvirke retningen av den estimerte effekten eller hvorvidt man kan trekke konklusjoner basert på den aktuelle studien. ROBINS-E er bygget opp på liknende måte som Risk Of Bias In Non-randomized Studies of Interventions (ROBINS-I) og Cochrane Risk of Bias versjon 2 (ROB 2). ROBINS-E krever god faglig og metodologisk innsikt av den som skal bruke det. Det er et nokså omfattende og tidkrevende verktøy å bruke, spesielt når man gjør det for første gang.
ROBINS-E krever at forfatterne gjør et forarbeid med å identifisere mulig viktige forvekslingsfaktorer som kan påvirke sammenhengen mellom eksponering og utfall. Man blir også oppfordret til å diskutere hvilke målemetoder (for eksponering og utfall) og hvilke statistiske analyser som er passende, før man begynner å vurdere studiene.
Etter forarbeidet skal man gjøre en rekke foreløpige vurderinger for hver studie. Dette inkluderer å spesifisere det resultatet som skal vurderes, å identifisere studier med svært høy risiko for systematiske skjevheter (som man kan unnlate å gjøre en detaljert vurdering av) og hente inn informasjon fra studiene som skal benyttes i vurderingene.
Deretter starter selve vurderingen av risiko for systematiske skjevheter for hvert av disse syv domenene:
- forvekslingsfaktorer
- måling av eksponeringen
- utvalget av deltakere til studien (eller til analysene)
- intervensjoner etter eksponering
- manglende data
- måling av utfall
- utvalg av rapporterte resultater
To forfattere bør uavhengig av hverandre klassifisere disse i én av fire kategorier; lav risiko, noen bekymringer, høy risiko eller svært høy risiko for systematiske skjevheter. Videre gjør man en vurdering av retningen på eventuelle systematiske skjevheter, og om størrelsen og retningen på de mulige systematiske skjevhetene kan påvirke hvorvidt man kan trekke konklusjoner basert på den aktuelle studien (ja/nei/uklart).
Når to av forfatterne har vurdert alle syv domener, gjør de en samlet vurdering av risiko for systematiske skjevheter for det aktuelle resultatet fra den aktuelle studien, med de samme kategoriene som for enkeltdomenene. Det er ikke mulig å gi en samlet vurdering som kommer bedre ut enn det dårligste enkeltdomenet. Det betyr for eksempel at hvis minst ett domene er vurdert å ha høy risiko for systematiske skjevheter, blir den samlede vurderingen enten høy eller svært høy risiko for systematiske skjevheter. Dette er i tråd med COSMOS-E retningslinjene som anbefaler å ikke benytte en totalskår for å komme fram til en samlet vurdering av risiko for systematiske skjevheter, men å heller gjøre kvalitative vurderinger (1).
Forfatterne gjør også en samlet vurdering av retning på eventuelle systematiske skjevheter, og om størrelsen og retningen på de mulige systematiske skjevhetene kan påvirke hvorvidt man kan trekke konklusjoner basert på den aktuelle studien (ja/nei/uklart).
ROBINS-E har også en del hvor man vurderer hvorvidt studien er egnet til å undersøke den aktuelle sammenhengen mellom eksponering og utfall (‘study sensitivity’ eller ‘appropriateness’). Dette kan for eksempel dreie seg om hvorvidt oppfølgingstiden i studien var lang nok. Denne delen handler mer om ekstern validitet enn risiko for systematiske skjevheter (intern validitet), og er derfor ikke med i hoveddelen av ROBINS-E. Dersom en studie ikke er egnet til å svare på det aktuelle spørsmålet, kan man bruke denne delen av ROBINS-E for å vurdere om studien bør ekskluderes.
Newcastle-Ottawa Scale
Newcastle-Ottawa Scale er et verktøy for å vurdere risiko for systematiske skjevheter i ikke-randomiserte studier med kontrollgruppe. Verktøyet finnes i to versjoner, én for kohortstudier og én for kasus-kontrollstudier. Newcastle-Ottawa Scale kan benyttes for ikke-randomiserte intervensjonsstudier, men også for ikke-randomiserte studier av eksponering. Sjekklisten er enkel å bruke og mindre omfattende enn for eksempel ROBINS-I- og ROBINS-E. Verktøyet er lagt opp slik at vurderingen av risiko for systematiske skjevheter gjøres på studienivå, altså som en samlet vurdering på tvers av ulike utfall, men man bør vurdere om dette er tilstrekkelig eller om vurderingene må gjøres på utfallsnivå. Dette gjelder kun for kohortstudier der man kan se på flere ulike utfall i en studie, og ikke kasuskontrollstudier.
Vi har beskrevet Newcastle-Ottawa Scale nærmere her.
Sjekklister fra Joanna Briggs Institute (JBI)
JBI har en rekke sjekklister som er relativt enkle å bruke, bl.a. for kohortstudier, kasus—kontrollstudier, pasientserier, kasusrapporter og tverrsnittsstudier.
Hente ut data, sammenfatte og gradere
Når vi har vurdert risiko for systematiske skjevheter i inkluderte studier, skal vi hente ut data, sammenfatte og gradere tilliten til resultatene. Dette har vi beskrevet her.
Vi anbefaler at forfattere av systematiske oversikter med spørsmål om årsak tar kontakt med en erfaren statistiker eller epidemiolog før man går i gang med å sammenfatte data fra inkluderte studier.
Metaanalyse eller narrativ syntese?
Vi vurderer risiko for systematiske skjevheter og andre kilder til heterogenitet før vi overveier om det er hensiktsmessig å statistisk slå sammen alle studier, en subgruppe av studier, eller ikke slå sammen studier i det hele tatt. Vi baserer ikke disse overveielsene kun på statistiske mål på heterogenitet (1). Vi kan slå sammen studier hvis vi vurderer at studiene har moderat eller lav risiko for systematiske skjevheter og er relativt homogene når det gjelder spørsmålet definert ved PECO (populasjon, eksponering, sammenlikning og utfall) og konteksten studiene er utført i (Cochrane Handbook for Systematic Reviews of Interventions Chapter 24; (6))
Heterogenitet
Vi kan forvente en høyere grad av heterogenitet når vi oppsummerer ikke randomiserte studier enn randomiserte studier. En del av heterogeniteten kan være metodisk, for eksempel ved at studiene har brukt ulike metoder for å måle eksponering og utfall, eller at de har justert for flere eller færre viktige forvekslingsfaktorer. Egenskaper ved ulike studiedesign kan også bidra til heterogenitet, og vi bør derfor være varsomme med å slå sammen studier med ulike design i metaanalyse (Cochrane Handbook, kap 24 (6)).
Hvis studiene ikke er tilstrekkelig like, kan vi presentere resultatene i balansediagram (forest plot) uten et samlet effektestimat. Vi kan sortere studier etter for eksempel studiedesign og risiko for systematiske skjevheter. Det er vanskelig å rapportere resultater narrativt uten å være selektiv eller betone noen resultater foran andre resultater (Cochrane training kap 24 (6)). «Synthesis without meta analysis – SWiM » er en retningslinje for transparent rapportering av narrative/beskrivende synteser (7).
Effektmål
Effektmål som vi bruker i randomiserte kontrollerte studier kan vi også bruke i metaanalyser som inkluderer observasjonsstudier, altså risk ratio, odds ratio og hazard ratio for dikotome utfall, og gjennomsnittsforskjell og standardisert gjennomsnittsforskjell for kontinuerlige utfall (1,6). Mål på assosiasjon som korrelasjonskoeffisienter og regresjonskoeffisienter er andre eksempler på utfallsmål (1).
Statistisk modell
Tilfeldig (random) effekt-modell og generisk invers-varians modell basert på estimater og standardfeil er egnet for observasjonsstudier (1,6). Ved manglende rapportering av standardfeil kan man bruke kalkulatoren i RevMan Web for å beregne standardfeilen.
Justerte/ujusterte data:
Estimater som er justert for forvekslingsfaktorer er vanligvis de mest interessante i observasjonsstudier. Det er nyttig å trekke ut ujusterte estimater eller rådata, siden sammenligning av disse kan gi innsikt i hvilken rolle forvekslingsfaktorene spiller (1). Hvis man må velge mellom alternative justerte estimater bør man velge estimatet man vurderer gir lavest mulig risiko for systematiske skjevheter på grunn av relevante forvekslingsfaktorer (6).
Vurdering av tillit til resultatene i studier om årsaks- og risikofaktorer
Vi kan bruke den samme GRADE tilnærmingen når vi vurderer tilliten til resultatene i en systematisk oversikt om effekt av eksponering (spørsmål om årsaks- og risikofaktorer) som når vi vurderer tilliten til resultatene i en systematisk oversikt om effekt av en intervensjon. Når vi skal oppsummere studier om årsaks- og risikofaktorer har vi svært sjelden randomiserte studier. Vi søker etter relevante observasjonsstudier (kohortstudier, kasus-kontroll-studier eller tverrsnittsstudier).
GRADE har to veier inn for å vurdere tillit til resultater fra ikke-randomiserte studier om effekt av eksponering.
Den tradisjonelle tilnærmingen er at observasjonsstudier starter på lav tillit. Dette er basert på risikoen for at gjenværende forvekslingsfaktorer og seleksjonsskjevhet kan påvirke resultatene (vi kan jo bare justere for de faktorene vi faktisk vet om). Hvis det ikke hefter noen andre problemer med den systematiske oversikten, kan vi gradere opp hvis det er store effekter, dose-respons-sammenheng, eller der forventet effekt av mulige forvekslingsfaktorer ville øke tilliten til resultatet.
Med ROBINS-I og ROBINS-E er det mulig å starte med høy tillit til resultatene også basert på en systematisk oversikt med ikke-randomiserte studier (8). Det vil i de aller fleste tilfeller være risiko for systematiske skjevheter på grunn av gjenværende forvekslingsfaktorer og seleksjonsskjevheter i studier som ikke er randomiserte, og da må vi gradere ned. Derfor er det slik at vi stort sett lander på samme tillit til resultatene uansett hvilken vei man tar med GRADE.
GRADE og miljø- og klimavurderinger
Når det gjelder GRADE-vurderinger for studier som undersøker miljø- og klimaeffekter så er GRADE anbefalingen den samme som når man vurderer effekt av annen eksponering, slik som beskrevet over (9).
GRADE og prekliniske dyrestudier
Når vi vurderer tilliten til resultatene i prekliniske dyrestudier er det flere faktorer som vi vurderer spesifikt (10). For det første må vi vurdere overføringsverdi fra dyreforsøk til dyr, dernest overføringsverdi fra dyr til mennesker/ klinisk situasjon (translatability). For det andre må vi vurdere eventuell mangel på samsvar mellom dyrearter. Hva som er akseptable nivåer for heterogenitet, kan avhenge av om forskjeller mellom arter kan forklare noe av heterogeniteten. Dersom studier på alle de ulike dyreartene viser den samme retningen på effekt som studier hos mennesker, vil det styrke tilliten til resultatene, og vi nedgraderer ikke selv om den statistiske heterogeniteten målt med I2 kan være betydelig. Bruk av optimal-informasjons-størrelse (optimal information size OIS) er en ekstra utfordring for dyreforsøk, da det er vanskelig å sette meningsfulle estimater for klinisk viktighet. Dette med OIS er enda ikke avklart, men foreløpig forslag er å bruke størrelsesgrensene som brukes for effektstørrelser til standardiserte gjennomsnittsforskjeller (SMD) og nedgradere om konfidensintervallet overlapper to grenser, eller sammenligne med andre medisiner/kjemikalier.
Oppgraderingsregler for effektestimater/resultater sammensatt av dyreforsøk er de samme som for forsøk med mennesker. I tillegg diskuteres det om samsvar i retning på tvers av forskjellige arter burde kunne føre til oppgradering av tilliten eller fortsatt bare være en grunn til å ikke nedgradere.
GRADE og OHAT
The Office of Health Assessment and Translation (OHAT) i US National Toxicology Program har laget en modifikasjon av GRADE (11). OHAT benytter de samme fem kategoriene for nedgradering og de samme tre kategoriene for oppgradering, men har lagt til to andre oppgraderingsmuligheter. Den ene ekstra OHAT-oppgraderingsmuligheten er den som er diskutert over, der det er samsvar på tvers av studiedesign, populasjoner/ dyremodeller og eller arter. Den andre ekstra OHAT-oppgraderingsmulighetene kalles annet («Other»), og omfatter sjeldne uønskede hendelser der det er usannsynlig at det kan være andre årsaksfaktorer (11,12).
OHAT bruker også egne startpunktregler for forskjellige studiedesign. OHAT stiller fire spørsmål om studiedesignet der svarene avgjør om studien starter på høy, moderat, lav eller svært lav. Dette er forklart i kapittelet om risikovurdering (11).
Skrive rapport
Se det generelle kapittelet «Skrive rapport» under Framgangsmåte
Fagfellevurdere, godkjenne og publisere
Det siste trinnet når vi skal utarbeide en systematisk oversikt over studier som undersøker spørsmål om årsak, skiller seg ikke fra det vi gjør for systematiske oversikter om andre spørsmål. Dette er beskrevet i et eget kapittel.