Systematisk oversikt
Screeningverktøy for kognitiv funksjon og bilkjøring
Systematisk oversikt
|Publisert
I denne rapporten har vi kartlagt hva som finnes av kognitive screeningtester for å vurdere funksjoner med betydning for bilkjøringsevne, og hvor gode testene er til å forutsi hvem som vil bestå en praktisk kjøretest eller hvem som vil oppleve en bilulykke de nærmeste årene etter screeningtesten.
Hovedbudskap
Det er ulike årsaker til at personer med førerkort ikke lenger er i stand til å kjøre bil. Det kan for eksempel skyldes hjerneslag, traumatisk hjerneskade, eller begynnende demens. For å vurdere om personer med mistenkt kognitiv svikt er i stand til å kjøre bil, er det behov for gode tester som kan kategorisere personer i tre grupper: (1) er ikke i stand til å kjøre bil, (2) er i stand til å kjøre bil, (3) bør henvises til mer omfattende vurderinger av kognitive evner.
I denne rapporten har vi kartlagt hva som finnes av kognitive screeningtester for å vurdere funksjoner med betydning for bilkjøringsevne, og hvor gode testene er til å forutsi hvem som vil bestå en praktisk kjøretest eller hvem som vil oppleve en bilulykke de nærmeste årene etter screeningtesten.
Vårt hovedbudskap er at:
- Vi har ikke funnet noen kognitive screeningtester som har god dokumentasjon på diagnostisk nøyaktighet for å forutsi prestasjon på praktiske kjøretester. Tester som kunne oppdage minst 65 prosent av farlige bilførere i alle studier var Montreal Cognitive Assessment (MoCa, oppdaget 70-85 %), klokketesten (oppdaget 65-71 %) og Trail-Making Test-B (oppdaget 70-77 %). Vi har i de fleste tilfeller liten eller svært liten tillit til resultatene
- Det var stor variasjon i hvor gode testene var for å forutsi resultater på en praktisk kjøretest
- Det er et stort behov for standardisering av utfallsmålene og testbatteriene i forskning om screeningtester for kjøreferdighet.
- Vi kan derfor ikke konkludere på spørsmålet om hvilke(n) test(er) som egner seg best for å vurdere om personer med mistenkt kognitiv svikt er egnet til å fortsette å kjøre bil
Sammendrag
Bakgrunn
Nasjonalt kunnskapssenter for helsetjenesten fikk i oppdrag fra Haukeland universitetssjukehus å kartlegge hvilke screeningverktøy som er valide og reliable instrumenter for å forutsi om kognitiv funksjon er tilstrekkelig for sikker kjøring.
Metode
Vi søkte systematisk etter studier som hadde rapportert diagnostiske egenskaper for kognitive screeningtester når det gjelder å forutsi hvordan personer ble vurdert på standardiserte kjøretester. Vi søkte spesielt etter studier hvor alle studiedeltakerne hadde gjennomgått én eller flere screeningtester (indekstester) og etterpå hadde tatt en praktisk kjøretest (referansetest). Vi inkluderte studier hvor vi kunne finne eller beregne de fire tallene: sanne positive, falske positive, falske negative, og sanne negative. Dette gjorde det mulig å regne ut sensitivitet (hvor stor andel av de dårlige bilførerne vurdert fra kjøretesten som screeningtestene klarte å fange opp) og spesifisitet (hvor stor andel av de gode bilførerne vurdert fra kjøretesten som screeningtestene klarte å fange opp). To personer gikk, uavhengig av hverandre, gjennom søketreffene. Risikoen for systematiske skjevheter i de inkluderte studiene ble vurdert av to forskere uavhengig av hverandre, med instrumentet QUADAS 2. Resultater på sensitivitet og spesifisitet er presentert for hver studie, og kvaliteten på dokumentasjonen er vurdert ved hjelp av GRADE.
Resultat
Vi fant 53 studier som oppfylte inklusjonskriteriene. 47 studier hadde sammenliknet resultater på screeningtester med resultater på en praktisk kjøretest. Tre studier hadde en simulator som referansetest, og tre studier hadde både simulator og praktisk kjøretest. Vi fant ingen studier med ulykker som utfall. Ni studier hadde rapportert separate resultater for Stroke Driver’s Screening Assessment (SDSA) med sensitivitet mellom 0,30 og 0,88. Fem studier rapporterte separate resultater for Useful Field of View (UFOV) med sensitivitet mellom 0,48 og 0,89. Tre studier hadde brukt klokketesten (sensitivitet mellom 0,65 og 0,71), og tre hadde brukt Mini Mental State Examination (MMSE) med sensitivitet mellom 0,10 og 0,80. Trail-Making Test A var rapportert for tre studier (sensitivitet mellom 0,40 og 0,82) og det samme for Trail-Making Test B (sensitivitet mellom 0,70 og 0,77). To studier hadde rapportert resultater fra Montreal Cognitive Assessment med sensitivitet mellom 0,50 og 0,73. Vi har laget forest plot og Hierarchical Summary Receiver Operation Characteristic Curve (HSROC) plot for disse testene. Alle de andre studiene hadde brukt forskjellige kombinasjoner av utfallsmål. Her var det derfor ikke hensiktsmessig å slå sammen resultatene for diagnostisk nøyaktighet på tvers av studiene. Det var stor variasjon mellom studiene både for sensitivitet (SDSA: 0,30-0,88, UFOV: 0,48-0,89, klokketesten: 0,65-0,71, MMSE: 0,10-0,80, MoCa: 0,70-0,85, TMT-A: 0,40-0,82, TMT-B: 0,70-0,77) og spesifisitet (SDSA: 0,46-0,97, UFOV: 0,42-0,93, klokketesten: 0,42-0,98, MMSE: 0,60-0,98, MoCa: 0,50-0,73, TMT-A: 0,60-0,91, TMT-B: 0,49-0,68). Kvaliteten på dokumentasjonen ble i de fleste tilfeller vurdert til å være lav eller svært lav.
Diskusjon
Det er en svakhet i litteraturen at det ikke er standardiserte utfallsmål, noe som gjør det vanskelig å sammenfatte resultatene. For det første har studiene stort sett brukt ulike kombinasjoner av tester og testbatterier. For det andre har de studiene som har brukt de samme testene/ batteriene brukt ulike terskelverdier for å skille mellom bestått og ikke bestått test. Disse terskelverdiene er ofte generert slik at de er optimale i det aktuelle utvalget av personer i studien. Dette fører til at sensitivitet og spesifisitet blir kunstig høy. Det er en svakhet ved denne oversikten at vi ikke fant resultater på det ultimate utfallsmålet: ulykker i trafikken.