Kunstig intelligens i Mammografiprogrammet - en randomisert kontrollert studie
I forskningsprosjektet "Kunstig intelligens i Mammografiprogrammet - en randomisert kontrollert studie", også kalt AIMS Norway, undersøker vi om bruk av KI i sammen med røntgenleger kan være like bra eller bedre for å påvise brystkreft enn dagens standardprosedyre, der to røntgenleger vurderer bildene uavhengig av hverandre.
Om prosjektet
-
Prosjektperiode: 01.01.2022 - 31.12.2033 (Aktivt)
- Koordinerende institutt: Folkehelseinstituttet
-
Prosjektleder:
- Solveig Sand-Hanssen Hofvind, Folkehelseinstituttet
-
Prosjektdeltakere:
- Håkon Lund-Hanssen, St. Olavs Hospital HF
- Solveig Roth Hoff, Helse Møre og Romsdal HF
- Henrik Wethe Koch, Helse Stavanger HF - Stavanger universitetssjukehus
- Nataliia Moshina, Kreftregisteret
- Kristina Lång, Skånes universitetssjukhus
- Jonas Thy, Kreftregisteret
- Åsne Holen, Kreftregisteret
- Silje Sagstad, Kreftregisteret
- Edoardo Botteri, Kreftregisteret
- Jan F Nygård, Kreftregisteret
- Marthe Larsen, Kreftregisteret
- Tone Hovda, Vestre Viken HF
- Elin Bjørnson, Kreftregisteret
- Camilla Flåt Aglen, Kreftregisteret
Sammendrag
Formålet med prosjektet: Overordnet mål er å teste om en tydeprosedyre som inkluderer kunstig intelligens (KI) trygt kan redusere arbeidsmengden til radiologer i Mammografiprogrammet. Dette vil vi gjøre ved å sammenligne antall brystkrefttilfeller påvist blant kvinner som fikk sine mammografibilder tydet av KI og radiologer med antall brystkrefttilfeller påvist ved bruk av standard tydeprosedyre i Mammografiprogrammet (primærmål). Vi vil også sammenligne en rekke andre måleparametre, som er beskrivet som sekundære mål senere i søknaden og i protokollen Hvilke individer som skal inkluderes: Alle kvinner i alderen 50-69 år inviteres til mammografi i det offentlige screeningprogrammet for brystkreft, hvert annet år. Om lag 75% av de inviterte møter årlig. Vi ønsker å inkludere alle kvinner som møter til Mammografiprogrammet i Helse Midt-Norge. Resultater fra styrkeberegninger viser at vi trenger å inkludere 110 904 undersøkelser. Kvinner som tidligere har hatt brystkreft og/eller har brystimplantat vil ekskluderes fra studien. Hvilke data som skal inkluderes: Informasjon fra Transpara, en algoritme som bruker kunstig intelligens for å finne suspekte funn på mammografibildene, vil kobles sammen med informasjon fra Kreftregisteret (radiologenes tyding og resultatet fra screeningundersøkelsene). Transpara gir hver enkelt undersøkelse en skår fra 1 til 10, hvor 1 er lav risiko for brystkreft og 10 er høy risiko for sykdom. Radiologene gir bildene av hvert bryst en skår fra 1 til 5, hvor 1 betyr normale funn og 5 betyr høy sannsynlighet for brystkreft. Alle undersøkelser hvor en eller begge radiologer har gitt en skår på 2 eller høyere blir diskutert i konsensus hvor det blir bestemt om kvinnen skal kalles inn til tilleggsundersøkelser eller ikke. Hvilken metode skal anvendes?: Vi vil gjennomføre en RCT med non-inferior studiedesign. Kvinnene vil motta informasjon om studien sammen med invitasjon til screening. Det gis muligheter for å reservere seg mot deltakelse. Vi vil randomisere alle som ikke reserverer seg mot deltakelse i to grupper, en studie- og en kontrollgruppe. I kontrollgruppen skal to uavhengige radiologer tyde alle mammografibildene etter standard prosedyre i Mammografiprogrammet. Intervensjonen i studien er i tydeprosessen: i studiegruppen vil alle undersøkelser med KI-skår 1-5 bli tydet av én radiolog (Studiegruppe 1), og alle undersøkelser med skår 6-10 gjennomgå en uavhengig dobbelttyding (Studiegruppe 2). Radiologenes tydeskår er avgjørende for om undersøkelsen vil bli diskutert i konsensus eller ikke som ved vanlig prosedyre, uavhengig av KI-skår. Forutgående mammografibilder vil være tilgjengelig for radiologene ved tyding og konsensus i begge grupper, som vanlig. Konsensus vil bli utført som vanlig i kontrollgruppen, med tidligere bilder tilgjengelig. Samme prosedyre vil bli utført for studiegruppen, men her vil også KI-skåren og et "hot spot" fra KI være tilgjengelig for radiologene. Tilbakekallingsundersøkelse og oppfølging av positive funn vil bli utført som vanlig i begge grupper. Hvorfor vi vil benytte denne metoden: En RCT gir oss best mulighet for å kunne konkludere om intervensjonen som testes (en eller to radiologer tyder mammogramer basert på KI-skår) ikke er dårligere enn standard tydeprosedyre. Nytteverdien av prosjektet: Organisert mammografiscreening for kvinner i alderen 50-69 år er anbefalt av nasjonale og internasjonale helsemyndigheter da det er vist å redusere dødeligheten av brystkreft med mer enn 20%. Høyt kvalifiserte fagpersoner, brystradiologer, bruker mye tid på å tyde negative screeningbilder siden mer enn 99% av alle undersøkelsene er negative. Det er i dag stor mangel på radiologer i Norge og internasjonalt. Dersom KI kan benyttes til tyding av mammografibilder kan vi spare radiologressurser og samfunnsressurser. Den frikjøpte radiolotiden kan også benyttes mer effektiv til å utrede kvinner med klini
Bakgrunn
Når du deltar i Mammografiprogrammet, blir mammografibildene dine i dag vurdert av to røntgenleger, uavhengig av hverandre. Dette gir høy sikkerhet, men, siden de aller fleste som screenes ikke har brystkreft, innebærer dette også at legene bruker mye tid på vurdering av normale bilder.
Kunstig intelligens (KI) kan hjelpe legene med å oppdage brystkreft, og samtidig redusere arbeidsmengden deres. Studier har vist at KI kan finne like mange eller flere brystkrefttilfeller enn dagens standardprosedyre i Mammografiprogrammet, uten at dette fører til en økning i "falske alarmer", som vil si tilleggundersøkelser der det ikke blir påvist brystkreft. Samtidig kan bruk av KI betydelig redusere antall undersøkelser som må vurderes av to røntgenleger.
I denne studien, som vi kaller AIMS Norway (Artificial Intelligence in Mammography Screening in Norway) skal vi teste det CE-merkede KI-programmet Transpara som støtte i vurdering av screeningbilder i Mammografiprogrammet. At programmet er CE-merket betyr at det oppfyller europeiske krav til sikkerhet for medisinsk utstyr.
Hensikt
Hensikten med studien er å undersøke om KI, brukt sammen med én eller to røntgenleger i en ellers vanlig screeningsituasjon, er like bra eller bedre til å oppdage brystkreft på mammografibilder enn vanlig prosedyre i Mammografiprogrammet med uavhengig dobbelttyding.
Dersom KI kan bidra til å opprettholde eller forbedre kvaliteten på screeningtydingen, kan det bety at Mammografiprogrammet kan bruke legeressursene mer effektivt, uten at det går på bekostning av tryggheten for deg som deltar i programmet.
Gjennomføring
AIMS Norway gjennomføres som to delstudier, AIMS 1 og AIMS 2, der KI skal tas i bruk på litt ulike måter i de to delstudiene. Begge gjennomføres som randomiserte kontrollert studier. Det betyr at i begge delstudier vil halvparten av studiedeltakerne få mammografibildene sine vurdert av KI i kombinasjon med én eller to røntgenleger (studiegruppen), mens den andre halvparten vil få bildene sine vurdert av to røntgenleger etter standard prosedyre (kontrollgruppen).
Inndelingen i studie- eller kontrollgruppe er randomisert (tilfeldig), og skjer automatisk etter signering av samtykke. Dette betyr at det er tilfeldig om studiedeltakeren havner i studie- eller kontrollgruppen, og at verken deltakerne, radiografene som tar mammografibildene eller legene som vurderer bildene kan påvirke fordelingen.
Screeningundersøkelsen og eventuelle oppfølgende undersøkelser og behandling gjennomføres som vanlig, uavhengig av om du deltar i delstudiene eller ikke, og hvilken gruppe du eventuelt er i.
AIMS 1
I denne delstudien vil studiegruppen få mammografibildene sine vurdert av en eller to leger, avhengig av KI-programmets vurdering. De undersøkelsene som KI klassifiserer til å ha lav risiko for brystkreft, vil bli vurdert av én lege, mens de resterende med middels eller høy risiko vil bli vurdert av to (vanlig prosedyre).
Legene vil ikke ha tilgang til KI-resultatene når de vurderer bildene første gang. Kun hvis de ser noe mistenkelig, får de se KI-resultatene i et såkalt "konsensus-møte" der minst to leger diskuterer funnet og avgjør om deltagerne skal innkalles til videre undersøkelser.
I kontrollgruppen blir alle bildene vurdert av to røntgenleger, etter vanlig prosedyre. Også her vil KI-programmet analysere bildene, men resultatene fra KI vil først bli tilgjengelige etter at datainnsamlingen er avsluttet. Alle resultatene registreres i Kreftregisteret, FHI for senere analyser i studien.
Denne delstudien gjennomføres ved brystsentrene i Helse Vest, Helse Midt-Norge og Helse Nord. Alle som møter til screening i Mammografiprogrammet ved disse brystsentrene, vil bli spurt om å delta. De som ønsker å delta, må gi skriftlig samtykke. Dette blir du spurt om når du møter til screening.
AIMS 2
Også i denne delstudien vil mammografibildene i studiegruppen blir vurdert av én eller to røntgenleger, avhengig av risikovurderingen fra KI-programmet. Forskjellen er at her i AIMS 2 vil undersøkelser som KI klassifiserer til å ha lav til middels risiko for brystkreft, vil bli vurdert av én lege, mens undersøkelser klassifisert med høy risiko skal vurderes av to leger.
I tillegg vil røntgenlegene ha tilgang til KI-resultatene når de vurderer bildene første gang, og i konsensus-møtet i denne studien.
I kontrollgruppen blir alle undersøkelser vurdert av to røntgenleger, i henhold til vanlig prosedyre.
Denne delstudien skal gjennomføres i Helse Sør-Øst, ved brystsentrene i Vestre Viken og Oslo. Når studien starter, vil alle som møter til screening i Mammografiprogrammet ved disse sentrene bli spurt om å delta. De som ønsker å delta, må gi skriftlig samtykke.
Datagrunnlag
Studien vil kun bruke opplysninger om kvinner som har samtykket til å delta. I studien vil Kreftregisteret, FHI registrere og bruke opplysninger som KI-programmet gir om mammografibildene. Dette inkluderer en score som sier noe om sannsynligheten for at brystkreft er til stede i bildet.
I tillegg vil studien benytte opplysninger knyttet til oppmøte og funn på mammografibildene for alle som har samtykket til å delta i studien. Dette er opplysninger som lagres i Kreftregisteret etter vanlig prosedyre ved deltakelse i Mammografiprogrammet. Dette inkluderer informasjon om røntgenlegenes vurderinger, inkludert resultatet av screeningundersøkelsene (screeningopplysninger). Vi vil også bruke mammografibildene, som ligger i journalen, for å kvalitetssikre resultatene i studien.
Det vil være umulig å gjenkjenne enkeltpersoner i resultater som publiseres.
Organisering
Kreftregisteret, FHI er koordinerende institusjon med Solveig Hofvind som prosjektleder. Begge delstudiene er multisenterstudier, og både Kreftregisteret ved FHI og de samarbeidende helseforetakene er forskningsansvarlige i henhold til Helseforskningsloven. Partene har et selvstendig ansvar for organisering og utførelse av den delen av studien som gjennomføres i egen institusjon, og at dette skjer i henhold til relevant regelverk og formelle godkjenninger.
Kreftregisteret ved FHI er dataansvarlig i begge delstudiene. Dette innebærer ansvar for å innhente nødvendige godkjenninger, innsamling av data, monitorering av studiene, kvalitetssikring og analyser av datamaterialet, samt publisering og rapportering av resultatene.
Studien skal gjennomføres ved alle brystsentere i Helse Vest, Helse Midt-Norge og Helse Nord (AIMS 1) og ved Vestre Viken HF og Oslo universitetssykehus i Helse Sør-Øst (AIMS 2). Dette inkluderer 16 screeningenheter i tillegg til mammografibusser. Mammografibildene vil bli tydet av røntgenleger ved de ti inkluderte brystsentrene. IT-avdelingene ved de fire helseregionene vil bistå i installasjon og oppsett av KI-programmet i samarbeid med Kreftregisteret og PACS-leverandør (program for visning av røntgenbilder).
ScreenPoint Medical (Nederland) er selskapet som har utviklet KI-programmet (Tranpara) som skal brukes i begge delstudiene. De vil bistå med installasjon, samt opplæring i bruk av systemet.
Status
AIMS 1
Denne delstudien startet i Helse Vest i november 2024 med rekruttering av deltakere, og i Helse Midt-Norge i september 2025. Helse Nord vil inkluderes etter hvert.
Rekruttering av studiedeltakere vil pågå til studien har nådd et antall som gir god nok statistisk styrke til å vise om KI i kombinasjon med røntgenleger er like god eller bedre i vurdering av mammografibilder enn kun røntgenleger. Dette antallet er om lag 140 000 kvinner. Vi håper å nå dette antallet i løpet av 2026.
AIMS 2
Denne delstudien er i planleggingsfasen og vi arbeider med å etablere teknisk arbeidsflyt. Planlagt oppstart er i første halvdel av 2026. Målet er å inkludere om lag 40 000 kvinner.
Finansiering: Studien er finansiert gjennom midler fra Rosa sløyfe-aksjonen og gjennom forskningsmidler fra Helse Vest 2023, Helse Midt-Norge 2024, Helse Nord 2024 og Helse Sør-Øst 2025.
Varighet: 1.1.2023-31.12.2033
Samtykke
- Informasjon og samtykke AIMS 1 (nettside)
- Informasjons- og samtykkeskriv AIMS 1 (pdf).
- Generell informasjon om personvern i Kreftregisteret ved FHI
REK: Prosjektet er godkjent i Regionale komiteer for medisinsk helsefaglig forskningsetikk (REK), prosjektnr. 366405.
Samarbeidspartnere:
- Helse Vest, ved Helse Bergen, Helse Fonna, Helse Førde og Helse Stavanger
- Helse Midt, ved Helse Møre og Romsdal og St. Olavs hospital
- Helse Nord, ved Universitetssykehuset i Nord-Norge og Nordlandssykehuset
- Helse Sør-Øst, ved Vestre Viken HF og Oslo universitetssykehus
- ScreenPoint Medical, Nijmegen, Nederland
Publikasjoner
Koch HW, Bergan MB, Gjesvik J, Larsen M, Bartsch H, Haldorsen IHS, et al. Mammographic features in screening mammograms with high AI scores but a true-negative screening result. Acta Radiol. 2025.
Martiniussen MA, Larsen M, Hovda T, Kristiansen MU, Dahl FA, Eikvil L, et al. Performance of Two Deep Learning-based AI Models for Breast Cancer Detection and Localization on Screening Mammograms from BreastScreen Norway. Radiol Artif Intell. 2025:e240039.
Hovda T, Larsen M, Bergan MB, Gjesvik J, Akslen LA, Hofvind S. Retrospective evaluation of a CE-marked AI system, including 1 017 208 mammography screening examinations. Eur. Radiol. 2025.
Gjesvik J, Moshina N, Lee CI, Miglioretti DL, Hofvind S. Artificial Intelligence Algorithm for Subclinical Breast Cancer Detection. JAMA Network Open. 2024;7(10):e2437402-e.
Larsen M, Olstad CF, Lee CI, Hovda T, Hoff SR, Martiniussen MA, et al. Performance of an Artificial Intelligence System for Breast Cancer Detection on Screening Mammograms from BreastScreen Norway. Radiol Artif Intell. 2024;6(3):e230375.
Koch HW, Larsen M, Bartsch H, Martiniussen MA, Styr BM, Fagerheim S, et al. How do AI markings on screening mammograms correspond to cancer location? An informed review of 270 breast cancer cases in BreastScreen Norway. Eur Radiol. 2024;34(9):6158-67.
Bergan MB, Larsen M, Moshina N, Bartsch H, Koch HW, Aase HS, et al. AI performance by mammographic density in a retrospective cohort study of 99,489 participants in BreastScreen Norway. Eur Radiol. 2024.
Larsen M, Olstad CF, Koch HW, Martiniussen MA, Hoff SR, Lund-Hanssen H, et al. AI Risk Score on Screening Mammograms Preceding Breast Cancer Diagnosis. Radiology. 2023;309(1):e230989.
Koch HW, Larsen M, Bartsch H, Kurz KD, Hofvind S. Artificial intelligence in BreastScreen Norway: a retrospective analysis of a cancer-enriched sample including 1254 breast cancer cases. Eur Radiol. 2023;33(5):3735-43.
Larsen M, Aglen CF, Lee CI, Hoff SR, Lund-Hanssen H, Lang K, et al. Artificial Intelligence Evaluation of 122 969 Mammography Examinations from a Population-based Screening Program. Radiology. 2022;303(3):502-11.
Larsen M, Aglen CF, Hoff SR, Lund-Hanssen H, Hofvind S. Possible strategies for use of artificial intelligence in screen-reading of mammograms, based on retrospective data from 122,969 screening examinations. Eur Radiol. 2022;32(12):8238-46.