Fordeler og ulemper ved kunstig intelligens i Mammografiprogrammet
Gjennom retrospektive studier skal vi undersøke fordeler og ulemper ved å benytte kunstig intelligens i vurderingen av screeningbilder i Mammografiprogrammet.
Bakgrunn
Mammografiprogrammet er et offentlig tilbud til kvinner i alderen 50 til 69 år om mammografi hvert annet år. Hensikten med programmet er å oppdage brystkreft i et tidlig stadium, for at flere skal få mer skånsom behandling og færre dø av sykdommen.
De fleste kvinner som møter i Mammografiprogrammet har ikke brystkreft. Røntgenlegene som jobber i screeningprogrammet bruker dermed mye tid på å vurdere mammografibilder uten tegn til brystkreft.
De senere årene har flere studier vist at kunstig intelligens (KI) har et potensiale for å forbedre dagens mammografiprogram, blant annet som støtte for legene i vurdering av bilder. Med «kunstig intelligens» mener vi her digitale systemer som har blitt trent opp ved å analysere store datamengder over tid, og som dermed har lært å gjenkjenne mønstre i mammografibilder som kan være tegn til brystkreft.
Kreftregisteret ved FHI er i gang med flere studier for å teste ulike KI-verktøy i vurdering av screeningbilder i Mammografiprogrammet. I dette prosjektet benytter vi mammografibilder som allerede er vurdert av røntgenlegene, såkalt retrospektiv testing.
Hensikt
I dette prosjektet vil vi utforske fordeler og ulemper ved å bruke KI i vurdering av screeningbilder i Mammografiprogrammet. Det langsiktige målet er å tilby kvinner som deltar i programmet et forbedret screeningtilbud.
Delstudiene gjennomføres som retrospektive kohortstudier, hvor resultatene fra flere KI-verktøy skal sammenlignes med resultater fra røntgenlegenes vurderinger. Studiene er basert på screeningundersøkelser utført ved ulike brystsentre i Norge, se nedenfor.
Resultatene vil bidra med kunnskap om hvorvidt KI er av en slik kvalitet at det kan benyttes i Mammografiprogrammet. Resultatene vil også være viktige for å utforme og gjennomføre studier der KI brukes i reelle screeningsituasjoner (prospektiv testing), samt for å planlegge en framtidig innføring i programmet.
Datagrunnlag
KI-verktøyene vil bruke bildedata fra screeningundersøkelser i Mammografiprogrammet for å vurdere risiko for brystkreft. I studiene vil Kreftregisteret, FHI registrere og bruke opplysningene som KI-verktøyene gir om mammografibildene. Dette inkluderer en skår som sier noe om sannsynligheten for at brystkreft er til stede på bildene.
Studiene vil også inkludere screeningopplysninger fra undersøkelser utført ved ulike brystsentre i Mammografiprogrammet. Screeningopplysningene består blant annet av informasjon om oppmøte og resultat fra screeningundersøkelsen, inkludert røntgenlegenes vurderinger.
Bildedata og screeningopplysninger er hentet fra følgende brystsenter og tidsperioder:
- Helse Vest:
- Helse Bergen, 2008-2022
- Helse Stavanger, 2010-2019
- Helse Førde, 2017-2019
- Helse Midt-Norge:
- St. Olavs hospital, 2009-2018
- Helse Møre og Romsdal, 2011-2018
- Helse Nord:
- Universitetssykehuset i Nord-Norge, 2004-2018
- Helse Sør-Øst:
- Vestre Viken HF, 2008-2019
- Akershus universitetssykehus (Ahus), 2007-2021
- Sykehuset i Vestfold, 2004-2021
- Sørlandet sykehus, 2010-2019
- Sykehuset Østfold, 2008-2019
- Oslo universitetssykehus, 2005-2021
- Sykehuset Innlandet, 2009-2019
Studiene benytter kun data fra kvinner som ikke har reservert seg mot at opplysninger fra screeningundersøkelser med normalt funn skal lagres i Kreftregisteret, i henhold til kreftregisterforskriften. Kvinnene vil ikke bli kontaktet angående studiene, og det vil være umulig å gjenkjenne enkeltpersoner i resultater som publiseres.
Eksempler på delstudier
Vi gjennomfører flere delstudier for å kunne belyse ulike fordeler og ulemper ved bruk av KI i vurdering av screeningbilder. Eksempler på problemstillinger er:
- Hvordan KI risikovurderer screeningundersøkelser med normalt resultat og screeningundersøkelser der det har blitt påvist brystkreft
- Hvordan KI risikovurderer screeningundersøkelser som er gjennomført ved oppmøter forut for brystkreftdiagnose
- Sammenligninger av nyere og eldre versjoner av KI-verktøyene i hvordan de risikovurderer screeningundersøkelser
- Klarer KI å markere "riktig" område på mammografibildene, det vil si der brystkreft er påvist
- Hvordan KI-verktøyene klassifiserer ulike grader av mammografisk tetthet
Organisering
Kreftregisteret ved Folkehelseinstituttet er prosjektleder og forskningsansvarlig institusjon. Vi er ansvarlige for å innhente nødvendige godkjenninger, inngå avtaler med leverandører av KI-verktøy, samle inn bildedata og screeningopplysninger i delstudiene, installasjon og gjennomkjøring av bilder i KI-verktøyene, analysere datamaterialet og publisere resultater.
Helseforetakene ved brystsentrene er samarbeidspartnere i ulike delstudier. De er regionale spesialister på screening og diagnostikk av brystkreft. De bidrar blant annet med bildedata til studiene, samt radiologikompetanse og kunnskap om praktisk screening.
Ved Helse Stavanger og Sykehuset Østfold er det for tiden to doktorgradsstipendiater, Henrik Wethe Koch (Helse Stavanger) og Marit Almenning Martiniussen (Sykehuset Østfold), som arbeider med ulike delstudier.
Leverandørene av de ulike KI-verktøyene bistår med installasjon og opplæring i bruk av verktøyene. Leverandørene har ikke tilgang på personopplysninger i studiene, og de kan ikke påvirke resultatene som publiseres.
Status per september 2025
Prosjektet har innhentet nødvendige godkjenninger og inngått avtaler om å prøve ut KI-verktøy fra leverandørene ScreenPoint Medical, Lunit Inc. og Vara. Arbeidet med å samle inn bildedata, installere KI-verktøyene og kjøre de innsamlede bildedataene gjennom disse, er ferdig.
De fleste delstudiene er fullførte, mens andre er i sluttfasen. Foreløpig har arbeidet resultert i 11 vitenskapelige publikasjoner, og flere er under arbeid.
På bakgrunn av resultatene fra de første delstudiene har Kreftregisteret startet en studie, kalt AIMS Norway, der KI inkluderes som en del av bildevurderingen i en ellers normal screeningsituasjon.
Publikasjoner
Koch HW, Bergan MB, Gjesvik J, Larsen M, Bartsch H, Haldorsen IHS, et al. Mammographic features in screening mammograms with high AI scores but a true-negative screening result. Acta Radiol. 2025.
Martiniussen MA, Larsen M, Hovda T, Kristiansen MU, Dahl FA, Eikvil L, et al. Performance of Two Deep Learning-based AI Models for Breast Cancer Detection and Localization on Screening Mammograms from BreastScreen Norway. Radiol Artif Intell. 2025:e240039.
Hovda T, Larsen M, Bergan MB, Gjesvik J, Akslen LA, Hofvind S. Retrospective evaluation of a CE-marked AI system, including 1 017 208 mammography screening examinations. Eur. Radiol. 2025.
Gjesvik J, Moshina N, Lee CI, Miglioretti DL, Hofvind S. Artificial Intelligence Algorithm for Subclinical Breast Cancer Detection. JAMA Network Open. 2024;7(10):e2437402-e.
Larsen M, Olstad CF, Lee CI, Hovda T, Hoff SR, Martiniussen MA, et al. Performance of an Artificial Intelligence System for Breast Cancer Detection on Screening Mammograms from BreastScreen Norway. Radiol Artif Intell. 2024;6(3):e230375.
Koch HW, Larsen M, Bartsch H, Martiniussen MA, Styr BM, Fagerheim S, et al. How do AI markings on screening mammograms correspond to cancer location? An informed review of 270 breast cancer cases in BreastScreen Norway. Eur Radiol. 2024;34(9):6158-67.
Bergan MB, Larsen M, Moshina N, Bartsch H, Koch HW, Aase HS, et al. AI performance by mammographic density in a retrospective cohort study of 99,489 participants in BreastScreen Norway. Eur Radiol. 2024.
Larsen M, Olstad CF, Koch HW, Martiniussen MA, Hoff SR, Lund-Hanssen H, et al. AI Risk Score on Screening Mammograms Preceding Breast Cancer Diagnosis. Radiology. 2023;309(1):e230989.
Koch HW, Larsen M, Bartsch H, Kurz KD, Hofvind S. Artificial intelligence in BreastScreen Norway: a retrospective analysis of a cancer-enriched sample including 1254 breast cancer cases. Eur Radiol. 2023;33(5):3735-43.
Larsen M, Aglen CF, Lee CI, Hoff SR, Lund-Hanssen H, Lang K, et al. Artificial Intelligence Evaluation of 122 969 Mammography Examinations from a Population-based Screening Program. Radiology. 2022;303(3):502-11.
Larsen M, Aglen CF, Hoff SR, Lund-Hanssen H, Hofvind S. Possible strategies for use of artificial intelligence in screen-reading of mammograms, based on retrospective data from 122,969 screening examinations. Eur Radiol. 2022;32(12):8238-46.
Om prosjektet
Prosjektleder: Solveig Hofvind
Prosjektdeltakere:
- Marthe Larsen
- Åsne Holen
- Marie Burns Bergan
- Silje Sagstad
- Nataliia Moshina
Finansiering: Prosjektet er finansiert med Rosa sløyfe-midler gjennom Kreftforeningen og Brystkreftforeningen
Varighet: 01.03.2019 – 28.02.2029
REK: Prosjektet er godkjent i Regionale komiteer for medisinsk helsefaglig forskningsetikk (REK), 2018/2574.
Personvern: Generell informasjon om personvern i Kreftregisteret
Samarbeidende institusjoner
- Helse Bergen HF
- Helse Stavanger HF
- Helse Førde HF
- Oslo universitetssykehus HF
- Vestre Viken HF
- Sykehuset i Vestfold HF
- Sørlandet sykehus HF
- Universitetssykehuset i Nord-Norge HF
- Sykehuset Østfold HF
- St. Olavs hospital HF
- Sykehuset Innlandet HF
- Helse Møre og Romsdal HF
- Akershus universitetssykehus HF
Leverandører av KI-modeller