Fordeler og ulemper ved kunstig intelligens i Mammografiprogrammet
Gjennom retrospektive studier skal vi undersøke fordeler og ulemper ved å benytte kunstig intelligens i vurderingen av screeningbilder i Mammografiprogrammet.
Om prosjektet
-
Prosjektperiode: 01.03.2019 - 28.02.2029 (Aktivt)
- Koordinerende institutt: Folkehelseinstituttet
-
Prosjektleder:
- Solveig Sand-Hanssen Hofvind, Folkehelseinstituttet
-
Prosjektdeltakere:
- Camilla Flåt Olstad, Kreftregisteret
- Anders Skyrud Danielsen, Kreftregisteret
- Åsne Sørlien Holen, Kreftregisteret
- Silje Sagstad, Kreftregisteret
- Kaitlyn Michiko Tsuruda, Kreftregisteret
Sammendrag
Prosjektets hovedmålsetting er å kombinere automatisk analyse med radiologisk ekspertise, ved å integrere et maskinlæringssystem i tydingen av screeningmammogrammer. I dag bruker radiologer mye tid på å tyde mammogrammer til friske kvinner. Ved å benytte maskinlæring i tydeprosessen kan screeningprosessen effektiviseres og arbeidsmengden til radiologene reduseres, slik at de kan bruke mer tid på kvinner med mistanke om brystkreft. Prosjektet vil gjennomføres i to deler: Del 1 er en retrospektiv studie hvor programvaren testes på screeningundersøkelser som allerede er gjennomført og hvor resultatet testes opp mot radiologenes tyderesultater. Dersom det viser seg at systemet ikke har en dårligere tydeevne enn radiologer vil vi gjennomføre Del 2, hvor kvinner som møter i Mammografiprogrammet vil bli forespurt om deltakelse i en randomisert kontrollert studie hvor de blir tilbudt screening med vanlig tyding eller med vanlig tyding pluss maskinlesing. Endringsmelding vil bli sendt REK.
Bakgrunn
Mammografiprogrammet er et offentlig tilbud til kvinner i alderen 50 til 69 år om mammografi hvert annet år. Hensikten med programmet er å oppdage brystkreft i et tidlig stadium, for at flere skal få mer skånsom behandling og færre dø av sykdommen.
De fleste kvinner som møter i Mammografiprogrammet har ikke brystkreft. Røntgenlegene som jobber i screeningprogrammet bruker dermed mye tid på å vurdere mammografibilder uten tegn til brystkreft.
De senere årene har flere studier vist at kunstig intelligens (KI) har et potensiale for å forbedre dagens mammografiprogram, blant annet som støtte for legene i vurdering av bilder. Med «kunstig intelligens» mener vi her digitale systemer som har blitt trent opp ved å analysere store datamengder over tid, og som dermed har lært å gjenkjenne mønstre i mammografibilder som kan være tegn til brystkreft.
Kreftregisteret ved FHI er i gang med flere studier for å teste ulike KI-verktøy i vurdering av screeningbilder i Mammografiprogrammet. I dette prosjektet benytter vi mammografibilder som allerede er vurdert av røntgenlegene, såkalt retrospektiv testing.
Hensikt
I dette prosjektet vil vi utforske fordeler og ulemper ved å bruke KI i vurdering av screeningbilder i Mammografiprogrammet. Det langsiktige målet er å tilby kvinner som deltar i programmet et forbedret screeningtilbud.
Delstudiene gjennomføres som retrospektive kohortstudier, hvor resultatene fra flere KI-verktøy skal sammenlignes med resultater fra røntgenlegenes vurderinger. Studiene er basert på screeningundersøkelser utført ved ulike brystsentre i Norge, se nedenfor.
Resultatene vil bidra med kunnskap om hvorvidt KI er av en slik kvalitet at det kan benyttes i Mammografiprogrammet. Resultatene vil også være viktige for å utforme og gjennomføre studier der KI brukes i reelle screeningsituasjoner (prospektiv testing), samt for å planlegge en framtidig innføring i programmet.
Datagrunnlag
KI-verktøyene vil bruke bildedata fra screeningundersøkelser i Mammografiprogrammet for å vurdere risiko for brystkreft. I studiene vil Kreftregisteret, FHI registrere og bruke opplysningene som KI-verktøyene gir om mammografibildene. Dette inkluderer en skår som sier noe om sannsynligheten for at brystkreft er til stede på bildene.
Studiene vil også inkludere screeningopplysninger fra undersøkelser utført ved ulike brystsentre i Mammografiprogrammet. Screeningopplysningene består blant annet av informasjon om oppmøte og resultat fra screeningundersøkelsen, inkludert røntgenlegenes vurderinger.
Bildedata og screeningopplysninger er hentet fra følgende brystsenter og tidsperioder:
- Helse Vest:
- Helse Bergen, 2008-2022
- Helse Stavanger, 2010-2019
- Helse Førde, 2017-2019
- Helse Midt-Norge:
- St. Olavs hospital, 2009-2018
- Helse Møre og Romsdal, 2011-2018
- Helse Nord:
- Universitetssykehuset i Nord-Norge, 2004-2018
- Helse Sør-Øst:
- Vestre Viken HF, 2008-2019
- Akershus universitetssykehus (Ahus), 2007-2021
- Sykehuset i Vestfold, 2004-2021
- Sørlandet sykehus, 2010-2019
- Sykehuset Østfold, 2008-2019
- Oslo universitetssykehus, 2005-2021
- Sykehuset Innlandet, 2009-2019
Studiene benytter kun data fra kvinner som ikke har reservert seg mot at opplysninger fra screeningundersøkelser med normalt funn skal lagres i Kreftregisteret, i henhold til kreftregisterforskriften. Kvinnene vil ikke bli kontaktet angående studiene, og det vil være umulig å gjenkjenne enkeltpersoner i resultater som publiseres.
Eksempler på delstudier
Vi gjennomfører flere delstudier for å kunne belyse ulike fordeler og ulemper ved bruk av KI i vurdering av screeningbilder. Eksempler på problemstillinger er:
- Hvordan KI risikovurderer screeningundersøkelser med normalt resultat og screeningundersøkelser der det har blitt påvist brystkreft
- Hvordan KI risikovurderer screeningundersøkelser som er gjennomført ved oppmøter forut for brystkreftdiagnose
- Sammenligninger av nyere og eldre versjoner av KI-verktøyene i hvordan de risikovurderer screeningundersøkelser
- Klarer KI å markere "riktig" område på mammografibildene, det vil si der brystkreft er påvist
- Hvordan KI-verktøyene klassifiserer ulike grader av mammografisk tetthet
Organisering
Kreftregisteret ved Folkehelseinstituttet er prosjektleder og forskningsansvarlig institusjon. Vi er ansvarlige for å innhente nødvendige godkjenninger, inngå avtaler med leverandører av KI-verktøy, samle inn bildedata og screeningopplysninger i delstudiene, installasjon og gjennomkjøring av bilder i KI-verktøyene, analysere datamaterialet og publisere resultater.
Helseforetakene ved brystsentrene er samarbeidspartnere i ulike delstudier. De er regionale spesialister på screening og diagnostikk av brystkreft. De bidrar blant annet med bildedata til studiene, samt radiologikompetanse og kunnskap om praktisk screening.
Ved Helse Stavanger og Sykehuset Østfold er det for tiden to doktorgradsstipendiater, Henrik Wethe Koch (Helse Stavanger) og Marit Almenning Martiniussen (Sykehuset Østfold), som arbeider med ulike delstudier.
Leverandørene av de ulike KI-verktøyene bistår med installasjon og opplæring i bruk av verktøyene. Leverandørene har ikke tilgang på personopplysninger i studiene, og de kan ikke påvirke resultatene som publiseres.
Status per september 2025
Prosjektet har innhentet nødvendige godkjenninger og inngått avtaler om å prøve ut KI-verktøy fra leverandørene ScreenPoint Medical, Lunit Inc. og Vara. Arbeidet med å samle inn bildedata, installere KI-verktøyene og kjøre de innsamlede bildedataene gjennom disse, er ferdig.
De fleste delstudiene er fullførte, mens andre er i sluttfasen. Foreløpig har arbeidet resultert i 11 vitenskapelige publikasjoner, og flere er under arbeid.
På bakgrunn av resultatene fra de første delstudiene har Kreftregisteret startet en studie, kalt AIMS Norway, der KI inkluderes som en del av bildevurderingen i en ellers normal screeningsituasjon.
Referanselitteratur
Koch HW, Bergan MB, Gjesvik J, Larsen M, Bartsch H, Haldorsen IHS, et al. Mammographic features in screening mammograms with high AI scores but a true-negative screening result. Acta Radiol. 2025.
Martiniussen MA, Larsen M, Hovda T, Kristiansen MU, Dahl FA, Eikvil L, et al. Performance of Two Deep Learning-based AI Models for Breast Cancer Detection and Localization on Screening Mammograms from BreastScreen Norway. Radiol Artif Intell. 2025:e240039.
Hovda T, Larsen M, Bergan MB, Gjesvik J, Akslen LA, Hofvind S. Retrospective evaluation of a CE-marked AI system, including 1 017 208 mammography screening examinations. Eur. Radiol. 2025.
Gjesvik J, Moshina N, Lee CI, Miglioretti DL, Hofvind S. Artificial Intelligence Algorithm for Subclinical Breast Cancer Detection. JAMA Network Open. 2024;7(10):e2437402-e.
Larsen M, Olstad CF, Lee CI, Hovda T, Hoff SR, Martiniussen MA, et al. Performance of an Artificial Intelligence System for Breast Cancer Detection on Screening Mammograms from BreastScreen Norway. Radiol Artif Intell. 2024;6(3):e230375.
Koch HW, Larsen M, Bartsch H, Martiniussen MA, Styr BM, Fagerheim S, et al. How do AI markings on screening mammograms correspond to cancer location? An informed review of 270 breast cancer cases in BreastScreen Norway. Eur Radiol. 2024;34(9):6158-67.
Bergan MB, Larsen M, Moshina N, Bartsch H, Koch HW, Aase HS, et al. AI performance by mammographic density in a retrospective cohort study of 99,489 participants in BreastScreen Norway. Eur Radiol. 2024.
Larsen M, Olstad CF, Koch HW, Martiniussen MA, Hoff SR, Lund-Hanssen H, et al. AI Risk Score on Screening Mammograms Preceding Breast Cancer Diagnosis. Radiology. 2023;309(1):e230989.
Koch HW, Larsen M, Bartsch H, Kurz KD, Hofvind S. Artificial intelligence in BreastScreen Norway: a retrospective analysis of a cancer-enriched sample including 1254 breast cancer cases. Eur Radiol. 2023;33(5):3735-43.
Larsen M, Aglen CF, Lee CI, Hoff SR, Lund-Hanssen H, Lang K, et al. Artificial Intelligence Evaluation of 122 969 Mammography Examinations from a Population-based Screening Program. Radiology. 2022;303(3):502-11.
Larsen M, Aglen CF, Hoff SR, Lund-Hanssen H, Hofvind S. Possible strategies for use of artificial intelligence in screen-reading of mammograms, based on retrospective data from 122,969 screening examinations. Eur Radiol. 2022;32(12):8238-46.