Behandlinger av relapserende og/eller refraktær myelomatose: En fullstendig metodevurdering
Metodevurdering
|Publisert
Folkehelseinstituttet fikk i oppdrag fra Bestillerforum for Nye Metoder å utføre en fullstendig metodevurdering av farmakologisk behandling av myelomatose.
Hovedbudskap
I den første versjonen av denne rapporten ble kildene for prisene på Ixasomib og Isatuximab ved et uhell byttet om i tabell 19, side 96. Dette ble korrigert 25. april 2023.
I PDF-filen er priser sladdet av hensyn til konfidensialitet for produsent. I teksten under kommer sladdingen fram som X.
Myelomatose er den nest vanligste blodkrefttypen, med omtrent 450 nye tilfeller årlig i Norge. Det finnes ingen kur for myelomatose, og behandlingsmålet er derfor å oppnå så god effekt som mulig, uten uakseptable bivirkninger, samt at pasientens livskvalitet opprettholdes gjennom behandlingen.
Vi inkluderte data fra fem utfallsmål: totaloverlevelse, livskvalitet, alvorlige uønskede hendelser, progresjonsfri overlevelse, og avbrutt behandling som følge av uønskede hendelser, hvor totaloverlevelse er det primære utfallsmålet. Ettersom det ikke var tilgjengelige data for alle behandlingsregimer og utfallsmål, mener vi at det ikke er mulig å fastslå om ett behandlingsregime er overlegen de andre med hensyn på alle utfallsmål. De følgende seks trippelkombinasjonene er eksempler på behandlingsregimer med gunstige hasard ratioer for totaloverlevelse, og som også er høyt rangert med hensyn på andre utfallsmål:
- [EP + d]: elotuzumab (E), pomalidomid (P) og deksametason (d)
- [IsP + d]: isatuksimab (Is), pomalidomid (P), og deksametason (d)
- [DK + d]: daratumumab (D), karfilzomib (K), og deksametason (d)
- [KR + d]: karfilzomib (K), lenalidomid (R), og deksametason (d)
- [DR + d]: daratumumab (D), lenalidomid (R), og deksametason (d)
- [DV + d]: daratumumab (D), bortezomib (V), og deksametason (d)
Den helseøkonomiske analysen baserte seg på en “partitioned survival analysis” for å beregne totale kostnader (i NOK), helsegevinst (i QALYs), og kostnadseffektbrøk (incremental-cost-effectiveness-ratio, ICER) for de aktuelle behandlingsalternativene. Vi grupperte behandlingsregimene i tre separate grupper, hver basert på det relevante referanseregimet, for å kunne utføre analysen. Vi brukte hasard ratioer fra nettverksmetaanalysen for å utarbeide kurver for totaldødelighet og progresjonsfri overlevelse, som inngikk i modellen. Resultatene fra den helseøkonomiske analysen var :
- I [R + d] gruppen var [R + d] det behandlingsregimet som hadde lavest kostnader, NOK X, med en helsegevinst på 2,90 QALYs . Bare to andre behandlingsregimer var ikke dominert av andre behandlingsregimer: [IR + d] hadde en kostnad på NOK X, 3,82 QALYs, og ICER på NOK X, sammenliknet med [R + d]. [DR + d] hadde en kostnad på NOK X, 4,31 QALYs, og en ICER på NOK X, sammenliknet med [IR + d].
- I [V + d] gruppen var både [V + d] og [DV + d] ikke dominert av andre behandlingsregimer: [DV + d] hadde en kostnad på NOK X, 3,63 QALYs, og en ICER på NOK X, sammenliknet med [V + d].
- I [P + d] gruppen var både [P + d] og [EP + d] ikke dominert av andre behandlingsregimer: [P + d] hadde en kostnad på NOK X, og 0,81 QALYs. [EP + d] hadde en kostnad på NOK X, 1,39 QALYs, og en ICER på NOK X.
Det svært stor usikkerhet knyttet til disse resultatene, og vi har svært lav tillit til rangeringer av disse behandlingsregimene. Vi foreslår derfor å vektlegge sammenlikninger fra direkte estimater fra randomiserte studier, hvor slike finnes.
Resultatene av kost-nytteanalysen bør regnes som høyst usikre på grunn av mangel på tilgang til individdata samt usikkerheten som hefter ved resultatene fra nettverksmetaanalysen som inngår i de helseøkonomiske beregningene. Våre resultater kan ikke brukes til å fastslå den beste behandlingsrekkefølgen for pasienter med relapserende og/eller refraktær myelomatose.
Sammendrag
Innledning
Myelomatose er den nest vanligste typen blodkreft, med nesten 450 nye tilfeller i Norge hvert år. Median alder ved diagnose er ca. 70 år, og sykdommen er svært sjelden blant personer under 30 år. Myelomatose kjennetegnes av ukontrollert vekst av plasmacellene i benmargen. Det er foreløpig ingen kur for myelomatose, og behandlingsmålet er å oppnå en forbedret overlevelse, fortrinnsvis med høy livskvalitet, og uten sykdomsprogresjon eller uakseptable bivirkninger.
Hensikt
Å undersøke klinisk effekt, sikkerhet, samt kostnadseffektivitet av sykdomsmodifiserende legemidler til behandling av myelomatose med tilbakefall (relapserende myelomatose), og/eller som er behandlingsrefraktær for minst en tidligere behandling (RRMM), satt i en norsk kontekst.
Effekt og sikkerhet
Metode
Vi har systematisk samlet og oppsummert evidens for klinisk effekt og sikkerhet for sykdomsmodifiserende behandling av RRMM, i henhold til PRISMA-reglene. Relevante publikasjoner fra randomiserte kontrollerte studier ble identifisert gjennom systematiske oversikter fra vår tidligere kartleggingsrapport, samt gjennom systematiske søk. Inklusjonskriteriene var personer over 18 år diagnostisert med myelomatose som enten var behandlingsrefraktære eller som hadde erfart ett eller flere tilbakefall. Behandlingen (intervensjonen) var medikamentene som er listet opp nedenfor; alene eller i kombinasjon med hverandre og/eller med et glukokortikoid som for eksempel deksametason, sammenliknet med ett av intervensjonsmedikamentene alene, eller i kombinasjon med hverandre, eller i kombinasjon med andre medikamenter.
Legemiddelbehandlinger som er nevnt i oppdraget og i prosjektplan:
Fork. |
Virkestoff |
D |
Daratumumab |
E |
Elotuzumab |
F |
Panobinostat (Farydak) |
I |
Iksazomib |
Is |
Isatuksimab |
K |
Karfilzomib |
P |
Pomalidomid |
R |
Lenalidomid (Revlimid) |
V |
Bortezomib (Velcade) |
De primære utfallsmålene var totaloverlevelse, helserelatert livskvalitet og alvorlige uønskede hendelser der totaloverlevelse var det viktigste primære utfallsmålet. Sekundære utfallsmål var progresjonsfri overlevelse, uønskede hendelser og avbrutt behandling på grunn av uønsket hendelse. Vi brukte vurderingen av risiko for systematiske skjevheter (risk of bias) fra den systematiske oversikten for studiene som vi hadde inkludert fra denne, og gjennomførte vår egen vurdering for de resterende studiene. Alle utfallsmål ble analysert i en nettverksmetaanalyse. Vi har presentert data for legemiddelbehandlinger nevnt i bestillingen, i tillegg til legemiddelbehandlinger som har blitt brukt som komparator i de inkluderte studiene. Vi vurderte tilliten til resultatene ved hjelp av GRADE-tilnærmingen (Grading of Recommendations Assessment, Development and Evaluation) som uttrykkes som høy, middels, lav, og svært lav, avhengig av hvor stor tillit vi har til effektestimatene.
Resultat
Vi inkluderte 72 artikler fra 50 randomiserte, kontrollerte studier, som alle undersøkte effekt av ulike behandlingsregimer som inneholdt ett til tre sykdomsmodifiserende legemidler, og gjennomførte en komponent metaanalyse på opp til 34 randomiserte, kontrollerte studier, 12 873 randomiserte pasienter og 31 behandlinger.
Radardiagrammene under illustrerer de samlede resultatene med hensyn på effekt og sikkerhet for hvert av behandlingsregimene på tvers av alle utfallsmål. Hvert enkelt radardiagram presenterer tilgjengelig P-score for de ulike utfallsmålene, for hvert behandlingsregime, som en polygon (farget). P-score uttrykker med gjennomsnittlig grad av sikkerhet at et behandlingsregime er overlegent alle andre inkluderte behandlingsregimer i den underliggende metaanalysen (det vil si med hensyn på ett enkelt utfallsmål, for eksempel totaloverlevelse). Uformelt tolkes dette som sannsynligheten for at et behandlingsregime er «best». Et behandlingsregime med en P-score nær 100% kan tolkes som å være overlegent (med hensyn på lenger overlevelse, bedre livskvalitet, færre alvorlige uønskede hendelser, lenger progresjonsfri overlevelse, eller færre avbrutte behandlinger som følge av uønskede hendelser) et behandlingsregime med lav P-score, nær 0%. I radardiagrammene vil behandlingsregimer med polygoner med større areal generelt sett være bedre enn behandlinger med polygoner med mindre areal. Denne tolkningen kan imidlertid være misvisende ettersom data ikke er tilgjengelige for alle behandlinger og utfallsmål. Det er derfor mulig for svært effektive behandlingsregimer å ha små areal i diagrammene som følge av manglende data. Ved sammenlikning av resultater for ulike behandlingsregimer bør man være varsom med å tolke effekt kun ut fra arealene i diagrammene.
Det er vanskelig å kunne slå fast om ett behandlingsregime overgår de andre når en tar hensyn til alle utfallsmål. Radardiagrammene for [P + d] er eksempler på legemiddelregimer som har store polygonareal i diagrammene. Dette burde indikere bedre effekt og sikkerhet enn behandlingsregimer med mindre areal, f.eks. [DR + d]. Når man ser nøyere på de individuelle P-scorene, finner man imidlertid at [P + d] har lavere P-score for totaloverlevelse enn [DR + d]. Basert på dette vil vi forvente lenger overlevelse ved behandling med [DR + d] enn ved [P + d]. Mens radardiagram kan være nyttige for å forstå balansen mellom effekt og sikkerhet, bør de ikke tolkes isolert, uten resultattabellene. Sammenlikning av de ulike behandlingsregimene vanskeliggjøres ytterligere som følge av at vår tiltro til resultatene varierer stort på tvers av behandlingsregimer og utfallsmål. Vi vurderte stort sett tiltroen til evidensen for at én behandling er bedre enn en annen, til å være lav eller svært lav, med enkelte unntak.
De seks legemiddelbehandlingene [EP + d], [IsP + d], [DK + d], [KR + d], [DR + d] og [ER + d] er eksempler på relevante behandlingsregimer for ikke-refraktære pasienter som har gunstige hasard ratioer for totaloverlevelse, og som også er høyt rangert med hensyn på andre utfallsmål.
Radar diagram for behandlingsregimer relevante for ikke-refraktære pasienter
Radardiagrammene viser behandlingsregimer som er relevante for Norge. D: daratumumab, d: deksametason, Disc.: avsluttet behandling som følge av uønskede hendelser (risikoratio), Dox: doxorubicin, E: elotuzumab, F: panobinostat, I: ixazomib, Is: isatuximab, K: carfilzomib, OS: totaloverlevelse (hasardratio), P: pomalidomid, PFS: progresjonsfri overlevelse (hasardratio), QLQ-C30: livskvalitet (forskjell i gjennomsnittsscore), R: lenalidomide, SAE: alvorlige uønskede hendelser (insidensrateratio), V: bortezomib. Radardiagrammene oppsummerer effekt og sikkerhet, men reflekterer ikke vurdering av tiltro til evidensen eller resultater av den helseøkonomiske analysen.
Helseøkonomisk evaluering
Metode
Vi utførte en kost-nytteanalyse av 13 behandlingsregimer for pasienter med RRMM, hvor helsegevinst ble målt i form av kvalitetsjusterte leveår (QALYs), kostnader i norske kroner (NOK) og resultatene ble presentert som kostnadseffektbrøker (incremental-cost-effectiveness-ratios, ICERs). Vi valgte å benytte en «partitioned survival analysis»-modell i TreeAge for å utføre analysen. Partitioned survival analysis brukes gjerne for å modellere kost-nytteforholdet for kreftbehandlinger fordi Kaplan-Meierplot av kurver for total dødelighet og progresjonsfri overlevelse fra kliniske studier kan brukes for å følge pasienter gjennom tre helsetilstander: Progresjonsfri, progrediert og død.
Overvelseskurver og helsetilstander i partition survival analysis
OS – PFS = Progressed, PFS = Progression Free, OS = Alive (Progressed + Progression Free)
Uten tilgang til individdata er det ikke mulig å framstille godt tilpassede overlevelseskurver for hvert behandlingsregime i modellen. I stedet benyttet vi en vanlig teknikk for kost-nytteanalyser der vi framstiller en overlevelseskurve for komparator-regimet i analysen for deretter å framstille tilsvarende kurver for de aktuelle behandlingsregimene ved å anvende hasard ratioer fra en metaanalyse på komparatorens overlevelseskurve.
Ettersom hasard ratioer fra total- og progresjonsfri-overlevelse ble hentet fra nettverksmetaanalysen i den kliniske effektdelen av denne rapporten, hadde vi ingen «komparator» i konvensjonell forstand. I en nettverksmetaanalyse kan alle behandlingsregimene ses på som «referansebehandlinger», fordi matrisen av resultater fra analysene genererer en hasard ratio for hvert behandlingsregime i forhold til alle andre behandlingsregimer som inngår i analysen. Basert på råd fra klinisk ekspertise, delte vi den økonomiske modellen inn i tre undergrupper, hver basert på ett av tre referanseregimer: lenalidomid (Evlimid) + deksametason [R + d], bortezomib (Velcade) + deksametason [V + d], og pomalidomid + deksametason [P + d].
[R + d] gruppen omfattet: [R + d] , [DR + d], [RK + d], [ER + d] og [IR + d].
[V + d]-gruppen omfattet: [V + d], [DK + d], [K + d], [FV + d] og [DV + d].
[P + d]-gruppen omfattet: [P + d], [EP + d] og [IsP + d].
Kostnader som inngikk i analysen inkluderte: 1) legemiddelkostnader, 2) tidsbruk for apotek- og pleiepersonale for forberedelse and administrering av medikamenter ved injeksjon eller infusjon, 3) tidsbruk for legebesøk og prøver tatt ved rutinekontroller, og 4) pasientenes tids- og reisekostnader knyttet til behandlingen. Vi var ikke i stand til å inkludere kostnader som følge av alvorlige uønskede hendelser ettersom disse ikke var konsekvent rapportert fra de kliniske studiene. Dette hadde neppe vesentlig innflytelse på resultatene fordi disse kostnadene er lave sammenliknet med legemiddelkostnadene.
For å ta høyde for usikkerhet assosiert med variablene som inngikk i modellen (hasard ratioer, nyttevekt for livskvalitet og behandlingskostnader) kjørte vi modellen som en probabilistisk sensitivitetsanalyse med 10 000 tilfeldige trekk ved Monte Carlo-repetisjoner. Modellen gjorde det også mulig å beregne absolutt prognosetap – variabelen som brukes til å fastsette en sykdoms alvorlighetsgrad. Vi gjennomførte også en enveis sensitivitetsanalyse for å avklare hvilke av variablene som hadde størst innflytelse på resultatene.
Resultater
Vi rapporterer kost-nytte-resultater for behandlingsregimer i hver referansegruppe, som ikke var dominert av et annet behandlingsregime. En behandling regnes som dominert hvis den har høyere totalkostnader og gir lavere helsegevinst en annen behandling (summer er oppgitt som X da det av koer av konkurransemessig betydning å hemmeligholde summene).
I [R + d] gruppen var [R + d] det behandlingsregimet som hadde lavest kostnader, NOK X, med en helsegevinst på 2,90 QALYs . Bare to andre behandlingsregimer var ikke dominert av andre behandlingsregimer: [IR + d] hadde en kostnad på NOK X, 3,82 QALYs, og ICER på NOK X, sammenliknet med [R + d]. [DR + d] hadde en kostnad på NOK X, 4,31 QALYs, og en ICER på NOK X, sammenliknet med [IR + d]. I [V + d] gruppen var både [V + d] og [DV + d] ikke dominert av andre behandlingsregimer: [DV + d] hadde en kostnad på NOK X, 3,63 QALYs, og en ICER på NOK X, sammenliknet med [V + d]. I [P + d] gruppen var både [P + d] og [EP + d] ikke dominert av andre behandlingsregimer: [P + d] hadde en kostnad på NOK X, og 0,81 QALYs. [EP + d] hadde en kostnad på NOK X, 1,39 QALYs, og en ICER på NOK X. I tillegg til kost-nytteresultatene gav den helseøkonomiske analysen estimater for gjennomsnittlig absolutt prognosetap for behandlingsregimene i hver referansegruppe. Disse var relativt like i hver referansegruppe: fra 12,46 til 14,95 tapte friske leveår.
Diskusjon
Effekt og sikkerhet
Rapporten har begrenset evidens for hvert av behandlingsregimene. Ettersom de inkluderte studiene definerte frakoblede nettverk, måtte vi bruke komponent nettverksmetaanalyse, og vi kunne derfor ikke formelt teste antakelsen om at behandlingsregimene kan modelleres på denne måten. Inklusjon av umodne data i analysene kan potensielt ha introdusert bias i rapporten som følge av selektiv rapportering. Det er sannsynlig at modnere data vil kunne føre til andre metaanalyse resultater, og sikrere antakelser om evidensen.
De fleste inkluderte RCTer er internasjonale studier, hovedsakelig er gjennomført i Nord-Amerika og Europa. Resultatene for totaloverlevelse ved behandling med behandlingsregimene [IR + d] og [DV + d] er imidlertid kun basert på én liten, kinesisk studie, og én stor internasjonal studie, hvor det var forskjeller i behandlingen som ble tilbudt pasienter med sykdomsprogresjon, noe som gjør det vanskelig å tolke resultatene. Det var også etniske og andre forskjeller i studiepopulasjonene. Det er rapportert etniske forskjeller i insidens av myelomatose og sykdomsaggressivitet. I tillegg har etnisitet vist seg å påvirke legemiddelrespons i kreftbehandling ved andre kreftformer. Vi vet imidlertid ikke om eller i hvilken grad dette også gjelder for RRMM. På bakgrunn av dette bør resultatet vårt for totaloverlevelse tolkes med forsiktighet.
Ideelt sett bør fremtidige studier direkte sammenlikne mer effektive trippelregimer fremfor å bruke mindre effektive dobbelregimer som kontroll. Det kan være vanskelig å gjennomføre overlegenhetsstudier med tilstrekkelig styrke dersom man skal sammenlikne behandlingsregimer med veldig lik effekt, men ikke-underlegenhetsstudier kan være nyttige.
Helseøkonomisk evaluering
Det er betydelig usikkerhet knyttet til resultatene fra den helseøkonomiske analysen. Noe av denne usikkerheten skyldes at vi måtte basere oss på resultatene fra nettverksmetaanalysen for beregning av de kliniske effektene av de forskjellige behandlingsregimene. Kildene til usikkerhet i nettverksmetaanalysen er beskrevet over. I tillegg er det usikkerhet knyttet til metodene vi benyttet for å beregne overlevelseskurvene for referansebehandlingene. Mangelen på tilgang til individdata medførte at vi ikke kunne ta høyde for korrelasjon mellom progresjonsfri og total overlevelse. Dette er viktig fordi det begrenser vår mulighet til å tilpasse de delene av overlevelseskurvene som går utover studieperiodene. I den grad vi ikke var i stand til å ta høyde for dosereduksjoner i løpet av behandlingen kan vi også ha overestimert behandlingskostnadene.
Konklusjon
Det er ikke mulig å trekke klare, korte konklusjoner, av flere årsaker, inkludert høy grad av usikkerhet på tvers av de fleste resultatene; behov for samlet vurdering av flere ulike utfallsmål; samt ulike hensyn på tvers av subgrupper av pasienter (f.eks. pasienter som er refraktære mot ulike legemidler). Ingen av behandlingsregimene utpeker seg som bedre enn de andre med hensyn på alle utfallsmål. De seks legemiddelbehandlingene [EP + d], [IsP + d], [DK + d], [KR + d], [DR + d] og [ER + d] er eksempler på relevante behandlingsregimer for ikke-refraktære pasienter, som ser ut til å ha gunstige hasard ratioer for totaloverlevelse, og som også er høyt rangert med hensyn på andre utfallsmål. Det er imidlertid viktig å merke seg den store usikkerheten i kunnskapsgrunnlaget for disse resultatene. Vi foreslår derfor å vektlegge sammenlikninger fra direkte estimater fra randomiserte studier, hvor slike finnes.
Kost-nytteresultatene må vurderes innenfor rammene av hver referansegruppene, ettersom sammenlikning av behandlingsregimer ikke ble gjort på tvers av referansegruppe. I alt var det kun sju behandlingsregimer som ikke var dominert av andre behandlingsregimer: [R + d], [IR + d] og [DR + d] i [R + d]-gruppen; [V + d] og [DV + d] i [V +d]-gruppen; og [P + d] og [EP + d] i [P + d]-gruppen. ICER for disse behandlingsregimene varierte mellom NOK X og NOK X. Absolutt prognosetap for pasienter med RRMM var mellom 12 og 15 tapte friske leveår. Det er høy grad av usikkerhet knyttet til resultatene av kost-nytteanalysen.