
Diagnostik av äggstockscancer
Tillförlitlighet för algoritmbaserad diagnostik vid misstanke om äggstockscancer
Systematisk översikt och utvärdering av medicinska, etiska och hälsoekonomiska aspekter
Sammanfattning
Huvudbudskap
SBU har utvärderat kapaciteten hos sex olika metoder (SR, PR, RMI, ROMA, ADNEX, LR21) att bedöma risken för äggstockscancer. Forskning visar att den diagnostiska tillförlitligheten hos de i Sverige ofta använda metoderna SR och PR framstår som likvärdig med flertalet av de övriga metoderna.
Slutsatser
Efter att ha granskat den vetenskapliga litteraturen har SBU dragit följande slutsatser:
- Hos kvinnor före och under klimakteriet (premenopaus) har metoderna SR, PR och ADNEX högst diagnostisk tillförlitlighet vid misstänkt äggstockscancer.
- Hos kvinnor efter klimakteriet (postmenopaus) är den diagnostiska tillförlitligheten vid misstänkt äggstockscancer hög och likvärdig för fem metoder – SR, PR, RMI, ROMA och ADNEX.
- För den sjätte utvärderade metoden LR2 finns inte tillräckligt vetenskapligt underlag för att säkert bedöma den diagnostiska tillförlitligheten.
1. SR: Simple Rules, PR: Pattern Recognition, RMI: Risk of Malignancy Index, ROMA: Risk of Ovarian Malignancy Algorithm, ADNEX: Assessment of Different NEoplasias in the adnexa, LR2: Logistic Regression Model 2.
Hur kan de viktigaste resultaten förstås?
Till följd av grundläggande skillnader i sjukdomsförekomst har resultaten delats upp på kvinnor före och under klimakteriet (premenopaus) respektive efter klimakteriet (postmenopaus).
Resultaten uppvisar, med några få undantag, hög sensitivitet vilket innebär att metoderna har en god förmåga att identifiera en stor andel av cancerfallen i en population. Däremot är specificiteten (förmågan att utesluta cancer) ofta lägre, vilket medför att kvinnor fått sina tumörer felaktigt klassificerade som cancer. En låg specificitet kan därmed innebära onödiga operationer med komplikationsrisker, ökad resursåtgång och undanträngningseffekter i vården. Balansen mellan över- och underdiagnostik är därför viktig att värdera. För mer detaljerade resultat om sensitivitet och specificitet per metod och stadium av menopaus (Kapitel 6).
Grunden för diagnostik vid en svår sjukdom, såsom äggstockscancer, är att tillförlitligheten (både sensitivitet och specificitet) är hög. Det är också viktigt att det finns en väl etablerad behandling och att tidigt insatt behandling leder till förbättrad prognos (Kapitel 6).
Resultaten stöds av ett stort antal studier och många undersökta patienter. Kvinnorna i studierna hade framför allt remitterats till den specialiserade vården på grund av misstanke om äggstockscancer, vilket medför att förekomsten av cancer i studierna är betydligt högre än i till exempel primärvården.
Vad handlar rapporten om?
Äggstockscancer är en allvarlig och svårdiagnosticerad sjukdom. Den slutliga diagnosen bygger på mikroskopisk vävnadsanalys eller en strukturerad uppföljning när aktiv åtgärd (kirurgi med eller utan onkologisk terapi) inte rekommenderas. Det finns flera olika metoder (algoritmer) för att diagnosticera äggstockscancer före den mikroskopiska analysen eller den strukturerade uppföljningen. Data som har analyserats i de olika algoritmerna är uppgifter om kvinnans ålder/menopausalt status, resultat från undersökning med ultraljud och koncentrationen av olika tumörmarkörer i blod.
Syftet med denna rapport var att utvärdera sex olika metoder för att undersöka om någon metod hade en högre diagnostisk tillförlitlighet än de andra. Rapporten belyser även etiska och hälsoekonomiska aspekter. Projektet har genomförts inom ramen för ett övergripande uppdrag från regeringen med att ta fram kunskapsunderlag inom området kvinnohälsa.
Vilka studier ligger till grund för resultaten?
Resultaten baseras på 59 studier från hela världen, med totalt fler än 71 000 observationer. Litteratursökningen utgick från en systematisk översikt om diagnostik av äggstockscancer från Cochrane 2022. Kompletterande litteratur söktes och den senaste litteratursökningen genomfördes i februari 2025.
1. Inledning
1.1 Uppdrag
Rapporten är en del i SBU:s regeringsuppdrag om att ta fram kunskapsunderlag inom området kvinnohälsa (SBU:s regleringsbrev för 2023, dnr S2022/04810). Inom ramen för regeringsuppdraget andra myndigheter och representanter för professionen tillfrågats om områden där det finns ett behov av kunskapssammanställningar. Detta projekt är en följd av ett identifierat behov som framfördes av representanter för Svensk Förening för Obstetrik och Gynekologi (SFOG) för att lyfta kunskapsnivån nationellt för att få en förbättrad och mer likvärdig diagnostik av äggstockscancer. Detta projekt är det andra på SBU om diagnostik av äggstockscancer. Det första granskade det aktuella kunskapsläget för diagnostik av äggstockscancer med vätskebiopsi [1].
1.2 Syfte
Syftet med denna systematiska översikt är att utvärdera den diagnostiska tillförlitligheten (test accuracy) för sex algoritmer vid misstanke om äggstockscancer (påvisad oklar förändring i och runt äggstockarna eller symtom tydande på detta).
1.3 Målgrupper för rapporten är:
Målgrupp för rapporten är patienter, vårdpersonal (till exempel gynekologer, obstetriker, läkare inom bild- och funktionsmedicin, allmänläkare och sjuksköterskor), beslutsfattare, Regeringskansliet, Svensk förening för Obstetrik och Gynekologi (SFOG), andra specialistföreningar (kirurgi, bild- och funktionsmedicin) och patientföreningar.
2. Bakgrund
2.1 Förekomst och prognos
Äggstockscancer är en allvarlig sjukdom som klassas som svår utifrån Socialstyrelsens kriterier för sjukdomars svårighetsgrad [2]. Det är den gynekologiska cancer med högst dödlighet. Tumören ger ofta diffusa symtom och kan likna många andra vanliga besvär. Vissa kvinnor får inga symtom alls. Eftersom sjukdomen ofta upptäcks sent är prognosen ofta ogynnsam. Omkring 30 procent upptäcks i ett tidigt stadium och resterande 70 procent när tumören redan är spridd [3]. Förbättrad diagnostik kan leda till bättre prognos för patienterna.
Äggstockscancer är ovanligt. Av 100 000 kvinnor (oberoende av menopausal status) insjuknar i genomsnitt 11,5 kvinnor och 7,1 kvinnor avlider av sjukdomen årligen (2023) i Sverige. Incidensen har minskat på senare år, oklart varför, men det kan möjligen vara på grund av förändrad p-pilleranvändning (Figur 2.1). Av de ungefär 700 kvinnor som insjuknar varje år i Sverige får 500 diagnosen äggstockscancer (inklusive primär äggledarcancer och primär bukhinnecancer) och 200 kvinnor får diagnosen borderlinetumör. Borderlinetumörer är en typ av tumör som ligger i gränslandet mellan godartad (benign tumör) och elakartad (malign tumör) som kan leda till spridd äggstockscancer om tumören inte opereras bort. Prognosen för äggstockscancer och borderline har förbättrats på senare år (Figur 2.1 och Figur 2.2) tack vare effektivare kirurgi, nya läkemedel och organisatoriska förändringar [4] [5]. Däremot är femårsöverlevnaden fortfarande låg, omkring 50 procent och tioårsöverlevnaden är cirka 30 procent [6]. Överlevnaden är relaterad till ålder (Figur 2.2) och FIGO-stadium, där stadium I-II har god prognos jämfört med stadium III-IV (Figur 2.3).
Indelning i FIGO-stadier; I: enbart i ena eller bägge äggstockarna, II: spridd sjukdom i bäckenet, III: spridd sjukdom i bukhålan, IV: spridd sjukdom utanför bukhålan till andra organ, X/0: primärtumören är inte klassificeringsbar.
Av äggstocks-, äggledare-, primär bukhinnecancer så upptäcks cirka 30 procent i tidigt stadium FIGO-stadium I utan spridning men ca 70 procent upptäcks med spridd sjukdom, FIGO II-IV. [7]. En orsak till att äggstockscancer upptäcks sent beror på att sjukdomen ger diffusa symtom som är vanliga och kan bero på många olika tillstånd. En systematisk översikt visar att mellan 5 och 20 procent av kvinnorna inte har några symtom vid diagnos. [8].
2.2 Faktorer som ökar och minskar risken
Av de som får äggstockscancer har 10–15 procent en ärftlig förändring i arvsmassan (DNA) som ökar risken för cancer. Andra faktorer som ökar risken för äggstockscancer är tidig menstruationsdebut och sent klimakterium, barnlöshet och användning av fertilitetsstimulerande medel. Ett stort antal ägglossningar under livet kan öka risken, det vill säga ju fler antal ägglossningar desto större risk. Även menopausal hormonterapi med progestiner och endometrios ökar risken något. Däremot minskar risken efter intag av kombinerade p-piller, sterilisering med avknytning av äggledarna, borttagning av äggledarna eller livmodern. Man har också identifierat att gravideter och amning är skyddande faktorer [9].
2.3 Olika typer av äggstockscancer
Äggstockscancer är en heterogen sjukdom med varierande ursprung och sjukdomsförlopp. Mellan 80 och 90 procent är epiteliala, vilket innebär att cancern kommer från celler som kantar kroppens inre och yttre ytor, och dessa kan delas in i typ 1- och typ 2-tumörer som skiljer sig avseende uppkomstmekanismer, molekylär profil och kliniskt förlopp [10].
Typ 1-tumörer utvecklas ofta långsamt och uppstår från godartade eller premaligna lesioner i det ytliga epitelet på äggstocken. En vanlig utgångspunkt är så kallade inklusionscystor som bildas när ytepitel invagineras i ovariets stroma. Dessa cystor kan genomgå successiva genetiska förändringar som leder till atypi och dysplasi, vilket i sin tur kan utvecklas till låggradig cancer. En annan viktig prekursor är endometrioscystor som kan förändras och utvecklas till klarcellig eller endometrioid äggstockscancer. Typ 1-tumörer är ofta genetiskt stabila, och tenderar att vara lokaliserade vid diagnos och har ett mindre aggressivt förlopp [10] [11].
Typ 2-tumörer är däremot biologiskt aggressiva och har ofta redan spridit sig vid diagnos. Dessa tumörer förmodas inte primärt uppstå i äggstocken, utan i äggledarens fimbriedel. Det aktuella patogenetiska konceptet är att serösa tubära intraepiteliala carcinom (STIC-lesioner) i äggledaren är ursprunget till höggradig serös ovarialcancer. Tumörceller från äggledaren exfolierar och implanteras på ovariets yta eller i bukhinnan. Typ 2-tumörer kännetecknas av höggradig cellatypi, snabb tillväxt och genetisk instabilitet, ofta med mutationer i TP53 (TP – tumörsuppressorgen) och ibland BRCA1/2 [10] [11].
Cirka tio procent av äggstockstumörerna är icke-epiteliala. Dessa drabbar oftast premenopausala kvinnor, är ensidiga och har god prognos [9].
Tidig upptäckt av och begränsad sjukdom (FIGO I och II, Figur 2.3) ökar chansen till förbättrade behandlingsresultat. Det innebär att allmän screening teoretisk skulle kunna löna sig [12]. Screeningstudier av kvinnor med ultraljud, med eller utan analys av tumörmarkören CA125, har däremot inte visat effekt på överlevnaden. En metaanalys av tre studier på knappt 300 000 kvinnor i två grupper, en interventionsgrupp som lottats till screening och en kontrollgrupp som lottats till att inte screenas, visade inte någon minskad dödlighet i äggstockscancer. Däremot uppstod operationskomplikationer hos 1–3 procent av kvinnorna som visade sig ha godartade tumörer där man inte kunnat utesluta att cancer fanns före operationen [13].
Om kvinnor med ärftlig förändring i arvsmassan, som ökar risken för cancer, skulle gynnas av screening är inte helt klarlagt. Man identifierar cancern i ett tidigare skede, men kvinnornas livslängd ökar inte, när sjukdomen upptäcks vid screening [14]. Därför erbjuder man kvinnor med vissa genetiska förändringar förebyggande kirurgi, att operera bort äggstockarna, förutsatt att kvinnan uppnått en viss ålder och inte vill ha fler barn [9]. Lämplig ålder för förebyggande kirurgi beror på vilken genetisk förändring kvinnan bär på och vid vilken ålder kvinnans släktingar fått äggstockscancer [15] [16].
2.4 Diagnostik
Misstanke om äggstockscancer baseras oftast på ett ultraljudsfynd vid platsen för äggstockarna, men kan också baseras på symtom, sjukdomshistoria och någon gång bifynd vid annan undersökning. Bukhålan kan härbärgera stora tumörer utan att kvinnan märker det. Det kan dessutom vara svårt att upptäcka en tumör vid klinisk undersökning. Manuell undersökning kan vara svår speciellt vid högt Body Mass Index (BMI). Därför behövs ofta någon form av bilddiagnostik.
De senaste 30 åren har undersökning med ultraljud helt ändrat förutsättningarna för diagnostik av äggstockscancer eftersom ultraljudstekniken har utvecklats och ersatt många invasiva ingrepp. Diagnostik av äggstockstumörer kräver erfarenhet av ultraljudsteknik, men även en erfaren undersökare kan ha svårt att skilja en godartad från en elakartad tumör trots användning av en apparat av hög kvalitet. Därför har en internationell grupp, utvecklat ett system för bedömning av äggstockstumörer med ultraljud [17].
Nålbiopsi från en misstänkta tumör är olämpligt eftersom det ökar risken för att sprida tumörceller till bukhålan vilket kan leda till sämre prognos om tumören eller cystan är elakartad. Nålbiopsitekniken används endast när det finns en tydlig misstanke om spridd sjukdom, det vill säga när man på ultraljud identifierar flera misstänkta tumörhärdar.
Ett tiotal icke-invasiva algoritmer har utvecklats sedan tidigt 2000-tal för att underlätta diagnostik av äggstockscancer. I vilken utsträckning dessa algoritmer används var oklart. Vi gjorde därför en praxisundersökning (Kapitel 3).
Vi valde att studera sex algoritmer som är vanligt förekommande internationellt, med delvis överlappande delkomponenter. Algoritmernas delkomponenter är vanligen menopausalt status, tumörmarkörer i blod och olika ultraljudskriterier. De ingående delkomponenterna viktas även olika och i vissa fall görs själva analysen med hjälp av olika varianter av regressionsanalyser. Det förekommer även skilda tröskelvärden för samma algoritm. I denna rapport har vi valt att utvärdera det tröskelvärde som är nationellt vanligast förekommande.
I den första algoritmen som utvecklades, Risk of Malignancy Index (RMI), ingår ultraljudsfynd, menopausstatus och tumörmarkören CA125 [18]. Senare har det tillkommit flera algoritmer som använder delvis samma variabler men ersätter menopausstatus med ålder, till exempel ADNEX [19]. Enbart ultraljudsundersökning görs i Simple Rules [20] och Pattern Recognition [21]. Simple Rules är anpassat för mindre vana undersökare och vana undersökare med specialistkunskap använder ofta Pattern Recognition (kallas ibland Subjective Assessment). ROMA är en annan algoritm där tumörmarkörerna CA125 och HEA4 används i kombination med menopausstatus [22] [23] [24] utan ultraljudsundersökning. LR2 är en algoritm som är baserad på ålder och ultraljudsfynd som läggs in i en logistisk regression [25]. Se Bilaga 1 för mer beskrivning av algoritmerna.
| Sammanfattning av de olika undersökningsmodaliteterna som ingår i respektive algoritm (diagnostisk metod). ADNEX kan genomföras både med och utan tumörmarkören CA125. I Sverige ingår CA125 i princip alltid vid användandet av ADNEX. Även om det menopausala statuset/åldern formellt inte ingår vare sig SR eller PR är det ofrånkomligt, i den kliniska vardagen, att sonografens (ultraljudsundersökarens) tolkning av den genomförda undersökningen även tar hänsyn till detta. | |||
| Algoritm | Menopausal status/ålder | Blodburen tumörmarkör | Ultraljud (abdominellt och transvaginalt) |
|---|---|---|---|
| RMI Risk of Malignancy Index |
X | CA125 | X |
| ROMA Risk of Ovarian Malignancy Algorithm |
X | CA125 + HE4 | – |
| LR2 Logistic Regression model 2 |
X | – | X |
| ADNEX Assessment of Different NEoplasias in the adneXa model |
X | +/– CA125 | X |
| SR Simple Rules |
(X) | – | X |
| PR Pattern Recognition (Subjective Assessment) |
(X) | – | X |
2.5 Utredning av äggstocksförändringar enligt standardiserat vårdförlopp och övergripande om behandling
Vid misstanke om äggstockscancer följs ett standardiserat vårdförlopp för att säkerställa snabb och strukturerad utredning. Utredningen kan initieras i primärvården, men det är vanligtvis gynekologisk öppenvård som avgör om kriterierna för välgrundad misstanke är uppfyllda och om utredning enligt det standardiserade vårdförloppet ska inledas. De vanligaste symtomen som väcker misstanke är nytillkomna buk- eller bäckensmärtor, ökat bukomfång, ascites (bukvätska), pleuravätska (vätskan mellan lungsäckens blad) utan annan förklaring, förändrade avföringsvanor, frekventa urinträngningar, aptitförlust eller tidig mättnadskänsla. Även fynd som djup ventrombos hos kvinnor utan känd riskfaktor kan vara tecken på underliggande malignitet.
Obligatoriska utredningsmoment inkluderar noggrann anamnes med fokus på symtom, hereditet (särskilt BRCA-associerad cancer), gynekologisk historik och riskfaktorer. Därefter följer statusundersökning omfattar allmäntillstånd, bukpalpation, lymfkörtelstatus, rektalpalpation och vid behov gynekologisk undersökning. Standardprover samt tumörmarkörer CA125 och/eller HE4 (äggstockscancermarkör) men även CEA (tjocktarmscancermarkör). kreatinin och abdominellt och transvaginalt tumörmarkör, CA125 och/eller HE4 (äggstockscancermarkörer, CEA (tjocktarmscancermarkör). Bilddiagnostik med transvaginalt ultraljud är förstahandsval, ofta kompletterat med datortomografi (DT) i buk och bröstkorg för att stadieindela och bedöma tumörutbredning.
Vid välgrundad misstanke skickas remiss till specialiserad gynekologisk enhet. Patienten diskuteras därefter vid en multidisciplinär konferens, där gynekolog, onkolog, radiolog och patolog gemensamt planerar fortsatt handläggning, inklusive behov av kirurgi, cytostatika och eventuell genetisk testning [9]. Operation vid misstänkt eller konstaterad äggstockscancer utförs på sex universitetsenheter med högspecialiserad kompetens inom gynekologisk cancerkirurgi, där både kirurgisk expertis och onkologisk eftervård finns tillgänglig.
2.5.1 Olika vävnadstyper vid äggstocksförändringar och diagnostik med hjälp av ultraljud
Transvaginalt ultraljud är ett centralt diagnostiskt verktyg vid utvärdering av äggstocksförändringar, men det kan inte fastställa en exakt histopatologisk (mikroskopisk vävnads) diagnos. Däremot kan det ge viktiga morfologiska ledtrådar som hjälper till att bedöma sannolikheten för malignitet. Ultraljudet möjliggör visualisering av tumörens storlek, form, innehåll (cystiskt, solitt eller blandat), väggstruktur, septa och eventuell papillär tillväxt. Vaskularisering kan bedömas med Doppler, där rik blodförsörjning och lågt resistensindex ofta ses vid maligna förändringar.
2.5.2 Översiktligt om behandling
Behandlingen av äggstockscancer anpassas efter sjukdomens stadium, tumörens biologiska egenskaper och patientens allmäntillstånd. Den vanligaste behandlingsstrategin består av kirurgi i kombination med cytostatika (cellgifter), ofta kompletterad med målriktade läkemedel.
Vid FIGO I (Figur 2.3), där cancern är begränsad till ena eller båda äggstockarna, är kirurgi den primära behandlingen. Om tumören är av låg risk kan kirurgi vara tillräckligt. Vid högre risk rekommenderas tilläggsbehandling med cytostatika.
Behandling av spridd äggstockscancer FIGO II–IV (Figur 2.3) inleds oftast med kirurgi där målet är att avlägsna all synlig tumörvävnad. Man tar bort äggstockar, äggledare, livmoder och tarmkäx (oment), med tumörhärdar, och även de delar av tarmen som är engagerade av cancer liksom förstorade lymfkörtlar med cancer. Om tumörbördan är för stor och patienten inte bedöms operabel kan man, i vissa fall, ge cytostatika före operation (neoadjuvant behandling) för att få tumören att krympa så att patienten därmed blir operabel. Om patientens allmäntillstånd inte tillåter omfattande kirurgi, ges först cytostatika för att minska tumörbördan, vanligen tre kurer följt av fördröjd kirurgi med efterföljande tre kurer cytostatika. Om initial kirurgi utförts ges tilläggsbehandling med sex kurer cytostatika för att ta bort mikroskopisk cancer. Även målriktade läkemedel som kärlhämmare eller PARP-hämmare används beroende på tumörens genetiska profil.
Behandlingen planeras vid multidisciplinär konferens (MDK) och anpassas efter patientens ålder, samsjuklighet och tumörens utbredning.
Uppföljning för att finna återfall, lindra biverkningar av behandlingen och bidra till cancerrehabilitering inkluderar kliniska kontroller var tredje till var sjätte månad, där vanligtvis laboratorieprov med tumörmarkörer såsom CA125 och vid behov datortomografi används.
Sammanfattningsvis är behandlingen av äggstockscancer en kombination av kirurgi, cytostatika och målriktade läkemedel, där behandlingsstrategin anpassas efter sjukdomsstadium och återfallsprofil.
3. Enkätundersökning av arbetssätt (praxis) i Sverige
Under våren 2025 genomfördes en anonymiserad digital enkätundersökning (Bilaga 2) av projektgruppen. Syftet med undersökningen var att få en uppfattning om eventuella likheter och skillnader i användandet av de olika diagnostiska algoritmerna i Sverige.
Enkäten ställdes till ansvariga verksamhetschefer för olika vårdnivåer som handlägger diagnostik vid misstanke om äggstockscancer. Den sändes till samtliga landets region/universitetssjukhus, eftersom den finala diagnostiken och den mer avancerade behandlingarna genomförs där. Enkäten sändes även till länssjukhus som bedriver initial diagnostik och operationer i de fall förändringen bedöms vara godartad. För denna kategori av enkätmottagare fokuserade projektgruppen på att skicka till så många länssjukhus att resultaten skulle kunna betraktas som representativt nationellt. Även ett mindre antal öppenvårdsgynekologer både offentliga och privata mottagningar med avtal med den offentliga sjukvården fick inbjudan att delta i enkäten. Vårdcentraler tillskrevs inte.
I händelse av uteblivet svar sändes en påminnelse, den upprepades vid behov vid ytterligare ett tillfälle. Mottagaren angav i sitt svar vilken sjukvårdsnivå man representerade.
Enkäten inleddes med ett fiktivt scenario ”Du är en specialist i gynekologi. Vi önskar att dina svar speglar klinikens generella utredningsgång. Den fiktiva patienten är en icke-gravid kvinna utan känd risk för ovarialcancer som inkommer till kliniken via egna mottagningen eller via remiss, med oklar bäckentumor. Hur går ni vidare i diagnostiken?” Detta följdes ett mindre antal frågor. Frågornas svar var av två typer; dels ett svar som angavs utifrån förvalda intervall; Aldrig / Undantagsvis (0–10%), Ibland (11–30%), Vanligen (31–70%), Ofta (71–90%), Alltid / Nära nog alltid (91–100%), och dels svarstyp i form av en kort fritext (Bilaga 2).
Samtliga sex tillfrågade region-/universitetssjukhus svarade på enkäten. Enkäten besvarades av nio länssjukhus med god geografiska täckningen i landet. Svarsfrekvensen bland öppenvårdsgynekologerna var alltför låg för att kunna betraktas som ett rimligt representativt stickprov, och därför har dessa svar inte redovisats. I Tabell 3.1 redovisas vilka av de algoritmer som utvärderats i denna rapports som används i klinisk praxis vid alla regions-/universitetssjukhus och 9 av 44 länssjukhus (20 %) med kvinnosjukvård.
Svaren bör ses som en ögonblicksbild från våren 2025 av vilka diagnostiska verktyg som används som förstahandsval vid misstanke om äggstockscancer. Den heltäckande svarsfrekvensen från universitets-/regionsjukhus gör att data är robusta. Svaren från länssjukhusen, om än med god geografisk spridning, bör tolkas med en viss försiktighet eftersom landets samtliga länssjukhus inte inbjudits att delta.
| Diagnostisk förstahandsstrategi? | Alltid/ nära nog alltid, 91–100% |
Ofta, 71–90% | Vanligen, 31–70% | Ibland, 11–30% | Aldrig/ undantagsvis, 0–10% |
Saknade svar |
|---|---|---|---|---|---|---|
| Totalt antal svarade, n = 15 | ||||||
| RMI | 1 | 1 | 1 | 2 | 10 | – |
| ROMA | – | – | 1 | – | 14 | – |
| LR2 | – | – | – | 1 | 14 | – |
| ADNEX m CA125 | 1 | 4 | 2 | – | 7 | 1 |
| SR | 4 | 4 | 2 | 4 | 1 | – |
| PR | 8 | 2 | 1 | 3 | 1 | – |
| Universitets-/regionsjukhus, n = 6 | ||||||
| RMI | – | – | – | 1 | 5 | – |
| ROMA | – | – | – | – | 6 | – |
| LR2 | – | – | – | – | 6 | – |
| ADNEX m CA125 | 1 | 1 | 1 | – | 2 | 1 |
| SR | 1 | 1 | 1 | 2 | 1 | – |
| PR | 3 | 1 | – | 2 | – | – |
| Länssjukhus, n = 9 | ||||||
| RMI | 1 | 1 | 1 | 1 | 5 | – |
| ROMA | – | – | 1 | – | 8 | – |
| LR2 | – | – | – | 1 | 8 | – |
| ADNEX m CA125 | – | 3 | 1 | – | 5 | – |
| SR | 3 | 3 | 1 | 2 | – | – |
| PR | 5 | 1 | 1 | 1 | 1 | – |
Enkätundersökningen visade att de ultraljudsbaserade metoderna PR och SR dominerande. Den äldsta algoritmen, RMI, används fortfarande även om dess användning som förstahandsmetod inte längre är tydlig. Den senast tillkomna algoritmen ADNEX (från 2014) har ännu inte fått någon större klinisk spridning i landet. Detsamma gäller ROMA, som introducerades i Sverige 2012. Praxisundersökningen indikerade dessutom att LR2 förefaller föga relevant i den aktuella svenska kontexten.
Enkäten visade att PR är den mest använda förstahandsstrategin, följt av SR. Algoritmerna RMI, ROMA och LR2 används sällan eller aldrig, särskilt inte på universitets-/regionsjukhus. ADNEX med CA125 används i viss utsträckning, främst på länssjukhus, där tre svarande uppger att de ofta använder metoden. Universitets-/regionsjukhusen tenderade att använda färre algoritmer och lutar mer mot subjektiva bedömningar (PR och SR), medan länssjukhus visade något större variation i användningen. Generellt sett var det stor variation i val av diagnostisk strategi, med en tydlig dominans för subjektiva metoder.
4. Metod
Detta kapitel beskriver frågeställningar, urvalskriterier och metodik för rapporten. Utförligare information om metodiken finns i SBU:s metodbok [26]. Syftet med en systematisk översikt är att få en objektiv sammanställning av kunskapsläget utifrån genomförd forskning på området.
Projektprocessen följde de internationella riktlinjerna för systematiska översikter, PRISMA [27].
4.1 Frågeställningar
- a) Vilken är tillförlitligheten för diagnostiska algoritmer vid misstanke om äggstockscancer?
b) Vilken av de studerade diagnostiska algoritmerna har den största tillförlitligheten? - Vilka etiska aspekter kan uppkomma vid användandet av diagnostiska algoritmer vid misstanke om äggstockscancer?
- Vilka övergripande hälsoekonomiska aspekter bör uppmärksammas vid införande/användande/avveckling av diagnostiska algoritmer?
4.2 Urvalskriterier enligt PIRO
- Population: Pre- och postmenopausala kvinnor2 med objektiva fynd av misstänkt tumör som har sitt ursprung i äggstockar eller äggledare alternativt symtom som kan inge misstanke om äggstockscancer. I studier där både pre- och postmenopausala kvinnor ingår måste resultaten vara särredovisade för respektive grupp. Studier som innehåller prepubertala eller gravida kvinnor exkluderas.
- Indextest: Algoritmerna: RMI (Risk of Malignancy Index), ROMA (Risk of Ovarian Malignancy Algorithm), ADNEX (Assessment of Different NEoplasias in the adneXa model), LR2 (Logistic Regression 2), SR (Simple Rules) och PR (Pattern Recognition) (Bilaga 1).
- Referenstest: För patienter som genomgår operation; en morfologisk mikroskopisk patologisk anatomisk diagnos (PAD), ställd av patolog. För patienter som inte opereras; en strukturerad uppföljning (vanligen ultraljud, med eller utan biokemisk tumörmarkör) och inte utvecklar operationskrävande diagnos under minst 12 månader. Dessa två varianter av referenstest betraktas som sinsemellan likvärdiga.
- Utfallsmått: Sensitivitet och specificitet. Sensitivitets/specificitetsdata för 2x2-tabeller ska gå att beräkna (antal sant/falskt positiva och sant/falskt negativa analyssvar).
2. Enligt artikelförfattarnas uppdelning.
4.3 Övriga avgränsningar
- Studiedesign: Vi inkluderade diagnostiska tvärsnittsstudier (indextest och referenstest görs på samma kvinnor som inkluderats) som kan vara prospektiva eller retrospektiva (i det senare fallet är referenstestet gjort före indextestet) och randomiserade studier.
- Studiestorlek: Vi inkluderade studier med minimum 50 kvinnor för den pre- respektive postmenopausala gruppen.
- Publikationstyp: Primärstudier med originaldata i fulltext, publicerade i sakkunniggranskade tidskrifter och HTA rapporter från 2010 och framåt inkluderades. Detta årtal valdes eftersom den snabba tekniska utvecklingen för ultraljudsapparater bedömdes försvåra rättvisa jämförelser mellan kliniskt använda ultraljuds apparater dessförinnan jämfört med nyare.
- Språk: Engelska för originalartiklar, engelska, svenska, norska och danska för HTA-rapporter inkluderas.
- Bortfall: ≥20 % bortfall vid uppföljning (lost to follow-up) ledde till exklusion av studien, om ej använd imputering redovisats på erforderligt sätt.
- Kontext: För inklusion skulle studien vara utförd i en kontext lik den dagsaktuella svenska.
- Övrigt: Studier som avhandlade Artificial Intelligence, Machine Learning, Deep Learning och dylika metoder exkluderas då dessa nya metoder bedömdes vara alltför heterogena och ännu inte validerade för att sammanvägas på ett tillförlitligt sätt. Studier med kontrastförstärkt ultraljud, MR och DT som delkomponenter vid algoritmbaserad diagnostik är inte tillräckligt spridd för att sammanvägas tillförlitligt.
4.4 Process för urval av studier
4.4.1 Litteratursökning
Arbetet med att identifiera relevanta studier inleddes med en granskning av relevanta systematiska översikter inom området. En relativt nygjord systematisk översikt, av Davenport och medförfattare identifierades och fick utgöra grunden för det fortsatta arbetet. I januari 2025 gjordes en modifierad uppdateringssökning av Davenports sökning, för att identifiera studier som publicerats efter översiktens sökdatum [28].
En kompletterande sökning gjordes därefter i februari 2025. Syftet var att identifiera studier om de två metoderna SR (Simple Rules) och PR (Pattern Recognition), som är relevanta för svenska förhållanden, och som inte i tillräcklig grad hade kommit med i den ursprungliga sökstrategin. Slutligen gjordes en sökning efter relevanta studieprotokoll i maj 2025. Utöver strukturerade sökningar i bibliografiska databaser granskades referenslistor till relevanta systematiska översikter och primärstudier för att identifiera ytterligare studier.
En informationsspecialist utformade och genomförde de strukturerade och uttömmande sökningarna, i samarbete med projektledare och sakkunniga. Sökstrategin bestod av två sökblock, ett för populationen och ett för indextesten. Båda blocken bestod av kontrollerad vokabulär och fritexttermer och -fraser. För att identifiera sökord användes till stor del sökstrategin från Davenport, samt termer och fraser från nyckelartiklar och förslag från projektgruppen. Sökstrategierna granskades av projektgruppen, samt av en annan informationsspecialist inom organisationen. Fullständiga sökstrategier redovisas i Bilaga 3.
I den första sökningen, för att uppdatera översikten av Davenport, användes avgränsningar till publikationsåren 2019 och framåt, till humanstudier och till språken engelska, svenska, norska och danska. Övriga sökningar för projektet hade inga motsvarande avgränsningar utan uteslöt endast konferensabstracts.
Dubbletter mellan databaser har rensats i EndNote 21 [29] enligt metod utvecklad av Bramer och medförfattare [30].
Vi använde databaserna: Cochrane Library, CDSR, Central (Wiley), Embase (Elsevier), Medline (Ovid), Clinicaltrials.gov (NLM), WHO ICTRP (WHO)
4.4.2 Gallring på abstraktnivå och relevansbedömning i fulltext
Två projektledare vid SBU:s kansli granskade oberoende av varandra de artikelsammanfattningar som identifierats i litteratursökningarna. Granskningen genomfördes med hjälp av gallringsverktyget Rayyan [31]. De artikelsammanfattningar som uppfyllde urvalskriterierna och övriga avgränsningar (till exempel språkliga), och där konsensus uppnåtts mellan projektledarna beställdes i fulltext. Studierna granskades därefter genom att samtliga fulltextartiklar fördelades 50/50 till två granskningspar, som var och en bestod av en sakkunnig och en projektledare. Sakkunniga och projektledare granskade studierna oberoende av varandra och bedömde om studierna uppfyllde de uppställda urvalskriterierna. Eventuella oenigheter inom granskningsparet löstes genom diskussion i projektgruppen till konsensus uppnåddes. Studier som inte uppfyllde kriterierna exkluderades och huvudorsak till exklusion noterades (Bilaga 4).
4.4.3 Bedömning av risk för systematisk snedvridning (risk för bias)
Risken för systematisk snedvridning i studierna bedömdes med verktyget QUADAS-2 [32]. En sammanfattning av genomförd granskning redovisas i Bilaga 5. Studier där risk för systematisk snedvridning bedömts som hög exkluderades från utvärderingen. Någon omprövning avseende risken för systematiskt snedvridning av de primärstudier som inkluderats i Davenports översikt gjordes inte. Vi använde översiktsförfattarnas bedömningar och uteslöt därefter studier med hög risk.
4.5 Metod för sammanvägning av resultat och syntes
En beskrivning av studierna, med låg och måttlig risk för snedvridning finns redovisade i Bilaga 5. Tabellen sammanställdes av en projektdeltagare och granskades av en annan projektdeltagare. Metaanalys av diagnostiska data gjordes med hjälp av hierarkiska modeller. Vi använde en bivariatmodell som tar hänsyn till den underliggande korrelationen mellan sensitivitet och specificitet. Med hjälp av denna modell fick vi ett sammanfattande punktestimat för sensitivitet och specificitet med en konfidensregion som ett mått på punktestimatet osäkerhet (Bilaga 6).
För att utvärdera eventuella skillnader mellan de olika algoritmerna gjordes en avslutande jämförelse av de sammanvägda algoritmernas diagnostiska tillförlitlighet för de pre- respektive postmenopausala kohorterna.
4.6 Bedömning av de sammanvägda resultatens vetenskapliga tillförlitlighet
Styrkan på det vetenskapliga underlaget (vetenskaplig tillförlitlighet) anger hur tillförlitlig uppskattningen av effekten är. Tillförlitligheten bedömdes med hjälp av GRADE (Grading of Recommendations Assessment, Development and Evaluation) [33]. Det vetenskapliga underlaget analyserades med avseende på övergripande risk för systematisk snedvridning, i vilken grad studiernas resultat överensstämde med varandra (samstämmighet), hur stor osäkerheten i det sammanvägda resultatet var (konfidensintervallets storlek, precision), risk för problem med överförbarhet samt risk för snedvridning av resultatet på grund av att studier med negativa resultat inte publicerats (publikations snedvridning) [26].
4.7 Metod för att undersöka etiska aspekter
Vi har dels utgått från SBU:s avsnitt om etiska aspekter i Metodboken [34] och dels diskuterat i projektgruppen.
5. Urval av studier
5.1 Flödesschema över studier
Den sista litteratursökningen genomfördes i januari 2025 och genererade 3 347 artikelsammanfattningar (Figur 5.1). Av dem lästes 185 artiklar i fulltext och 31 uppfyllde urvalskriterierna. Åtta studier hade hög risk för snedvridning och ingår därmed inte i analysen men listas i Bilaga 4. Till de 29 relevanta studierna från vår egen litteratursökning adderade vi 38 studier från översikten av Davenport och medförfattare över algoritmerna RMI, ROMA, LR2 och ADNEX. Eftersom Davenport inte redovisar en sammanvägd risk för snedvridning utan enbart riskerna domänvis valde vi att exkludera studier med hög risk för bias i två eller flera domäner. Detta medförde att vi inkluderade 38 av Davenports 71 inkluderade studier [28].
Vi har även gjort en sökning i Cochrane Central Register of Controlled Trials för befintliga studieprotokoll [35]. Sökningsresultatet kunde inte påvisa några större pågående studier med väsentlig potential att förändra resultaten i denna rapport bortsett från studien av Sundar och medförfattare, som inom en snar framtid förväntas redovisa sina data även för den premenopausala kohorten [36].
5.2 Forskningsintegritet
I mars och april 2025 utfördes kontroller av inkluderade studier avseende forskningsintegritet. Syftet var att kontrollera att ingen av de publikationer som inkluderats i rapporten hade dragits tillbaka, eller att det fanns oklarheter kring publiceringen som kan påverka tillförlitligheten till resultaten. Kontrollen omfattade både de studier som inkluderats i översikten av Davenport, samt de som tillkommit efter de kompletterande sökningarna. Det gjordes genom:
- Genomgång i databasen Retraction Watch av om någon av de aktuella översikterna återkallats av utgivaren. Genomgången gjordes i EndNote.
- Genomgång av om Comments, Errata eller Expression of Concern publicerats i PubMed, samt publicering av eventuella kommentarer i databasen PubPeer.
- Tidskrifterna som översikterna publicerats i har kontrollerats i Norwegian Register for Scientific Journals, Series and Publishers [37].
- Kontrollen identifierade inte några tecken på brister i den systematiska översikten eller hos de primärstudier som ingår i rapporten.
5.3 Inkluderade studiers ursprung och antal
Sammanlagt inkluderades 59 primärstudier i analysen med totalt 71 489 observationer. Av dessa var 36 533 pre- och 34 956 postmenopausala. Observationerna härstammade från 30 768 unika kvinnor, varav 15 260 var premenopausala och 15 508 var postmenopausala. Fördelningen av antalet studier per världsdel redovisas i Tabell 5.1.
| Samtliga studier publicerade åren 2009–2025. | ||
| Ursprungs världsdel |
Antal studier | Kommentar |
|---|---|---|
| Europa | 34 | Varav 5 multinationella via intresseorganisationen IOTA |
| Amerika | 5 | Samtliga från USA |
| Asien | 18 | Hälften från Kina |
| Afrika | 2 | Båda från Egypten |
Studiedesignen var i drygt hälften av fallen diagnostiska tvärsnittsstudier där man prospektivt gjort indextestet före referenstestet (patologisk anatomisk diagnos, PAD efter operation eller exspektans med förnyade kontroller). De återstående var retrospektiva där man utifrån register och journalhandlingar börjat med PAD innan analys av indextest (sparade ultraljudsdata och eventuellt blodprov). Studierna gjordes vanligen på tertiärcentrum vid universitetssjukhus eller annat större sjukhus. Personerna som genomförde och bedömde ultraljudsundersökningarna beskrivs i de flesta studier som välutbildade och erfarna, fast i regel utan någon närmare specifikation. I alla studier har de klinisk-kemiska analyserna av tumörmarkörer rapporterats ha genomförts automatiserat och i enlighet med fabrikantens rekommendationer.
I två stora studier saknades data för att kunna beräkna sensitivitet och specificitet [38] [39]. Första författaren för respektive studie kontaktades och de översände erforderliga data så att studierna kunde ingå i analyserna.
6. Resultat
I detta kapitel sammanfattas inledningsvis skillnader i resultat av metaanalyser för de bivariat framräknade värdena för sensitivitet och specificitet med konfidensregioner med eventuell statistisk signifikans för de sex algoritmerna i de inkluderade studierna av pre- respektive postmenopausala kvinnor. Detaljerade resultat inklusive kopplade skogsdiagram, algoritmernas punktestimat med GRADE-bedömning redovisas i Avsnitt 6.3 och Avsnitt 6.5.
I Avsnitten 6.2 och 6.4 redovisas resultaten för sensitivitet och specificitet för de sex olika algoritmerna: RMI, ROMA, LR2, ADNEX, SR och PR uppdelat på populationerna pre- och postmenopausala kvinnor. Vi särredovisar den diagnostiska tillförlitligheten för pre- och postmenopausala kvinnor eftersom grupperna har olika cancerrisk, olika fördelning av cancertyp och prognos. Resultaten redovisas i form av kopplade skogsdiagram, hierarkisk summations ROC-kurva, punktestimat för sensitivitet och specificitet beräknat med bivariat analys och evidensvärdering enligt GRADE för sensitivitet och specificitet.
En sammanfattande tabell visas för den vetenskapliga tillförlitlighetsbedömningen enligt GRADE av sensitivitet och specificitet för respektive grupp, en jämförande analys visas för punktestimat med konfidensregioner runt respektive punktestimat och slutligen redovisas antal missade fall (falskt negativa) och falskt positiva för samtliga algoritmer räknat på en hypotetisk kohort (1 000 kvinnor) med cancerprevalens 10 procent, (Avsnitt 6.3 och Avsnitt 6.5). I dessa tabeller har också tillförts värden som kan ses som ”rankinglistor” för hur bra ett test fungerar för dikotoma utfall (Tabell 6.7 och 6.14). En sådan lista baserar sig på Yodens index som beräknas enligt: sensitivitet + specificitet -1, där värdet för ett bra test ska ligga så nära 1 som möjligt. Den andra listan baserar sig på beräkning av diagnostisk oddskvot (DOR) som är relationen mellan odds för att testet ska visa positivt utfall hos de med sjukdom och odds för positivt test för de utan sjukdom. Högre värde talar för bättre diskriminativ förmåga. Någon hypotesprövande statistiska beräkningar är inte utförda för dessa rankinglistor.
6.1 Sammanfattning av huvudresultaten
För kvinnor före och under klimakteriet (premenopaus):
- SR, PR och ADNEX:
- det förelåg inte någon statistiskt säkerställd inbördes skillnad för diagnostisk tillförlitlighet vid indirekta jämförelser,
- de hade en högre säkerställd tillförlitlighet jämfört med RMI och ROMA.
- RMI och ROMA:
- det förelåg en inbördes säkerställd skillnad dem emellan,
RMI hade en tydligt lägre sensitivitet och högre specificitet, - det omvända förhållandet förelåg för ROMA med högre sensitivitet men lägre specificitet.
- det förelåg en inbördes säkerställd skillnad dem emellan,
- LR2:
- punktestimatet för LR2 var mer i samklang med gruppen ADNEX, PR och SR än med gruppen RMI och ROMA, antalet observationer var för lågt för att kunna ange en osäkerhet för resultatet.
- Vetenskaplig tillförlitlighet (GRADE):
- vi sänkte GRADE-poäng för sensitivitet för RMI och ROMA till
(låg tillförlitlighet). GRADE för sensitivitet och specificitet för andra algoritmer var åtminstone GRADE-poäng
(måttlig tillförlitlighet).
- vi sänkte GRADE-poäng för sensitivitet för RMI och ROMA till
För kvinnor efter klimakteriet (postmenopaus):
- SR, PR, RMI och ROMA:
- punktestimaten för sensitivitet låg samlade runt 0,9 och specificiteten omkring en tiondel lägre,
- algoritmerna hade överlappande konfidensregioner och kunde inte särskiljas.
- ADNEX:
- punktestimatet för sensitivitet var likvärdigt högt i förhållande till de övriga men hade en lägre specificitet (större andel falskt positiva resultat),
- PR hade en gemensam konfidensregion med ADNEX,
- RMI hade en tangerande konfidensregion med ADNEX.
- LR2:
- punktestimatet för sensitivitet var likvärdigt med de övriga och specificiteten var i samma storleksordning som för ADNEX,
- antalet observationer var för lågt för att kunna ange en osäkerhet för resultatet.
- Vetenskaplig tillförlitlighet (GRADE):
- I den postmenopausala gruppen GRADE-bedömdes sensitivitet för ROMA till
och specificiteten för RMI, LR2 och ADNEX till
.
- Övriga GRADE-bedömningar för algoritmernas sensitivitet och specificitet var åtminstone
.
6.2 Premenopausala kvinnor
6.2.1 RMI, tröskelvärde 200
Resultatet är baserat på 18 studier [38, 40-56] vilka inkluderade totalt 8 229 premenopausala kvinnor av vilka 1 295 fick diagnosen äggstockscancer. Den genomsnittliga prevalensen av patienter med cancer inklusive borderlinetumörer var 17,6 procent (95 % KI: 7,1–27,8), median 14,3 procent spridning 4,4–40,2 procent. Sensitiviteten för RMI var 0,57 (95 % KI: 0,48–0,66) och specificiteten 0,94 (95 % KI: 0,92–0,96). Det positiva respektive negativa prediktiva värdet var 0,61 (95 % KI: 0,52–0,70) samt 0,91 (95 % KI: 0,89–0,93). Det vetenskapliga underlaget är svagt för sensitivitet och starkt för specificitet (Figur 6.1, Figur 6.2 och Tabell 6.1).
TP = True Positive (sant positiv); FP = False Positive (falskt positiv); FN = False Negative (falskt negativ); TN = True Negative (sant negativ).
Ingående studier i alfabetisk ordning. Prevalensen anges efter namnet på studiens första författre och år, som en procentsats (gäller samtliga nedan kopplade skogsdiagram).
| KI = Konfidensintervall. * Avdrag 1 för heterogenitet och 1 för precision. |
||||
| Algoritm, tröskelvärde, population |
Antal observationer (antal studier) |
Sensitivitet och specificitet (95 % KI) Positivt och negativt prediktiva värden, PPV och NPV (95 % KI) |
Vetenskaplig tillförlitlighetsbedömning, enl. GRADE | Implikation (per 1 000 pat.) vid genomsnittlig prevalens i RMI-studierna |
|---|---|---|---|---|
| RMI 200, premenopaus |
n=8 229 (n=18) |
Sensitivitet: 0,57 (0,48−0,66) Specificitet: 0,94 (0,92−0,96) PPV: 0,61 (0,52−0,70) NPV: 0,91 (0,89−0,93) |
Sensitivitet Specificitet |
I en population på 1 000 kvinnor där 180 har äggstockscancer skulle man med testet missa 77 (62–93) fall (falskt negativa) och 49 (34–69) kvinnor skulle testat positivt när de inte har äggstockscancer (falskt positiva) |
6.2.2 ROMA, tröskelvärde 11,4–12,5 procent
Resultatet är baserat på 26 studier [22] [39] [41] [44] [45] [46] [47] [57-74] som inkluderade 6 150 premenopausala kvinnor varav 989 fick diagnosen äggstockscancer. Den genomsnittliga prevalensen i studierna var 18,7 procent (95 % KI: 14,3–23,2). Median 14,1 procent och spridning 2,4–48,1 procent. Sensitiviteten för ROMA var 0,74 (95 % KI: 0,68–0,79) och specificiteten 0,85 (95 % KI: 0,82–0,87). Det positiva respektive negativa prediktiva värdet var 0,48 (95 % KI: 0,40–0,55) samt 0,93 (95% KI: 0,91–0,95). Det vetenskapliga underlaget är svagt för sensitivitet och starkt för specificitet (Figur 6.3, Figur 6.4 och Tabell 6.2)
| KI = Konfidensintervall. * Avdrag 2 för heterogenitet. |
|||||
| Algoritm, tröskelvärde, population |
Antal observationer (antal studier) |
Sensitivitet och specificitet (95 % KI) Positivt och negativt prediktiva värden, PPV och NPV (95 % KI) |
Vetenskaplig tillförlitlighetsbedömning, enl. GRADE | Implikation (per 1 000 pat.) vid genomsnittlig prevalens i RMI-studierna | |
|---|---|---|---|---|---|
| ROMA, 11,4–12,5 % premenopaus |
n=6 150 (n=26) |
Sensitivitet: 0,74 (0,68−0,79) Specificitet: 0,85 (0,82−0,87) PPV: 0,48 (0,40−0,55) NPV: 0,93 (0,91−0,95) |
Sensitivitet Specificitet |
I en population på 1 000 kvinnor där 190 har äggstockscancer skulle man med testet missa 49 (40–60) fall (falskt negativa) och 124 (106–145) kvinnor skulle testat positivt när de inte har äggstockscancer (falskt positiva) | |
6.2.3 LR2, tröskelvärde 10 procent
Det samlade resultatet baserades på fyra studier, [42] [48] [53] [38] som inkluderade 4 578 premenopausala kvinnor av vilka 849 erhållit diagnosen äggstockscancer. Den genomsnittliga prevalensen i studierna var 20,2 procent (95 % KI: 13,3–27,0). Median 19,3 procent, spridning 14,2–27,9 procent. Sensitiviteten för LR2 var 0,82 (95 % KI: 0,82–0,83) och specificiteten 0,89 (95 % KI: 0,89–0,90), enligt Bayes (AL kommer att formulera lämplig kortfattad mening och referens). Både det positiva respektive det negativa prediktiva värdena var 0,68, (respektive 95 % KI: var 0,62–0,74 samt 0,65–0,69). Det vetenskapliga underlaget är måttligt starkt för både sensitivitet och specificitet. (Figur 6.5, Figur 6.6 och Tabell 6.3)
| KI = Konfidensintervall. * Avdrag: 1 för heterogenitet och få studier. |
||||
| Algoritm, tröskelvärde, population |
Antal observationer (antal studier) |
Sensitivitet och specificitet (95 % KI) Positivt och negativt prediktiva värden, PPV och NPV (95 % KI) |
Vetenskaplig tillförlitlighetsbedömning, enl. GRADE | Implikation (per 1 000 pat.) vid genomsnittlig prevalens i RMI-studierna |
|---|---|---|---|---|
| LR2, 10 % premenopaus |
n=4 578 (n=4) |
Sensitivitet: 0,82 (0,82−0,83) Specificitet: 0,89 (0,89−0,90) PPV: 0,68 (0,62−0,74) NPV: 0,68 (0,65−0,69) |
Sensitivitet: Specificitet: |
I en population på 1 000 kvinnor där 200 har äggstockscancer skulle man med testet missa 34 (22–36) fall (falskt negativa) och 88 (80–88) kvinnor skulle testat positivt när de inte har äggstockscancer (falskt positiva) |
6.2.4 ADNEX med CA125, tröskelvärde 10 procent
Resultatet är baserat på 13 studier som [38] [39] [42] [48] [52] [55] [56] [75] [76] [77] [78] [79] inkluderande 6 843 premenopausala kvinnor varav av 1 333 fick diagnosen äggstockscancer. Den genomsnittliga prevalensen i studierna var 20,4 procent (95 % KI: 16,1–24,7), median 18,4 procent, spridning 8,7–37,0 procent. Sensitiviteten för ADNEX var 0,91 (95 % KI: 0,88–0,93) och specificiteten 0,86 (95 % KI: 0,81–0,89). Det positiva respektive negativa prediktiva värdet var 0,61 (95 % KI: 0,56–0,66) samt 0,98 (95 % KI: 0,97–0,99). Det vetenskapliga underlaget är måttligt starkt för både sensitivitet och specificitet (Figur 6.7, Figur 6.8 och Tabell 6.4).
| KI = konfidensintervall. * Avdrag 1 för heterogenitet. |
||||
| Algoritm, tröskelvärde, population |
Antal observationer (antal studier) |
Sensitivitet och specificitet (95 % KI) Positivt och negativt prediktiva värden, PPV och NPV (95 % KI) |
Vetenskaplig tillförlitlighetsbedömning, enl. GRADE | Implikation (per 1 000 pat.) vid genomsnittlig prevalens i RMI-studierna |
|---|---|---|---|---|
| ADNEX, 10 % med CA125 premenopaus |
n=6 843 (n=13) |
Sensitivitet: 0,91 (0,88−0,93) Specificitet: 0,86 (0,81−0,89) PPV: 0,61 0,56−0,66) NPV: 0,98 0,97−0,99) |
Sensitivitet: Specificitet: |
I en population på 1 000 kvinnor där 200 har äggstockscancer skulle man med testet missa 18 (14–24) fall (falskt negativa) och 112 (88–152) kvinnor skulle testat positivt när de inte har äggstockscancer (falskt positiva) |
6.2.5 Simple Rules (SR)
Resultatet är baserat på nio studier [38] [42] [55] [71] [76] [79] [80] [81] [82]. Studierna inkluderade 5 453 premenopausala kvinnor av vilka 760 fått diagnosen äggstockscancer. Den andel osäkra (inkonklusiva) resultat som identifierades hanterades på olika sätt i de olika publikationerna (fem osäkra hanterades som maligna, tre osäkra resultat hanterades med fortsatt utredning, ett stycke hanterades med att man inte räknade med dessa i 2x2-tabellen). Andelen osäkra resultat (varken klart maligna eller benigna) var i storleksordningen 20 procent i de inkluderade publikationerna. I majoriteten av studierna klassades de osäkra som maligna och handlades enligt lokalt gällande klinisk rutin. I andra fall gjordes förnyad ultraljuds diagnostik enligt PR eller annan diagnostisk algoritm, alternativt att de osäkra undersökningarna exkluderades från 2x2-tabelleringen (sant positiv/negativ eller falskt positiv/negativ). Den genomsnittliga prevalensen i studierna var 14,9 procent (95 % KI: 11,5–18,3). Median 14,3 procent, spridning 8,7–23,9 procent. Sensitiviteten för Simple Rules var 0,89 (95 % KI: 0,83–0,93) och specificiteten 0,95 (95 % KI: 0,88–0,98). Det positiva respektive det negativa prediktiva värdet var 0,70 (95 % KI: 0,58–0,82) samt 0,98 (95 % KI: 0,96–0,99). Det vetenskapliga underlaget är måttligt starkt för både sensitivitet och specificitet (Figur 6.9, Figur 6.10 och Tabell 6.5).
| KI = Konfidensintervall. * Avdrag: 1 för heterogenitet och för precision. |
||||
| Algoritm, tröskelvärde, population |
Antal observationer (antal studier) |
Sensitivitet och specificitet (95 % KI) Positivt och negativt prediktiva värden, PPV och NPV (95 % KI) |
Vetenskaplig tillförlitlighetsbedömning, enl. GRADE | Implikation (per 1 000 pat.) vid genomsnittlig prevalens i RMI-studierna |
|---|---|---|---|---|
| Simple Rules, olika hand-läggning av osäkra fall, premenopaus |
n=5 453 (n=9) |
Sensitivitet: 0,89 (0,83−0,93) Specificitet: 0,95 (0,88−0,98) PPV: 0,78 (0,73−0,82) NPV: 0,92 (0,89−0,96) |
Sensitivitet: Specificitet: |
I en population på 1 000 kvinnor där 150 har äggstockscancer skulle man med testet missa 16 (10–25) fall (falskt negativa) och 42 (17–102) kvinnor skulle testat positivt när de inte har cancer (falskt positiva) |
6.2.6 Pattern Recognition (PR)
Resultatet är baserat på sju studier [42] [44] [83] [38] [84] [55] [56]. Studierna inkluderande 5 280 premenopausala kvinnor av vilka 646 fick diagnosen äggstockscancer. Den genomsnittliga prevalensen i studierna var 15,1 procent (95 % KI: 8,9–21,3). Sensitiviteten för PR var 0,92 (95 % KI: 0,85–0,96) och specificiteten 0,93 (95 % KI: 0,90–0,95). Det positiva respektive negativa prediktiva värdet var 0,65 (95 % KI: 0,52–0,78) samt 0,99 (95 % KI: 0,98–0,99). Median 14,3 spridning 3,1–28,4 procent. Det vetenskapliga underlaget är måttligt starkt för sensitivitet och starkt för specificitet (Figur 6.11, Figur 6.12 och Tabell 6.6).
| KI = Konfidensintervall. * Avdrag: 1 för heterogenitet och precision. |
||||
| Algoritm, tröskelvärde, population |
Antal observationer (antal studier) |
Sensitivitet och specificitet (95 % KI) Positivt och negativt prediktiva värden, PPV och NPV (95 % KI) |
Vetenskaplig tillförlitlighetsbedömning, enl. GRADE | Implikation (per 1 000 pat.) vid genomsnittlig prevalens i RMI-studierna |
|---|---|---|---|---|
| Pattern Recognition, Ultraljud vanligen utfört av erfaren sonograf, premenopaus |
n=5 280 (n=7) |
Sensitivitet: 0,92 (0,85−0,96) Specificitet: 0,93 (0,90−0,95) PPV: 0,70 (0,58−0,82) NPV: 0,98 (0,96−0,99) |
Sensitivitet: Specificitet: |
I en population på 1 000 kvinnor där 150 har äggstockscancer skulle man med testet missa 12 (6–22) fall (falskt negativa) och 60 (42–85) kvinnor skulle testat positivt när de inte har äggstockscancer (falskt positiva) |
6.3 Sammanfattning av de indirekta jämförelserna för den premenopausala gruppen
I tabellen nedan beskriver vi effektmått för de olika algoritmerna för gruppen premenopausala kvinnor avseende missade (falskt negativa) och överdiagnostiserade (falskt positiva cancrar) i en hypotetisk kohort. Den omfattar 1 000 premenopausala kvinnor med prevalens 10 procent cancer, samt värden för diagnostisk oddskvot och Yoden index per algoritm samt bedömning av vetenskaplig tillförlitlighet enligt GRADE (Tabell 6.7).
I figuren nedan redovisas vi en analys av punktestimat med konfidensregioner för de sammanvägda resultaten från de olika algoritmerna i den premenopausala populationen (Figur 6.13).
| KI = konfidensintervall; DOR = diagnostisk oddskvot. |
||||||
| Algoritm | Sensitivitet (95 % KI) GRADE |
Falskt negativa (95 % KI) |
Specificitet (95 % KI) GRADE |
Falskt positiva (95 % KI) |
DOR | Yoden index |
|---|---|---|---|---|---|---|
| RMI | 0,57 (0,48–0,66) |
43 (34–52) |
0,94 (0,92–0,96) |
54 (36–72) |
20,8 | 0,51 |
| ROMA | 0,74 (0,68−0,79) |
26 (21–32) |
0,85 (0,82–0,87) |
135 (117–162) |
16,1 | 0,59 |
| LR2 | 0,82 (0,82−0,83) |
18 (17–18) |
0,89 (0,89–0,90) |
99 (90–99) |
36,9 | 0,71 |
| ADNEX | 0,91 (0,88–0,93) |
9 (7–12) |
0,86 (0,81–0,89) |
126 (99–171) |
62,1 | 0,77 |
| SR | 0,89 (0,83–0,93) |
11 (7–17) |
0,95 (0,88–0,98) |
45 (18–108) |
153,4 | 0,84 |
| PR | 0,92 (0,85–0,96) |
8 (4–15) |
0,93 (0,90–0,95) |
63 (45–90) |
152,8 | 0,85 |
Det förelåg inte någon statistiskt säkerställd inbördes skillnad för den diagnostiska tillförlitligheten mellan ADNEX, PR och SR, eftersom deras konfidensregioner överlappar. Dessa tre metoder hade en högre sammanvägd diagnostiskt tillförlitlighet jämfört med både RMI och ROMA. Den inbördes skillnaden mellan RMI och ROMA är statiskt säkerställd. RMI hade en tydligt lägre sensitivitet, men högre specificitet. Förhållandena för ROMA var det omvända med en högre sensitivitet på bekostnad av lägre specificitet.
Punktestimatet för LR2 var mer i samklang med gruppen ADNEX, PR och SR än vad det är för gruppen RMI och ROMA. Däremot förelåg en osäkerhet för LR2 eftersom antalet observationer understeg möjligheten att beräkna konfidensregionen för denna algoritm.
6.4 Postmenopausala kvinnor
6.4.1 RMI, tröskelvärde 200
Resultatet är baserat på 22 studier [36] [38] [39] [40] [41] [42] [43] [45] [46] [47] [48] [49] [50] [52] [53] [54] [55] [56] [75] [76] [79] [85]. Studierna inkluderade 8 731 postmenopausala kvinnor av vilka 3 138 fått diagnosen äggstockscancer. Den genomsnittliga prevalensen cancer inklusive borderline tumörer var 37,6 procent (95 % KI: 32,5–42,6). Median 37,8 procent, spridning 14,2–61,3 procent. Sensitiviteten för RMI var 0,87 (95 % KI: 0,83–0,91) och specificiteten 0,79 (95 % KI: 0,73–0,84). Det positiva respektive det negativa prediktiva värdet var 0,70 (95 % KI: 0,65–0,75) samt 0,90 (95 % KI: 0,88–0,93). Det vetenskapliga underlaget är måttligt starkt för sensitivitet och svagt för specificitet (Figur 6.14, Figur 6.15 och Tabell 6.8).
TP = True Positive (sant positiv); FP = False Positive (falskt positiv); FN = False Negative (falskt negativ); TN = True Negative (sant negativ).
Ingående studier i alfabetisk ordning. Prevalens anges efter namnet på studiens första författare och år som en procentsats (gäller samtliga nedan kopplade skogsdiagram).
| KI = Konfidensintervall. * Avdrag: 1 för heterogenitet. ** Avdrag 2 för heterogenitet och precision. |
|||||
| Algoritm, tröskelvärde, population |
Antal observationer (antal studier) |
Sensitivitet och specificitet (95 % KI) Positivt och negativt prediktiva värden, PPV och NPV (95 % KI) |
Vetenskaplig tillförlitlighetsbedömning, enl. GRADE | Implikation (per 1 000 pat.) vid genomsnittlig prevalens i RMI-studierna | |
|---|---|---|---|---|---|
| RMI, tröskelvärde: 200 postmenopaus |
n=8 731 (n=22) |
Sensitivitet: 0,87 (0,83−0,91) Specificitet: 0,79 (0,73−0,84) PPV: 0,70 (0,65−0,75) NPV: 0,90 (0,88−0,93) |
Sensitivitet: Specificitet: |
I en population på 1 000 kvinnor där 380 har äggstockscancer skulle man med testet missa 57 (34–65) fall (falskt negativa) och 130 (99–167) kvinnor skulle testat positivt när de inte har äggstockscancer (falskt positiva) | |
6.4.2 ROMA, tröskelvärde 14,4–29,9 procent
Resultatet är baserat på 32 studier [22] [36] [39] [41] [44] [45] [46] [47] [52] [57] [59] [60] [61] [62] [64] [66] [69] [70] [71] [72] [73] [74] [86–95]. Studierna inkluderade 7 896 postmenopausala kvinnor, varav 2 613 fick diagnosen äggstockscancer. Den genomsnittliga prevalensen i studierna var 39,1 procent (95 % KI: 35,0–48,6), median 41,0 procent spridning 8,2–77,4 procent. Sensitiviteten för ROMA var 0,87 (95 % KI: 0,82–0,91) och specificiteten 0,83 (95 % KI: 0,80–0,86). Det positiva respektive negativa prediktiva värdet var 0,71 (95 % KI: 0,65–0,77) samt 0,90 (95 % KI: 0,88–0,92). Det vetenskapliga underlaget är lågt för sensitivitet och måttligt starkt för specificitet (Figur 6.16, Figur 6.17 och Tabell 6.9).
| KI = Konfidensintervall. * Avdrag: 2 för heterogenitet och precision. ** Avdrag: 1 för heterogenitet. |
|||||
| Algoritm, tröskelvärde, population |
Antal observationer (antal studier) |
Sensitivitet och specificitet (95 % KI) Positivt och negativt prediktiva värden, PPV och NPV (95 % KI) |
Vetenskaplig tillförlitlighetsbedömning, enl. GRADE | Implikation (per 1 000 pat.) vid genomsnittlig prevalens i RMI-studierna | |
|---|---|---|---|---|---|
| ROMA, 14,4–29,9 %, postmenopaus |
n=7 896 (n=32) |
Sensitivitet: 0,87 (0,82−0,91) Specificitet: 0,83 (0,80−0,86) PPV: 0,71 (0,65−0,77) NPV: 0,90 (0,88−0,92) |
Sensitivitet: Specificitet: |
I en population på 1 000 kvinnor där 390 har äggstockscancer skulle man med testet missa 51 (35–70) fall (falskt negativa) och 104 (85–122) kvinnor skulle testat positivt när de inte har äggstockscancer (falskt positiva) | |
6.4.3 LR2, tröskelvärde 10 procent
Resultatet är baserat på fem studier [38] [42] [48] [49] [53]. Studierna inkluderade 3 735 postmenopausala kvinnor varav 1 461 fick diagnosen äggstockscancer. Den genomsnittliga prevalensen i studierna var 40,8 procent (95 % KI: 31,5–50,1). Median 41,0 procent spridning 30,0–57,4 procent. Sensitiviteten för LR2 var 0,91 (95 % KI: 0,91–0,92) och specificiteten 0,66 (95 % KI: 0,66–0,67). Det positiva respektive det negativa prediktiva värdet var 0,65 (95% KI: 0,53–0,76) samt 0,91 (95 % KI: 0,88–0,95). Det vetenskapliga underlaget är måttligt starkt för sensitivitet och svagt för specificitet (Figur 6.18, Figur 6.19 och Tabell 6.10).
| KI = Konfidensintervall. * Avdrag 1 för heterogenitet och få studier. ** Avdrag 2 för heterogenitet och få studier |
|||||
| Algoritm, tröskelvärde, population |
Antal observationer (antal studier) |
Sensitivitet och specificitet (95 % KI) Positivt och negativt prediktiva värden, PPV och NPV (95 % KI) |
Vetenskaplig tillförlitlighetsbedömning, enl. GRADE | Implikation (per 1 000 pat.) vid genomsnittlig prevalens i RMI-studierna | |
|---|---|---|---|---|---|
| LR2, tröskelvärde, 10 % |
n=3 735 (n=5) |
Sensitivitet: 0,91 (0,91−0,92) Specificitet: 0,66 (0,66−0,67) PPV: 0,65 (0,53−0,76) NPV: 0,91 (0,88−0,95) |
Sensitivitet: Specificitet: |
I en population på 1 000 kvinnor där 400 har äggstockscancer skulle man med testet missa 36 (32–36) fall (falskt negativa) och 204 (198–204) kvinnor skulle testat positivt när de inte har äggstockscancer (falskt positiva) | |
6.4.4 ADNEX med CA125, tröskelvärde 14, 4–29,9 procent
Resultatet är baserat på 13 studier [36] [38] [39] [42] [48] [52] [55] [56] [75] [76] [77] [78] [79]. Studierna inkluderade 6 412 postmenopausala kvinnor varav 2 554 fick diagnosen äggstockscancer. Den genomsnittliga prevalensen i studierna var 41,8 procent (95 % KI: 35,0–48,6). Median 41,1 procent, spridning 23,0–61,3 procent. Sensitiviteten för ADNEX var 0,95 (95 % KI: 0,93–0,96) och specificiteten 0,67 (95 % KI: 0,59–0,75). Det positiva respektive negativa prediktiva värdet var 0,67 (95 % KI: 0,61–0,72) samt 0,95 (95 % KI: 0,94–0,96). Det vetenskapliga underlaget är mycket starkt för sensitivitet och svagt för specificitet (Figur 6.20, Figur 6,21 och Tabell 6.11).
| KI = Konfidensintervall. * Avdrag: 1 för heterogenitet och 1 för precision |
||||||
| Algoritm, tröskelvärde, population |
Antal observationer (antal studier) |
Sensitivitet och specificitet (95 % KI) Positivt och negativt prediktiva värden, PPV och NPV (95 % KI) |
Vetenskaplig tillförlitlighetsbedömning, enl. GRADE | Implikation (per 1 000 pat.) vid genomsnittlig prevalens i RMI-studierna | ||
|---|---|---|---|---|---|---|
| ADNEX, tröskelvärde: 10 % med CA125, postmenopaus | n=6 412 (n=14) |
Sensitivitet: 0,95 (0,93−0,96) Specificitet: 0,67 (0,59−0,75) PPV: 0,67 (0,61−0,72) PPN: 0,95 (0,94−0,96) |
Sensitivitet: Specificitet: |
I en population på 1 000 kvinnor där 420 har äggstockscancer skulle man med testet missa 21 (17–29) fall (falskt negativa) och 191 (145–238) kvinnor skulle testat positivt när de inte har äggstockscancer (falskt positiva | ||
6.4.5 Simple Rules (SR)
Resultatet är baserades på tio studier [36] [38] [42] [55] [71] [76] [79] [80] [81] [82]. Studierna inkluderade 4 795 postmenopausala kvinnor varav 1 446 fick diagnosen äggstockscancer. De osäkra resultaten hanterades på olika sätt i de olika publikationerna (fem stycken osäkra hanterades som maligna, tre stycken osäkra resultat hanterades med fortsatt utredning, två stycken hanterades med att man inte räknade med dessa i 2x2-tabellen). Andelen osäkra resultat var omkring 20 procent. I majoriteten av studierna klassades de osäkra som maligna och handlades enligt gällande klinisk praxis. I andra fall gjordes en förnyad ultraljudsunds diagnostik som Pattern Recognition eller annan diagnostisk algoritm användes, i ett par hanterades de osäkra undersökningarna med exklusion och medtogs inte 2x2-tabelleringen (sant positiv/negativ eller falskt positiv/negativ). Sensitiviteten för Simple Rules var 0,89 (95 % KI: 0,85–0,93) och specificiteten 0,86 (95 % KI: 0,83–0,89). Den genomsnittliga prevalensen i studierna var 37,9 procent (95 % KI: 30,3–43,5), median 39,0 procent, spridning 18,6–50,4 procent. Det positiva respektive det negativa prediktiva värdet var 0,78 (95 % KI: (0,73–0,82) samt 0,92 (95 % KI: 0,88–0,96). Det vetenskapliga underlaget är måttligt starkt för både sensitivitet och specificitet (Figur 6.22, Figur 6. 23 och Tabell 6.12).
| KI = Konfidensintervall. * Avdrag: 1 för heterogenitet och för precision. |
|||||
| Algoritm, tröskelvärde, population |
Antal observationer (antal studier) |
Sensitivitet och specificitet (95 % KI) Positivt och negativt prediktiva värden, PPV och NPV (95 % KI) |
Vetenskaplig tillförlitlighetsbedömning, enl. GRADE | Implikation (per 1 000 pat.) vid genomsnittlig prevalens i RMI-studierna | |
|---|---|---|---|---|---|
| Simple Rules, olika handläggning av inkonklusiva fall, postmenopaus | n=4 795 (n=10) |
Sensitivitet: 0,89 (0,85−0,93) Specificitet: 0,86 (0,83−0,89) PPV: 0,78 (0,73−0,82) NPV: 0,92 (0,88−0,96) |
Sensitivitet: Specificitet: |
I en population på 1 000 kvinnor där 380 har äggstockscancer skulle man med testet missa 42 (27–57) fall (falskt negativa) och 87 (68–106) kvinnor skulle testat positivt när de inte har äggstockscancer (falskt positiva) | |
6.4.6 Pattern Recognition (PR)
Resultatet är baserat på sex studier [42] [44] [38] [84] [55] [56]. Studierna inkluderade 3 187 postmenopausala kvinnor varav 1 144 fick diagnosen äggstockscancer. Den genomsnittliga prevalensen i studierna var 45,9 procent (95 % KI: 36,8–55,0). Median 43,3 procent, spridning 30,0–61,3. Sensitiviteten för PR var 0,93 (95 % KI: 0,87–0,97) och specificiteten 0,83 (95 % KI: 0,78–0,88). Det positiva respektive negativa prediktiva värdet var 0,81 (95 % KI: 0,74–0,88) samt 0,92 (95 % KI: 0,86–0,98). Det vetenskapliga underlaget är måttligt starkt för både sensitivitet och specificitet (Figur 6.24, Figur 6.25 och Tabell 6.13).
| KI = Konfidensintervall. * Avdrag: 1 för heterogenitet och precision. |
|||||
| Algoritm, tröskelvärde, population |
Antal observationer (antal studier) |
Sensitivitet och specificitet (95 % KI) Positivt och negativt prediktiva värden, PPV och NPV (95 % KI) |
Vetenskaplig tillförlitlighetsbedömning, enl. GRADE | Implikation (per 1 000 pat.) vid genomsnittlig prevalens i RMI-studierna | |
|---|---|---|---|---|---|
| Pattern Recognition utfört av erfaren sonograf, postmenopaus | n=3 187 (n=6) |
Sensitivitet: 0,93 (0,87−0,97) Specificitet: 0,83 (0,78−0,88) PPV: 0,81 (0,74−0,88) NPV: 0,92 (0,86−0,98) |
Sensitivitet: Specificitet: |
I en population på 1 000 kvinnor där 460 har äggstockscancer skulle man med testet missa 32 (27–57) fall (falskt negativa) och 92 (65–119) kvinnor skulle testat positivt när de inte har äggstockscancer (falskt positiva) | |
6.5 Sammanfattning av de indirekta jämförelserna för den postmenopausala gruppen
Nedan beskriver vi i en tabell med jämförande effektmått den postmenopausala gruppen avseende missade (falskt negativa) och överdiagnostiserade (falskt positiva cancrar) i en hypotetisk kohort. Den omfattande 1 000 individer med prevalens 10 procent cancer samt värden för diagnostisk oddskvot och Yoden index per algoritm samt bedömning av vetenskaplig tillförlitlighet enligt GRADE (Tabell 6.14).
I figuren redovisar vi en indirekt jämförande analys av punktestimat med konfidensregioner för de sammanvägda resultaten från de olika algoritmerna i den postmenopausala populationen (Figur 6.26).
| KI = Konfidensintervall; DOR = diagnostisk oddskvot. |
||||||
| Algoritm | Sensitivitet (95 % KI) GRADE |
Falskt negativa (95 % KI) |
Specificitet (95 % KI) GRADE |
Falskt positiva (95 % KI) |
DOR | Yoden index |
|---|---|---|---|---|---|---|
| RMI | 0,87 (0,83–0,91) |
13 (9–17) |
0,79 (0,73–0,84) |
189 (144–243) |
25,2 | 0,66 |
| ROMA | 0,87 (0,82–0,91) |
13 (9–18) |
0,83 (0,80–0,86) |
153 (126–180) |
32,7 | 0,70 |
| LR2 | 0,91 (0,91–0,92) |
9 (8–9) |
0,66 (0,66–0,77) |
306 (207–306) |
19,6 | 0,57 |
| ADNEX | 0,95 (0,93–0,96) |
5 (4–7) |
0,67 (0,59–0,75) |
297 (225–369) |
38,6 | 0,62 |
| SR | 0,89 (0,85–0,93) |
11 (7–15) |
0,86 (0,83–0,89) |
126 (99–153) |
49,7 | 0,75 |
| PR | 0,93 (0,87–0,97) |
7 (3–13) |
0,83 (0,78–0,88) |
153 (108–198) |
64,9 | 0,76 |
Punktestimaten för PR, SR, RMI och ROMA:s sensitivitet ligger väl samlade runt 0,9 och specificiteten omkring en tiondel lägre. Dessa fyra algoritmer har alla överlappande konfidensregioner. ADNEX och LR2 har båda ett uppmätt punktestimat för sensitivitet som är likvärdigt högt i förhållande de övrigas men en lägre specificitet. ADNEX och PR har delvis gemensamma konfidensregioner, vidare har ADNEX en tangerande konfidensregion med RMI.
Även för de postmenopausala LR2-patienterna förelåg ett otillräckligt antal observationer för att möjliggöra beräkning av konfidensregionen i denna jämförande analys.
7. Hälsoekonomi
I en rapport från 2018 beräknades samhällskostnaden för äggstockscancer i Sverige uppgå till cirka 824 miljoner kronor [96]. Kostnadsberäkningen inkluderade både direkta och indirekta kostnader. Direkta kostnader inkluderade slutenvård, specialiserad öppenvård, cytostatika, angiogeneshämmare och PARP-hämmare för tilläggs- och underhållsbehandling. Indirekta kostnader inkluderade produktionsförluster till följd av kortvarig, långvarig och permanent sjukfrånvaro, men även till följd av förlorade levnadsår (det vill säga de förlorade produktionsår som uppstår till följd av att en individ avlider innan pensionsåldern). Enligt rapporten uppgick kostnaden för tidig död och produktionsbortfall till 539 miljoner kronor, motsvarande cirka 65 procent av den totala kostnaden. Även om det är viktigt att förstå sjukdomens samhällsekonomiska börda, ger uppskattningen av kostnaderna ingen information om behandlingsmetodernas kostnadseffektivitet eller om hur väl den diagnostiska processen fungerar.
En analys av hälsoekonomiska aspekter syftar till att belysa relationen mellan kostnader och effekter av en viss insats inom hälso- och sjukvården. En hälsoekonomisk utvärdering av diagnostiska test ger beslutsfattare underlag att bedöma testernas kostnadseffektivitet. Kostnadseffektiviteten beräknas genom att jämföra vad ett test genererar för kostnader och effekter på marginalen jämfört med ett annat test och uttrycks därför i formen av en inkrementell kostnadseffektkvot (ICER). För att analysen ska vara fullständig måste ett tillräckligt långt tidsperspektiv appliceras där samtliga relevanta kostnader och effekter inkluderas. Kostnadseffektivitetsanalyser av diagnostiska test tar hänsyn till både kostnader och effekter av de test som jämförs, men också hur testresultaten påverkar vårdflöden, resursförbrukning och patientens hälsoutfall över tid, helts utifrån ett livstidsperspektiv.
Testens tillförlitlighet, uttryckt i termer av sensitivitet och specificitet, påverkar sannolikheten för olika utfall såsom val av behandling, överlevnad och livskvalitet, och vore därför en central parameter i en hälsoekonomisk analys. Därutöver krävs information om kostnader och effekter relaterad till patienten och vårdflödet för samtliga utfall av testerna: sant positiva, falskt positiva, falskt negativa och sant negativa. Analysen resulterar i en jämförelse som på ett strukturerat sätt tar hänsyn till testens olika värden i sensitivitet och specificitet. I den postmenopausala gruppen, uppskattas i denna rapport (Tabell 6.15) att ADNEX har högst sensitivitet men lägre specificiteten än SR. Detta medför risk för överdiagnostik och behandling av kvinnor utan cancer, vilket inte bara orsakar personligt lidande och risk för negativa hälsoeffekter, utan också att vårdresurser används till patienter utan behov istället för till dem med ett faktiskt vårdbehov. Högst specificitet hade istället SR, men i kombination med en lägre sensitivitet, det medför att risken för överbehandling minskar men att risken att inte upptäcka kvinnor med cancer ökar.
Kostnaden för ett transvaginalt ultraljud är cirka 2 000 kronor och för ett CA125- och HE4-prov cirka 50 respektive 180 kronor (uppgifter om kostnader från sakkunniga). Ur ett samhällsekonomiskt perspektiv kan även kostnader uppstå för patienten till följd av resor till och från provtagning samt tiden som det tar att genomföra testet. För patienten kan ett diagnostiskt test påverka livskvaliteten genom att skapa oro (till exempel om testresultatet dröjer, eller om det finns stor risk för falskt positiva eller negativa resultat) eller ge obehag (om testet är smärtsamt eller integritetskränkande). Dessa är exempel på kostnader som ska ingå i en analys men sannolikt inte de som driver kostnaderna. I en fullständig analys, där ett livstidsperspektiv appliceras, är det rimligt att anta att det snarare är skillnader i testernas tillförlitlighet utifrån effekten på över- och underdiagnostisering som påverkar resursförbrukning, livskvalitet och överlevnad.
8. Etiska aspekter vid diagnostik av äggstockscancer
Vid diagnostik av äggstockscancer finns flera etiska aspekter att beakta, såsom risker för överdiagnostik och underdiagnostik, integritetsintrång, jämlik tillgång till vård och associerade kostnader. De etiska resonemangen i denna rapport bör förstås utifrån svensk lagstiftning samt det faktum att svensk sjukvård till största del är offentligt finansierad.
- Hälso- o sjukvårdslagen om att målet med hälso- och sjukvården är en god hälsa och en vård på lika villkor för hela befolkningen [97].
- Etiska plattformen om de tre övergripande principerna: människovärdes-principen, behovs- och solidaritetsprincipen samt kostnadseffektivitetsprincipen [98].
- Patientsäkerhetslagen om att vård ska ges i enlighet med vetenskap och beprövad erfarenhet [99].
- Patientlagen om att stärka patientens integritet, självbestämmande och delaktighet [100].
8.1 Över- respektive underdiagnostik
Överdiagnostik innebär att testet överskattar det sanna antalet med sjukdomen (falskt positiva utfall). Underdiagnostik innebär att testet underskattar det sanna antalet (falskt negativa utfall). Diagnostik av allvarliga sjukdomar som äggstockscancer medför ofta en ökad risk för överdiagnostik. Vilket kan förklaras, och även sannolikt rättfärdigas, enligt en försiktighetsprincip. Denna försiktighetsprincip kan härledas från sjukvårdens generella strävan att göra gott, det vill säga att diagnostisera, behandla och i bästa fall bota den allvarliga sjukdomen alternativt lindra och förlänga överlevnaden.
Även om risken för överdiagnostik på gruppnivå är begränsad är den allvarlig på individnivå för både den pre- respektive den postmenopausala patienten. Om testet visar misstänkt cancer före operation, är det vanligt att både patienten och vårdteamet accepterar risken för komplikationer.
För premenopausala patienter som diagnosticerats med algoritmen RMI är risken för överdiagnostik tydlig, förmågan att identifiera sann sjukdom är lägre än vad det är för de andra algoritmerna. För dessa patienten finns det också risk att äggstockskirurgi påverkar fertiliteten på lång sikt. Vidare finns alltid principiella risker med kirurgi och narkos. Enligt svenska komplikationsregistret år 2024 registrerades en komplikation hos drygt 16 procent av de 1 403 opererade under åren 2023 och 2024 [3]. Tre procent var allvarliga komplikationer och resterande ”lindriga” komplikationer där huvudparten var infektioner.
Vid underdiagnostik upptäcks de missade cancerfallen senare till följd av sjukdomens progression med mer tydligare symptom och kliniska tecken. Patienten kan vid det tillfället vara i ett mer avancerat sjukdomsstadie med en sämre prognos (Figur 2.3). Behandlingen är då ofta mer avancerad och krävande för patienten. Vidare torde den avancerade behandlingen vara mer kostsam (Hälsoekonomi Kapitel 7) vilket medför risk för undanträngningseffekter inom den offentligt finansierade sjukvården. Den missade diagnosen kan naturligtvis även leda till att tumörsjukdomen upptäcks så sent att endast palliativ behandling kommer i fråga.
8.2 Potentiella integritetsintrång, tillgänglighet och kostnad
Den diagnostiska metod som oftast används idag innefattar ett inslag som kan upplevas som ett intrång i den personliga integriteten – exempelvis ett transvaginalt ultraljud, vilket används av samtliga algoritmer utom ROMA. Alternativt kan metoden vara mindre tillgängligt för individen, när den endast erbjuds inom högspecialiserad vård (till exempel PR som kräver en mycket erfaren sonograf), eller vara förenad med högre kostnader för kliniken. En hypotetisk algoritm som har något lägre diagnostisk tillförlitlighet, men samtidigt innebär ett mindre integritetsintrång, är mer lättillgänglig för patienten och dessutom kostnadseffektiv. Sammantaget skulle den hypotetiska algoritmen kunna leda till att fler patienter väljer att genomgå undersökningen. Trots den något sämre tillförlitligheten skulle det totala antalet patienter som får en tidig diagnos kunna öka, eftersom fler faktiskt genomgår testet.
Det etiska dilemmat blir då: Vilken är den lägsta tolerabla nivån för den diagnostiska tillförlitligheten på gruppnivå i förhållande till subjektivt integritetsintrång, likvärdig tillgänglighet och kostnad.
9. Diskussion
Syftet med denna utvärdering var att undersöka den diagnostiska tillförlitligheten hos de enskilda algoritmer som används vid misstänkt äggstockscancer samt jämföra dem sinsemellan.
9.1 Resultatdiskussion
Ingen av de utvärderade algoritmernas diagnostiska tillförlitlighet var överlägsen de övriga i någon av grupperna. I den postmenopausala gruppen var det sammanvägda värdet för ADNEX specificitet klart lägre. Ultraljudsmetoderna SR och PR, som huvudsakligen används i Sverige, står sig väl i diagnostiken av äggstockscancer.
I den premenopausala gruppen fann vi att det inte fanns någon statistiskt säkerställd inbördes skillnad för den diagnostiska tillförlitligheten mellan ADNEX, PR och SR och dessa tre algoritmer hade en högre diagnostisk tillförlitlighet än både RMI och ROMA. RMI hade högre specificitet men lägre sensitivitet än ROMA som inte inkluderar ultraljud. Data var otillräckliga för att beräkna en konfidensregion för LR2 men punktestimatet ligger nära PR, SR och ADNEX.
I den postmenopausala gruppen visade resultaten att punktestimaten för PR, SR, RMI och ROMA:s sensitivitet är väl samlade runt 0,9 och specificiteten är omkring en tiondel lägre. Dessa fyra algoritmer kunde inte med säkerhet särskiljas. PR hade en större yta för konfidensregionen vilket betyder en större statistisk osäkerhet. ADNEX och LR2 hade båda ett punktestimat för sensitivitet som är likvärdigt de övrigas, men lägre specificitet. ADNEX och PR hade överlappande konfidensregioner medan SR och ROMA hade en statistiskt lägre sensitivitet än ADNEX.
Vår utvärdering visar att ingen av de övriga algoritmerna hade en högre diagnostisk tillförlitlighet än SR och PR, som används i svensk sjukvård i dag. Resultaten baserades på en stor mängd data från flera studier med ett stort antal observationer. Kontexten i studierna är huvudsakligen i specialiserad vård (sekundär och tertiär vård) med tidvis hög prevalens cancer. Positivt och negativt prediktivt värde påverkas av prevalensen, men prevalensen cancer påverkar även sensitivitet och specificitet i studierna. Detta medför att resultaten inte nödvändigtvis är överförbara till primärvård.
RMI-algoritmen, som har använts längst, består av de tre delarna: ett viktat menopausal status, tumörmarkören CA125 och ett strukturerat ultraljud. Denna algoritm hade, i vår utvärdering och även i Davenports utvärdering, en hög specificitet och därmed ett högt negativt prediktivt värde, vilket innebar att man med hög säkerhet kan friskförklara en premenopausal kvinna med ett negativt RMI-provsvar. Vi inkluderade 18 studier i den premenopausala gruppen och resultatet för specificitet var med god precision 0,94 (95 % KI: 0,92–0,96). Det negativa prediktiva värdet var 0,91 (95 % KI: 0,89–0,93) vilket betyder att ett negativt provsvar i cirka 9 fall av 10 var korrekt vid given prevalens. Det vetenskapliga underlaget för RMI:s specificitet bedömdes som starkt.
I ROMA-algoritmen ingår tumörmarkörerna CA125 och HE4 som kombineras med ett viktat menopausalt status, men däremot inte ultraljud. För ROMA visade vår utvärdering att tillägget av tumörmarkören HE4 inte uppväger den informationen som ultraljudskomponenten tillför.
Davenport och medförfattare framhåller ADNEX som algoritmen att föredra, eftersom den missar färre cancerfall [28]. Vår systematiska översikt innehåller till skillnad från Davenports översikt även sammanvägda resultat för SR och PR. Sammanvägningen visade att båda dessa ultraljudsbaserade metoder hävdar sig statistiskt väl jämfört med ADNEX med CA125. I överenstämmelse med Davenport fick vi relativt högt sensitivitetsvärde för ADNEX men på bekostnad av sämre specificitet framför allt i postmenopausala gruppen. Många kvinnor utan cancer blev felaktigt klassificerade som om de hade cancer. (Tabell 6.9 och Figur 6.13). Värt att notera är att de båda ultraljudsmetoderna SR och PR samt även RMI, uppvisade hög specificitet i den premenopausala gruppen, vilket stöder att ett negativt utfall med stor sannolikhet betyder godartad förändring, inte minst vid låg prevalens och därmed högt negativt prediktivt värde. Resultaten för SR och PR talar för att sonografen (ultraljudsundersökaren) i större utsträckning hade lättare att identifiera premenopausala kvinnor med godartad förändring än cancer vilket naturligtvis också påverkas av att sonografen vet att risken för cancer är lägre i denna grupp kvinnor.
I den postmenopausala gruppen fann vi att samtliga sex studerade algoritmer hade hög sensitivitet med få missade cancerfall (Figur 6.26). Detta gäller också ADNEX som däremot förefaller ha en lägre specificitet, många falskt positiva, vilket kan medföra att man opererar friska kvinnor.
I båda grupperna (pre- och postmenopausala) uppvisade PR och SR hög sensitivitet och hög specificitet som, i förhållande till de andra algoritmerna, innebär färre falskt positiva utfall vid beräkning i en hypotetisk kohort med en given cancerprevalens. Ett intressant observandum är att SR och PR även hamnar i topp i rankinglistorna för Yodens index och diagnostisk odds ratio. Vilket också överensstämmer med SR och PR:s diagnostiska tillförlitlighet (Figur 6.13 och 6.26).
I den kliniska vardagen används vanligen SR av gynekologer vid den initiala bedömningen. PR används i regel av gynekologer med mer erfarenhet och/eller kompletteras med ytterligare undersökning hos ultraljudsspecialiserad gynekolog som använder PR i bedömningen.
Både PR och SR har nackdelar. PR kräver en skicklig och erfaren sonograf. Certifiering med IOTA är ett sätt att säkerställa att undersökningarna utförs av en kompetent sonograf, med möjlighet att upprätthålla sin kompetens.
För SR föreligger en inbyggd svaghet avseende den relativt betydande andelen osäkra fynd som är cirka 1 av 5 patienter i de inkluderade publikationerna. Dessa oklara patienter hanteras olika i studierna. Vissa centra driver diagnostiken av osäkra SR-fall vidare, oftast med PR eller annan diagnostik såsom CT eller MR, medan andra handlägger dessa fall som maligna. Ytterligare andra centra handlägger oklara med en strukturerad uppföljning med förnyad ultraljudsundersökning med CA125-analys oftast inom 8–12 veckor, tills risken för eventuell malignitet överväger och operation erbjuds, alternativt att patienten friskförklaras.
Kvinnor med misstänkt äggstockscancer som genomgått en ultraljudsundersökning med osäkra fynd, det vill säga, där den identifierade förändringen inte med (rimlig) säkerhet är malign eller benign, kan ha cancer. Definitiv diagnos kan endast fastställas efter kirurgiskt avlägsnande av förändringen och efterföljande histopatologisk undersökning. I praktiken kan man inte utsätta alla med osäkra fynd för de operativa risker eller de samhälliga kostnaderna för en operation. Det gäller både falskt negativa och falskt positiva och även när algoritmen har hög sensitivitet och specificitet uppstår sådana fall. Kvinnor där en definitiv diagnos ännu inte kunnat fastställas behöver följas upp på ett strukturerat sätt för att undvika fördröjd diagnos med försämrad prognos.
I en stor IOTA-studie undersöks uppföljningen av osäkra fall. Alla deltagare bedömdes först enligt IOTA-kriterierna [25]. Förändringar på äggstockarna som bedömdes som fysiologiska (follikel eller corpus luteumcystor) eller små enrummiga cystor uteslöts. Studiedeltagare med större och mer komplicerade förändringar som bedömdes som benigna följdes upp efter 3, 6 och 12 månader och därefter med årliga uppföljningar. Efter två år var 0,4 procent av de som initialt bedömts som benigna, maligna. [101]. IOTA har därför som en följd av detta utvecklat ett tvåstegsförfarande. Detta förfarande går ut på att studiedeltagare med cystor med misstanke om endometrios, dermoider och andra cystor med benigna tecken, så kallade ”benign descriptors” följdes upp vilket resulterade i att så många som 99,3 procent visade sig vara benigna [102]. Dessa fynd har bekräftats i en senare studie som för närvarande är elektroniskt publicerad [103].
Strukturerade uppföljningar skulle kunna vara ett potentiellt sätt att hantera mängden av misstänkt falskt positiva och oklara fynd. Arbetsgruppen för ultraljudsdiagnostik inom Svensk Förening för Obstetrik och Gynekologi förbereder kunskapsstöd i linje med detta.
9.2 Metoddiskussion
Vi har sammanställt och utvärderat den diagnostiska tillförlitligheten för sex olika algoritmer som används för att diagnosticera äggstockscancer internationellt varav flera även är i bruk i Sverige. Litteratursökningen omfattade både randomiserade studier och observationsstudier. Men vi identifierade inga relevanta randomiserade studier. De flesta inkluderade studier var diagnostiska tvärsnittsstudier där indextestet gjorts i nära anslutning till referenstestet, där referenstestet var mikroskopisk undersökning av den avlägsnade tumörvävnaden (Gold standard) eller en strukturerad uppföljning av de som inte opererats.
I prospektiv studiedesign däremot börjar studien med indextestet och därefter görs referenstestet. Vad gäller möjligheten för att minska risken för systematisk snedvridning ska patologen som gör referenstestet vara blindad för indextestets resultat. ROCKets studien av Sundar och medförfattare är ett exempel på en stor prospektiv studie på postmenopausala kvinnor som är genomförd på detta sätt. Prevalensen cancer i studien var dessutom relativt låg (17 %) [36].
Vid en retrospektiv diagnostisk tvärsnittsstudie utgår man från journalanteckningar eller register för att identifiera de som har opererats och därefter kan indextestet göras på sparade ultraljudsfilmer och/eller analys av sparade blodprover. Här är det viktigt att indextestet utförs blindat. Viktiga punkter för bedömningen av risken för systematisk snedvridning i dessa studier är om fallserien rapporteras som konsekutiv och att eventuella bortfall redovisas.
Prevalensen av äggstockscancer varierade stort mellan studierna och var påfallande hög vilket inger en misstanke om selektion av patienter. De mottagningar som patienterna rekryterats till, var oftast tertiärcentrum (högspecialiserad vård) men i flera studier anges inte på vilket sätt studiedeltagarna rekryterats. Prevalensen kan påverka sensitivitet och specificitet och definitivt positivt och negativt prediktivt värde. Högre prevalens medför högre positivt prediktivt värde och lägre negativt prediktivt värde vilket man ska ha i åtanke vad gäller den egna kliniken. Trots att de inkluderade studierna skiljer sig åt vad gäller prevalens, bedömde vi att de hade mer gemensamt än vad som skilde dem åt. Därför gjorde vi bivariatanalyser och sammanvägde dem i metaanalyser. För flera algoritmer hade vi ett stort antal studier vilket medförde precisa punktestimat med litet konfidensintervall. Men för LR2 var studierna för få för att bedöma punktestimatets osäkerhet.
Vi har särredovisat den diagnostiska tillförlitligheten för pre- och postmenopausala kvinnor vilket minskar heterogeniteten i analysen och detta är dessutom mer kliniskt relevant eftersom grupperna har olika cancerrisk och inte helt lika fördelning av cancertyp.
Man kan diskutera och ifrågasätta upplägget av metodiken i denna utvärdering och i andra systematiska utvärderingar av diagnostisk tillförlitlighet där utfallen, jämfört med en Gold standard referenstest, blir bivariata i form av en 2x2-tabell såsom sant positiva, falskt negativa, sant negativa och falskt positiva. I varje publikation extraherades data så att sensitivitet och specificitet kunde räknas fram ur 2x2-tabeller. Därefter erhölls sensitivitet och specificitetsvärden. Dessa plottades i kopplade skogsdiagram med punktestimat och konfidensintervall. Sammanvägningen gjordes i en bivariat HSROC-analys med punkestimat och konfidensregion. Vi kunde sedan jämföra de sammanvägda resultaten för de andra algoritmerna. Problemet är att algoritmerna som jämförts avseende diagnostiska prestanda inte har jämförts direkt i samma studie på samma patientpopulation. Den idealiska studien som vore att föredra är om två eller flera algoritmers prestanda jämförs direkt i samma studie på samma patientpopulation. Man kan jämföra med interventionsstudier där behandling A jämförs med behandling B och man skulle naturligtvis kräva att A jämförs med B i samma studie, företrädesvis efter randomisering. Om man inte har direkta jämförelser i samma studie finns metodik där man med nätverksmetaanalyser indirekt kan jämföra A med B om jämförande studier gjorts med en annan tredje behandling och på så sätt få en rankinglista om flera behandlingars effekter ska studeras utan att direkt jämförande studier gjorts. Någon sådan nätverksmetaanalys för resultat från diagnostiska studier har vi inte gjort. Vi anser att vi fått, en tillräckligt god uppfattning genom indirekta jämförelser av den diagnostiska tillförlitligheten, trots frånvaro av analys av direkt jämförande studier och nätverksmetaanalys. Vi sammanvägde resultaten för en viss algoritm från olika studier. Direkta effekter på en population med en ”given” prevalens cancer kunde räknas fram i form av antalet missade cancerfall (falskt negativa) och antalet överdiagnostiserade, det vill säga positivt testresultat, trots att de inte hade cancer (falskt positiva) och resultatet jämfördes med andra algoritmers (Avsnitt 6.3 och Avsnitt 6.5).
10. Överväganden för framtida forskning inom diagnostik
Det hade varit fördelaktigt både på individ- och gruppnivå om man hade kunnat säkerställa en lägsta klinisk godtagbar diagnostisk tillförlitlighetsnivå för algoritmer vid misstanke om äggstockscancer. Detta låter sig i praktiken svårligen göras av flera anledningar. På ett ytligt plan förefaller äggstockscancer vara en sjukdoms entitet. I själva verket kan sjukdomen brytas ner i tydliga undergrupper, bland annat beroende av vilket vävnadsursprung som tumörvävnaden har, med påföljande inneboende olika allvarlighetsgrader, vilken population som huvudsakligen drabbas, eventuell förekomst av genetiskt predisponerande faktorer med mera (Avsnitt 2.3). På grund av att sjukdomen och populationen är heterogen har man inte kunnat identifiera eller validera en lägsta gemensam godtagbar diagnostisk tillförlitlighetsnivå. Detta forskningsarbete bör utföras i nära samarbete mellan klinisk- och grundforskning.
Diagnostiken av äggstocksförändringar genomgår en snabb utveckling där avancerade teknologier och tvärvetenskapliga metoder samverkar för att förbättra den diagnostiska tillförlitligheten, särskilt för tidig upptäckt av cancer och borderline förändringar. Flera innovativa tekniker utvecklas för att förbättra diagnostik och uppföljning av äggstockscancer. Vätskebiopsi med cfDNA (cellfritt DNA) möjliggör icke-invasiv analys av tumörmutationer. Artificiell Intelligens (AI) förbättrar bilddiagnostik, särskilt för ultraljud, och kan automatisera bedömningar. Med olika avbildningsmetoder kan man kombinera struktur med funktion såsom PET-MR och PET-CT vilket teoretiskt kan leda till avancerade bedömningar. Algoritmer som O-RADS (Ovarian-Adnexal Reporting and Data System) kan ge detaljerad riskklassificering. VOC (Volatil Organic Compounds) -analyser och proteomik erbjuder nya sätt att identifiera cancer via analys av organiska föreningar kroppsvätskor och proteinmönster. Dessa metoder kräver validering men har potential att tillsammans med AI skapa integrativa modeller för precisionsdiagnostik. Standardisering och internationellt samarbete är avgörande för framtida klinisk användning.
För ytterligare läsning om kommande diagnostiska tekniker, se Bilaga 7 där även referenser anges.
11. Medverkande
11.1 Projektgrupp
11.1.1 Sakkunniga
- Ellika Andolf, professor emerita, gynekolog, Karolinska Institutet, Danderyds Sjukhus, Stockholm
- Christer Borgfeldt, professor, gynekolog, subspecialist i gynekologisk tumörkirurgi med cancervård, Universitetssjukhuset i Linköping
11.1.2 Kansli
- Jan Holst, projektledare
- Sigurd Vitols, biträdande projektledare
- Ann Kristine Jonsson, informationsspecialist tom. 2025-02-01
- Maja Kärrman Fredriksson, informationsspecialist from 2025-02-18
- Johanna Wiss, hälsoekonom
- Elisabeth Gustafsson, projektadministratör tom 20 september 2024
- Anna Attergren Granath, projektadministratör from 20 september 2024
- Jenny Odeberg, projektansvarig chef
- Anna Levinsson, medverkande projektledare
- Fredrik Tholander, medverkande projektledare
11.1.3 Externa granskare
- Karin Sundfeldt, professor, gyn-onkologisk kirurg, Sahlgrenska sjukhuset, Göteborg
- Ulrika Ottander, docent, gyn-onkologisk kirurg, Umeå universitetssjukhus, Umeå
SBU anlitar externa granskare av sina rapporter. De har kommit med värdefulla kommentarer som förbättrat rapporten. SBU har dock inte alltid möjlighet att tillgodose alla ändringsförslag och de externa granskarna står därför inte med nödvändighet bakom samtliga slutsatser och texter i rapporten.
11.1.4 Bindningar och jäv
Sakkunniga och externa granskare har i enlighet med SBU:s krav lämnat deklarationer om bindningar och jäv. SBU har bedömt att de förhållanden som redovisats där är förenliga med myndighetens krav på saklighet och opartiskhet.
11.1.5 SBU:s vetenskapliga råd
- Anna Ehrenberg, Högskolan Dalarna, ordförande (omvårdnad)
- Katarina Steen Carlsson, Lunds universitet, vice ordförande (hälsoekonomi)
- Aron Naimi-Akbar, Malmö universitet (tandvård)
- Ata Ghaderi, Karolinska institutet (psykologi)
- Britt-Marie Stålnacke, Umeå universitet (medicin)
- Carina Berterö, Linköpings universitet (omvårdnad)
- Christina Nehlin Gordh, Uppsala universitet (psykiatri)
- Eva Uustal, Linköpings universitet (medicin)
- Jahangir Khan, Göteborgs universitet (hälsoekonomi)
- Lena Dahlberg, Högskolan Dalarna (socialt arbete)
- Magnus Svartengren, Uppsala universitet (arbetsmiljö)
- Martin Bergström, Lunds universitet (socialt arbete)
- Mussie Msghina, Örebro universitet (medicin)
- Petter Gustavsson, Karolinska institutet (psykologi)
- Susanne Guidetti, Karolinska institutet (arbetsterapi)
- Sverker Svensjö, Falun och Uppsala universitet (medicin)
- Titti Mattsson, Lunds universitet (etik, juridik)
- Ulrik Kihlbom, Karolinska institutet (etik)
- Urban Markström, Umeå universitet (socialt arbete, funktionstillstånd- och funktionshinder)
- Ylva Nilsagård, Örebro universitet (fysioterapi).
12. Ordförklaringar och förkortningar
| ADNEX | Eng. Assessment of Different NEoplasias in the adneXa model, är en algoritm |
| Algoritm | En tågordning eller procedur för ett antal väldefinierade delmoment eller regler som genomförs för att lösa en frågeställning. Begreppet algoritm härstammar från den berömda persiske matematiker och astronomen al Khwarizmi. |
| Atypi | Atypi betyder att det avviker från det normala. Till exempel kan celler i kroppen vara atypiska det vill säga att de har förändrats. |
| AUC | Arean under kurvan (statistiskt begrepp) |
| Benign | Godartad |
| Bias | Ett systematiskt fel (snedvridning) i en vetenskaplig studies upplägg eller genomförande som påverkar resultaten och inte beror på slumpfaktorer |
| Bivariat | Att man undersöker två saker samtidigt – oftast kallade X och Y och tar reda på om det finns ett samband mellan dem. I detta sammanhang sensitivitet och specificitet. |
| Blindning | Åtgärd för att studiedeltagarna och de som utför, observerar eller analyserar studien ska vara ovetande om vilken insats deltagarna fått. Blindning hindrar att det uppkommer snedvridning av resultatet vid en studies genomförande. |
| BRCA | BRCA-associerad cancer innebär att en cancertumör har uppstått på grund av en mutation i en av BRCA-generna, BRCA1 eller BRCA2. Dessa gener är normalt involverade i reparation av DNA-skador och en mutation i dem kan leda till ökad risk för vissa cancerformer, framförallt bröstcancer och äggstockscancer |
| Bäckentumor | Tumör lokaliserad till bäckenet, kan vara benign eller malign. |
| CA125 | Tumörmarkör, bland annat för äggstockscancer. |
| CEA | Carcinoembryonalt antigen, är en tumörmarkör som mäts i blodprov och kan indikera förekomst av vissa cancertyper, framförallt i matsmältningssystemet. Det kan också användas för att följa hur effektiv en cancerbehandling är och se om cancern återkommer |
| Confounder | Förväxlingsfaktor som man måste ta hänsyn till eftersom den riskerar att snedvrida resultatet vid analys av det undersökta orsakssambandet |
| Dermoid | En medfödd, godartad tumör som kan innehålla olika typer av vävnad från kroppens celler, såsom hud, hår, tänder och brosk, inneslutna i ett skal av bindväv (även kallad dermoidcysta) |
| Dysplasi | Missbildning, rubbning i utvecklingen, till exempel cervixdysplasi, missbildade celler på livmoderhalsen |
| DOR | Den diagnostiska oddskvoten, ett enhetligt mått på en diagnostisk tests prestationsförmåga som är oberoende av sjukdomens förekomst (prevalens) i populationen. |
| DT | Datortomografi, vilket är en medicinsk röntgenundersökning som ger detaljerade bilder av kroppens inre organ |
| Effektmått | Effektmått är ett begrepp som används för att beskriva hur stark eller betydelsefull en skillnad eller ett samband är i en undersökning eller analys |
| FIGO | FIGO-stadieindelning, inom gynekologisk cancer, avser ett klassificeringssystem framtaget av International Federation of Gynecology and Obstetrics (FIGO). Det används för att bedöma spridningen av cancer i underlivet (till exempel livmoderhalscancer, äggstockscancer, vulvacancer) och hjälper till att bestämma lämplig behandling och prognos |
| Fysiologiska cystor på äggstockarna | är normala, vätskefyllda blåsor som uppstår som en del av den normala menstruationscykeln |
| GRADE | Grading of Recommendations Assessment, Development and Evaluation. Modell för värdering av tillförlitligheten av resultat i systematiska översikter och andra forskningssammanställningar |
| Histopatologisk | Undersökning av vävnad i mikroskop. |
| HTA | Health Technology Assessment. Utvärdering av hälso- och sjukvårdens metoder. Det är en tvärvetenskaplig process som använder specifika utvärderingsmetoder för att bedöma kunskapsläget rörande en åtgärd. Syftet är att ta fram ett beslutsunderlag som främjar likvärdig och effektiv hälso- och sjukvård av hög kvalitet. |
| Incidens | Antalet nya fall av en sjukdom eller ett tillstånd som uppstår inom en given population under en specifik tidsperiod |
| Inklusionscystor | Vätskefyllda blåsor som kan bildas på äggstockarna. De är oftast godartade och försvinner oftast av sig själva |
| IOTA | International Ovarian Tumor Analysis (IOTA) Group |
| Karcinom | Cancer som utgår från epitelceller, det vill säga den vävnad som täcker kroppens ytor och inre organ |
| Konfidensintervall | Osäkerhetsintervall för en statistisk skattning (till exempel ett medelvärde). |
| LR2 | Eng. Logistic Regression 2, är en algoritm |
| Låggradig cancer | Långsam tillväxt och celler som liknar normala celler mer än vid höggradig cancer |
| Malign | Elakartad, som utan behandling leder till döden. |
| Metaanalys | Statistisk metod för att sammanväga resultat från flera undersökningar. |
| MR | Magnetisk resonanstomografi, en medicinsk avbildningsteknik som använder starka magnetfält och radiovågor för att skapa detaljerade bilder av kroppens inre organ och vävnader |
| Observationsstudie | I en observationsstudie studeras deltagarna utan påverkan från de som utför studien. |
| Obstetriker | Medicinsk specialitet som fokuserar på vården av kvinnor under graviditet, förlossning och tiden efter förlossningen (barnbörd) |
| PARP-hämmare | En typ av läkemedel som används främst vid behandling av vissa former av cancer |
| Patogenetisk | Uppkomst och utveckling av en sjukdom, förhållandet mellan sjukdomsorsak- och verkan |
| PIRO | En strukturerad fråga enligt följande format: Population (Eng. population) Indextest (Eng. index test) Referenstest (Eng. reference standard) Utfall (Eng. outcome) |
| Prekursor | Ett tidigt tecken eller ämne som indikerar att en sjukdom eller ett tillstånd är på väg att utvecklas |
| Population | Den grupp som studeras i ett forskningsprojekt, i detta projekt avses pre- och postmenopausala kvinnor med antingen misstänkt cancer eller där man identifierat objektiva fynd av bäckentumor. |
| PR | Eng. Pattern Recognition, är en algoritm |
| Prediktivt värde | Ett statistiskt mått som anger hur bra ett testresultat är på att förutsäga ett visst utfall eller tillstånd. Det beskriver sannolikheten att ett positivt eller negativt testresultat faktiskt är korrekt |
| Punktestimat | Ett urval (ett stickprov) från en större population och sedan beräknar ett tal som ska representera ett visst värde för hela populationen för att uppskatta olika typer av populationsparametrar |
| RCT-studie | Randomised Controlled Trial. Svenska: randomiserad kontrollerad studie. Vetenskaplig studie där deltagarna slumpmässigt delas in olika grupper. En grupp får en viss insats, en annan grupp får inte insatsen |
| Referenstest | Test som man jämför det studerade testet mot. I denna rapport avses mikroskopisk patologisk anatomisk diagnos eller icke-ovarial cancerdiagnos över tid (12 mån) i diagnostiska fall-kontrollstudier. |
| RMI | Eng. Risk of Malignancy Index, en algoritm |
| ROMA | Eng. Risk of Ovarian Malignancy Algorithm, är en algoritm |
| Sensitivitet | Förmågan att identifiera sjukdom, diagnostikens känslighet (SP / ((SP+FN)) |
| SFOG | Förening för Obstetrik och Gynekologi, är en professionsorganisation |
| Skogsdiagram | Eng. forest plot, är en grafisk representation av resultaten från en metaanalys. Det visar effektstorleken och konfidensintervallet för varje enskild studie som ingår i metaanalysen, samt den totala sammanlagda effekten |
| Sonograf | Ultraljudsundersökare, en medicinsk yrkesutövare som utför ultraljudsundersökningar för att diagnostisera och övervaka olika medicinska tillstånd |
| Specificitet | Förmågan att utesluta sjukdom, diagnostikens träffsäkerhet (SN / ((FP+SN)) |
| SR | Eng. Simple Rules, är en algoritm |
| SROC | Summary Receiver Operating Characteristics (sROC)-analys är en nyligen utvecklad statistisk teknik som kan tillämpas på metaanalys av diagnostiska tester |
| Studie med kvantitativ forskningsmetodik | Vetenskaplig studie som bygger på kvantitativa data (mätvärden som uttrycks i siffror) och där analysen ofta utförs med statistiska metoder |
| Systematisk översikt | Sammanställning av resultat från vetenskapliga undersökningar som med systematiska och tydligt beskrivna metoder har identifierats, valts ut och bedömts kritiskt och som avser en specifikt formulerad forskningsfråga |
| Tröskelvärde | En bestämd nivå eller gräns som avgör om ett testresultat eller en mätning indikerar förekomst av ett visst tillstånd eller sjukdom |
| Vetenskaplig kunskapslucka | En vetenskaplig kunskapslucka innebär att det inte går att bedöma vilken effekt en metod eller insats har. |
| Yodens index | Ett rankingtest som definieras av sensitivitet plus specificitet minus 1. Ju högre värde desto bättre. |
13. Bilagor
- Bilaga 1. Sammanfattning om utvärderade algoritmer (pdf)
- Bilaga 2. Enkät för praxisundersökning (pdf)
- Appendix 3. Search strategies (pdf)
- Appendix 4. Excluded references and references with high risk of bias (pdf)
- Bilaga 5. En sammanfattning av genomförd granskning (Quadas 2) (xls)
- Bilaga 6. Grundläggande terminologi för använda effektmått och översiktlig förklaring av genomförda analyser (pdf)
- Bilaga 7. Framtida diagnostik av äggstocksförändringar (pdf)
14. Referenser
- SBU. Vätskebiopsi vid diagnostik av äggstockscancer. Stockholm: Statens beredning för medicinsk och social utvärdering (SBU); 2024. SBU Bereder 376. [accessed Jun 3 2025]. Available from: https://www.sbu.se/376
- Broqvist M, Sandman L, Widenlou Nordmark A, Edin U. Nationell modell för öppna prioriteringar inom hälso- och sjukvård: ett verktyg för rangordning. Linköping: Linköping University Electronic Press; 2017. 2017:2. [accessed June 1 2025]. Available from: https://liu.diva-portal.org/smash/get/diva2:1144043/FULLTEXT01.pdf
- Svenska Kvalitetsregistret för Gynekologisk Cancer (SQRGC). Rapporten är baserat på datauttag från SQRGC: 2025-05-06: Statistik Incanet. Årsrapport 2024. Available from: https://statistik.incanet.se/gyncancer/
- RCC. Äggstockscancer med epitelial histologi. Nationellt vårdprogram Regionala cancercentrum i samverkan; 2025. [updated April 22 2025; accessed June 2 2025]. Available from: https://kunskapsbanken.cancercentrum.se/globalassets/cancerdiagnoser/gynekologi/aggstockscancer/nationellt-vardprogram-aggstockscancer.pdf
- RCC. Äggstockscancer icke-epitelial. Könscellstumörer och könssträngs-stromacellstumörer samt ovanliga icke-epiteliala tumörer. Nationellt vårdprogram. Regionala cancercentrum i samverkan; 2025. [updated Feb 25 2025].
- Leandersson P, Hogberg T, Dickman PW, Malander S, Borgfeldt C. Incidence and survival of epithelial ovarian, fallopian tube, peritoneal, and undesignated abdominal/pelvic cancers in Sweden 1960–2014: A population-based cohort study. BMC Cancer. 2021;21(1):465. Available from: https://doi.org/10.1186/s12885-021-08169-w
- Svenska Kvalitetsregistret för Gynekologisk Cancer (SQRGC). Svenska Kvalitetsregistret för Gynekologisk cancer (SQRGC). Årsrapport 2024. Rapporten är baserat på datauttag från SQRGC: 2025-09-10. Available from: https://statistik.incanet.se/gyncancer/
- Bankhead CR, Kehoe ST, Austoker J. Symptoms associated with diagnosis of ovarian cancer: a systematic review. BJOG: An International Journal of Obstetrics & Gynaecology. 2005;112(7):857-65. Available from: https://doi.org/https://doi.org/10.1111/j.1471-0528.2005.00572.x
- RCC. Nationellt vårdprogram äggstockscancer. 2023. Available from: https://cancercentrum.se/diagnosbehandling/cancerdiagnoser/gynekologiskacancersjukdomar/aggstock/vardprogram.7275.html
- Shih Ie M, Kurman RJ. Ovarian tumorigenesis: a proposed model based on morphological and molecular genetic analysis. Am J Pathol. 2004;164(5):1511-8. Available from: https://doi.org/10.1016/s0002-9440(10)63708-x
- Cho KR, Shih I-M. Ovarian Cancer. Annual Review of Pathology: Mechanisms of Disease. 2009;4(Volume 4, 2009):287-313. Available from: https://doi.org/https://doi.org/10.1146/annurev.pathol.4.110807.092246
- Wilson JMG, Jungner G, World Health O. Principles and practice of screening for disease. Geneva: World Health Organization; 1968.
- Henderson JT, Webber EM, Sawaya GF. Screening for Ovarian Cancer: Updated Evidence Report and Systematic Review for the US Preventive Services Task Force. Jama. 2018;319(6):595-606. Available from: https://doi.org/10.1001/jama.2017.21421
- Rosenthal AN, Fraser LSM, Philpott S, Manchanda R, Burnell M, Badman P, et al. Evidence of Stage Shift in Women Diagnosed With Ovarian Cancer During Phase II of the United Kingdom Familial Ovarian Cancer Screening Study. J Clin Oncol. 2017;35(13):1411-20. Available from: https://doi.org/10.1200/jco.2016.69.9330
- Menon U, Karpinskyj C, Gentry-Maharaj A. Ovarian Cancer Prevention and Screening. Obstet Gynecol. 2018;131(5):909-27. Available from: https://doi.org/10.1097/aog.0000000000002580
- Menon U, Gentry-Maharaj A, Burnell M, Singh N, Ryan A, Karpinskyj C, et al. Ovarian cancer population screening and mortality after long-term follow-up in the UK Collaborative Trial of Ovarian Cancer Screening (UKCTOCS): a randomised controlled trial. Lancet. 2021;397(10290):2182-93. Available from: https://doi.org/10.1016/s0140-6736(21)00731-5
- IOTA. IOTA + Ultrasound Education. International Ovarian Tumor Analysis (IOTA) Group [accessed Oct 07]. Available from: https://iotaplus.org/en
- Hutchon D. The Risk of Malignancy in ovarian cancer calculator - decision support system. 2002. Available from: http://www.hutchon.net/RMIcalc.htm
- Barrenada L, Ledger A, Dhiman P, Collins G, Wynants L, Verbakel JY, et al. ADNEX risk prediction model for diagnosis of ovarian cancer: systematic review and meta-analysis of external validation studies. BMJ medicine. 2024;3(1):e000817. Available from: https://doi.org/https://dx.doi.org/10.1136/bmjmed-2023-000817
- Timmerman D, Ameye L, Fischerova D, Epstein E, Melis GB, Guerriero S, et al. Simple ultrasound rules to distinguish between benign and malignant adnexal masses before surgery: prospective validation by IOTA group. Bmj. 2010;341:c6839. Available from: https://doi.org/10.1136/bmj.c6839
- Valentin L, Ameye L, Savelli L, Fruscio R, Leone FP, Czekierdowski A, et al. Adnexal masses difficult to classify as benign or malignant using subjective assessment of gray-scale and Doppler ultrasound findings: logistic regression models do not help. Ultrasound Obstet Gynecol. 2011;38(4):456-65. Available from: https://doi.org/10.1002/uog.9030
- Moore RG, McMeekin DS, Brown AK, DiSilvestro P, Miller MC, Allard WJ, et al. A novel multiple marker bioassay utilizing HE4 and CA125 for the prediction of ovarian cancer in patients with a pelvic mass. Gynecologic Oncology. 2009;112(1):40-6. Available from: https://doi.org/https://doi.org/10.1016/j.ygyno.2008.08.031
- Li F, Tie R, Chang K, Wang F, Deng S, Lu W, et al. Does risk for ovarian malignancy algorithm excel human epididymis protein 4 and CA125 in predicting epithelial ovarian cancer: a meta-analysis. BMC cancer. 2012;12:258. Available from: https://doi.org/https://dx.doi.org/10.1186/1471-2407-12-258
- Kalapotharakos G, Asciutto C, Henic E, Casslén B, Borgfeldt C. High preoperative blood levels of HE4 predicts poor prognosis in patients with ovarian cancer. J Ovarian Res. 2012;5(1):20. Available from: https://doi.org/10.1186/1757-2215-5-20
- Timmerman D, Valentin L, Bourne TH, Collins WP, Verrelst H, Vergote I. Terms, definitions and measurements to describe the sonographic features of adnexal tumors: a consensus opinion from the International Ovarian Tumor Analysis (IOTA) group. Ultrasound in Obstetrics & Gynecology. 2000;16(5):500-5. Available from: https://doi.org/https://doi.org/10.1046/j.1469-0705.2000.00287.x
- SBU. Utvärdering av metoder i hälso- och sjukvården och insatser i socialtjänsten: en metodbok. Stockholm: Statens beredning för medicinsk och social utvärdering (SBU); 2020. Available from: https://www.sbu.se/sv/metod/metodboken-2023/
- The Prisma 2020 Statement. BMJ 2021;372:n71. 2021. Available from: https://doi.org/http://dx.doi.org/10.1136/bmj.n71
- Davenport C, Rai N, Sharma P, Deeks JJ, Berhane S, Mallett S, et al. Menopausal status, ultrasound and biomarker tests in combination for the diagnosis of ovarian cancer in symptomatic women. The Cochrane database of systematic reviews. 2022;7:CD011964. Available from: https://doi.org/https://dx.doi.org/10.1002/14651858.CD011964.pub2
- The EndNote Team. EndNote 21. Philadelphia, PA: Clarivate; 2013.
- Bramer WM, Giustini D, de Jonge GB, Holland L, Bekhuis T. De-duplication of database search results for systematic reviews in EndNote. J Med Libr Assoc. 2016;104(3):240-3. Available from: https://doi.org/10.3163/1536-5050.104.3.014
- Ouzzani M, Hammady H, Fedorowicz Z, Elmagarmid A. Rayyan-a web and mobile app for systematic reviews. 2016. Available from: https://www.ncbi.nlm.nih.gov/pubmed/27919275
- Whiting P, Rutjes A, Westwood M, Mallett S, Deeks J, Reitsma J, et al. QUADAS-2: a revised tool for the quality assessment of diagnostic accuracy studies. Annals of internal medicine. 2011;155(8):529-36.
- Guyatt GH, Oxman AD, Vist GE, Kunz R, Falck-Ytter Y, Alonso-Coello P, et al. GRADE: an emerging consensus on rating quality of evidence and strength of recommendations. BMJ. 2008;336(7650):924. Available from: https://doi.org/10.1136/bmj.39489.470347.AD
- SBU. Etiska aspekter på insatser inom hälso- och sjukvården. En vägledning för att identifiera relevanta etiska aspekter. Stockholm: Statens beredning för medicinsk och social utvärdering (SBU); 2021. [accessed June 3 2025]. Available from: https://www.sbu.se/globalassets/ebm/etiska_aspekter_halso_sjukvarden.pdf
- Cochrane Central Register of Controlled Trials. Cochrane Library. [accessed Oct 8 2025]. Available from:https://www.cochranelibrary.com/central
- Sundar S, Agarwal R, Davenport C, Scandrett K, Johnson S, Sengupta P, et al. Risk-prediction models in postmenopausal patients with symptoms of suspected ovarian cancer in the UK (ROCkeTS): a multicentre, prospective diagnostic accuracy study. Lancet Oncol. 2024;25(10):1371-86. Available from: https://doi.org/https://dx.doi.org/10.1016/S1470-2045(24)00406-6
- Norwegian Register for Scientific Journals Series and Publishers. The Norwegian Directorate for Higher Education and Skills. Bergen. [updated March 6 2024; accessed April 23 2025]. Available from: https://kanalregister.hkdir.no/en/informasjonsartikler/search-in-the-register
- Van Calster B, Valentin L, Froyman W, Landolfo C, Ceusters J, Testa AC, et al. Validation of models to diagnose ovarian cancer in patients managed surgically or conservatively: multicentre cohort study. BMJ. 2020;370:m2614. Available from: https://doi.org/10.1136/bmj.m2614
- Landolfo C, Ceusters J, Valentin L, Froyman W, Van Gorp T, Heremans R, et al. Comparison of the ADNEX and ROMA risk prediction models for the diagnosis of ovarian cancer: a multicentre external validation in patients who underwent surgery. British journal of cancer. 2024;130(6):934-40. Available from: https://doi.org/https://dx.doi.org/10.1038/s41416-024-02578-x
- Abdalla N, Piórkowski R, Stanirowski P, Cendrowski K, Sawicki W. Can Replacing CA125 with HE4 in Risk of Malignancy Indices 1-4 Improve Diagnostic Performance in the Presurgical Assessment of Adnexal Tumors? Biomed Res Int. 2017;2017:6712376. Available from: https://doi.org/10.1155/2017/6712376
- Al Musalhi K, Al Kindi M, Al Aisary F, Ramadhan F, Al Rawahi T, Al Hatali K, et al. Evaluation of HE4, CA-125, Risk of Ovarian Malignancy Algorithm (ROMA) and Risk of Malignancy Index (RMI) in the Preoperative Assessment of Patients with Adnexal Mass. Oman medical journal. 2016;31(5):336-44. Available from: https://doi.org/https://dx.doi.org/10.5001/omj.2016.68
- Borges AL, Brito M, Ambrósio P, Condeço R, Pinto P, Ambrósio B, et al. Prospective external validation of IOTA methods for classifying adnexal masses and retrospective assessment of two-step strategy using benign descriptors and ADNEX model: Portuguese multicenter study. Ultrasound in Obstetrics & Gynecology. 2024;64(4):538-49. Available from: https://doi.org/https://doi.org/10.1002/uog.27641
- Ertas S, Vural F, Vural F, Tufekci EC, Ertas AC, Kose G, et al. Predictive Value of Malignancy Risk Indices for Ovarian Masses in Premenopausal and Postmenopausal Women. Asian Pacific journal of cancer prevention : APJCP. 2016;17(4):2177-83. Available from: https://doi.org/https://dx.doi.org/10.7314/apjcp.2016.17.4.2177
- Janas L, Stachowiak G, Glowacka E, Piwowarczyk I, Kajdos M, Soja M, et al. The use of CA125, human epididymis protein 4 (HE4), risk of ovarian malignancy algorithm (ROMA), risk of malignancy index (RMI) and subjective assessment (SA) in preoperative diagnosing of ovarian tumors. Ginekol Pol. 2024;95(5):321-7. Available from: https://doi.org/10.5603/GP.a2022.0144
- Krascsenits G, Balázs B, Dudnyikova A, Purcsi K, Orosz E, Pete I. [Investigating the predictive value of RMI and ROMA indices in patients with ovarian tumors of uncertain dignity]. Magy Onkol. 2016;60(4):320-7.
- Liest A-L, Omran AS, Mikiver R, Rosenberg P, Uppugunduri S. RMI and ROMA are equally effective in discriminating between benign and malignant gynecological tumors: A prospective population-based study. Acta obstetricia et gynecologica Scandinavica. 2019;98(1):24-33. Available from: https://doi.org/https://dx.doi.org/10.1111/aogs.13462
- Lycke M, Kristjansdottir B, Sundfeldt K. A multicenter clinical trial validating the performance of HE4, CA125, risk of ovarian malignancy algorithm and risk of malignancy index. Gynecologic oncology. 2018;151(1):159-65. Available from: https://doi.org/https://dx.doi.org/10.1016/j.ygyno.2018.08.025
- Meys EMJ, Jeelof LS, Achten NMJ, Slangen BFM, Lambrechts S, Kruitwagen RFPM, et al. Estimating risk of malignancy in adnexal masses: external validation of the ADNEX model and comparison with other frequently used ultrasound methods. Ultrasound in obstetrics & gynecology : the official journal of the International Society of Ultrasound in Obstetrics and Gynecology. 2017;49(6):784-92. Available from: https://doi.org/https://dx.doi.org/10.1002/uog.17225
- Niemi RJ, Saarelainen SK, Luukkaala TH, Maenpaa JU. Reliability of preoperative evaluation of postmenopausal ovarian tumors. Journal of ovarian research. 2017;10(1):15. Available from: https://doi.org/https://dx.doi.org/10.1186/s13048-017-0309-4
- Radosa MP, Camara O, Vorwergk J, Diebolder H, Winzer H, Mothes A, et al. Preoperative multimodal strategies for risk assessment of adnexal masses: analysis of 1362 cases in a gynecologic cancer center. International journal of gynecological cancer : official journal of the International Gynecological Cancer Society. 2011;21(6):1056-62. Available from: https://doi.org/https://dx.doi.org/10.1097/IGC.0b013e3182187eb0
- Radwan AM, Taema MI. Accuracy of the risk of malignancy index-I in diagnosing ovarian malignancy in menopausal women. Przeglad menopauzalny = Menopause review. 2023;22(1):1-5. Available from: https://doi.org/https://dx.doi.org/10.5114/pm.2023.126435
- Spagnol G, Marchetti M, Carollo M, Bigardi S, Tripepi M, Facchetti E, et al. Clinical Utility and Diagnostic Accuracy of ROMA, RMI, ADNEX, HE4, and CA125 in the Prediction of Malignancy in Adnexal Masses. Cancers. 2024;16(22). Available from: https://doi.org/10.3390/cancers16223790
- Testa A, Kaijser J, Wynants L, Fischerova D, Van Holsbeke C, Franchi D, et al. Strategies to diagnose ovarian cancer: new evidence from phase 3 of the multicentre international IOTA study. British journal of cancer. 2014;111(4):680-8. Available from: https://doi.org/https://dx.doi.org/10.1038/bjc.2014.333
- van den Akker PAJ, Zusterzeel PLM, Aalders AL, Snijders MPLM, Samlal RAK, Vollebergh JHA, et al. Use of risk of malignancy index to indicate frozen section analysis in the surgical care of women with ovarian tumors. International journal of gynaecology and obstetrics: the official organ of the International Federation of Gynaecology and Obstetrics. 2016;133(3):355-8. Available from: https://doi.org/https://dx.doi.org/10.1016/j.ijgo.2015.10.019
- Vilendecic Z, Radojevic M, Stefanovic K, Dotlic J, Likic Ladjevic I, Dugalic S, et al. Accuracy of IOTA Simple Rules, IOTA ADNEX Model, RMI, and Subjective Assessment for Preoperative Adnexal Mass Evaluation: The Experience of a Tertiary Care Referral Hospital. Gynecologic and obstetric investigation. 2023;88(2):116-22. Available from: https://doi.org/10.1159/000529355
- Wang R, Yang Z. Evaluating the risk of malignancy in adnexal masses: validation of O-RADS and comparison with ADNEX model, SA, and RMI. Ginekol Pol. 2023;94(10):799-806. Available from: https://doi.org/10.5603/GP.a2023.0019
- Chen X, Zhou H, Chen R, He J, Wang Y, Huang L, et al. Development of a multimarker assay for differential diagnosis of benign and malignant pelvic masses. Clinica Chimica Acta. 2015;440:57-63. Available from: https://doi.org/https://doi.org/10.1016/j.cca.2014.11.013
- Chudecka-Glaz AM. ROMA, an algorithm for ovarian cancer. Clinica chimica acta; international journal of clinical chemistry. 2015;440:143-51. Available from: https://doi.org/https://dx.doi.org/10.1016/j.cca.2014.11.015
- Cradic KW, Lasho MA, Algeciras-Schimnich A. Validation of the Cut-points Recommended for ROMA Using the Roche Elecsys CA125 and HE4 Assays. Annals of clinical and laboratory science. 2018;48(1):90-3.
- Grenache DG, Heichman KA, Werner TL, Vucetic Z. Clinical performance of two multi-marker blood tests for predicting malignancy in women with an adnexal mass. Clinica chimica acta; international journal of clinical chemistry. 2015;438:358-63. Available from: https://doi.org/https://dx.doi.org/10.1016/j.cca.2014.09.028
- Kim B, Park Y, Kim B, Ahn HJ, Lee K-A, Chung JE, et al. Diagnostic performance of CA 125, HE4, and risk of Ovarian Malignancy Algorithm for ovarian cancer. Journal of clinical laboratory analysis. 2019;33(1):e22624. Available from: https://doi.org/10.1002/jcla.22624
- Molina R, Escudero JM, Auge JM, Filella X, Foj L, Torne A, et al. HE4 a novel tumour marker for ovarian cancer: comparison with CA 125 and ROMA algorithm in patients with gynaecological diseases. Tumour biology : the journal of the International Society for Oncodevelopmental Biology and Medicine. 2011;32(6):1087-95. Available from: https://doi.org/https://dx.doi.org/10.1007/s13277-011-0204-3
- Montagnana M, Danese E, Ruzzenente O, Bresciani V, Nuzzo T, Gelati M, et al. The ROMA (Risk of Ovarian Malignancy Algorithm) for estimating the risk of epithelial ovarian cancer in women presenting with pelvic mass: is it really useful? Clinical chemistry and laboratory medicine. 2011;49(3):521-5. Available from: https://doi.org/https://dx.doi.org/10.1515/CCLM.2011.075
- Moore RG, Miller MC, Disilvestro P, Landrum LM, Gajewski W, Ball JJ, et al. Evaluation of the diagnostic accuracy of the risk of ovarian malignancy algorithm in women with a pelvic mass. Obstetrics and gynecology. 2011;118(2 Pt 1):280-8. Available from: https://doi.org/https://dx.doi.org/10.1097/AOG.0b013e318224fce2
- Romagnolo C, Leon AE, Fabricio ASC, Taborelli M, Polesel J, Del Pup L, et al. HE4, CA125 and risk of ovarian malignancy algorithm (ROMA) as diagnostic tools for ovarian cancer in patients with a pelvic mass: An Italian multicenter study. Gynecol Oncol. 2016;141(2):303-11. Available from: https://doi.org/10.1016/j.ygyno.2016.01.016
- Shin KH, Kim HH, Kwon BS, Suh DS, Joo JK, Kim KH. Clinical Usefulness of Cancer Antigen (CA) 125, Human Epididymis 4, and CA72-4 Levels and Risk of Ovarian Malignancy Algorithm Values for Diagnosing Ovarian Tumors in Korean Patients With and Without Endometriosis. Annals of laboratory medicine. 2020;40(1):40-7. Available from: https://doi.org/https://dx.doi.org/10.3343/alm.2020.40.1.40
- Spacir Prskalo Z, Bulic P, Langer S, Gace M, Puljiz M, Danolic D, et al. Proofs for implementation of higher HE4 and ROMA index cut-off values in ovarian cancer preoperative stratification. J Obstet Gynaecol. 2019;39(2):195-201. Available from: https://doi.org/10.1080/01443615.2018.1476471
- Teh BH, Yong SL, Sim WW, Lau KB, Suharjono HN. Evaluation in the predictive value of serum human epididymal protein 4 (HE4), cancer antigen 125 (CA 125) and a combination of both in detecting ovarian malignancy. Hormone molecular biology and clinical investigation. 2018;35(1). Available from: https://doi.org/https://dx.doi.org/10.1515/hmbci-2018-0029
- Terlikowska KM, Dobrzycka B, Witkowska AM, Mackowiak-Matejczyk B, Sledziewski TK, Kinalski M, et al. Preoperative HE4, CA125 and ROMA in the differential diagnosis of benign and malignant adnexal masses. Journal of ovarian research. 2016;9(1):43. Available from: https://doi.org/https://dx.doi.org/10.1186/s13048-016-0254-7
- Van Gorp T, Cadron I, Despierre E, Daemen A, Leunen K, Amant F, et al. HE4 and CA125 as a diagnostic test in ovarian cancer: prospective validation of the Risk of Ovarian Malignancy Algorithm. British journal of cancer. 2011;104(5):863-70. Available from: https://doi.org/https://dx.doi.org/10.1038/sj.bjc.6606092
- Yang Y, Ju H, Huang Y. Diagnostic performance of IOTA SR and O-RADS combined with CA125, HE4, and risk of malignancy algorithm to distinguish benign and malignant adnexal masses. Eur J Radiol. 2023;165:110926. Available from: https://doi.org/10.1016/j.ejrad.2023.110926
- Zhang L, Chen Y, Wang K. Comparison of CA125, HE4, and ROMA index for ovarian cancer diagnosis. Current problems in cancer. 2019;43(2):135-44. Available from: https://doi.org/https://dx.doi.org/10.1016/j.currproblcancer.2018.06.001
- Zhang P, Wang C, Cheng L, Zhang P, Guo L, Liu W, et al. Comparison of HE4, CA125, and ROMA Diagnostic Accuracy: A Prospective and Multicenter Study for Chinese Women With Epithelial Ovarian Cancer. Medicine. 2015;94(52):e2402. Available from: https://doi.org/https://dx.doi.org/10.1097/MD.0000000000002402
- Zhu C, Zhang N, Zhong A, Xiao K, Lu R, Guo L. A combined strategy of TK1, HE4 and CA125 shows better diagnostic performance than risk of ovarian malignancy algorithm (ROMA) in ovarian carcinoma. Clinica chimica acta; international journal of clinical chemistry. 2022;524:43-50. Available from: https://doi.org/https://dx.doi.org/10.1016/j.cca.2021.11.018
- Elsner Hernández N, De Luis Escudero JF, Pérez Méndez LI, Báez Quintana DR, Bruno Santana E, Pérez Álvarez JA, et al. Evaluation of the incorporation of an IOTA-ADNEX model in the discrimination of adnexal masses in our third-level hospital centre, taking into account the menopausal status of patients. Five years of experience. Clinica e Investigacion en Ginecologia y Obstetricia. 2024;51(1). Available from: https://doi.org/10.1016/j.gine.2023.100910
- Spagnol G, Marchetti M, De Tommasi O, Vitagliano A, Cavallin F, Tozzi R, et al. Simple rules, O-RADS, ADNEX and SRR model: Single oncologic center validation of diagnostic predictive models alone and combined (two-step strategy) to estimate the risk of malignancy in adnexal masses and ovarian tumors. Gynecologic oncology. 2023;177:109-16. Available from: https://doi.org/10.1016/j.ygyno.2023.08.012
- Szubert S, Wojtowicz A, Moszynski R, Zywica P, Dyczkowski K, Stachowiak A, et al. External validation of the IOTA ADNEX model performed by two independent gynecologic centers. Gynecologic oncology. 2016;142(3):490-5. Available from: https://doi.org/https://dx.doi.org/10.1016/j.ygyno.2016.06.020
- Van Calster B, Van Hoorde K, Valentin L, Testa AC, Fischerova D, Van Holsbeke C, et al. Evaluating the risk of ovarian cancer before surgery using the ADNEX model to differentiate between benign, borderline, early and advanced stage invasive, and secondary metastatic tumours: prospective multicentre diagnostic study. BMJ (Clinical research ed). 2014;349:g5920. Available from: https://doi.org/https://dx.doi.org/10.1136/bmj.g5920
- Yoeli-Bik R, Longman RE, Wroblewski K, Weigert M, Abramowicz JS, Lengyel E. Diagnostic Performance of Ultrasonography-Based Risk Models in Differentiating Between Benign and Malignant Ovarian Tumors in a US Cohort. JAMA network open. 2023;6(7):e2323289. Available from: https://doi.org/https://dx.doi.org/10.1001/jamanetworkopen.2023.23289
- Phinyo P, Patumanond J, Saenrungmuaeng P, Chirdchim W, Pipanmekaporn T, Tantraworasin A, et al. Diagnostic Added-Value of Serum CA-125 on the IOTA Simple Rules and Derivation of Practical Combined Prediction Models (IOTA SR X CA-125). Diagnostics (Basel). 2021;11(2). Available from: https://doi.org/10.3390/diagnostics11020173
- Piovano E, Cavallero C, Fuso L, Viora E, Ferrero A, Gregori G, et al. Diagnostic accuracy and cost-effectiveness of different strategies to triage women with adnexal masses: a prospective study. Ultrasound in obstetrics & gynecology : the official journal of the International Society of Ultrasound in Obstetrics and Gynecology. 2017;50(3):395-403. Available from: https://doi.org/https://dx.doi.org/10.1002/uog.17320
- Tian C, Han Y-W, Shi Z-J, Li Y-W, Xie L, Liu X-L, et al. Diagnostic value of the International Ovarian Tumor Analysis simple rules combined with contrast-enhanced ultrasound for adnexal masses. International journal of gynecological cancer : official journal of the International Gynecological Cancer Society. 2025;35(2):100049. Available from: https://doi.org/https://dx.doi.org/10.1016/j.ijgc.2024.100049
- Radosa MP, Vorwergk J, Fitzgerald J, Kaehler C, Schneider U, Camara O, et al. Sonographic discrimination between benign and malignant adnexal masses in premenopause. Ultraschall in der Medizin (Stuttgart, Germany : 1980). 2014;35(4):339-44. Available from: https://doi.org/https://dx.doi.org/10.1055/s-0033-1335728
- Van Gorp T, Veldman J, Van Calster B, Cadron I, Leunen K, Amant F, et al. Subjective assessment by ultrasound is superior to the risk of malignancy index (RMI) or the risk of ovarian malignancy algorithm (ROMA) in discriminating benign from malignant adnexal masses. European journal of cancer (Oxford, England : 1990). 2012;48(11):1649-56. Available from: https://doi.org/https://dx.doi.org/10.1016/j.ejca.2011.12.003
- Vural F, Aka N, Ertas S, Kose G, Tufekci EC. The ovarian cancers in geriatric population: the validity of inflammatory markers, malignancy risk indices 1, 2, 3, 4, and CA-125 levels in malignancy discrimination of adnexal masses. European journal of gynaecological oncology. 2016;37(6):846-51.
- Chan KKL, Chen C-A, Nam J-H, Ochiai K, Wilailak S, Choon A-T, et al. The use of HE4 in the prediction of ovarian cancer in Asian women with a pelvic mass. Gynecologic oncology. 2013;128(2):239-44. Available from: https://doi.org/https://dx.doi.org/10.1016/j.ygyno.2012.09.034
- Karlsen MA, Sandhu N, Høgdall C, Christensen IJ, Nedergaard L, Lundvall L, et al. Evaluation of HE4, CA125, risk of ovarian malignancy algorithm (ROMA) and risk of malignancy index (RMI) as diagnostic tools of epithelial ovarian cancer in patients with a pelvic mass. Gynecologic oncology. 2012;127(2):379‐83. Available from: https://doi.org/10.1016/j.ygyno.2012.07.106
- Li L, Wan J, Cai G, Yuan L, Liang J, Song J, et al. Value of serum human epididymis secretory protein 4 as a marker for differential diagnosis of malignant and benign gynecological diseases of patients in southern China. Clinica chimica acta; international journal of clinical chemistry. 2016;459:170-6. Available from: https://doi.org/https://dx.doi.org/10.1016/j.cca.2016.06.010
- Melo A, Verissimo R, Farinha M, Martins NN, Martins FN. Discriminative value of CA-125, HE4, Risk of Malignancy Index II (RMI-II) and Risk of Malignancy Algorithm (ROMA) in the differential diagnosis of pelvic masses: conclusions from a referral Centre in Portugal. Journal of obstetrics and gynaecology : the journal of the Institute of Obstetrics and Gynaecology. 2018;38(8):1140-5. Available from: https://doi.org/https://dx.doi.org/10.1080/01443615.2018.1457632
- Novotny Z, Presl J, Kucera R, Topolcan O, Vrzalova J, Fuchsova R, et al. HE4 and ROMA index in Czech postmenopausal women. Anticancer research. 2012;32(9):4137-40.
- Ortiz-Muñoz B, Aznar-Oroval E, García García A, Covisa Peris A, Perez Ballestero P, Sanchez Yepes M, et al. HE4, Ca125 and ROMA algorithm for differential diagnosis between benign gynaecological diseases and ovarian cancer. Tumour Biol. 2014;35(7):7249-58. Available from: https://doi.org/10.1007/s13277-014-1945-6
- Park H, Shin JE, Lee DW, Kim MJ, Lee HN. Diagnostic Accuracy of the Risk of Ovarian Malignancy Algorithm in Clinical Practice at a Single Hospital in Korea. Annals of laboratory medicine. 2019;39(3):252-62. Available from: https://doi.org/https://dx.doi.org/10.3343/alm.2019.39.3.252
- Spacir Prskalo Z, Gaće M, Dobrijević S, Mayer L. Benefits human epidydimis protein (HE4) compared to traditional used tumor markers in gynecological oncology. Libri Oncologici [Internet]. 2015 [pristupljeno 18.06.2025.];43(1-3):9-14. Dostupno na: https://hrcak.srce.hr/189799. 2025.
- Salim E, Zubairi AM, Danish SH, Ali U. Diagnostic Accuracy of Risk of Ovarian Malignancy Algorithm (ROMA) in Post-Menopausal Patients with Ovarian Mass. J Coll Physicians Surg Pak. 2018;28(6):440-4. Available from: https://doi.org/10.29271/jcpsp.2018.06.440
- Shen F, Lu S, Peng Y, Yang F, Chen Y, Lin Y, et al. Performance of ROMA based on Architect CA 125 II and HE4 values in Chinese women presenting with a pelvic mass: A multicenter prospective study. Clin Chim Acta. 2017;471:119-25. Available from: https://doi.org/10.1016/j.cca.2017.05.029
- Nätverket mot gynekologisk cancer. Samhällskostnader för ovarialcancer 2018. 2020. Available from: https://gyncancer.se/rapportaggstockscancer/hela-rapporten-svenska/
- SFS 2017:30. Hälso- och sjukvårdslag. författningssamling S. Stockholm: Riksdagen. [accessed Oct 9 2025].
- Riksdagsskrivelse 1996/1997:185. Prioriteringar inom vården. Stockholm: Riksdagen. [accessed Oct 9 2025].
- SFS 2010:659. Patientsäkerhetslag. författningssamling S. Stockholm: Riksdagen. [accessed Oct 9 2025].
- SFS 2014:821. Patientlag. författningssamling S. Stockholm: Riksdagen. [accessed Oct 9 2025].
- Froyman W, Landolfo C, De Cock B, Wynants L, Sladkevicius P, Testa AC, et al. Risk of complications in patients with conservatively managed ovarian tumours (IOTA5): a 2-year interim analysis of a multicentre, prospective, cohort study. The Lancet Oncology. 2019;20(3):448-58. Available from: https://doi.org/10.1016/S1470-2045(18)30837-4
- Landolfo C, Bourne T, Froyman W, Van Calster B, Ceusters J, Testa AC, et al. Benign descriptors and ADNEX in two-step strategy to estimate risk of malignancy in ovarian tumors: retrospective validation in IOTA5 multicenter cohort. Ultrasound in obstetrics & gynecology : the official journal of the International Society of Ultrasound in Obstetrics and Gynecology. 2023;61(2):231-42. Available from: https://doi.org/https://dx.doi.org/10.1002/uog.26080
- Moro F, Momi M, Ledger A, Barrenada L, Ceusters J, Sturla D, et al. External validation of ultrasound-based models for differentiating between benign and malignant adnexal masses: a nationwide prospective multicenter study (IOTA phase 6). Am J Obstet Gynecol. 2025. Available from: https://doi.org/10.1016/j.ajog.2025.07.017