Skip to content
mammografia

Screening mammografico, l’intelligenza artificiale può migliorare i risultati?

Secondo dati presenti in letteratura, l’impiego dell’intelligenza artificiale (IA) nei programmi di screening dovrebbe consentire di migliorare i risultati delle campagne di prevenzione, aumentando sensibilità e specificità dell’esame e riducendo il numero di falsi positivi.

Un riscontro importante è offerto dai primi studi in real world, cioè sui risultati ottenuti nei centri in cui l’IA viene utilizzata. Tra questi va segnalato uno studi, pubblicato su Nature Medicine, che riguarda l’impiego dell’IA in una campagna di screening mammografico condotta in Germania.

Lo studio PRAIM (PRospective multicenter observational study of an integrated AI system with live Monitoring) è stato incorporato nel programma di screening mammografico tedesco, e rappresenta la più ampia ricerca condotta per valutare gli effetti dell’integrazione dell’IA nelle procedure di screening mammografico sui tassi di individuazione della malattia (BCDR, breast cancer detection rate) e sui tassi di recall. Complessivamente, sono state coinvolte 463.094 donne tra i 50 e 69 anni e 119 radiologi di 12 centri distribuiti sul territorio nazionale.

L’obiettivo primario della ricerca era valutare il tasso di diagnosi e il tasso di richiamo (recall rate), mentre il potere predittivo dell’IA e il suo ruolo nella diagnosi rappresentavano gli outcome secondari.

Dopo l’esecuzione dell’esame e la lettura delle immagini da parte di due radiologi, gli stessi avevano la possibilità di scegliere, su base volontaria, se ricorrere a una lettura e interpretazione del referto con il supporto dell’IA. Tutti gli esami per i quali nessuno dei due radiologi avesse compilato il referto utilizzando il supporto dell’intelligenza artificiale, hanno costituito il gruppo di controllo.

L’IA migliora il tasso di individuazione di tumore del seno

Rispetto al metodo tradizionale, con doppia lettura da parte di due radiologi, la doppia lettura supportata poi dall’IA è stata associata con un tasso di individuazione della malattia più elevato, senza però influenzare negativamente la frequenza dei recall.

Lo studio ha infatti evidenziato che il supporto IA ha permesso di ottenere un BCDR di 6,7 per 1.000, ossia del 17,6% (IC al 95%: +5,7%, +30,8%) più elevato rispetto a quello del gruppo di controllo, che era invece pari a 5,7 per 1.000. Il tasso di recall nel gruppo sperimentale era pari a 37,4 per 1.000: più basso, e non inferiore, rispetto al valore di 38,3 per 1.000 riscontrato nel gruppo di controllo, senza il supporto dell’IA.

Il valore predittivo positivo (PPV) del recall è risultato pari al 17,9% nel gruppo dei referti valutati con l’IA, e del 14,9% nel gruppo di controllo. Il PPV della biopsia è risultato del 64,5% nel gruppo sperimentale, e del 59,2% nel gruppo di controllo.

Risultati che, secondo gli Autori, sono indice della possibilità di migliorare significativamente la procedura di screening mammografico grazie all’IA; la tecnologia, infatti, può supportare lo specialista nell’interpretare le immagini mammografiche, migliorando l’identificazione di sottili anomalie che potrebbero, altrimenti, non essere rilevate.

Aspetti da chiarire in futuro

Sebbene lo studio abbiamo mostrato che l’impiego di IA può condurre a screening più efficaci con tassi di BCDR più elevati, senza peggiorare il tasso di recall rispetto alla metodica tradizionale, alcune questioni restano da approfondire.

Tra queste, una riguarda l’aumentato BCDR e la effettiva possibilità che questo comporti una minor incidenza di diagnosi di tumori che compaiono nell’intervallo tra due screening, una migliore distribuzione per stadio della malattia invasiva e una ridotta incidenza dei tumori individuati al successivo round di screening.

Inoltre, i risultati suggeriscono che l’impiego dell’intelligenza artificiale negli screening mammografici potrebbe ulteriormente aumentare il tasso di diagnosi di forme come il carcinoma duttale in situ (DCIS), con preoccupazioni circa il potenziale rischio di sovradiagnosi e di successivi sovratrattamenti. La conoscenza circa l’importanza della maggior frequenza di individuazione di DCIS e di tumori di grado 1 è cruciale, ma potrà essere più chiara solo dopo due/tre anni di follow-up.

A fronte del disegno non randomizzato, che può rappresentare un limite, lo studio presenta punti di forza quali l’elevato numero dei partecipanti, il contesto real world e il disegno prospettico. Inoltre l’analisi dei risultati per sottogruppo, in base a variabili rilevanti come età delle donne o densità del seno, hanno mostrato la non inferiorità statistica del BCDR nello screening supportato da IA; pertanto la lettura mammografica supportata dall’IA può essere considerata applicabile all’intera popolazione, senza necessità di stratificazione.

In conclusione, i risultati contribuiscono alle evidenze in favore dell’impiego di IA nelle procedure di screening mammografico, come metodo applicabile e sicuro, e in grado di ridurre il carico di lavoro dei radiologi; il contesto real world rafforza la possibilità di generalizzare i risultati a programmi di screening simili, cioè con la doppia lettura. In base alle evidenze oggi disponibili, l’adozione di programmi di screening supportati dall’IA dovrebbe, secondo gli Autori, essere urgentemente promossa, e inserita nelle relative linee guida.

stefania-cifani
Stefania Cifani

Giornalista scientifica e Medical writer