L’IA sarà utile con la prossima pandemia

Un’eccessiva fiducia nelle capacità dell’intelligenza artificiale potrebbe portare a decisioni approssimative che convogliano denaro pubblico verso aziende di IA poco affidabili, a scapito di finanziamenti ai programmi per la produzione di farmaci.

di Will Douglas Heaven

Il 30 dicembre, un’azienda di intelligenza artificiale chiamata BlueDot, che utilizza l’apprendimento automatico per monitorare le epidemie di malattie infettive in tutto il mondo, ha avvisato i clienti, compresi vari governi, ospedali e aziende, di un insolito picco nei casi di polmonite a Wuhan, in Cina. Sarebbero trascorsi altri nove giorni prima che l’Organizzazione Mondiale della Sanità segnalasse ufficialmente ciò che tutti abbiamo imparato a conoscere come Covid-19.

BlueDot non era sola. Anche un servizio automatizzato chiamato HealthMap al Boston Children’s Hospital ha colto questi primi segnali. Così ha fatto un modello gestito da Metabiota, con sede a San Francisco. Il fatto che l’IA possa individuare un focolaio dall’altra parte del mondo è piuttosto sorprendente e i primi avvertimenti salvano vite umane.

Ma quanto ha davvero aiutato l’IA ad affrontare l’attuale epidemia? È una domanda difficile a cui rispondere. I medici sostengono di aver individuato la diffusione del virus lo stesso giorno dell’IA. Altri progetti in cui l’IA viene esplorata come strumento diagnostico o utilizzata per aiutare a trovare un vaccino sono ancora nelle loro fasi iniziali. Anche se avranno successo, ci vorrà del tempo – probabilmente mesi – per mettere queste innovazioni nelle mani degli operatori sanitari che ne hanno bisogno.

La suggestione supera la realtà. In effetti, la narrativa che è apparsa in molti notiziari e comunicati stampa, vale a dire che l’IA è una nuova potente arma contro le malattie, è solo in parte vera e rischia di diventare controproducente. Per esempio, una eccessiva fiducia nelle capacità dell’IA potrebbe portare a decisioni impulsive che incanalano denaro pubblico verso aziende di IA poco affidabili, a scapito di interventi sui programmi per i farmaci.

È anche negativo per il settore stesso: più di una volta in passato, aspettative esagerate ma deluse, hanno portato a un crollo dell’interesse per l’IA e alla conseguente perdita di fondi. L’IA non ci salverà dal coronavirus, certamente non questa volta. Ma ci sono tutte le premesse perchè giochi un ruolo maggiore nelle future epidemie, a patto di apportere grandi cambiamenti. La maggior parte non sarà facile e alcuni non ci piaceranno. 

Esistono tre aree principali in cui l’IA può aiutare: previsione, diagnosi e trattamento. 

Previsione

Aziende come BlueDot e Metabiota utilizzano una serie di algoritmi di elaborazione del linguaggio naturale (NLP) per monitorare i notiziari e i rapporti sanitari ufficiali in diverse lingue in tutto il mondo, segnalando se citano malattie ad alta priorità, come il coronavirus o ancora più endemiche, come l’HIV o la tubercolosi. I loro strumenti predittivi possono anche attingere ai dati sui viaggi aerei per valutare il rischio che gli hub di transito possano vedere persone infette in arrivo o in partenza. 

I risultati sono ragionevolmente precisi. Per esempio, l’ultimo rapporto pubblico di Metabiota, il 25 febbraio, prevedeva che il 3 marzo ci sarebbero stati 127.000 casi cumulativi in tutto il mondo. Ha sbagliato di circa 30.000, ma Mark Gallivan, direttore della scienza dei dati dell’azienda, afferma che questo è un margine di errore accettabile. Aveva inoltre elencato i paesi che avevano maggiori probabilità di presentare nuovi casi, tra cui Cina, Italia, Iran e Stati Uniti. 

Altri tengono d’occhio anche i social media. Stratifyd, un’azienda di analisi dei dati con sede a Charlotte, nella Carolina del Nord, sta sviluppando un’intelligenza artificiale che analizza i post su siti come Facebook e Twitter e li confronta con descrizioni di malattie tratte da fonti come il National Institutes of Health, la World Organisation for Animal Health e il database globale per l’identificazione dei microbi, che memorizza le informazioni sul sequenziamento del genoma. 

Il lavoro di queste aziende è decisamente impressionante. E dimostra quanto sia avanzato l’apprendimento automatico negli ultimi anni. Alcuni anni fa Google ha tentato di prevedere le epidemie con il suo sfortunato Flu Tracker, che è stato accantonato nel 2013 quando non è riuscito a prevedere il picco di influenza di quell’anno. Che cosa è cambiato? Dipende principalmente dalla capacità dell’ultimo software di ascoltare una gamma molto più ampia di fonti.

Anche l’apprendimento automatico senza supervisione è fondamentale. Lasciare che un’intelligenza artificiale identifichi i propri schemi nel rumore informativo, piuttosto che addestrarla su esempi preselezionati, evidenzia cose che non si pensava di cercare. “Quando si fanno previsioni, si va alla ricerca di nuovi comportamenti”, afferma Derek Wang, CEO di Stratifyd.

Ma cosa si fa con queste previsioni? Quella iniziale di BlueDot ha individuato correttamente alcune città che sarebbero state attaccate dal virus. Ciò avrebbe potuto consentire alle autorità di prepararsi, allertare gli ospedali e mettere in atto misure di contenimento. Ma con l’aumentare della scala dell’epidemia, le previsioni sono diventate meno specifiche. L’avvertimento di Metabiota che alcuni paesi sarebbero stati colpiti nella settimana successiva poteva anche essere corretto, ma è difficile sapere cosa fare con tali informazioni. 

Inoltre, tutti questi approcci diventano meno precisi con il progredire dell’epidemia, in gran parte perché i dati affidabili di cui l’IA ha bisogno sono difficili da ottenere con il Covid-19. Fonti di notizie e rapporti ufficiali offrono account incoerenti. C’è stata confusione sui sintomi e su come si trasmette il virus tra le persone. I media possono riportare le notizie e le autorità possono minimizzare.

Prevedere dove una malattia può diffondersi da centinaia di siti in dozzine di paesi è un compito molto più complesso che comprendere dove un singolo focolaio potrebbe diffondersi nei suoi primi giorni. “Il rumore informativo è sempre nemico degli algoritmi di apprendimento automatico”, afferma Wang. In effetti, Gallivan riconosce che le previsioni giornaliere di Metabiota erano più facili da fare nelle prime due settimane (si veda link).

Uno dei maggiori ostacoli è la mancanza di test diagnostici, afferma Gallivan. “Per raggiungere dei risultati seri, dovremmo avere a disposizione un test per rilevare immediatamente il nuovo coronavirus e testare tutti almeno una volta al giorno”, egli spiega. Inoltre, non sappiamo davvero quali comportamenti le persone stanno adottando – chi lavora da casa, chi si auto-mette in quarantena, chi si lava o non si lava le mani – e quale effetti potrebbero avere. Se si vuole prevedere cosa succederà in una fase successiva, si ha bisogno di un quadro preciso di ciò che sta accadendo nel presente. 

Non è nemmeno chiaro cosa stia succedendo negli ospedali. Ahmer Inam di Pactera Edge, una società di consulenza su dati e intelligenza artificiale, afferma che gli strumenti di previsione sarebbero migliori se i dati sulla salute pubblica non fossero relegati all’interno di enti governativi come accade in molti paesi, compresi gli Stati Uniti. 

Ciò significa che un’intelligenza artificiale deve basarsi soprattutto su dati facilmente disponibili come le notizie online. “Quando i media rilevano una potenziale condizione medica nuova, è già troppo tardi”, egli sostiene. Ma se l’IA ha bisogno di molti più dati da fonti affidabili per svolgere un ruolo utile in questo settore, le strategie per ottenerlo possono essere controverse. 

Diverse persone con cui ho parlato hanno messo in evidenza questo scomodo compromesso: per ottenere previsioni migliori dall’apprendimento automatico, dobbiamo condividere più dati personali con aziende e governi. Darren Schulte, direttore generale e CEO di Apixio, che ha creato un’intelligenza artificiale per estrarre informazioni dai dati personali dei pazienti, ritiene che le cartelle cliniche di tutti gli Stati Uniti dovrebbero essere aperte per l’analisi dei dati.

Ciò potrebbe consentire a un’intelligenza artificiale di identificare automaticamente le persone più a rischio di Covid-19 a causa di una condizione sottostante. Le risorse potrebbero quindi essere concentrate su quelle persone che ne hanno maggiormente bisogno. La tecnologia per leggere i dati dei pazienti ed estrarre informazioni salvavita esiste, afferma Schulte. Il problema è che questi record sono suddivisi su più database e gestiti da diversi servizi sanitari, il che li rende più difficili da analizzare. 

I dati sanitari dovrebbero anche essere condivisi tra i paesi, afferma Inam: “I virus non operano entro i confini geopolitici”. A suo parere, i paesi dovrebbero sottoscrivere un accordo internazionale per rilasciare dati in tempo reale su diagnosi e ricoveri ospedalieri, che potrebbero poi essere inseriti in modelli di apprendimento automatico su scala globale di una pandemia.

Certo, questo può essere poco più di un pio desiderio. Ogni parte del mondo ha normative sulla privacy diverse per i dati medici. E molti di noi si sono già rifiutati di rendere i nostri dati accessibili a terzi. Nuove tecniche di elaborazione dei dati, come la privacy differenziale e la formazione sui dati sintetici invece che sui dati reali, potrebbero offrire un modo per affrontare questo dibattito. Ma questa tecnologia deve ancora essere perfezionata. Trovare un accordo sugli standard internazionali richiederà tempo. 

Per ora, dobbiamo sfruttare al massimo i dati che abbiamo. La risposta di Wang è assicurarsi che gli umani siano in grado di fare riferimento ai modelli di apprendimento automatico affidabili, assicurandosi di scartare previsioni che non suonano vere. “Se uno è eccessivamente ottimista o fa affidamento su un modello predittivo completamente autonomo, la situazione potrebbe diventare problematica”, egli chiarisce. L’IA può trovare segnali nascosti nei dati, ma sono gli umani a dover collegare i punti.

Fan Zhongjie, uno specialista delle malattie respiratorie, legge un’immagine medica nella provincia di Hubei, in Cina.AP

Diagnosi precoce

Oltre a prevedere il decorso di un’epidemia, molti sperano che l’IA possa aiutare a identificare le persone che sono state contagiate. In questo caso l’intelligenza artificiale ha una comprovata esperienza. I modelli di apprendimento automatico per l’esame delle immagini mediche possono rilevare i primi segni di malattia che potrebbero sfuggire ai medici umani, dalle malattie degli occhi alle condizioni cardiache al cancro. Ma questi modelli richiedono in genere molti dati da cui imparare.

Una serie di documenti in via di stampa sono stati pubblicati online nelle ultime settimane suggerendo che l’apprendimento automatico può diagnosticare il Covid-19 da scansioni TC del tessuto polmonare, se addestrato per individuare segni rivelatori della malattia nelle immagini. Alexander Selvikvåg Lundervold dell’Università di scienze applicate della Norvegia occidentale, a Bergen, in Norvegia, che è un esperto di apprendimento automatico e imaging medico, afferma che dovremmo aspettarci che a un certo punto l’IA sarà in grado di rilevare i segni di Covid-19 nei pazienti. 

Ma non è chiaro se l’imaging sia la strada da percorrere. Per prima cosa, i segni fisici della malattia potrebbero non apparire nelle scansioni fino a qualche tempo dopo l’infezione, rendendo la diagnosi precoce non più utile. Inoltre, poiché finora sono disponibili pochi dati per la formazione, è difficile valutare l’accuratezza degli studi pubblicati online. 

La maggior parte dei sistemi di riconoscimento delle immagini, compresi quelli addestrati sulle immagini mediche, sono adattati da modelli inizialmente “formati” su ImageNet, un set di dati ampiamente utilizzato che comprende milioni di immagini quotidiane. “Classificare qualcosa di semplice che si avvicina ai dati di ImageNet, come le immagini di cani e gatti, si può fare con pochissimi dati”, afferma Lundervold. “Nel caso delle immagini mediche, la situazione è differente”.

Questo non vuol dire che non accadrà. E’ possibile che gli strumenti di IA siano pronti a rilevare le prime fasi della malattia nei futuri focolai, ma è d’obbligo rimanere scettici su molte delle affermazioni dei medici di IA che diagnosticano Covid-19 oggi. Anche in questo caso, la condivisione di più dati sui pazienti aiuterà, così come le tecniche di apprendimento automatico che consentono di addestrare i modelli anche quando sono disponibili pochi dati. 

Per esempio, l’apprendimento con pochi dati, in cui un’intelligenza artificiale può apprendere modelli solo da una manciata di risultati e l’apprendimento per trasferimento, in cui un’intelligenza artificiale già addestrata a fare una cosa può essere rapidamente adattata per fare qualcosa di simile, sono promettenti progressi, ma ancora in corso.

La panacea

I dati sono essenziali se l’intelligenza artificiale aiuta a sviluppare terapie per la malattia. Una tecnica per identificare possibili candidati a farmaci è quella di utilizzare algoritmi di progettazione generativa, che producono un gran numero di potenziali risultati e quindi vagliarli per evidenziare quelli che vale la pena esaminare più da vicino. Questa tecnica può essere utilizzata, per esempio, per cercare rapidamente tra milioni di strutture biologiche o molecolari.

SRI International sta collaborando a uno strumento di intelligenza artificiale, che utilizza l’apprendimento profondo per generare molti nuovi candidati a farmaci di cui gli scienziati possono valutare l’efficacia. Questo è un punto di svolta per la scoperta di farmaci, ma possono ancora passare mesi prima che un candidato promettente diventi una terapia praticabile.

In teoria, l’IA potrebbe essere utilizzata anche per prevedere l’evoluzione del coronavirus. Inam immagina di eseguire algoritmi di apprendimento senza supervisione per simulare tutti i possibili percorsi di evoluzione. È quindi possibile aggiungere potenziali vaccini alla miscela e vedere se i virus mutano per sviluppare resistenza. “Ciò consentirà ai virologi di essere un passo avanti rispetto ai virus e creare vaccini nel caso in cui si verifichi una di queste mutazioni”, egli spiega. 

È una possibilità molto interessante, ma lontana nel tempo. Non si hanno ancora abbastanza informazioni su come il virus muta per essere in grado diportare avanti questo tipo di simulazioni. Nel frattempo, l’ultima barriera potrebbe essere legata al problema della responsabilità. “Quello che mi piacerebbe di più cambiare è la relazione tra i politici e l’IA”, afferma Wang.

L’intelligenza artificiale non sarà in grado di prevedere i focolai della malattia da sola, indipendentemente dalla quantità di dati che ottiene. Far sì che i leader del governo, delle imprese e dell’assistenza sanitaria si fidino di questi strumenti cambierà radicalmente la velocità con cui possiamo reagire alle epidemie di malattie, dice Wang.

Ma questa fiducia deve provenire da una visione realistica di ciò che l’IA può e non può fare ora e di cosa potrebbe migliorarla. Per sfruttarla al meglio occorreranno molti dati, tempo e un coordinamento intelligente tra molte persone diverse. Tutti requisiti che mancano in questo momento. 

Immagine: Ms Tech / Unsplash

(rp)

Related Posts
Total
0
Share