EVA REDAMONTI

L’intelligenza artificiale e la ricerca medica secondo Mark Zuckerberg e Priscilla Chan

I cofondatori della Chan Zuckerberg Initiative immaginano un sistema virtuale di modellazione cellulare alimentato dall’IA, che porterà progressi importanti nella comprensione delle malattie.

Essendo le più piccole unità viventi, le cellule sono fondamentali per la comprensione delle malattie, eppure non sappiamo molto di loro. Non sappiamo, ad esempio, come miliardi di biomolecole, come il DNA, le proteine e i lipidi, si uniscano per formare una cellula. Né sappiamo come i tanti tipi di cellule interagiscano all’interno del nostro corpo. Abbiamo una comprensione limitata di come le cellule, i tessuti e gli organi si ammalino e di cosa sia necessario per renderli sani.

L’intelligenza artificiale può aiutarci a rispondere a queste domande e ad applicare conoscenze per migliorare la salute e il benessere in tutto il mondo, a patto che i ricercatori riescano ad accedere a queste nuove e potenti tecnologie e a sfruttarle.

Immaginate se avessimo un sistema per rappresentare ogni stato e tipo di cellula utilizzando modelli di intelligenza artificiale. Una “cellula virtuale” potrebbe simulare l’aspetto e le caratteristiche note di qualsiasi tipo di cellula del nostro corpo, dai bastoncelli e coni che rilevano la luce nella retina ai cardiomiociti che fanno battere il cuore.

Gli scienziati potrebbero usare questo simulatore per prevedere come le cellule potrebbero rispondere a condizioni e stimoli specifici: come una cellula immunitaria risponde a un’infezione, cosa succede a livello cellulare quando un bambino nasce con una malattia rara o anche come il corpo di un paziente risponderà a un nuovo farmaco. Le scoperte scientifiche, le diagnosi dei pazienti e le decisioni terapeutiche diventerebbero più rapide, sicure ed efficienti.

Alla Chan Zuckerberg Initiative, stiamo contribuendo a generare i dati scientifici e a costruire l’infrastruttura informatica per rendere tutto questo una realtà, e a fornire agli scienziati gli strumenti necessari per sfruttare i nuovi progressi dell’IA e contribuire a sconfiggere le malattie.

Dati

I progressi dell’intelligenza artificiale, uniti a grandi volumi di dati scientifici, hanno già previsto la struttura di quasi tutte le proteine conosciute. DeepMind ha addestrato AlphaFold su 50 anni di dati accuratamente raccolti e in soli cinque anni ha risolto il mistero della struttura delle proteine. ESM, un altro sistema di intelligenza artificiale sviluppato da Meta, è un protein language model, addestrato non sulle parole ma su oltre 60 milioni di sequenze proteiche. Viene utilizzato per un’ampia gamma di applicazioni, come la previsione della struttura delle proteine e degli effetti delle mutazioni a partire da singole sequenze.

Un sistema virtuale di modellazione cellulare richiederà anche grandi quantità di dati. Dal 2016, la CZI ha sostenuto i ricercatori di tutto il mondo negli sforzi per generare e annotare i dati sulle cellule e i loro componenti, ha costruito strumenti per integrare questi grandi insiemi di dati e li ha resi ampiamente disponibili per i ricercatori, affinché potessero imparare e basarsi su di essi.

Un consorzio mondiale di ricercatori sta costruendo una mappa di riferimento di ogni tipo di cellula del corpo e il nostro Biohub di San Francisco sta creando atlanti cellulari di interi organismi. Insieme, questi set di dati stanno dando vita alla prima bozza dell’Atlante cellulare umano open-source, che traccerà i tipi di cellule del corpo, dallo sviluppo all’età adulta. Il nostro SF Biohub e il Chan Zuckerberg Imaging Institute stanno collaborando a OpenCell, che mappa la posizione delle diverse proteine nelle nostre cellule.

I ricercatori utilizzano anche modelli di apprendimento automatico come Geneformer e scGPT per esplorare grandi quantità di dati su geni e cellule, compresi i dati generati da CELLxGENE, la piattaforma software open-source che i team scientifici e tecnologici della CZI hanno creato per accelerare la ricerca sulle singole cellule. Allo stesso modo, con un nuovo prototipo di portale di dati per la tomografia crioelettronica, il nostro Imaging Institute e i nostri team scientifici e tecnologici stanno coinvolgendo esperti di apprendimento automatico per sviluppare annotazioni automatiche dei dati di microscopia. Questo accelererà i tempi di elaborazione dei dati da mesi o addirittura anni a poche settimane.

Stiamo rendendo i dati il più rappresentativi possibile per garantire che le scoperte scientifiche vadano a beneficio di tutti. Questo include l’integrazione dei dati pediatrici nell’Atlante cellulare umano, colmando le lacune nelle nostre conoscenze sui meccanismi cellulari delle malattie che insorgono nell’infanzia. Con le nostre sovvenzioni per l’Ancestry Networks for the Human Cell Atlas, sosteniamo anche i ricercatori che generano dati di riferimento sulle cellule basati su campioni di tessuto di persone di colore, latino-americane, del sud-est asiatico e indigene, oltre che di altri contesti razziali, etnici e atavici poco studiati.

I team di ricerca hanno già fatto delle scoperte utilizzando questi set di dati ben curati. Uno ha scoperto che il gene modificato legato alla fibrosi cistica è espresso da un tipo di cellula che gli scienziati non avevano mai incontrato prima, mentre un altro ha identificato le cellule respiratorie più vulnerabili alla SARS-CoV-2. Altri stanno usando i dati per scoprire nuove opzioni di splicing dei geni per correggere le mutazioni che causano malattie in cellule specifiche.

Queste scoperte sono il primo passo per lo sviluppo di trattamenti per le malattie, e crediamo che l’IA nel futuro potrà accelerare in modo significativo il ritmo delle scoperte dei ricercatori.

Calcolo

Per creare una cellula virtuale, stiamo costruendo un cluster di calcolo ad alte prestazioni con oltre 1000 GPU H100 che ci consentirà di sviluppare nuovi modelli di intelligenza artificiale addestrati su vari set di dati di grandi dimensioni su cellule e biomolecole, compresi quelli generati dai nostri istituti scientifici. Con il tempo, ci auguriamo che questo consenta agli scienziati di simulare ogni tipo di cellula, sia in stato di salute sia di malattia, e di interrogare queste simulazioni per vedere come si svolgono i fenomeni biologici più elusivi, tra cui il modo in cui le cellule nascono, come interagiscono all’interno dell’organismo e come le alterazioni che causano le malattie le influenzano esattamente.

Il nostro cluster di calcolo non sarà grande come quelli utilizzati nel settore privato per i prodotti commerciali, ma una volta in funzione sarà uno dei più grandi cluster di IA al mondo per la ricerca scientifica senza scopo di lucro. Si tratterà di una risorsa importante per i team accademici che sono pronti a utilizzare i set di dati in modi nuovi, ma che non possono a causa dei costi proibitivi di accesso alle più recenti tecnologie di IA. Come gli altri nostri strumenti, questi modelli cellulari digitali, con i relativi dati e applicazioni, saranno apertamente accessibili ai ricercatori di tutto il mondo.

Persone

La generazione di questi set di dati, la costruzione di questo cluster di calcolo e l’utilizzo dell’IA per la biologia sono il tipo di sforzo multidisciplinare e collaborativo che definisce il nostro lavoro.

La nostra rete di biohub ha riunito esperti di diverse discipline e istituzioni per affrontare alcune delle sfide più grandi e rischiose della scienza, che non potevano essere risolte in ambienti accademici tradizionali. Grazie a progetti come CELLxGENE, i ricercatori di tutto il mondo hanno contribuito a costruire un corpus di dati su una singola cellula, a testimonianza di quanto efficacemente una risorsa condivisa per la scienza aperta possa crescere con un maggior numero di collaboratori che contribuiscono con risorse e cervello.

Quando la CZI ha lanciato il suo lavoro scientifico nel 2016, ci siamo impegnati a raggiungere un grande obiettivo: aiutare la comunità scientifica a curare, prevenire o gestire tutte le malattie entro la fine di questo secolo. Crediamo che questo obiettivo sia possibile e che sarà notevolmente migliorato se i principali scienziati e tecnologi lavoreranno insieme per sfruttare al meglio le opportunità create dall’IA. Possiamo iniziare a svelare i misteri delle nostre cellule, e questo può portare a un lavoro che aiuta a porre fine a molte malattie come le conosciamo oggi.

Priscilla Chan è cofondatrice e co-CEO della Chan Zuckerberg Initiative. Il lavoro di Priscilla con i pazienti e gli studenti delle comunità della Bay Area come pediatra e insegnante ha fatto crescere il suo desiderio di rendere l’apprendimento più personalizzato, di trovare nuove strade per gestire e curare le malattie e di espandere le opportunità per un maggior numero di persone. Priscilla ha conseguito la laurea in biologia all’Università di Harvard e il dottorato di ricerca alla UC San Francisco (UCSF).

Mark Zuckerberg è cofondatore e co-CEO della Chan Zuckerberg Initiative. In qualità di fondatore, presidente e amministratore delegato di Meta, Mark apporta al lavoro della CZI un impegno per dare opportunità alle persone e per lo sviluppo di comunità, nonché una profonda esperienza tecnica. Mark ha studiato informatica all’Università di Harvard prima di trasferirsi a Palo Alto, in California, nel 2004.

Related Posts
Total
0
Share