Data Science per lo studio del morbo di Alzheimer: pattern nascosti nel connettoma strutturale
Scarica il Paper frutto della collaborazione tra Exprivia e l’Universidad de Zaragoza.Un importante risultato ottenuto grazie al rapporto virtuoso tra la ricerca accademica e quella industriale.
Autori:
Ernesto Estrada
Institute of Applied Mathematics (IUMA), Universidad de Zaragoza and ARAID Foundation, Government of Aragon
Eufemia Lella
Innovation Lab Exprivia and Istituto Nazionale di Fisica Nucleare, sezione di Bari
Tra le più grandi sfide della ricerca in Neuroscienza c’è quella di fare luce sui meccanismi di neurodegenerazione che originano le malattie del cervello. La Data Science fornisce uno strumento essenziale per estrarre informazioni all’apparenza nascoste a partire da dati clinici, genetici e di imaging. In particolare la risonanza magnetica pesata in diffusione fornisce informazioni sulle caratteristiche della connessione strutturale tra le regioni del cervello e dunque consente di studiare come questa si modifica in presenza della malattia. L’individuazione di pattern strutturali conduce alla scoperta di biomarcatori quantitativi, aprendo la strada all’utilizzo dell’Intelligenza Artificiale per la diagnosi, il più possibile precoce, delle malattie neurodegenerative.
La Neuroscienza, munita degli strumenti della Data Science e dell’AI, oggi riveste un ruolo fondamentale, in particolare nella ricerca sul morbo di Alzheimer, la più diffusa e invalidante malattia neurodegenerativa per la quale, ad oggi, non esiste cura. Una grande sfida è quella della diagnosi precoce, che rappresenta un importante traguardo nella prospettiva della sperimentazione di nuovi farmaci.
Metodologie di Data Science in Neuroscienza: il cervello come una rete complessa
I dati di partenza, forniti dagli esami di risonanza magnetica, sono immagini 3D del cervello e il livello di grigio di ogni voxel ha un significato e un contenuto informativo relativo al tipo specifico di esame svolto. Queste immagini costituiscono dati “raw” e dunque, per interpretare ed estrarre conoscenza da essi, è cruciale l’utilizzo di metodologie per modellizzare e filtrare l’informazione. La Data Science, con tecniche statistiche e di Machine Learning, fornisce gli strumenti e le metodologie per estrarre informazioni da grandi moli di dati, partendo dal loro formato più “grezzo”. In particolare in Neuroscienza, sui dati di imaging del cervello, come metodologie di feature engineering spesso si utilizza l’estrazione del connettoma allo scopo di estrapolare in maniera efficace informazioni relative alla connettività tra le regioni del cervello, grazie alla Teoria delle Reti Complesse.
Il cervello è il più complesso tra i sistemi complessi, costituito da diverse parti che nella loro interazione producono comportamenti che non emergerebbero considerando le singole parti individualmente. Ricostruendo, attraverso algoritmi cosiddetti di “trattografia”, i tratti fibrosi che connettono le sue regioni anatomiche, il cervello può essere modellizzato come una rete complessa rappresentata da un grafo i cui nodi sono le regioni anatomiche e i cui link sono pesati in base al numero di tratti fibrosi che le connettono. Le caratteristiche topologiche e di connettività del grafo si studiano con la Teoria delle Reti Complesse che permette di descrivere quantitativamente la connettività del cervello e di metterne in evidenza le alterazioni in presenza di malattia. Ad esempio con la Teoria delle Reti Complesse si possono determinare i nodi con più connessioni nella rete, i cosiddetti “hub”, o i nodi e le connessioni più importanti dal punto di vista del traffico di informazioni nella rete, o la tendenza dei nodi a formare dei cluster o la tendenza della rete a costituire dei moduli. Queste configurazioni nella rete cerebrale possono subire variazioni in presenza della malattia.
La Communicability Distance evidenzia meccanismi di alterazione di connettività nel morbo di Alzheimer
Il concetto classico di distanza tra due nodi di una rete è associato alla lunghezza di cammino, ossia al numero di link che compongono il cammino tra due nodi. L’idea più comune nel campo della Teoria delle Reti Complesse è che la comunicazione tra due nodi di una rete avvenga attraverso il cammino di minima lunghezza tra di essi. Ma in molte reti del mondo reale l’informazione può fluire anche attraverso cammini non minimi, si pensi ad esempio alla diffusione del gossip nelle reti sociali, in cui l’informazione può fluire avanti e indietro più volte prima di raggiungere la destinazione finale. In questi casi il cammino di minima lunghezza non è sufficiente a descrivere in modo esauriente la comunicabilità all’interno della rete.
Nel 2008 Ernesto Estrada e Naomichi Hatano hanno proposto una nuova metrica delle reti complesse, la communicability, introducendo un nuovo concetto di comunicazione all’interno della rete. La communicability tiene conto non solo del cammino di minima lunghezza tra due nodi, ma di tutti i possibili cammini tra di essi dando un peso maggiore a quelli di minore lunghezza. Partendo dal concetto di communicability Ernesto Estrada ha introdotto un nuovo concetto di distanza nelle reti complesse, la communicability distance tra due nodi, associata alla differenza tra la quantità di informazione che partendo da un nodo ritorna a se stesso e la quantità di informazione che partendo da un nodo raggiunge l’altro nodo. Questi nuovi concetti di comunicazione e di distanza nelle reti sono particolarmente idonei a studiare quelle reti in cui l’informazione fluisce attraverso un processo di diffusione, come avviene nel connettoma del cervello estratto da immagini di risonanza magnetica pesata in diffusione. Inoltre questo nuovo concetto di distanza è fortemente adatto a caratterizzare le alterazioni di connettività in una malattia del cervello come il morbo di Alzheimer che alcune ricerche ipotizzano essere una “sindrome di disconnessione” e una malattia correlata alla perdita di integrità delle fibre di materia bianca che rappresentano le vie di comunicazione tra le regioni del cervello.
La communicability distance è stata utilizzata per evidenziare alterazioni di connettività tra le regioni del cervello nei malati di Alzheimer. Partendo dal modello matematico epidemiologico Susceptible-Infected (SI) della propagazione del Disease Factor (DF), si è mostrato che la communicability distance rappresenta la differenza tra la circulability del DF intorno a due regioni e la sua transmissibility da una regione all’altra. A partire dalla communicability distance si è calcolato il cammino di minima lunghezza in termini di comunicabilità tra le coppie di regioni del cervello e si è trovato che questa misura è molto più significativa, rispetto al classico cammino di minima lunghezza, nel rilevare differenze di connettività tra il gruppo dei sani e il gruppo dei malati. Utilizzando metodologie di selezione di feature in Data Science, quali test statistici di permutazione, sono state infatti trovate 399 coppie di regioni con differenza statisticamente significativa nel cammino di minima lunghezza in termini di comunicabilità, la gran parte delle quali interessano regioni appartenenti a due emisferi differenti o regioni entrambe dell’emisfero sinistro o connessioni del Vermis, trovando dei risultati in accordo con l’ipotesi che il morbo di Alzheimer sia una sindrome di disconnessione. Inoltre si è trovato che le connessioni che hanno mediamente una maggiore differenza di cammino di minima lunghezza in termini di comunicabilità, tra il gruppo dei sani e il gruppo dei malati, riguardano cluster di regioni che includono diverse zone del Cervelletto, il Vermis e l’Amygdala. Un interessantissimo risultato, emerso grazie all’utilizzo di tecniche statistiche di Data Science, e che rappresenta un pattern di connettività del cervello dei malati di Alzheimer, è che nel 76.9% delle regioni del cervello danneggiate il cammino di minima lunghezza in termini di comunicabilità diminuisce nei malati rispetto ai sani. Questo risultato controintuitivo indica come il morbo di Alzheimer trasformi la rete cerebrale in un sistema più efficiente nella trasmissione della malattia, perché fa diminuire la circulability del DF intorno alle regioni del cervello rispetto alla sua transmissibility ad altre regioni.
Nuove prospettive per l’AI nella diagnosi dell’Alzheimer
La scoperta di nuovi biomarcatori delle malattie neurodegenerative e di pattern legati ai meccanismi di alterazione del funzionamento del cervello, aprono sempre nuove e intriganti prospettive per l’utilizzo dell’AI nella diagnosi automatica e il più possibile precoce. In particolare, questi recenti risultati scientifici, suggeriscono l’efficacia dell’utilizzo di una nuova metrica di distanza per descrivere il flusso di informazione tra le regioni del cervello aprendo la strada a nuove analisi sulla topologia e l’organizzazione della rete cerebrale e dunque all’estrazione di nuove feature informative da dare in input ad algoritmi di AI per formulare modelli predittivi e per l’implementazione di nuovi tool per la diagnosi automatica.
Compila il form e inserisci i tuoi dati.