Con la diffusione capillare dell’impiego delle tecnologie digitali, la conseguente produzione di quantità ingenti di dati e l’incremento della potenza di calcolo, il fenomeno data science ha trovato negli ultimi anni applicazioni in una vasta gamma di campi. Considerevoli le intersezioni, ad esempio, con la Sanità, settore che grazie alla scienza dei dati è stato abilitato a compiere veri e propri salti quantici verso un paradigma di spiccata modernità. Certo, molti di questi balzi in avanti devono ancora essere intrapresi, alcuni di essi attraversano ancora le loro fasi precoci di progettazione, ma il processo di innovazione di molti settori della cura è indubbiamente in atto e gli strumenti per realizzarlo sono disponibili.
Per le sue caratteristiche, una delle aree sanitarie in cui l’impatto della data science è più rilevante è rappresentata dall’epidemiologia, la scienza che studia la distribuzione e i determinanti delle malattie nelle popolazioni. D’altra parte, è impossibile non essersi resi conto, non solo sulla scorta dell’esperienza pandemica, di come sia radicalmente cambiata la maniera di studiare, prevenire e monitorare le malattie e di come tutto ciò debba necessariamente in qualche modo riverberarsi sulla maniera di concepire le politiche sanitarie.
La complessità dei fenomeni biomedici
Quelli biologici rientrano nella categoria dei sistemi a complessità organizzata, l’ambito che annovera più in generale le scienze biomediche, caratterizzato dalla presenza di elementi non identici che interagiscono tra loro con una forza di correlazione variabile nel tempo.
La complessità organizzata presenta aspetti peculiari tali da non poter essere trattati efficacemente con le tecniche tradizionali: per capire come funziona un organismo, come cambia il suo funzionamento in presenza di una malattia, le conseguenze che le stesse patologie producono in differenti organismi è chiaro che la statistica non è sufficiente.
È quanto appena introdotto, fra l’altro, a legittimare la necessità di un approccio interdisciplinare alle science biomediche, che non coinvolga soltanto le varie branche della medicina e delle altre discipline sanitarie ma che sappia accogliere i contributi preziosi di altre discipline che con la scienza intrattengono rapporti più o meno stretti (fisica, matematica, filosofia). Accanto a ciò, la diffusione delle tecnologie high-throughput (come DNA sequencing, screening molecolari, tecnologie omiche) ha reso obsolete le tecniche tradizionali.
È da questo contesto, e dall’esigenza di affrontare i sempre più impegnativi bisogni di salute, che sfocia l’allineamento delle scienze predittive con i tempi.
La gestione dei dati
La scienza dei dati mette a disposizione strumenti potenti per l’analisi di dati complessi. Dunque inevitabili, e benvenute, le sinergie con l’epidemiologia, la cui evoluzione segue due direttrici: quella dell’integrazione fra l’approccio tradizionale e quello molecolare e quella dell’innovazione di metodo, che consiste nell’implementazione di soluzioni di interoperabilità dei dati, modelli matematici e sistemi di intelligenza artificiale.
Le fonti sono rappresentate come di consueto dai canali tradizionali, quelli che fanno riferimento alla sanità pubblica (cartelle cliniche elettroniche, registri di malattie, database di laboratori), e da canali alternativi esterni al sistema medico (survey, ricerche sul web, social media, app e device per il tracciamento dei dati biomedici). Le informazioni raccolte vengono successivamente sottoposte a procedure avanzate di pulizia, normalizzazione e archiviazione, al fine di garantire che i dati siano accurati, completi e prontamente disponibili per le analisi. In aggiunta, nuovi dati biomolecolari vengono generati a partire dagli studi condotti sulla popolazione.
Un’ulteriore linea di sviluppo è costituita dalla messa a punto di metodologie di analisi e interpretazione delle informazioni sempre più performanti.
European health data space
Lo scorso marzo è entrato in vigore il Regolamento (UE) 2025/327 sullo spazio europeo dei dati sanitari, che rappresenta la prima azione verso la realizzazione di una Unione europea della Salute e un importante frangia della strategia UE per i dati.
Gli obiettivi sono quelli di codificare l’uso primario dei dati, consentirne l’uso secondario (ai fini della ricerca e dell’elaborazione delle politiche sanitarie e delle attività regolatorie) e promuovere un mercato unico per i sistemi di cartelle cliniche elettroniche.
La normativa permetterà di costruire e potenziare le collaborazioni in ambito UE in campi strategici dell’innovazione medica, come quello oncologico, e la promozione di studi orientati alla stima del rischio e all’identificazione di nuovi e più efficaci sistemi di prevenzione, alla predisposizione di strumenti decisionali per gli operatori sanitari e alla conseguente ottimizzazione dei servizi sanitari.
Come si studia la distribuzione delle malattie
Ciò che, in concreto, fa l’epidemiologia è costruire scenari predittivi: i grandi volumi di dati e la potenza di analisi caratteristici della data science sono funzionali alla modellizzazione dei meccanismi di diffusione delle malattie, al fine di prevenire lo sviluppo di nuovi casi agendo sulle aree a rischio e valutare l’impatto delle misure di risk management. L’obiettivo finale è quello di supportare il decision making informato in ambito politico e amministrativo, per definire le policy sanitarie più opportune dato uno specifico contesto e flussi organizzativi ottimali all’interno delle strutture sanitarie.
Le tecniche di apprendimento automatico e intelligenza artificiale sono, ad esempio, estremamente efficienti nell’identificazione di pattern nei dati epidemiologici che potrebbero non essere evidenti all’occhio umano. Ciò può essere d’aiuto nell’individuazione di nuove correlazioni tra fattori di rischio e insorgenza di malattie, nell’implementazione di protocolli di medicina di precisione e personalizzata e nel perfezionamento delle previsioni epidemiologiche.
Se i dati sono fredde informazioni, scaldiamole con un po’ d’arte
Con un simile stravolgimento della maniera di intendere lo studio dell’andamento di malattie caratterizzate da incidenza significativa e impatto rilevante sulla vita delle persone, c’è da chiedersi se cambierà anche il modo di proporre i dati al pubblico e di scambiare informazioni all’interno degli stessi network scientifici.
Del resto, il protagonista della narrazione (il “re” dato), godendo di nuove origini e trovandosi inserito in nuovi meccanismi, non può che esigere uno storytelling che sia all’altezza della sua originale condizione.
Conseguentemente, la comunicazione in epidemiologia sta affrontando un’evoluzione mirata all’affinamento della data visualization, nella quale la scelta di rappresentare graficamente un fenomeno deve rispondere anche all’esigenza di rendere risultati complessi comprensibili a un pubblico di professionisti di varia estrazione (medici, scienziati non necessariamente esperti di data science, esponenti delle associazioni pazienti) e con sempre meno tempo a disposizione. Occorrerà, dunque, prestare maggiore attenzione alla predisposizione di elaborazioni grafiche semplici e fruibili, capaci di veicolare al meglio il messaggio del contenuto e prevenire il rischio di misinterpretazione e strumentalizzazione. E, colpo di scena rispetto a un passato di torte e bar chart grezzi, sarà necessario riflettere su come stimolare la curiosità dei lettori e catturarne il coinvolgimento. Scelte cromatiche nella sequenza delle rappresentazioni ed elaborazioni grafiche saranno indispensabili per suscitare l’effetto desiderato. Già oggi sono disponibili piattaforme di business intelligence capaci di combinare numeri, immagini e testi per offrire la visione d’insieme di un fenomeno, un colpo d’occhio che dia l’idea delle sue articolazioni alimentando l’interesse per il proseguimento della trattazione. Grafici interattivi e dashboard consentono agli operatori sanitari di farsi rapidamente un’idea delle tendenze di massima e ai cittadini di apprendere informazioni cruciali per proteggere la salute propria e quella pubblica.
Sempre più arte nella scienza, sempre più umanizzazione nella comunicazione scientifica.
L’introduzione dell’uso del chord diagram ha avuto un ruolo determinante nel modificare la data visualization in epidemiologia e nel permettere una veloce comprensione di meccanismi compositi. Ecco un esempio di diagramma che descrive i cambiamenti della frequenza delle comorbidità dell’apparato respiratorio in funzione della presenza di determinate condizioni mediche (Kaifeng Guo et al. Multi-Task Learning for Lung Disease Classification and Report Generation via Prior Graph Structure and Contrastive Learning. IEEE Access. 2023)