Dati strutturati e non strutturati, come aggiungono valore se integrati

Artexe il 6 dicembre 2022

Le strutture sanitarie si affidano all’analisi e alla valorizzazione dei dati per fornire servizi più efficaci, ottimizzare l’efficienza operativa e, tutt’altro che secondario, per migliorare gli esiti dei percorsi di cura.

 

I dati strutturati nell’universo healthcare 

I dati che le strutture hanno a disposizione sono di due tipologie: dati strutturati e non strutturati, laddove questi ultimi rappresentano l’80% del totale (fonte: Altexsoft). Ciò che li distingue è la standardizzazione: i dati strutturati seguono uno specifico data model e sono memorizzati all’interno di strutture relazionali (DBMS) che consentono di eseguire ricerche e analisi in modo relativamente agevole. In una cartella clinica elettronica, tra i dati strutturati troviamo le informazioni demografiche del paziente, i test di laboratorio, i medicinali prescritti e tutto ciò che rientra in uno schema fisso e quindi comparabile tra diversi documenti. L’analisi di ampi volumi di informazioni strutturate consente alla struttura di incrementare la qualità dei trattamenti, fornire servizi più efficaci, migliorare la ricerca ed efficientare i propri processi, allineandoli con le esigenze dei pazienti. 

 

Le potenzialità dei dati non strutturati 

I dati non strutturati, di cui l’healthcare è ricco, sono tutti quelli che non possono rientrare (direttamente) in una struttura fissa e definita. Come detto, l’80% dei dati rientra in questa categoria, tra cui:  

  • Tutto l’imaging radiologico, tra cui TAC, risonanze magnetiche e radiografie; 
  • File audio e di testo scritti in linguaggio naturale, come anamnesi, note e lettere di dimissioni ospedaliere. 

Il valore dei dati non strutturati è immenso e molto complesso. Questa complessità sta nel fatto che i dati non strutturati sono difficilmente interpretabili proprio perché non rientrano in una struttura standardizzata e presentano una serie di sfide specifiche: si consideri, per esempio, l’utilizzo di frasi incomplete, abbreviazioni e di un lessico specialistico nei documenti di testo e nelle note vocali. Ciò nonostante, le evoluzioni in quest’ambito sono serrate: metodi di analisi dei dati come NLP (Natural Language Processing), algoritmi di deep learning e tecniche avanzate come la radiomica consentono di tradurre in informazioni utili anche sorgenti non strutturate come una TAC o una lettera di dimissioni ospedaliera. 

 

Potenziare i dati strutturati con quelli non strutturati 

In determinati ambiti, come appunto le cartelle cliniche elettroniche, coesistono sia dati strutturati che non strutturati. Se è vero che la valorizzazione di entrambi si traduce in informazioni utili per le decisioni cliniche, per la definizione di percorsi di cura personalizzati e per l’efficienza delle strutture, è dall’unione sinergica di entrambe le tipologie che una storia clinica può essere raccontata con dovizia di particolari, e che una decisione viene indirizzata da un contesto informativo adeguato allo scopo. Si consideri, inoltre, che il “mix” di dati strutturati e non fa parte della pratica clinica da sempre: è infatti del tutto naturale, per un medico, formulare una diagnosi miscelando – per esempio – informazioni di una radiografia con dei test di laboratorio.  

Quanto appena riportato vale per l’ambito delle decisioni cliniche, così come per quelle amministrative e finanziarie (governance), per quanto in questi ultimi ambiti i dati non strutturati siano presenti in misura minore.  

Nella pratica clinica, i dati strutturati e non strutturati sono complementari, e non stupisce che nel corso degli anni diversi studi abbiano dimostrato i benefici della combinazione di entrambe le tipologie. A titolo d’esempio, nel 2019 una ricerca evidenziò i benefici positivi dell’analisi delle note cliniche nella gestione di diverse patologie croniche, e qualche anno prima venne dimostrato il valore della data integration di fonti strutturate e non ai fini dell’assegnazione di codici clinici diagnostici e procedurali.  

Il tema si sposta, infine, sulle metodologie di analisi di differenti tipi di dati, ovvero – in altri termini – sullo sviluppo di un framework d’integrazione. Semplificando, un metodo piuttosto comune prevede l’estrazione (conversione) di informazioni strutturate da dati non strutturati (es, tramite tecniche di NLP), la contestuale combinazione delle due tipologie di dati e la successiva applicazione di un unico modello di machine learning al fine di tradurre il dato in informazioni utili per il percorso del paziente, l’efficacia della struttura o per l’intero sistema sanitario. 

New call-to-action