La demenza è ormai da tempo un problema di salute pubblica, che causerà un enorme impatto sociale oltre a danneggiare gravemente la qualità di vita dei pazienti.
La causa più comune della demenza, che colpisce il 60-80% dei casi(2021 Alzheimer’s disease facts and figures) è la malattia di Alzheimer (MA), una patologia neurodegenerativa che comporta un progressivo declino cognitivo e che include disturbi legati al linguaggio.

Ad oggi il morbo Alzheimer è un disturbo cerebrale incurabile. Tuttavia la parola, un’abilità tipicamente umana, è emersa come importante biomarcatore nelle malattie neurodegenerative come l’MA. L’analisi della voce dei pazienti guidata dall’Intelligenza Artificiale (AI) può aiutare a identificare questa patologia?

L’importanza dello screening precoce per demenza e morbo di Alzheimer

Lo screening può identificare i primi segnali di declino cognitivo per un intervento precoce e per mettere in atto trattamenti che possono rallentare l’evolvere della malattia e migliorare la qualità della vita del paziente.

L’identificazione tempestiva di potenziali pazienti a rischio è il primo passo per ritardare, ove possibile, l’insorgenza della demenza, in modo da fornire supporto a famiglie, pazienti e operatori sanitari.

Le diagnosi tradizionale per il morbo di Alzheimer viene effettuata principalmente attraverso analisi cliniche come i test cognitivi che comportano tuttavia lunghe valutazioni mediche.

La voce come fonte di informazioni

La voce umana è la fonte primaria per la comunicazione tra gli individui. La voce, in quanto complesso insieme di suoni, contiene moltissime informazioni e svolge un ruolo fondamentale per l’interazione sociale, permettendoci di condividere emozioni, paure, sentimenti ed eccitazione, attraverso la modulazione del tono.

I recenti sviluppi nell’Intelligenza Artificiale legata al linguaggio e nello specifico delle tecnologie di riconoscimento vocale (Speech Recognition), di elaborazione del linguaggio naturale (Natural Language Processing) e di Text-to-Speech (TTS) hanno aperto la strada a nuove opportunità nel campo della salute e della prevenzione di diverse patologie.

Già nel 2018 alcuni studi hanno analizzato i registri vocali di persone sane e di quelle con demenza senile. L’algoritmo di AI era stato in grado di rilevare con precisione la presenza di demenza senile nell’89% dei casi. Un altro studio del 2019 (1) ha utilizzato un sistema di riconoscimento vocale per studiare le caratteristiche della voce, come la velocità e la tonalità e per prevedere la probabilità di sviluppare demenza senile.

L’uso della parola come biomarcatore potrebbe fornire una diagnosi rapida, economica, accurata e non invasiva del morbo di Alzheimer e delle altre forme di demenza.

Assistenti vocali e l’Alzheimer

Gli assistenti vocali sono dispositivi domestici controllati dalla voce che eseguono determinati compiti, di solito ripetitivi o che richiedono tempo.

Nel 2022 il 27% degli italiani aveva un dispositivo intelligente in casa come Alexa o Google Home (“Digital Consumer Trends Survey 2022” – Deloitte).

Gli assistenti vocali sono stati ampiamente impiegati durante la pandemia, per esempio in Francia, dove i pazienti affetti da COVID-19 venivano supportati da questa tecnologia. Da allora diverse funzionalità in ambito sanitario sono state aggiunte ad Alexa di Amazon, Siri di Apple e Home Assistant di Google per garantire l’assistenza da remoto ai pazienti.

L’evoluzione della tecnologia vocale, l’analisi del segnale audio e i metodi di elaborazione e comprensione del linguaggio naturale hanno dunque aperto la strada a numerose potenziali applicazioni della voce, come l’identificazione di biomarcatori vocali per la diagnosi, il monitoraggio remoto del paziente e per migliorare la pratica clinica.

Nel contesto della voce, un biomarcatore vocale è come una firma, una combinazione di caratteristiche che sono associate a un esito clinico e che potrebbero essere impiegate per monitorare i pazienti, diagnosticare una condizione o classificare la gravità o le fasi di una malattia o per la somministrazione di farmaci.

Sottili cambiamenti nella voce e nel linguaggio possono essere spesso osservati anni prima della comparsa dei sintomi della malattia di Alzheimer e possono essere rilevati anche nelle prime fasi del decadimento cognitivo.

In generale, il decadimento cognitivo influisce sulla fluidità verbale, riflessa dall’esitazione del paziente a parlare e dal rallentamento della velocità del parlato. Altre spie sono la difficoltà nel trovare le parole, che portano all’uso frequente di suoni di riempimento (ad esempio, uh, ehm), errori semantici, termini indefiniti, revisioni, ripetizioni, neologismi, semplificazioni lessicali e grammaticali, nonché perdita di abilità semantiche in generale [2].

Le alterazioni sono percepite anche nella prosodia – la variazione e modulazione del tono, il ritmo del linguaggio – e possono influenzare la reattività emotiva del paziente [3,4].

Gli assistenti vocali, proprio per la loro presenza quotidiana nella case delle persone anziane, potrebbero quindi diventare un valido strumento per sviluppare un sistema in grado di riconoscere anche i minimi cambiamenti nel parlato e ricondurli a potenziali sintomi[5].

GPT-2, GPT-3 e predizione della demenza e dell’Alzheimer

La modellazione linguistica (LM) è l’uso di varie tecniche statistiche per determinare la probabilità che una data sequenza di parole si verifichi in una frase. I modelli linguistici sono impiegati in applicazioni diverse che in generale producono del testo, come la traduzione automatica, la risposta a domande, la creazione di riassunti.

Tra i tanti modelli linguistici i modelli GPT di OpenAI, azienda americana del gruppo Microsoft, sono emersi per la loro grande efficacia. GPT è l’acronimo di Generative Pre-Training, perché questa famiglia di modelli viene addestrata in due diverse fasi, la prima (pre-training) consiste semplicemente nel “prevedere la parola successiva” in un enorme corpus di documenti. La seconda fase è una messa a punto supervisionata su compiti specifici, come la risposta alle domande o la classificazione del testo. Questo tipo di addestramento produce un modello molto versatile, mentre l’enorme quantità di dati utilizzati lo rende in grado di generare un testo quasi indistinguibile da quello scritto dall’uomo.

La ricerca Agbavor e Liang del 2022 [6] ha utilizzato come base le registrazioni derivanti da ADReSSo Challenge (Alzheimer’s Dementia Recognition through Spontaneous Speech only), le ha trasformate in testo con tecnologie di Speech-to-Text, ha applicato i modelli linguistici GPT-2 e GPT-3 ed è stata in grado di raggiungere un risultato importante. Questi modelli linguistici sembrerebbero in grado di prevedere la demenza senile ancora meglio che con l’analisi della voce e dei biomarcatori vocali.

La ricerca è appena iniziata, il campo è decisamente nuovo e richiede quindi tutta l’attenzione, la diligenza e soprattutto la precauzione necessaria.
Sono tuttavia risultati interessanti che fanno ben sperare sul miglioramento della prevenzione di malattie neurodegenerative come il morbo di Alzheimer e le altre forme di demenza.