UN NUOVO MODELLO PER PREVEDERE IL COMPORTAMENTO

 

 

Il comportamento di un animale è influenzato da vari fattori appartenenti al suo ambiente interno ed esterno e generalmente interagenti con il suo genoma: è possibile, studiando fattori e interazioni, prevedere come l’animale reagirà in una data situazione di difficoltà. Luksys e due collaboratori, in un lavoro recente, hanno dimostrato che alcuni di questi fattori possono essere inclusi in un modello di apprendimento basato sul rinforzo, ottenendo un accurato sistema di previsione del comportamento dell’animale in esame (Luksys G., et al. Stress, genotype and norepinephrine in the prediction of mouse behaviour using reinforcement learning. Nature Neuroscience 12, 1180-1186, 2009).

I modelli realizzati in precedenza avevano mostrato che le differenze comportamentali possono essere spiegate in parte sulla base di differenze nei “meta-parametri” di rinforzo dell’apprendimento, quali il tasso di apprendimento dell’animale, l’esploration-esploitation balance[1], e il future discounting, ossia una misura di quanto un animale preferisca ricevere una ricompensa immediatamente piuttosto che attenderla. La maggior parte dei modelli correntemente impiegati assume che questi “meta-parametri” siano costanti, ma le loro basi neurobiologiche, quali i neurotrasmettitori e l’attività neurale in particolari aree del cervello,  in vivo risultano essere dinamiche. Per questo Luksys e i due colleghi del Laboratorio di Neuroscienze Computazionali del Brain Mind Institute della Scuola Politecnica Federale di Losanna, hanno verificato se la variazione dei valori dei meta-parametri in un modello di apprendimento rinforzato potesse consentire di prevedere il comportamento più accuratamente.

I tre ricercatori hanno cominciato registrando, durante una prova di apprendimento condizionato, il comportamento di topi appartenenti a due ceppi genetici, uno manifestante un fenotipo ansioso, l’altro un fenotipo calmo. I roditori dovevano imparare ad inserire il naso in un foro di una parete della gabbia quando si accendeva una luce, per poter prendere la ricompensa. Durante gli 8 giorni di training, sono stati selezionati gruppi di topi che sono stati esposti a stress e/o sottoposti ad iniezione di un agonista o di un antagonista adrenergico. Dopo 26 giorni, i topi sono stati sottoposti a prove di richiamo multiplo, in cui si studiavano gli effetti di queste manipolazioni sull’apprendimento e sulla memoria[2].

I ricercatori hanno anche ottenuto dei dati di comportamento simulato impiegando un modello computerizzato di apprendimento rinforzato. I dati simulati però, quando i valori dei meta-parametri erano fissi, in molti casi non corrispondevano bene alla media di quelli reali. Allora Luksys e collaboratori hanno variato i valori dei meta-parametri secondo il tempo e i gruppi di topi con differenze nella genetica, nelle condizioni di stress e nel trattamento farmacologico, in modo tale che i dati risultanti dalla simulazione riproducessero con la maggiore fedeltà possibile l’andamento di quelli comportamentali reali. Ad esempio, nel modello computerizzato si è tenuto conto del fatto che col procedere dell’apprendimento gli animali sfruttavano in maniera crescente le proprie conoscenze, che lo stress induceva i topi a fenotipo calmo ad un maggiore impiego delle memorie e che i topi ansiosi presentavano un numero elevato di atti impulsivi che non aveva riscontro nei roditori calmi.

Dopo questa elaborazione, i ricercatori hanno addestrato una rete neurale artificiale[3] con informazioni circa il tipo di ceppo di topo, il fenotipo affettivo, le condizioni di stress, le manipolazioni farmacologiche e le prestazioni precedenti. L’output della rete neurale ha fornito valori dei meta-parametri per il modello di apprendimento rinforzato, in grado di predire il comportamento dei singoli roditori in esame. Il modello ha anche permesso di definire interazioni fra fattori diversi, consentendo di stabilire, ad esempio, che le manipolazioni farmacologiche alteravano i valori dei meta-parametri in maniera diversa, in dipendenza del livello di ansia psicomotoria e del ceppo genetico dell’animale.

Concludendo, il lavoro di Luksys, Gerstner e Sandi dimostra che è possibile costruire un modello fedele e prevedere il comportamento in prove di condizionamento di animali con caratteristiche di base differenti e sottoposti a diverse influenze farmacologiche. Il prosieguo degli studi potrà chiarire se questa procedura può essere impiegata per altri tipi di prove e prestazioni, e se il modello può essere migliorato includendo informazioni circa l’azione di altri modulatori dell’attività neurale, quali la dopamina e la serotonina. Infine, si può aggiungere che simili modelli computazionali del comportamento animale possono anche essere impiegati per studiare i requisiti ambientali necessari per migliorare le prestazioni individuali.

 

L’autrice della nota ringrazia la dottoressa Floriani per la correzione della bozza.

 

Nicole Cardon

BM&L-Ottobre 2009

www.brainmindlife.org

 

 

[Tipologia del testo: RECENSIONE]

 

 

 

 

 

 

 

 



[1] E’ una misura di quanto un animale esplori l’ambiente per opzioni, invece di usare informazioni raccolte in precedenza.

[2] Le valutazioni si sono basate sul calcolo del numero di volte che gli animali cacciavano il muso nel foro e sulla durata della permanenza in quella posizione nelle due condizioni di luce accesa e spenta.

[3] Le reti neurali artificiali non si programmano esplicitamente e possono essere addestrate, assomigliando in questo più a degli animali con un sistema nervoso estremamente semplice che a dei programmi di computer. Il loro potere di previsione si basa sulla struttura a più strati con unità nascoste e sulla funzione intrinseca dell’algoritmo di back diffusion. Il gruppo di neuropsicologia sperimentale “Paola Murolo”, in parte confluito nella “Società Nazionale di Neuroscienze BM&L-Italia”, con i suoi seminari didattici ha contribuito a diffondere la conoscenza delle reti neurali al di fuori della cerchia dei ricercatori.