Un algoritmo nella corteccia temporale inferiore per identificare gli oggetti da tratti distintivi invarianti

DIANE RICHMOND

NOTE E NOTIZIE - Anno VIII - 9 ottobre 2010.

Testi pubblicati sul sito www.brainmindlife.org della Società Nazionale di Neuroscienze “Brain, Mind & Life - Italia” (BM&L-Italia). La sezione “note e notizie” presenta settimanalmente note di recensione di lavori neuroscientifici selezionati dallo staff dei recensori fra quelli pubblicati o in corso di pubblicazione sulle maggiori riviste e il cui argomento rientra negli oggetti di studio dei soci afferenti alla Commissione Scientifica, e notizie o commenti relativi a fatti ed eventi rilevanti per la Società Nazionale di Neuroscienze.

[Tipologia del testo: RECENSIONE]

Un recente lavoro condotto da Li e Di Carlo del Massachusetts Institute of Technology (MIT) ha accertato l’esistenza nella corteccia temporale inferiore di una definita procedura per passi che consente l’apprendimento di tutte le varianti visive di un oggetto integrandole in una rappresentazione unica che permette il riconoscimento (Nuo Li & James Di Carlo, Unsupervised Natural Visual Experience Rapidly Reshapes Size-Invariant Object Representation in Inferior Temporal Cortex. Neuron 67 (6), 1062-1075, 2010).

In termini di cognizione visiva, noi viviamo in un mondo popolato da una miriade di elementi od oggetti che richiedono di essere riconosciuti immediatamente per un buon adattamento alle circostanze. Il mondo ci è familiare e comprensibile e le nostre reazioni sono costantemente appropriate grazie alla nostra straordinaria capacità di rilevare, discriminare ed attribuire senso alle immagini che vediamo, in base ai significati assoluti e al valore di contesto degli oggetti che queste rappresentano e che è presente nella nostra memoria[1]. Possiamo identificare persone senza vederne il volto, da un particolare della figura in movimento, magari di spalle e senza un’illuminazione sufficiente a discriminare con precisione le tinte e i limiti dei bordi dei dettagli. Una tale abilità è stupefacente se pensiamo all’alto grado dimensionale dell’input retinico, stimato nell’ordine di 10⁶ canali, e all’estesa variabilità della gamma di patterns prodotti da ciascun oggetto in dipendenza dell’angolazione visiva, della sua posizione, della distanza, dell’orientamento, del tipo e grado di illuminazione, e così via. Il cervello deve trasformare questo complesso e variabile flusso informativo proveniente dalla retina in rappresentazioni stabili, utili all’identificazione dell’oggetto ed alla comprensione del suo stato nell’attualità della sua presentazione.

I fattori che rendono problematica la risoluzione cognitiva dell’interpretazione dell’oggetto sono due: 1) l’elevata dimensione informativa della rappresentazione retinica e 2) la variabilità dei patterns. Ad entrambi questi fattori fanno fronte processi che dipendono dalla via ventrale della corteccia visiva che si limita, rispetto al resto della gerarchia di elaborazione corticale, alle connessioni fra le aree V2 e V4[2].

Il primo dei due problemi si può sinteticamente rendere in questi termini: una mappa di pixel che costituisce un segnale dell’ordine dimensionale del milione non è direttamente accessibile punto per punto alle aree corticali che devono elaborarla per guidare il comportamento, e non potrebbe essere immagazzinata in memoria in quanto tale. La via ventrale trasforma questa mappa retinica in un codice esplicito più snello e trattabile per l’ottenimento di informazioni utili sull’oggetto. L’operazione fondamentale sembra consistere in una ricodifica di ampie regioni della mappa di pixel in frammenti di confini o contorni caratterizzati da derivate geometriche.

Il secondo fattore è la variabilità delle immagini e conseguentemente dei patterns che appartengono ad ogni singolo oggetto. La via ventrale affronta questo problema derivando dalle mappe retiniche una rappresentazione più stabile mediante la trasformazione delle informazioni spaziali provenienti dall’occhio in un quadro di riferimento che, almeno parzialmente, è definito dall’oggetto stesso[3]. Come ciò sia possibile è materia di congetture. Un’ipotesi molto accreditata vuole che la tolleranza per uno spettro di schemi riferiti ad una sola identità[4] o invarianza è appresa dal sistema nervoso sulla base della stabilità nel tempo o costanza temporale dell’identità[5]. Prendendo le mosse da questa ipotesi, Nuo Li e James Di Carlo, che studiano da tempo le trasformazioni neurali delle informazioni visive, hanno indagato i processi che consentono l’identificazione degli oggetti sulla base di tratti distintivi invarianti.

I due ricercatori afferenti al McGovern Institute for Brain Research, Department of Brain and Cognitive Sciences del MIT, avevano in precedenza trovato evidenze in primati non-umani di questa costanza temporale dell’identità basata sulla tolleranza per uno spettro di schemi attribuiti allo stesso oggetto, in cima al flusso della via visiva ventrale, cioè nella corteccia temporale inferiore. In questo studio è stata sottoposta a verifica l’ipotesi che tale elaborazione costituisca un meccanismo generale di apprendimento della tolleranza.

Gli esiti della sperimentazione possono essere sintetizzati in tre punti.

1) E’ emerso che lo stesso tipo di esperienza non controllata che ridisegnava la tolleranza per la posizione nella corteccia temporale inferiore, era in grado di riconfigurare la tolleranza per la dimensione. L’entità (magnitudo) di queste riconfigurazioni era simile.

2) Tale tolleranza nella riconfigurazione poteva essere indotta dalle dinamiche dell’esperienza visiva che si verificano naturalmente, anche senza movimenti degli occhi.

3) Esperienze temporali contigue non controllate possono costruire nuova tolleranza neuronale.

A questi elementi salienti, si può aggiungere che è stata rilevata un’asimmetria temporale di apprendimento che suggerisce un meccanismo di tipo hebbiano.

Nel complesso i risultati della sperimentazione indicano che l’elaborazione del sistema visivo ventrale adotta un algoritmo generale di apprendimento della tolleranza per costruire le sue rappresentazioni invarianti degli oggetti.

L’autrice della nota, che ringrazia il presidente Giuseppe Perrella con il quale ha discusso l’argomento trattato e la dottoressa Isabella Floriani per la correzione della bozza, invita alla lettura degli scritti di argomento connesso che compaiono su questo sito.

Diane Richmond

BM&L- 9 ottobre 2010

www.brainmindlife.org

_____________________________________________________________________________________________________________________

La Società Nazionale di Neuroscienze BM&L-Italia, affiliata alla International Society of Neuroscience, è registrata presso l’Agenzia delle Entrate di Firenze, Ufficio Firenze 1, in data 16 gennaio 2003 con codice fiscale 94098840484, come organizzazione scientifica e culturale non-profit.

[1] L’abilità cognitiva di identificare un oggetto da uno dei tanti modi in cui si presenta alla nostra vista formando immagini retiniche è convenzionalmente definita “costanza dell’oggetto”. In questo genere di ricerca si intendono inclusi fra gli oggetti individui, volti ed altre parti del corpo, anche se più spesso gli esperimenti sono condotti adottando raffigurazioni grafiche schematiche dei caratteri di cui si studia l’elaborazione cerebrale.

[2] Oltre V4, l’informazione sull’oggetto è elaborata in una serie di stadi sviluppati in un percorso funzionale diretto secondo un asse postero-anteriore in territori della corteccia occipitale e temporale inferiore.

[3] Si veda Connor C. E., et al. Neural Transformation of Object Information by Ventral Pathway Visual Cortex. In The Cognitive Neurosciences, IV edition (Michael S. Gazzaniga, editor in chief), pp. 455-466, The MIT Press, Cambridge, Mass., 2009.

[4] La formulazione è tratta da G. Perrella, Il rovesciamento delle interpretazioni del fenomeno della costanza dell’oggetto nella percezione visiva. BM&L, Firenze 2004. In questo studio si propone una visione che parte dall’integrazione centrale dell’elaborazione percettiva e risulta interamente nuova rispetto alla classica suddivisione in comparti di informazione successivamente integrati nella corteccia cerebrale e sviluppati come se si trattasse di modelli informatici funzionanti in serie. La visione di Giuseppe Perrella considera la simultaneità evolutiva di tutte le parti che compongono il sistema visivo e la simultaneità funzionale nella vita dell’animale, come una traccia per la costruzione di modelli in cui le singole parti agiscono quali componenti specializzate attive in parallelo in un complesso funzionale integrato in quadri di estensione crescente fino a comprendere l’intero sistema nervoso centrale. Tale impostazione teorica è compatibile con la teoria della selezione dei gruppi neurali di Gerald Edelman e coerente con il complessivo e parallelo sviluppo delle componenti recettoriali e cerebrali nel corso dell’evoluzione.

[5] G. Perrella, Op. Cit.