Un
algoritmo nella corteccia temporale inferiore per identificare gli oggetti da
tratti distintivi invarianti
DIANE RICHMOND
NOTE E
NOTIZIE - Anno VIII - 9 ottobre 2010.
Testi pubblicati sul sito www.brainmindlife.org della Società Nazionale
di Neuroscienze “Brain, Mind & Life - Italia” (BM&L-Italia). La sezione
“note e notizie” presenta settimanalmente note di recensione di lavori
neuroscientifici selezionati dallo staff
dei recensori fra quelli pubblicati o in corso di pubblicazione sulle maggiori
riviste e il cui argomento rientra negli oggetti di studio dei soci afferenti
alla Commissione Scientifica, e
notizie o commenti relativi a fatti ed eventi rilevanti per la Società
Nazionale di Neuroscienze.
[Tipologia del testo:
RECENSIONE]
Un
recente lavoro condotto da Li e Di Carlo del Massachusetts Institute of
Technology (MIT) ha accertato l’esistenza nella corteccia temporale inferiore di
una definita procedura per passi che consente l’apprendimento di
tutte le varianti visive di un oggetto integrandole in una
rappresentazione unica che permette il riconoscimento (Nuo Li & James Di Carlo, Unsupervised Natural
Visual Experience Rapidly Reshapes Size-Invariant Object Representation in
Inferior Temporal Cortex. Neuron 67
(6), 1062-1075, 2010).
In
termini di cognizione visiva, noi viviamo in un mondo popolato da una miriade
di elementi od oggetti che richiedono
di essere riconosciuti immediatamente per un buon adattamento alle circostanze.
Il mondo ci è familiare e comprensibile e le nostre reazioni sono costantemente
appropriate grazie alla nostra straordinaria capacità di rilevare, discriminare
ed attribuire senso alle immagini che vediamo, in base ai significati assoluti
e al valore di contesto degli oggetti che queste rappresentano e che è presente
nella nostra memoria[1].
Possiamo identificare persone senza vederne il volto, da un particolare della
figura in movimento, magari di spalle e senza un’illuminazione sufficiente a
discriminare con precisione le tinte e i limiti dei bordi dei dettagli. Una tale
abilità è stupefacente se pensiamo all’alto grado dimensionale dell’input retinico, stimato nell’ordine di
106 canali, e all’estesa variabilità della gamma di patterns prodotti da ciascun oggetto in
dipendenza dell’angolazione visiva, della sua posizione, della distanza,
dell’orientamento, del tipo e grado di illuminazione, e così via. Il cervello
deve trasformare questo complesso e variabile flusso informativo proveniente
dalla retina in rappresentazioni stabili, utili all’identificazione
dell’oggetto ed alla comprensione del suo stato nell’attualità della sua
presentazione.
I
fattori che rendono problematica la risoluzione cognitiva dell’interpretazione
dell’oggetto sono due: 1) l’elevata dimensione informativa della
rappresentazione retinica e 2) la variabilità dei patterns. Ad entrambi questi fattori fanno fronte processi che dipendono
dalla via ventrale della corteccia visiva che si limita, rispetto al resto
della gerarchia di elaborazione corticale, alle connessioni fra le aree V2 e V4[2].
Il
primo dei due problemi si può sinteticamente rendere in questi termini: una
mappa di pixel che costituisce un
segnale dell’ordine dimensionale del milione non è direttamente accessibile punto per punto alle aree corticali che
devono elaborarla per guidare il comportamento, e non potrebbe essere
immagazzinata in memoria in quanto tale. La via
ventrale trasforma
questa mappa retinica in un codice esplicito più snello e trattabile per
l’ottenimento di informazioni utili sull’oggetto. L’operazione fondamentale
sembra consistere in una ricodifica di ampie regioni della mappa di pixel in frammenti
di confini o contorni
caratterizzati da derivate geometriche.
Il
secondo fattore è la variabilità delle immagini e conseguentemente dei patterns che appartengono ad ogni
singolo oggetto. La via ventrale affronta questo problema derivando
dalle mappe retiniche una rappresentazione più stabile mediante la
trasformazione delle informazioni spaziali provenienti dall’occhio in un quadro di riferimento che, almeno
parzialmente, è definito dall’oggetto stesso[3].
Come ciò sia possibile è materia di congetture. Un’ipotesi molto accreditata
vuole che la tolleranza per uno spettro di schemi riferiti ad una sola identità[4]
o invarianza è appresa dal sistema nervoso
sulla base della stabilità nel tempo o costanza
temporale dell’identità[5]. Prendendo le mosse da questa
ipotesi, Nuo Li e James Di Carlo, che studiano da tempo le trasformazioni
neurali delle informazioni visive, hanno indagato i processi che consentono
l’identificazione degli oggetti sulla base di tratti distintivi invarianti.
I
due ricercatori afferenti al McGovern Institute for Brain Research, Department
of Brain and Cognitive Sciences del MIT, avevano in precedenza trovato evidenze
in primati non-umani di questa costanza temporale dell’identità basata sulla
tolleranza per uno spettro di schemi attribuiti allo stesso oggetto, in cima al
flusso della via visiva ventrale, cioè nella corteccia temporale inferiore. In
questo studio è stata sottoposta a verifica l’ipotesi che tale elaborazione
costituisca un meccanismo generale di apprendimento della tolleranza.
Gli
esiti della sperimentazione possono essere sintetizzati in tre punti.
1)
E’ emerso che lo stesso tipo di esperienza non controllata che ridisegnava la
tolleranza per la posizione nella
corteccia temporale inferiore, era in grado di riconfigurare la tolleranza per
la dimensione. L’entità (magnitudo)
di queste riconfigurazioni era simile.
2)
Tale tolleranza nella riconfigurazione poteva essere indotta dalle dinamiche
dell’esperienza visiva che si verificano naturalmente, anche senza movimenti
degli occhi.
3)
Esperienze temporali contigue non controllate possono costruire nuova
tolleranza neuronale.
A
questi elementi salienti, si può aggiungere che è stata rilevata un’asimmetria
temporale di apprendimento che suggerisce un meccanismo di tipo hebbiano.
Nel
complesso i risultati della sperimentazione indicano che l’elaborazione del
sistema visivo ventrale adotta un algoritmo
generale di
apprendimento della tolleranza per costruire le sue rappresentazioni invarianti degli oggetti.
L’autrice della nota, che ringrazia il presidente Giuseppe
Perrella con il quale ha discusso l’argomento trattato e la dottoressa Isabella
Floriani per la correzione della bozza, invita alla lettura degli scritti di
argomento connesso che compaiono su questo sito.
[1] L’abilità cognitiva di identificare un oggetto da uno dei tanti modi in cui si presenta alla nostra vista formando immagini retiniche è convenzionalmente definita “costanza dell’oggetto”. In questo genere di ricerca si intendono inclusi fra gli oggetti individui, volti ed altre parti del corpo, anche se più spesso gli esperimenti sono condotti adottando raffigurazioni grafiche schematiche dei caratteri di cui si studia l’elaborazione cerebrale.
[2] Oltre V4, l’informazione sull’oggetto è elaborata in una serie di stadi sviluppati in un percorso funzionale diretto secondo un asse postero-anteriore in territori della corteccia occipitale e temporale inferiore.
[3]
Si veda Connor C. E., et al. Neural Transformation of Object Information by Ventral Pathway Visual
Cortex. In The Cognitive Neurosciences, IV edition
(Michael S. Gazzaniga, editor in chief),
pp. 455-466, The MIT Press, Cambridge, Mass., 2009.
[4] La formulazione è tratta da G. Perrella, Il rovesciamento delle interpretazioni del fenomeno della costanza dell’oggetto nella percezione visiva. BM&L, Firenze 2004. In questo studio si propone una visione che parte dall’integrazione centrale dell’elaborazione percettiva e risulta interamente nuova rispetto alla classica suddivisione in comparti di informazione successivamente integrati nella corteccia cerebrale e sviluppati come se si trattasse di modelli informatici funzionanti in serie. La visione di Giuseppe Perrella considera la simultaneità evolutiva di tutte le parti che compongono il sistema visivo e la simultaneità funzionale nella vita dell’animale, come una traccia per la costruzione di modelli in cui le singole parti agiscono quali componenti specializzate attive in parallelo in un complesso funzionale integrato in quadri di estensione crescente fino a comprendere l’intero sistema nervoso centrale. Tale impostazione teorica è compatibile con la teoria della selezione dei gruppi neurali di Gerald Edelman e coerente con il complessivo e parallelo sviluppo delle componenti recettoriali e cerebrali nel corso dell’evoluzione.
[5] G. Perrella, Op. Cit.