Nuovi modelli per la visione umana nella corteccia visiva

 

 

GIOVANNI ROSSI

 

 

 

NOTE E NOTIZIE - Anno XII – 24 maggio 2014.

Testi pubblicati sul sito www.brainmindlife.org della Società Nazionale di Neuroscienze “Brain, Mind & Life - Italia” (BM&L-Italia). Oltre a notizie o commenti relativi a fatti ed eventi rilevanti per la Società, la sezione “note e notizie” presenta settimanalmente lavori neuroscientifici selezionati fra quelli pubblicati o in corso di pubblicazione sulle maggiori riviste e il cui argomento rientra negli oggetti di studio dei soci componenti lo staff dei recensori della Commissione Scientifica della Società.

 

 

[Tipologia del testo: RECENSIONE]

 

Noi esseri umani abbiamo una straordinaria capacità di riconoscere gli oggetti nelle scene visive della vita di tutti i giorni, nelle più varie condizioni di luce e secondo i mutevoli aspetti che le circostanze della realtà contingente ci pongono sotto gli occhi. Le riproduzioni bidimensionali, fotografiche, cinematografiche o digitali, riducono di poco le prestazioni, quando non le esaltano addirittura, per l’ingrandimento o l’accentuazione di dettaglio di parti, l’aumento di risoluzione lineare o chiaroscurale. Non ci sorprende molto che le scimmie abbiano rivelato, a test condotti per decenni in vari contesti sperimentali, prestazioni non tanto distanti da quelle umane e, in alcuni casi, del tutto simili, perché riteniamo che queste abilità dipendano dall’organizzazione cerebrale dell’elaborazione della visione, che nei primati non umani è evoluta quasi quanto la nostra.

Questa abilità è consentita da una rete di aree cerebrali interconnesse secondo una gerarchia funzionale in gran parte nota. Ciò che non si riesce a comprendere, e che forse rimane una delle sfide maggiori della neuroscienza dei sistemi visivi, è il ruolo dei neuroni dei livelli più alti di elaborazione delle immagini. Non è questa la sede per ricordare nel dettaglio l’annosa controversia sull’esistenza della grandmother cell, per la quale si rimanda ad altri scritti presenti su questo sito web, ma sarà opportuno ricordare che la ricerca volta allo studio analitico di singoli neuroni e piccoli gruppi cellulari, pur fornendo una quantità di dati di notevole interesse generale, non sembra essere per il momento la giusta via per risolvere l’enigma.

Sembra che sia necessario approfondire la conoscenza dei criteri di relazione fra sottosistemi, per cercare di comprendere chiavi di processi che ancora ci sfuggono. Al fine di fare luce su queste relazioni, si stanno impiegando tecniche computazionali per cercare di identificare modelli di reti neurali che eguaglino l’abilità umana, o almeno quella simiana, nei difficili compiti di categorizzazione di oggetti di cui sono capaci volontari umani ed altri primati.

Daniel L. K. Yamins, con quattro colleghi coordinati da James Di Carlo, hanno definito su base computazionale le caratteristiche di una rete neurale in grado di riprodurre alcune prestazioni umane nell’identificazione degli oggetti. Sebbene il modello artificiale non sia stato esplicitamente costruito come analogo delle strutture neuroniche, è risultato in grado di consentire previsioni altamente fedeli delle risposte dell’area corticale V4 e della corteccia temporale inferiore, ossia regioni che corispondono a due livelli elevati della gerarchia funzionale della via ventrale dell’elaborazione visiva.

Secondo gli autori dello studio, oltre a fornire modelli della fisiologia visiva molto più fedeli ed avanzati di quelli di cui si dispone attualmente, i risultati emersi dallo studio suggeriscono che nella realtà biologica esista un processo naturale di ottimizzazione della prestazione che direttamente modella i meccanismi neurali (Yamins D. L. K., et al. Performance-optimized hierarchical models predict neural responses in higher visual cortex. Proceedings of the National Academy of Sciences USA – Epub ahead of print doi:10.1073/pnas.1403112111, 2014).

La provenienza degli autori dello studio è la seguente: Department of Brain and Cognitive Sciences and McGovern Institute for Brain Research, Massachusetts Institute of Technology, Cambridge, Massachusetts (USA); Harvard-MIT Division of Health Sciences and Technology, Institute for Medical Engineering and Science, Massachusetts Institute of Technology, Cambridge, Massachusetts (USA).

L’elaborazione visiva di alto livello è alla base dell’identificazione dell’oggetto; cioè alla base della capacità del riconoscimento e della comprensione di ciò che si vede, in quanto se ne comprende il significato e se ne inferisce il senso, grazie al collegamento mentale con la rete di valori cognitivi che la simbolizzazione linguistica consente di trasferire nella comunicazione. Il mancato riconoscimento di un oggetto, tipico dell’agnosia da danno cerebrale, è stato definito dal neuropsicologo Hans Lukas Teuber come un normale percetto che in qualche modo è stato privato del suo significato. Infatti, l’attribuzione del significato è uno dei più importanti processi che integra la fase cerebrale della visione e costituisce il nucleo principale dell’elaborazione di alto livello. La nostra esperienza visiva del mondo è fondamentalmente centrata sull’oggetto. Gli oggetti, come osserva Thomas D. Albright, sono spesso visualmente complessi, essendo composti da un gran numero di elementi combinati o associati.

Se consideriamo le componenti di un oggetto-prototipo, anche solo nei termini della fisica, ci accorgiamo di quanto vasta sia la gamma di variazioni cui sono sottoposte dalle condizioni in cui sono viste, quali l’illuminazione, l’angolazione, la posizione o la distanza.

Gli oggetti sono poi mentalmente associati con esperienze generiche e specifiche: ad esempio, altri oggetti ricordati dello stesso tipo, oppure quel particolare oggetto che appartiene ad una persona cara ed è in grado di farci rievocare un episodio di vita vissuta. Come osserva Giuseppe Perrella, oggetti, per il sistema visivo, non sono solo cose come automobili, libri, edifici, penne, chiavi, sedie, o parti del paesaggio naturale come alberi, monti, laghi o fiumi, ma sono anche animali, persone, singole o in gruppi, parti del corpo, e così via. Si comprende come l’identificazione di ciò che si vede, in relazione alle nostre esperienze, alle nostre memorie, ai nostri desideri, alle nostre speranze, ai nostri obiettivi tecnici, affettivi ed emozionali, possa avere una gamma di valori di senso e di potere evocativo estremamente ampia.

Gli studi sui primati, che hanno implicato nel riconoscimento dell’oggetto regioni neocorticali del lobo temporale e particolarmente la corteccia temporale inferiore, trovano corrispondenza nelle osservazioni neuropsicologiche che hanno riconosciuto il danno della corteccia temporale inferiore come causa del mancato riconoscimento dell’oggetto.

Ricordiamo che i segnali visivi originati dalla retina sono elaborati nel nucleo genicolato laterale (nucleo del corpo genicolato laterale annesso al talamo) prima di giungere alla corteccia occipitale dell’area calcarina V1 (area 17 della mappa di Brodmann); da qui seguono due flussi paralleli e gerarchicamente organizzati: il ventrale e il dorsale. La via ventrale si estende ventralmente ed anteriormente da V1, attraverso V2, V4 e la giunzione temporo-occipitale, prima di raggiungere la corteccia temporale inferiore che comprende il versante inferiore del solco temporale superiore e la convessità ventrolaterale del lobo temporale. Questa via ventrale fa della corteccia temporale inferiore la sede del livello più elevato di elaborazione visiva e, come osservano gli autori dello studio qui recensito, costituisce la chiave delle abilità umane di riconoscimento dell’oggetto.

Yamins e colleghi hanno attuato un approccio sperimentale mediante la realizzazione di una simulazione che contiene un modello quantitativamente accurato della corteccia temporale inferiore. Usando tecniche computazionali sofisticate, i ricercatori hanno rilevato che, all’interno di una classe di modelli di reti neurali gerarchiche biologicamente plausibili, c’è una forte correlazione fra la prestazione di categorizzazione di un modello e la sua abilità di prevedere i dati di risposta individuale delle unità neurali della corteccia temporale inferiore.

Seguendo questa traccia, i ricercatori hanno identificato una rete neurale di alta prestazione che raggiunge il livello dell’efficienza umana in una gamma di compiti di riconoscimento.

Un elemento che attrae l’attenzione è dato dal fatto che, anche se gli autori dello studio non hanno forzato il modello allo scopo di farlo corrispondere ai dati neurobiologici, il suo livello (“strato”) più elevato di output è risultato altamente predittivo di risposte di accensione dei neuroni per immagini naturalistiche complesse, sia al livello di singolo sito di rilievo e registrazione, sia al livello di popolazione neuronica.

Inoltre, i livelli (“strati”) intermedi sono risultati altamente predittivi delle risposte neurali nell’area corticale V4, che agisce in termini fisiologici come un grado intermedio nella gerarchia e fornisce un input dominante alla corteccia temporale inferiore.

L’insieme dei risultati dimostra che l’ottimizzazione della prestazione può essere impiegata per costruire modelli predittivi quantitativi dell’elaborazione neurale dei livelli più elevati di integrazione corticale.

 

L’autore della nota invita alla lettura delle recensioni di studi di argomento connesso che appaiono nella sezione “NOTE E NOTIZIE” del sito (utilizzare il motore interno nella pagina “CERCA”).

 

Giovanni Rossi

BM&L-24 maggio 2014

www.brainmindlife.org