Il disegno dei contorni basta al cervello per individuare la categoria di una scena naturale

                                                                                                                                           

 

GIOVANNI ROSSI

 

 

 

NOTE E NOTIZIE - Anno IX - 18 giugno 2011.

Testi pubblicati sul sito www.brainmindlife.org della Società Nazionale di Neuroscienze “Brain, Mind & Life - Italia” (BM&L-Italia). La sezione “note e notizie” presenta settimanalmente note di recensione di lavori neuroscientifici selezionati dallo staff dei recensori fra quelli pubblicati o in corso di pubblicazione sulle maggiori riviste e il cui argomento rientra negli oggetti di studio dei soci afferenti alla Commissione Scientifica, e notizie o commenti relativi a fatti ed eventi rilevanti per la Società Nazionale di Neuroscienze.

 

 

[Tipologia del testo: RECENSIONE]

 

Fino ad alcuni decenni fa si riteneva che la visione avesse il suo centro nodale nella formazione dell’immagine sulla retina. L’analogia dell’occhio con la macchina fotografica si spingeva fino ad equiparare la struttura a sette strati, che costituisce il sofisticato complesso fotorecettivo, alla pellicola inserita in una macchina fotografica che abbia l’iride per diaframma e il cristallino per obiettivo. Quando Henschen riuscì a dimostrare che la topografia dell’area visiva primaria della corteccia calcarina (V1, o area 17 secondo la ripartizione anatomica di Brodmann) presentava una corrispondenza punto per punto con la superficie neurorecettiva dell’occhio, quest’area corticale occipitale fu battezzata “retina cerebrale”. In realtà oggi, soprattutto grazie al lavoro di Semir Zeki e della sua scuola, sappiamo che esistono 32-33 aree corticali per la visione che, con l’eccezione di V1 e V2 che selezionano i segnali da inviare alle altre aree, sono specializzate in singole modalità di elaborazione dei segnali visivi, dalla cui sintesi cerebrale nascono le immagini che vediamo.

La capacità del cervello di ricostruire scene percettive, o di costruirle in assenza di percezione come accade nei sogni, è assolutamente straordinaria. I processi che “globalizzano” l’informazione visiva – secondo l’espressione di Edelman – costituiscono una componente importante della vita psichica in ogni suo aspetto[1]. Una parte di queste funzioni, ossia quelle che attengono all’elaborazione cognitiva è oggetto di studi che, ereditando la grande messe di dati prodotti dalla psicologia sperimentale della visione e dalla psicofisiologia sensoriale, ottengono risultati di notevole interesse grazie all’impiego dei metodi delle neuroscienze cognitive. Un filone nell’ambito di queste ricerche studia il rapporto fra processi di categorizzazione e percezione visiva, fornendo elementi molto significativi sui requisiti necessari e sufficienti per alcuni processi di inferenza cognitiva alla base dell’intelligenza visiva.

La nostra capacità di ripartire in categorie delle scene naturali, raggiunge un alto livello di efficienza già in età evolutiva, lasciandoci supporre una base neurale costituitasi nel corso dell’evoluzione e ben consolidata nell’ontogenesi. In effetti, attualmente, le categorie cui appartengono le scene[2] possono essere decodificate mediante risonanza magnetica funzionale (fMRI, da functional magnetic resonance imaging) a partire dai dati relativi alla corteccia visiva ventrale, inclusa la corteccia visiva primaria, alla place area paraippocampale (PPA, da parahippocampal place area) e alla corteccia retrostante lo splenio del corpo calloso (RSC, da retro splenial cortex).

Le scene che vediamo nella realtà che ci circonda sono straordinariamente eterogenee e complesse, tuttavia noi siamo in grado di riconoscerle in termini di luogo, identificarle per tipologia e assegnarle ad una categoria, anche solo dopo un’osservazione di pochi secondi: un paesaggio di montagna con scalatori, laghi e conifere; una foresta tropicale popolata da esemplari della sua ricca fauna; scene di mare con turisti e bagnanti di varia provenienza e imbarcazioni di ogni foggia; una vista sulle trafficate e caotiche vie del centro di una metropoli, con le sue luci policromiche e i suoi schermi pubblicitari elettronici.

Se a questo compito forniscono un contributo importante tutte le aree visive della corteccia, con le loro informazioni di dettaglio, si è accertato un ruolo specifico della porzione temporale ventrale della PPA nella elaborazione delle scene. Anche se si è enfatizzato molto il ruolo della PPA nella decodifica spaziale, indagini più recenti hanno rilevato un suo contributo in chiave semantica o contestuale, per questo non si hanno ancora certezze su come operano le singole componenti della rete funzionale, ed è lecito soffermare l’attenzione sulla “concettualizzazione morfologica” derivante dall’interazione dei neuroni delle regioni che compongono il circuito necessario a questo genere di classificazione.

Dirk B. Walther e colleghi del Department of Psychology, The Ohio State University, (Columbus), si sono chiesti se e dove possiamo ancora decodificare la categoria di una scena, se ne riduciamo l’immagine al solo disegno lineare dei contorni principali. Gli esiti dello studio suggeriscono un’interessante conclusione sul processo cerebrale di categorizzazione (Walther D. B., et al. Simple line drawings suffice for functional MRI decoding of natural scene categories. Proceedings of the National Academy of Science USA  108 (23): 9661-9666, 2011).

Gli autori del lavoro hanno eseguito scansioni tomografiche fMRI mentre i partecipanti guardavano fotografie e disegni lineari schematici, cioè senza chiaroscuro, di spiagge, strade statali, montagne, strade cittadine, foreste e uffici. Raccogliendo ed analizzando i dati sull’attività delle regioni cerebrali e ricavandone i patterns di decodifica, Walther e colleghi riuscivano a riconoscere la categoria della scena rappresentata nei disegni dal pattern cerebrale, quasi con la stessa fedeltà con la quale potevano riconoscere la categoria delle scene quando erano presentate mediante fotografie a colori. In particolare, dall’attività nella corteccia visiva primaria e in PPA e RSC, si capiva quale tipo di scena il soggetto stesse guardando in quel momento, quasi con la stessa probabilità per foto e disegni.

Per cercare di stabilire il contributo relativo della struttura locale e della struttura globale, all’abilità umana di categorizzare le scene, i ricercatori sono intervenuti sui disegni in due modi:

 

1) rimuovendo selettivamente i contorni lunghi;

2) rimuovendo selettivamente i contorni brevi.

 

In una prova di “confronto di categoria”, la prestazione dei partecipanti era decisamente peggiore nelle prove che implicavano il giudizio di disegni lineari privati dei contorni lunghi, che in quelle richiedenti la valutazione di rappresentazioni grafiche di scene private solo dei contorni brevi.

Lo studio, nel suo complesso, indica che la configurazione generale dei profili, preservata nei disegni lineari, è parte integrante nella rappresentazione tipologica della scena, e suggerisce che il giudizio di appartenenza categoriale delle scene è strettamente dipendente dalla concettualizzazione della struttura globale della scena stessa.

 

L’autore della nota ringrazia il prof. Perrella con il quale ha discusso l’argomento trattato, e invita alla lettura delle recensioni di argomento connesso che compaiono nella sezione “In Corso” e nelle “Note e Notizie” (impiegare la pagina “CERCA” del sito).

 

Giovanni Rossi  

BM&L-18 giugno 2011

www.brainmindlife.org

 

 

 

 

_____________________________________________________________________________________________________________________

 

La Società Nazionale di Neuroscienze BM&L-Italia, affiliata alla International Society of Neuroscience, è registrata presso l’Agenzia delle Entrate di Firenze, Ufficio Firenze 1, in data 16 gennaio 2003 con codice fiscale 94098840484, come organizzazione scientifica e culturale non-profit.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 



[1] Si pensi agli studi sulla coscienza basati sulla visione di immagini (frequenza γ, corrispondente ad oscillazioni a circa 40 hz nello strato delle grandi cellule piramidali della neocorteccia), condotti da Francis Crick, uno dei padri della doppia elica del DNA, in collaborazione con Christof Koch. Ma si pensi anche a tutte le risposte cerebrali e dell’intero organismo - dai riflessi di base alle evocazioni più sofisticate - che possono essere mediate dalla percezione visiva: paura, rabbia, appetito, eccitazione, riflessione, allerta, ammirazione, stizza, sconforto, attrazione, allarme, compassione, rimorso, disprezzo, entusiasmo, rimpianto, avversione, ecc.

[2] Un lavoro recente e molto interessante sull’argomento è stato pubblicato nel mese di maggio sul Journal of Neuroscience: Kravitz D. J., Peng C. S., Baker C. I., Real World Scene Representation in High-Level Visual Cortex: It’s the Space More Than the Places. J. Neurosci. 31 (20), 7322-7333, 2011. I tre autori lavorano presso il Laboratory of Brain and Cognition presso la sezione NIMH dell’NIH di Bethesda.