Sostieni Emergency

Chi Siamo Sommario Editoriale Poesia Cultura Elzeviro


Home Page


In primo piano


Oscar Bettelli, Modelli computazionali della mente
di Carmelo Calì
Carabba Editore

l'opera

Il libro di Bettelli si propone di esporre alcuni modelli computazionali della mente, analizzandone i paradigmi e affrontando i problemi che un ingegnere della conoscenza deve affrontare nella simulazione di attività intelligenti, date le differenze che separano il cervello, la mente o gli eventi mentali da un qualsiasi sistema artificiale, che può essere considerato dotato di comportamento intelligente da un osservatore che gli attribuisca un tale comportamento sulla base delle sue prestazioni.
La mia recensione si articolerà in tre nuclei che ritengo fondamentali: il modello di mente che l'A. presenta; l'esposizione e l'importanza dei modelli di elaborazione parallela; le teorie matematiche che permettono un'integrazione tra modelli computazionali differenti.
Un attributo che definisce una caratteristica essenziale della mente è, per l'A., "analogica": "la mente è strutturata a moduli interconnessi, ognuno specifico per risolvere determinati problemi […] disponibili per affrontare compiti analoghi in ambiti diversi" (p. 16). Per esempio, il modulo specializzatosi nella visione, diventa disponibile per la produzione delle immagini mentali, alle quali l'autore riconosce un ruolo fondamentale nell'elaborazione di informazioni, in assenza di stimoli percettivi; i moduli senso motori preposti all'elaborazione dei dati spaziali e temporali sono utilizzati per la manipolazione di concetti di natura logica o matematica. L'interconnessione dei moduli mentali e l'estensione per analogia di moduli, processi o intere modalità della conoscenza in domini d'applicazione diversi sono un ovvio vantaggio evolutivo. È possibile, infatti, usare certi meccanismi già disponibili per dar senso a nuovi ambiti, mentre la somiglianza, che si conserva tra i due ambiti su un piano astratto, permette di comprendere il nuovo in termini di conoscenze più familiari. Il modello della mente, presentato dall'autore, è caratterizzato dunque dalle seguenti proprietà: l'essere analogica, l'interconnessione e la sensibilità alle somiglianze. Queste tre proprietà stabiliscono quali aspetti della mente e dei processi cognitivi un modello computazionale deve simulare, per considerarsi un modello attendibile.
Secondo l'A., la mente deve essere compresa in relazione all'evoluzione del cervello e all'apprendimento, necessario all'organismo per interagire nell'ambiente. Da un lato, la mente si realizza in un corpo (p. 160), tanto che è possibile affermare che il cervello realizza i processi della visione e la mente sperimenta l'atto della visione. Dall'altro, l'apprendimento consiste nella facilitazione della formazione di una serie di collegamenti, che inducono la specializzazione di circuiti neurali complessi adatti a determinate circostanze, che realizzano le euristiche della mente nella soluzione dei suoi problemi.
Considerare la mente in relazione al cervello non equivale, però, ad identificarla senza residui con un oggetto fisico quale il cervello. In questo modo, la mente sarebbe uno stato della materia, in grado di produrre un sistema interno da mettere poi in correlazione con gli stati esterni del mondo (p. 24). La mente, infatti, è un processo, la cui caratteristica essenziale è la sua intenzionalità. Il carattere intenzionale della mente non la pone però in un dominio separato rispetto alla realtà. La mente è una parte della realtà e, d'altra parte, tutto ciò che ne diviene oggetto d'esperienza è altrettanto un evento reale che le accade. I concetti, le rappresentazioni, le credenze, infatti, entrano a far parte della mente, quando ne divengono un contenuto, senza per questo perdere il proprio significato autonomo. Se quindi ogni esperienza deve avere una controparte soggettiva, questa corrisponde alla necessità che ogni dato, per essere significativo, deve essere intenzionato da un soggetto per il quale esso possiede un valore informativo. Il carattere soggettivo dell'esperienza è una necessità del carattere intenzionale della mente, che non può essere ridotto a una sfumatura intrasogettiva e solipsistica, se si considera l'esperienza nei limiti in cui essa si dà (il richiamo è alle Ideen I di Husserl).
Da quest'impostazione derivano le definizioni di rappresentazione (pp. 27, 38, 40) e di informazione (p. 27). Nel mondo fisico, ogni rappresentazione presuppone un osservatore che ne determini proprietà e contenuto, con la propria attività intenzionale. L'informazione è invece una relazione di relazioni intenzionali, vale a dire di rappresentazioni, che risultino significative per il soggetto, in quanto averle come contenuto mentale modifica lo stato del soggetto, segnando una differenza che equivale all'acquisizione di un'informazione sull'ambiente. In base a questa definizione, la differenza tra la mente e un computer non potrebbe essere maggiore. Le rappresentazioni di un computer non sono autonome, come per la mente, bensì assegnate al sistema dall'esterno, attraverso la definizione della base della conoscenza del sistema e l'attribuzione di un senso alle rappresentazioni assegnate.
Nel mondo, ogni evento, per il solo fatto di accadere, è un indizio di informazione, il cui valore rispetto al processo di elaborazione del cervello o della mente è sotto determinato. Mente e cervello non solo selezionano differenze pertinenti, ma integrano spesso i dati forniti dai sensi. Di fronte al numero elevatissimo di potenziali informazioni, il cervello e la mente sono sensibili alle strutture e sfruttano il collegamento delle informazioni, per creare un sistema di rappresentazioni interdipendenti a più livelli, ciascuno dei quali registra differenti caratteristiche salienti degli insiemi di informazioni, permettendo quelle associazioni attraverso le quali l'organismo si appropria dell'esperienza (pp. 153-154).
È lecito formulare l'ipotesi, allora, che il cervello e la mente impieghino processi di elaborazione sia sequenziali, basati sull'elaborazione successiva di simboli in base a regole e iscrizioni in memoria, sia paralleli, basati sulla distribuzione dell'elaborazione di un elevato numero di unità che si attivano o s'inibiscono in parallelo. Da un lato di fronte alla molteplicità dei potenziali livelli significativi della rappresentazione e dell'informazione, il cervello deve ricorrere a procedure basate sul riconoscimento di regolarità nel numero enorme di stimolazioni ambientali. Dall'altro, l'intenzionalità della mente non è una facoltà misteriosa di proiezione all'esterno, bensì la caratteristica essenziale del processo con il quale dà unità ad una molteplicità di contenuti, che formano una rete di relazioni intenzionali.
Infatti, per un verso, si può ritenere che il modello di elaborazione sequenziale rappresenti un certo livello dell'attività del cervello che elabora le informazioni in modo simbolico. D'altronde, è però necessario integrare la descrizione dell'attività cerebrale con un modello di elaborazione parallela e distribuita, che rappresenti l'architettura del cervello, costituito da un centinaio di miliardi di neuroni, che reagiscono automaticamente a degli stimoli, e la sua capacità fondamentale di riconoscere ed integrare pattern nella popolazione di stimoli. Questa capacità può essere spiegata: (I) ipotizzando l'intervento di un'elaborazione che agisca massicciamente in parallelo; (II) la conseguente formazione, a livelli inferiori dell'elaborazione, di connessioni associative tra i dati in ingresso e le configurazioni che con l'apprendimento si depositano in memoria.
L'architettura dei processi del cervello è basata sul parallelismo dei neuroni, tra i quali è distribuita l'elaborazione dell'informazione, i significati della quale emergono statisticamente dalle inibizioni ed attivazioni tra neuroni attraverso le connessioni sinaptiche e dalla modificazione che questi segnali inducono nell'architettura delle connessioni. Analogamente, sebbene il pensiero possieda una natura sequenziale, la soluzione dei problemi posti dalla visione e l'incidenza di processi di tipo sintetico ed analogico, come il riconoscimento di configurazioni globali e la funzione che le immagini e gli isomorfismi mentali svolgono anche nelle attività di pensiero di alto livello, basate su un tipo di ragionamento analitico e logico, indicano che la mente opera anche con processi in parallelo. La mente strutturerebbe blocchi d'informazione a partire dal materiale percettivo immediato, la cui configurazione globale risulta in modo distribuito dall'attività parallela delle sue unità di elaborazione interconnesse, per poi estendere la portata di queste strutture con la costruzione per ricorsione di moduli interconnessi, sempre più ampi. La mente, quindi, deve la propria potenza alle "capacità combinatorie, compositive e sintattiche di cui dispone" (p. 17), ma è necessario ipotizzare un livello inferiore in cui le iscrizioni simboliche e le regole sintattiche ed inferenziali siano rappresentate da una rete di elementi che apprendono a riconoscere, associare ed integrare pattern con pattern già familiari.
Si pensi all'ordine di problemi posto dalla visione, ai quali l'autore dedica un intero capitolo (IV), me che ritornano come leitmotiv in molte delle argomentazioni e delle esemplificazioni del libro. Il cervello e la mente devono costruire una descrizione del mondo in un contenuto percettivo, che sia leggibile poi anche per altri moduli, a partire da un problema di ottica inversa, relativo alla proiezione retinica bidimensionale, alla quale possono corrispondere infinite forme d'oggetti in un numero infinito di posizioni. Si tratta, dunque, di un problema dalla soluzione non univoca, al quale si aggiunge il numero elevato di immagini, corrispondenti ai movimenti continui dell'occhio, che ogni secondo il cervello deve elaborare. Il sistema visivo cerca, dunque, degli indizi di proprietà non accidentali nel campo visivo, come linee rette o parallele, curve regolari o angoli retti, si affida al movimento per l'aggregazione di un certo insieme di parti in un unico oggetto o per individuare un elemento nel campo visivo. Ciò, tuttavia, non è sufficiente: è necessario che la mente possieda un insieme di presupposti sul mondo, relativi all'opacità delle ombre, alla coesione delle superfici, al non allineamento delle forme, o di vincoli di identificazione degli oggetti, quali la stabilità, la riconoscibilità e la ricorrenza. Ai presupposti e ai vincoli va aggiunta la necessità che il sistema visivo interagisca con un pattern di riferimento memorizzato delle forme che ne conservi la disposizione delle parti e ne faciliti il riconoscimento in caso di variazione della loro configurazione per un movimento dell'oggetto o dell'osservatore. Questo pattern può essere considerato uno schizzo, un'immagine mentale, la cui realizzazione neurofisiologica corrisponderebbe ad una mappa corticale organizzata topograficamente, una zona della corteccia in cui ogni neurone reagirebbe ai dati di una sola regione del campo visivo e neuroni confinanti a dati di regioni confinanti.
Ciò richiede che il cervello e la mente siano selettivi riguardo alle informazioni pertinenti da estrarre dall'ambiente, che siano in grado di estrarre una configurazione saliente dagli stimoli visivi, che siano sensibili per apprendimento a certi pattern e che ricostruiscano globalmente l'insieme dei dati del problema offerto dalla visione. Una buona teoria computazionale deve tener conto di questa molteplicità di livelli del funzionamento del cervello e della mente, e dotarsi di una nozione adeguata di rappresentazione. Un modello è il risultato di un'operazione biunivoca che mette in relazione gli elementi di un certo insieme con altri elementi che li rappresentano su un altro insieme. L'operazione di trasformazione su un insieme dà luogo alla costruzione di un modello dell'insieme di partenza. Dal momento, però, che ogni trasformazione sceglie di rappresentare gli elementi dell'insieme di partenza con simboli che non ne possiedono le stesse proprietà, è necessario che un modello computazionale scelga una specifica trasformazione. L'adeguatezza del modello dipenderà, allora, dalla natura della trasformazione specifica scelta sia per l'informazione sia per il processo di elaborazione. In base a questa nozione di adeguatezza, una teoria computazionale deve utilizzare modelli d'elaborazione sia sequenziale sia parallela, distinguendo un livello simbolico e uno sub-simbolico del trattamento delle informazioni. I due approcci non sono dunque né alternativi né incompatibili (p. 76).
Il libro di Bettelli si sofferma ad analizzare proprio i modelli di elaborazione parallela e distribuita, dei quali le reti neurali costituiscono un esempio. Vi sono diversi tipi elaborazione parallela (p. 41): il modello vettoriale, in cui l'elaborazione è affidata a processori distinti, le cui operazioni sono sincronizzate; il modello connessionista, in cui l'elaborazione è affidata all'attivazione/inibizione di neuroni interconnessi, con conseguente propagazione di un pattern; il modello multiagente, in cui l'elaborazione è distribuita tra componenti distinti, in grado non solo di comunicare ma di cambiare postazione con il proprio insieme di dati.
Una rete neurale è una forma di intelligenza artificiale costruita sulla metafora del neurone, che s'ispira all'architettura fisiologica del cervello, della quale però cattura solo certi aspetti generali. Un neurone artificiale riceve i segnali elettrici dai neuroni vicini, sommandone i valori. Se la somma supera un determinato valore di soglia, allora il neurone emette un segnale ad altri neuroni interconnessi, contribuendo alla propagazione di un determinato pattern. Le interazioni tra le singole parti della rete non sono descrivibili da funzioni lineari e la computazione si realizza con un processo statistico, in cui il risultato è il prodotto della cooperazione di un ampio insieme di unità elementari che operano in parallelo. Una caratteristica essenziale delle reti neurali, che le propone come seri candidati per la simulazione di certe attività del cervello e della mente, è la capacità di apprendere attraverso la modificazione dei pesi assegnati alle connessioni. Le connessioni con una coincidenza d'attivazione significativa nel caso di risposta corretta vengono rinforzate. In questo modo, la rete impara a riconoscere o ad integrare pattern, creando una classificazione degli stimoli, senza l'implementazione di programmi di analisi simbolica. Infatti, la rete è in grado di creare una classificazione o con una rappresentazione interna di dati, creata secondo certi algoritmi, o automaticamente, attraverso una competizione tra neuroni. In questo secondo caso, i neuroni sono divisi in un livello di input e uno di classificazione, all'interno del quale solo certi neuroni vicini sono collegati da connessioni fisse. Gli schemi di neuroni d'apprendimento sono in grado di calcolare la distanza e il grado di somiglianza tra gli input in ingresso al primo livello e le proprie configurazioni, attraverso semplici operazioni di unione ed intersezione d'insiemi cui applicano una funzione radiale di distanza. La capacità di apprendere dei pattern e di riconoscerne altri, in base alla somiglianza, è essenziale per la costruzione di modelli che simulino la soluzione dei problemi della visione. Il modello connessionista, infatti, permette di utilizzare i principi dell'associazione e della generalizzazione da esempi, che, se realizzati in un sistema artificiale di visione, lo mettono in grado di riconoscere la struttura tridimensionale di un oggetto da un piccolo numero di vedute, estraendone caratteristiche relativamente stabili e identificabili, che vincolino il riconoscimento dell'oggetto al variare della sua posizione e del suo orientamento. È questo il caso, per esempio, delle reti Hyper BF, che rappresentano oggetti attraverso una certa classe di funzioni, in base alla norma delle quali si assegnano pesi alle coordinate d'ingresso, che fungono da indice d'importanza delle caratteristiche. Si definisce così uno spazio di caratteristiche, che può essere misurato rispetto al centro di ogni funzione, il quale ha assunto per apprendimento il valore di prototipo, rispetto al quale misurare la somiglianza dei dati in ingresso. La rete è così sensibile a certe caratteristiche invarianti, in base alle quali può riconoscere stimoli nuovi o deformati. Le reti neurali mostrano, dunque, la proprietà essenziale di far emergere concetti o pattern nuovi ai diversi strati che le compongono. Questi nuovi fenomeni non possono essere compresi in termini d'analisi degli elementi dello strato inferiore, rispetto a quello d'emersione, ma sono funzione del raggruppamento delle unità inferiori.
È allora pensabile la costruzione di una scienza della visione artificiale, nella quale siano compresenti forme di elaborazione sequenziale e connessionista. L'apporto di questi diversi modelli di computazioni dipenderà dal livello di rappresentazione scelto dalla teoria, mentre la loro unione dipende dalla teoria fisico matematica impiegata. Le reti Hyper BF, per esempio, implementano la teoria dell'approssimazione di funzioni a più variabili a partire da insiemi di esempi.
A parere dell'A., una teoria matematica dotata del concetto di spazio astratto, nel quale è possibile indurre una metrica, è sufficientemente potente da permettere di utilizzare i meccanismi di classificazione, aggregazione, generalizzazione a qualunque livello di rappresentazione si operi (pp. 76-78).
Le stesse proprietà emergenti delle reti neurali possono essere studiate dalla matematica, dalla statistica e dalle leggi sulle interazioni parallele, mentre il livello di elaborazione sub simbolico può essere trattato dalla logica fuzzy e dalla statistica multivariata.
Il capitolo VI è dedicato proprio all'esposizione dell'Harmony Theory, una teoria matematica che si applica ai sistemi dinamici, in grado di eseguire compiti cognitivi in accordo al paradigma sub simbolico. Essa può essere impiegata per descrivere e studiare sistemi che elaborino inferenze, secondo schemi di livello n, attivati e composti da atomi di conoscenze, interpretati come tracce mnesiche, di livello n - 1, i quali si attivano contemporaneamente in parallelo per costruire la descrizione dello schema corrispondente, in accordo alle circostanze e al contesto del compito cognitivo. La risposta cognitiva del sistema consisterà nella costruzione di uno stato cognitivo, attraverso funzioni di massima consistenza e di armonia, che sia il più completo tra tutti gli stati possibili attivati, vale a dire quello che corrisponde al massimo della stima di tutti i possibili stati dell'ambiente, risultando caratterizzato dal maggior numero di coincidenze d'attivazione significative.

l'autore

Oscar Bettelli è laureato in fisica teorica e si occupa di informatica e sistemi informatici industriali e aziendali. Dal 1991 lavora presso il centro di calcolo dell'Università di Bologna. Tra le sue pubblicazioni: Dati, Relazioni & Associazioni, Apogeo Editore, Milano, 1997; Macchine Intelligenti, Arpa Publishing, 1997; Sincronicità: un paradigma per la mente, Antitesi Editoria, Roma; Processi Cognitivi, CLUEB, Bologna, 2000; Messaggi e comunicazione. Trasformazione delle simiglianze in programmazione logica, Franco Angeli, Milano, 2002.

Il testo

Oscar Bettelli, Modelli computazionali della mente, pp. 176, Carabba Editore, 2002.


Per gentile concessione del web site http://www.swif.uniba.it

 


Tutti i diritti riservati © 2005 Il Convivio - Partner tecnologico Pertronicware

Rubriche

E-book della poesia
Proposte di lettura
Recensioni
Concorsi letterari
Links
Box e-mail
Archivio


Centro di poesia contemporanea

Risoluzione consigliata: 800 x 600 pixel - Browser: Microsoft Internet Explorer 4.0 o successivi