L'IA e la semantica.pdf

7/22/2019 L'IA e la semantica.pdf

1/37

191

LIA e la semanticaALBERTOPERUZZI

The development of Artificial Intelligence (AI) has led to manycontroversies of philosophical interest involving issues of logic,computer science, software engeneering. The paper goes throughthe main steps of this development, deals with their philosophicalrelevance and sketches the unsolved problems, with special em-phasis on the AI models of semantic competence. Some criticisms

raised to such models in AI, either in its classical or neuralnetworks format, are examined. On the ground of the discussionof these criticisms, a view is proposed which avoids the inheritedgap between the project of AI and naturalistic philosophy andsuggests that filling the gap also provides a filter in order to selecta definite form of naturalism.

Keywords: artificial intelligence, semantics, logic, connectionism,naturalism.

1. Che senso ha?

LIntelligenza Artificiale (IA) una disciplina rinascimentale. Ovviamen-te non nel senso che sia stata sviluppata nel Rinascimento. Nasce infatti conun seminario organizzato da John McCarthy nel 1956 al Darmouth Col-lege, nel New Hampshire. Ma nel senso che tanto unarte quanto unascienza il cui oggetto di studio definito da ci che riesce a fare. Cosa vuolfare lIA? Sistemi intelligenti artificiali. Cosa studia lIA? Sistemi intelligen-ti artificiali. I computer, con i loro programmi, ne sono lesempio canonico.

La storia raccontata nel film di Steven Spielberg che sintitola AI(Artificial Intelligence) quella di un bambino artificiale, che si compor-ta in maniera simile a un bambino in carne e ossa; invece di essere ilrisultato di potenzialit scritte nel suo DNA, il risultato di un meraviglio-so programma per calcolatore.

Supponendo dintenderci su cosa sia un sistema, lidea dunque quelladi realizzare sistemi artificiali, perch non esistono gi in natura, ma in-telligenti, cio, in grado di fornire prestazioni paragonabili a quelle checonsideriamo tali anche se non sappiamo definirle bene. Sappiamo, co-munque, riconoscere diversi gradi di intelligenza: un sasso non intelli-


2/37

192

gente, un gatto pi intelligente di una lucertola. Una scala grossolana?Potremmo difenderci: non si pu definire esattamente lessenza di qualco-

sa che unessenza non ce lha. Oppure potremmo azzardare un criterioper riconoscere lintelligenza quando presente ed eventualmente misu-rarla. Quale? Un criterio basilare dato dalla capacit di svolgere un com-pito, risolvendo un problema. Certo, non basta. Bisogna anche tener con-to della variet dei compiti che si in grado di svolgere. Lalbero che oravedo nel giardino svolge ottimamente il compito di stare in equilibrio, emeglio di qualunque bipede implume. Un topolino messo in un labirintoriesce a trovarne la via duscita prima di un uomo. Un delfino di sei mesi samuoversi nellacqua meglio di un bambino di sei anni. Una rondine sarisolvere il problema di volare senza bisogno di protesi metalliche. Maintelligenza non soltanto sapere-comefare qualcosa; anche sapere-che

qualcosa cos e non cos. Non soltanto un insieme di procedure, maanche di conoscenze espresse in proposizioni dichiarative.

Da sempre, gli esseri umani hanno giocato la carta del linguaggioverbale per sancire una distanza incolmabile tra essi e tutti gli altri orga-nismi a quanto pare, per sapere-checi vuole un quid molto raro, chia-mato coscienza. Ma per scomodare la coscienza bisogna che ne valga lapena. Se al computer Hal 9000 di 2001: Odissea nello spaziofosse statochiesto di descrivere cosa stava succedendo e avesse risposto immancabil-mente Om (essendone cosciente), che avreste pensato della sua intel-ligenza? In un linguaggio che si rispetti, stati di cose diversi sono rap-

presentati in proposizioni diverse. (Daltra parte non dobbiamo nean-che fare come i saggi di Laputa: la sintassi ci fa risparmiare etichette.) Equante proposizioni ci sono in un linguaggio naturale come linglese olitaliano? Potenzialmente, un numero infinito. Fossero luna totalmen-te autonoma dallaltra, il pensiero sarebbe come un gigantesco, e caoti-co, album fotografico. Ma lintelligenza sta anche nel collegare fra loroproposizioni diverse, oltre che nellaverne tante a disposizione. Gli uo-mini primitivi non erano capaci di svolgere certi compiti, ma, prova eriprova, sapendo che se A allora B e se B allora C ..., hanno saputocomprendere le dipendenze tra fatti e costruire strumenti che li aiutas-sero a svolgere molti compiti.

Anche confinando lattenzione ai nostri simili, ci sono diversi tipidintelligenza, corrispondenti ai domini cognitivi: lintelligenza diMozart e quella del Tenente Colombo, quella di Kasparov e quella diLeonardo. Se di ci non si tien conto quando si va a misurare il famige-rato QI, il valore che si ottiene un po come una misura della felicitbasata sul numero di sorrisi al giorno (non irrilevante, ma non decisivo).Comunque, la caratteristica esclusiva dellintelligenza umana stata in-dicata nel pensiero razionale, il quale, per essere riconosciuto, ha biso-gno di essere espresso e comunicato. Il mezzo deputato a questo scopo

Alberto Peruzzi


3/37

193

appunto il linguaggio e non solo un medium per codificare in un for-mato opportuno tante informazioni di tipo diverso: anche un organon

del pensiero. Serve a rappresentarele nostre conoscenze in un formatoche ne favorisce la memorizzazione, ne ottimizza il recupero e serve acombinarle tra loro in maniera da ottenerne di nuove.

Perci si ritenuto che un sistema di IA dovesse in primo luogoessere un sistema che dispone di un linguaggio e che ne manipola inmodo appropriato i simboli. In modo appropriato significa: conforme-mente a un preciso insieme di regole. Che tipo di regole? Dovendo cor-rispondere a procedure razionali di elaborazione delle informazioni,cosa potrebbero essere se non regole logiche?

La logica una disciplina antica, solo che per poter essere imple-mentata su un hardware diverso dal nostro cervello ha dovuto aspettare

che si capisse come tradurre i processi logici nei termini di un calcolo eche fossero disponibili le risorse tecnologiche adatte per far eseguire talecalcolo a una macchina. I sistemi dellIA classica sono principalmentemacchine logico-linguistiche. Di macchine, come congegni prima mec-canici e poi elettrici, nel corso della storia se ne son costruite tante. Solorecentemente sono state costruite macchine logico-linguistiche. Premes-so che non tutte le regole logiche e ancor meno tutti i linguaggi si presta-no allo scopo, buona parte della ricerca in IA si occupata di comeautomatizzare la logica e di come costruire un linguaggio (artificiale) op-portuno per la codifica, la trasmissione e il recupero delle informazioni.

Gli ostacoli di natura tecnica, sotto il profilo matematico e ingegne-ristico, non sono mancati. S cominciato a dubitare che i progetti, quantomai ambiziosi, dellIA potessero essere candidamente dilazionati (ai com-puter della prossima generazione). Anzi, sono state fatte obiezioni diprincipio al progetto stesso dellIA. Anche se ridimensioniamo le aspet-tative iniziali sulle magnifiche sorti e progressive dellIA, il nostro am-biente di vita si sta comunque popolando di prodotti che derivano daricerche di IA impensabili solo qualche anno fa; sarebbe troppo facileridurre il significato dellIA a un insieme di ricette orientate al mercato.

Oggi, semmai, non c pi un unico paradigma-guida nel campodellIA e, in particolare, lenfasi sullarchitettura dei linguaggi e lideache si debba puntare a una rappresentazione delle conoscenze corri-spondente a un sofisticato assetto ipotetico-deduttivo non pi un trat-to condiviso. Andrew Brooks ha costruito al MIT degli insetti artificialicol preciso scopo di mostrare che lIA pu e deve fare a meno di sistemirappresentazionali. Si sta cercando di ridurre la distanza dellIA dallin-telligenza naturale non partendo dal carro (linguaggio e logica) ma daibuoi, e cos lattenzione si sposta verso sistemi che siano in grado diauto-organizzare la propria intelligenza disponendo unicamente di

pattern comportamentali pre-linguistici.

LIA e la semantica


4/37

194

I computer sanno fare velocemente e bene cose che noi facciamolentamente e commettendo errori, mentre non sanno fare cose che per

noi sono banali. Eppure, ogni volta che un tipo di simulazione artificialefallisce, impariamo per via sperimentalequalcosa di prezioso sullintelli-genza naturale qualcosa che sarebbe stato difficile imparare in altromodo. E sapendo come noncostruire un sistema di IA potremo costruir-ne di pi efficienti. presumibile che robot intelligenti si diffonderannosul pianeta. C chi dice fra meno di un secolo. I problemifilosoficipostida una simile eventualit sono numerosi. possibile che sistemi di IAsuperino lintelligenza umana e finiscano per trattarci come animali do-mestici? Dovremo considerare una macchina responsabile delle sue azio-ni? Di fatto, non abbiamo ancora costruito macchine che vagamente cisomiglino. Gli ostacoli non mancano e non neanche detto che siano

superabili. Per capire quali siano conviene partire da quelli che abbiamosuperato.

2.Un po di storia

Gli esseri umani hanno messo a punto due tipi basilari di sistemisimbolici con i quali organizzare in un codice discreto e sequenziale lastruttura del continuo spazio-temporale e di tutto ci che immerso inesso: il linguaggio verbale e il calcolo numerico. Che si possa parlare deinumeri e dei calcoli eseguibili con essi ovvio. Meno ovvio che si possa

codificare in termini numerici tutto quanto esprimibile in un qualsiasilinguaggio. E qui sta appunto la chiave di ci che fanno gli odierni com-puter. Lidea di una codifica digitale di informazioni che normalmentecoinvolgono rappresentazioni analogiche, per, non nuova. Risale nien-temeno che ai pitagorici.

Sono passati pi di duemila anni, durante i quali lidea si fattastrada, superando numerosi ostacoli pratici e teorici, aggirandone altri eignorandone, in modo opportunistico, altri ancora. Per fare un esempio,la scoperta degli irrazionali sembrava aver definitivamente frustrato lesperanze della discretizzazione, ma lo slittamento tipico della filosofiamoderna dallordo rerumallordo idearumpermise di riaprire i giochi.Dopo lequazione tra pensare e calcolare affermata da Hobbes, il divinoLeibniz inizi lalgebrizzazione sia della struttura dei concetti sia dellastruttura dei ragionamenti. Il controllo sulla correttezza di un sillogismoavrebbe potuto finalmente essere realizzato con una procedura del tuttomeccanica, analoga alla prova del 9 per le ordinarie divisioni. Chi perriusc a dare una compiuta sistemazione allidea di un calcolo algebricodella logica fu George Boole: e ci avvenne intorno alla met dellOtto-cento. Nello stesso periodo si ebbe, grazie a Charles Babbage, anche unprimo contributo allimplementazione di un calcolo simbolico. Se la mac

Alberto Peruzzi


5/37

195

china calcolatrice di Pascal consentiva di eseguire solo operazioni arit-metiche, la macchina analitica di Babbage consentiva di rappresentare

algoritmicamente una gamma molto pi ampia di dati, servendosi di unatecnologia che anticipava limpiego delle schede perforate.A parte questanticipazione, stato solo per mezzo del rigoglioso

sviluppo della logica matematica tra la fine dellOttocento e gli anni Trentadel Novecento che si riusciti a dare un assetto stabile alla codificazioneformale dei tipi pi diversi di inferenze, ben pi complesse di quellerappresentabili in termini di algebre di Boole, perch entrano in giocorelazioni e quantificatori (come nellimplicazione Se c qualche indivi-duo che ama tutti, allora ognuno amato da qualcuno). Si veniva, cos,precisando larchitettura di linguaggi rigorosi che si differenziavano dal-le lingue parlate in misura pi marcata di quanto fosse mai avvvenuto

con il linguaggio in cui erano (e sono) scritti i testi usuali di matematica.Il linguaggio logico di riferimento il linguaggio della logica del primoordine, in cui i quantificatori vincolano solo variabili individuali. (In essonon esprimibile limplicazione Se c una relazione che qualcuno hacon tutti, allora riflessiva). Questo e altri linguaggi logici si presentava-no come il formato definitivo in cui avrebbe dovuto esprimersi tutta laconoscenza e non solo quella matematica, ma certo il primo passo era larifomulazione in essi di tutta la matematica. Oltre a fornire la matrice diquesti linguaggi e ad elencare i principi di costruzione delledificio mate-matico, la logica si candidava a fornire la base pi solida su cui ledificio

avrebbe pouto poggiare. Ma come garantire in maniera incontrovertibileche la solidit delledificio non sarebbe mai stata minacciata dallinsor-gere di contraddizioni?

Fu proprio dai problemi incontrati nel tentativo di fornire tale ga-ranzia che trassero origine quelle ricerche che avrebbero portato a unaesplicita teoria generale degli algoritmi di calcolo. David Hilbert spera-va che si sarebbe riusciti a garantire la coerenza (noncontraddittoriet)dellaritmetica servendosi esclusivamente di manipolazioni finitarie deisimboli formali presenti nel linguaggio aritmetico manipolazioni chea loro volta sono rappresentabili nella stessa aritmetica. Ci richiedeva(i) la considerazione di tutte le possibili dimostrazioni che laritmeticaera in grado di ospitare e (ii) la prova che nessuna di queste portava auna contraddizione. Nel 1931, Kurt Gdel dimostr due teoremi diincompletezza, in base ai quali il programma formalista, cos cometracciato da Hilbert, non poteva essere realizzato. Il primo teorema sta-biliva lesistenza di proposizioni aritmetiche che non si possono n di-mostrare n refutare nellaritmetica; il secondo stabiliva che laritmeti-ca non pu dimostrare la propria coerenza. E tutto ci dipendeva dalfatto che il linguaggio aritmetico (proprio come una qualsiasi linguanaturale) capace di rappresentare al proprio interno la sua stessa sin-

LIA e la semantica


6/37

196

tassi, cio, di codificare numericamente tutte le propriet logico-sintatti-che di ogni possibile discorso sui numeri. Per ottenere i due teoremi,

Gdel fu indotto a isolare e a precisare formalmente il concetto intuitivodi procedura meccanica (algoritmo, funzione computabile) dando av-vio a quella teoria delle funzioni ricorsive che di l a poco avrebbetrovato anche altre formulazioni, tra le quali va segnalata quella intro-dotta da Alan Turing e che da lui prende nome: la teoria delle macchi-ne di Turing.

Una macchina di Turing non qualcosa di fisico, bens un conge-gno ideale di computo. (Nei riferimenti bibliografici ho indicato alcunitesti che forniscono unottima descrizione di come strutturata unamacchina del genere e di come essa equivalga, quanto a potenza di cal-colo, a una funzione ricorsiva). Grazie al fatto che esistono macchine di

Turing universali, cio, in grado di simulare le computazioni di qualun-que altra macchina di Turing, questa teoria ha catalizzato una gran moledi ricerche, costituendo il paradigma teorico per la descrizione di ciche un reale computer pu fare.

Turing formul anche un test, su cui i filosofi hanno versato un fiu-me dinchiostro. In breve, il test di Turing consiste nel mettere a con-fronto le risposte di un essere umano, come campione di sistema intelli-gente, con quelle fornite da un sistema artificiale S: se un giudice impar-ziale non capace di discernere le risposte delluno da quelle dellaltro,il test superato da S e conseguentemente non si potr negare intelligen-

za a S.Con tutto questo siamo ancora sul piano teorico. Ma gi negli anniQuaranta, McCulloch e Pitts avevano sfruttato la descrizione logica deicircuiti elettrici in termini di algebre di Boole per modellare le reti ner-vose. A partire dai prototipi iniziati nel 1941, nel 1946 fu realizzato ilprimo efficiente calcolatore, lENIAC, alla cui costruzione parteciparo-no sia John von Neumann, che aveva lavorato al programma di Hilbert,sia Norbert Wiener, che in quegli stessi anni stava gettando le basi di unanuova disciplina: la cibernetica, come scienza dei processi di autoregola-zione mediante cicli retroattivi (feedback) pensate al funzionamento diun termostato.

Mancava un ultimo tassello al mosaico. Claude Shannon e WilliamWeaver pubblicarono proprio allora il saggio con cui nasceva la teoriadellinformazione. Per precisare la ridondanza necessaria alla comunica-zione efficiente di un messaggio lungo un canale soggetto a rumore, sidefiniva la quantit dinformazione del messaggio come inversamenteproporzionale alla sua probabilit e la si faceva corrispondere al numerodi alternative binarie (0/1) richieste per definire il messaggio. Di qui ilbit(acronimo di binary digit) come unit di misura per calcolare linfor-mazione. Il codice numerico delezione diventava dunque quello binario

Alberto Peruzzi


7/37

197

invece di quello decimale perch gli si potevano correlare i due statifisici basilari di ciascuna porta di un circuito (on/off). Nel linguaggio-

macchina di un computer si trovano infatti lunghe liste di 0 e di 1, elabo-rate in conformit a precisi programmi, i quali non sono altro che casiparticolari degli algoritmi gi impostati teoricamente da Gdel e Turing.Per gestire efficientemente i programmi, per, gli informatici avevanobisogno di linguaggi pi comodi, di alto livello, e siccome tutto ci concui si aveva a che fare erano liste di liste ... di liste di simboli, uno deiprimi linguaggi (di programmazione) ad affermarsi fu il LISP (LIstProcessing), introdotto da John McCarthy. In seguito sono stati formu-lati molti altri linguaggi di programmazione, uno dei quali, il PROLOG(PRogramming LOGic) sispira alle caratteristiche del linguaggio dellalogica del primo ordine.

Avendo a disposizione questa discreta gamma di risorse informati-che e le tecnologie ingegneristiche di supporto, si potevano realizzaresistemi fisici che, comportandosi in conformit a uno o pi programmispecificati in linguaggi opportuni, simulassero prestazioni cognitive.Cominciava il cammino dellIA vera e propria.

Il lavoro dei ricercatori in IA si ben presto diviso in aree, ciascunadelle quali affronta una specifica tematica e richiede metodi risolutividifferenziati. Le principali aree dellIA hanno ormai denominazioni conso-lidate in inglese e cos le elencher:problem solving,planning,learning,automatic theorem proving,language understanding,knowledge represen-

tation,robotics. Evitando ogni tecnicismo, in quanto segue ne discuterle idee di fondo e ne segnaler quelle difficolt che hanno alimentato ildibattito filosofico sullIA. Qui mi limito ad aggiungere solo una cosa:nellultimo decennio, i numerosi problemi incontrati nel tentativo di met-tere a punto sistemi effficienti di IA hanno spinto ad abbandonare ilquadro teorico classico, costituito dallarchitettura sequenziale, alla vonNeumann, dellelaborazione, e a sostituire questo quadro con uno ra-dicalmente diverso, basato sullarchitettura in parallelotipica di quelle sichiamano reti neurali. Cercher di richiamare brevemente lidea cheguida la costruzione di reti neurali artificiali e di accennarne la rilevanzafilosofica, senza nascondere i loro limiti.

3. Problemi e strategie

La simulazione artificiale di un problema richiede un sistema disimboli in cui codificare i dati e la sua (eventuale) soluzione; e richiedeuna manipolazione di questi simboli conforme a un algoritmo di calco-lo, seguendo il quale, passo dopo passo, si generi alla fine una codificadella soluzione cercata. Allorch si dispone di un pacchetto di tecnichedi problem solving si pu impostare la simulazione dipianiin cui tali

LIA e la semantica


8/37

198

tecniche vengono sfruttate in serie. Ci dinteresse immediato per lapsicologia: limportanza dei piani di comportamento era gi stata messa

in evidenza dai primi cognitivisti. Bench il planning non sia unareanettamente distinta da quella delproblem solving, convolge aspetti nuo-vi, come lanticipazione degli effetti collaterali derivanti dallesecuzionedi una strategia e come lottimizzazione delle risorse al fine di consegui-re un obiettivo.

facile costruire un sistema artificiale che segua le regole degli scac-chi e riconosca quando c una situazione di scacco; altra cosa proget-tare un algoritmo (programma) che sia in grado di giocare decentemente.Negli ultimi ventanni sono stati fatti passi da gigante in questa direzione.Ha fatto epoca la notizia che il campione del mondo, Kasparov, avevaperso una partita contro il sistema Deep Blue (IBM). Tuttavia, esiste un

efficace generatore di mosse che garantiscala vittoria contro qualunqueavversario? No, e i giochi in cui possibile specificare in anticipo unastrategia vincente, guarda caso, ci attirano ben poco. Nel caso degli scac-chi, nonostante il fatto che i pezzi, le case della scacchiera e le mosse inciascun momento possibili siano in numero finito, linsieme delle alter-native indotte da una sequenza di mosse incredibilmente grande. Pigrande del numero stimato degli atomi delluniverso.

Passando dagli scacchi al linguaggio, supponiamo di riuscire a fareun programma che elenchi tutte le frasi della lingua italiana (sequenze dimosse nel gioco della grammatica) in ordine alfabetico nellipotesi di

aver ibernato il lessico italiano in qualche dizionario, cio in un data basefinito. Fra quelle frasi c anche linsieme di tutte le terzine dellaDivinaCommedia, ma potreste aspettare uneternit prima che il programmaarrivi a una data terzina!

Quando le possibilit di combinare tra loro, secondo ben preciseregole, un insieme finito di elementi crescono a dismisura, si ha unesplo-sione combinatoria. Gli scacchi sono un esempio della rapidit con cuilesplosione si pu verificare, eppure sono un sistema fatto di pochecose. Pi in generale, anche se sappiamo che c una soluzione a undato problema, e anche se sappiamo che cun algoritmo che genera lasoluzione, sapere tutto questo pu non essere di alcun aiuto pratico atrovarla. Non esaminando una a una tutte le possibili alternative cheprocediamo nella maggior parte delle nostre attivit. Riferito al linguag-gio: se per capire il significato di un enunciato devo predisporre unregistro di tutti i significati possibili, non far mai in tempo a capirneuno.

E qui c gi una piccola morale: per un comportamento efficientenon occorre essere onniscenti e non basta seguire le leggi della logica.Come facciamo allora a cavarcela con lesplosione combinatoria? Orga-nizziamo la ricerca della soluzione restringendo le alternative (potando

Alberto Peruzzi


9/37

199

lalbero delle opzioni) e a questo scopo ci serviamo di uneuristica:una opi strategie di ricerca per scartare rapidamente alcuni dei cammini pos-

sibili (nello spazio del problema). Se non trovate il vostro portafogli, re-stringete il numero dei possibili posti dove cercarlo. E se non vi ricorda-te il nome di battesimo di Cavour, non lo cercate nei libri di astronomia.

Nelle simulazioni si partiti dalle strategie di ottimizzazione perridurre al minimo la probabilit di perdere (non riuscire a risolvere unproblema) e massimizzare la probabilit di vincere (riuscirvi). E cos sison scoperte strategie diverse da quelle che di fatto seguiamo e perfinopi efficienti per certi scopi. Le strategie artificiali possono anzi gettarluce sulle caratteristiche del tipo dintelligenza che ci propria, propriocome abbiamo imparato qualcosa sullefficienza della forma degli uccel-li dopo aver progettato la forma degli aerei. Limportante che tali stra-

tegie siano codificabili in termini di qualche algoritmo (proceduraricorsiva) e implementabili sui circuiti di un calcolatore mediante pro-grammi scritti in un linguaggio opportuno.

Leuristica si collega in modo naturale con valutazioni di rilevanza.Sono state studiate diverse logiche della rilevanza. Si tratta di logichein cui, per poter asserire che il condizionale se pallora q valido,pdeve essere rilevante per stabilire q. (Nella logica standard, invece, bastache qsia valido perch il condizionale sepallora q sia a fortiori vali-do, qualunque sia lipotesip). In realt, ci che si suppone essere rilevan-te non resta sempre tale e ci che non era rilevante lo pu diventare.

Per problemi complicati, utile avere a disposizione pi euristicheoppure garantirsi che leuristica adottata sia flessibile. Ma quando silavora con pi euristiche occorrono criteri perpesarle, cio, per com-parare tra loro le diverse strategie di ricerca rispetto al compito dasvolgere, rispetto alle risorse disponibili, ecc. La rilevanza non va con-siderata soltanto in rapporto a come sono trattate le informazioni en-tro una data euristica, ma si ripropone anche al meta-livello, allorchelaboriamo un piano confrontando le diverse euristiche. Perci, la for-malizzazione logica della rilevanza richiede che vi si includa la meta-logica e allora le cose si fanno meno nitide. Bench siano eleganti co-struzioni, dubito che le logiche della rilevanza conseguano gli ambi-ziosi scopi loro assegnati.

Linteresse per il problem solving si iscrive in una bimillenaria tradi-zione filosofica, che ha fatto della padronanza del metodo un ingredien-te primario della razionalit, qui non importa se privilegiando metodideduttivi o induttivi. Il metodo, per, non mai il primum. Le tecnichedi problem solving partono sempre da un quesito che si suppone dato.Non meno importante, specie a fini formativi, la capacit di porre,identificare, inventare o scoprire, un problema. Il progresso della cultu-ra, nella storia delle scienze e delle arti, cos come nella maturazione di

LIA e la semantica


10/37

200

ciascun essere umano, dipeso e continua a dipendere dalla capacit delproblem raising, del sollevare problemi. Se anche riuscissimo a costruire

sistemi artificiali in grado di risolvere un qualunque problema che siarisolvibile, non avremmo ancora riprodotto una mente capace di porrenuovi problemi. Piuttosto, non varrebbe forse la pena impegnarsi a edu-care anche questa capacit con lausilio di sistemi di IA?

Ma che cosa ci aspettiamo poi da una simulazione? Oltre alle noteillusioni ottiche, ci sono errori inferenziali ricorrenti in cui gli esseri umanicadono. Inizialmente, lIA si proposta di simulare le buone prestazio-ni cognitive degli esseri umani, non di ripeterne gli errori uno dei mo-tivi per cui i calcolatori sono entrati prepotentemente nella nostra vita. fin troppo facile addurre esempi di virt proprie della nostra mente cheun computer non riesce a riprodurre, dimenticando che gli esseri umani

hanno anche vizi dai quali i computer sono immuni. Semmai, il tremen-do sospetto che, in un sistema di IA, il miglioramento di certe nostreprestazioni vada a scapito di altre e, pi specificamente, a scapito pro-prio di quelle che ci mettono in grado di porre nuovi problemi.

Come s detto, il problem solving collegato alla pianificazione. Sec la possibilit di scegliere tra piani alternativi, entra in funzione uncomponente essenziale della nostra vita: prendere decisioni. Sarebbedunque opportuna uneducazione a delimitare lo spazio del problema ea fornire unampia gamma di euristiche, perch una decisione efficacecomporta spesso la modifica dello spazio delle soluzioni.Tutti sappiamo

come questa modifica sia difficile, data la tendenza a conformarci allestrategie acquisite. il caso del problema seguente: con 6 fiammiferiformare 4 triangoli equilateri. La soluzione esiste ma non nel piano (cuici sentivamo confinati a cercarla).

Quando il dominio degli oggetti e linsieme degli stati di cose cui glioggetti possono dar luogo sono fissati, si possono definire sistemi di IAche risolvano problemi concernenti il dominio dato. I cosiddetti sistemiespertisono specializzati nel trattamento di informazioni relative a unaristretta cerchia di questioni, formulate in un linguaggio rigidamentedefinito e concernenti un prefissato dominio di cose e loro propriet. Cisono sistemi esperti impiegati nella diagnostica medica, nella ricerca diidrocarburi, nella progettazione architettonica, ecc. Ciascuno di essi trattaun micromondo e vi resta confinato. Questo stesso confinamento al do-minio in cui sono, appunto, esperti ne ha favorito la definizione e ilsuccesso commerciale. Ma specializzazione pu voler dire anche ottusite qui sta infatti il loro limite, specie quando si usano per fare modellidella comprensione del linguaggio. I sistemi espertipaganolacutezzainparticolari compiti con la miopia nei confronti di ci che va oltre il do-minio. I filosofi amano denunciarne la scarsa flessibilit, dimenticandoche un non minore difetto sarebbe la totale flessibilit.

Alberto Peruzzi


11/37

201

4. Piccoli mondi

Nellarea dellapattern recognition, uno dei primi programmi, relati-vo a un micromondo di solidi geometrici stato SHRDLU: un ambientefatto di blocchi colorati, su cui operano piparserspecializzati, con unacorrelazione tra un numero ristretto di nomi e forme, cos come tra unnumero ristretto di verbi e azioni da compiere su questi solidi. Il pro-gramma scritto in LISP. Lanalizzatore sintattico stabilisce se un insie-me di simboli in ingresso corrisponde alle regole della grammatica pergli enunciati che SHRDLU in grado di riconoscere; lanalizzatoresemantico gestisce i dati su come si presenta lo scenario di volta involta; infine c un minisistema che deduce informazioni dai dati fornitie stabilisce se le richieste fatte sono coerenti con il micromondo.

Domandina: il sistema ha davvero a che fare con un piccolo mondo disolidi o manipola soltanto simboli? Se manipola soltanto simboli, non hain realt una semantica....

SHRDLU fu inventato da Winograd allinizio degli anni 70 e daallora sono stati realizzati numerosi programmi per riconoscere configu-razioni comuni (tavoli, volti, ...), tenendo conto, a differenza di SHRDLU,anche del modo in cui due forme si congiungono e non semplicementedella posizione relativa. Lanalisi delle giunture stata poi estesa a interescene, evidenziando i vincoli che riducono il numero delle possibilitinterpretative di una figura in scene diverse. La comprensione dei vinco-

li che la fisica impone sulle giunture sufficiente a scartare combinazioniincoerenti di linee e superfici. Tuttavia, quando ci si spinti a simulare larappresentazione della conoscenza che abbiamo del mondo del sensocomune, questapproccio si appesantito, richiedendo lesecuzione dicalcoli giganteschi. Non solo che i programmi necessitano di un grannumero di dati, corrispondenti alla background knowledgeinglobata nelsenso comune. che prima bisogna esplicitare tale conoscenza. Come senon in un sistema dassiomi? Lo stampo prediletto a tale scopo risulta-to quello della logica del primo ordine, per la quale esiste una semanticarigorosa (quella tarskiana) in cui le nozioni di riferimento e verit trova-no precisazione formale. Cos facendo, gli studiosi di IA hanno riscopertole difficolt inerenti alformatodelle conoscenze ci che pi diamo perscontate. A differenza dei filosofi, non sono per rimasti paralizzati dallacomplessit di ci che vediamo e di cui parliamo nella vita quotidiana enon hanno visto il peccato originale nella modellizzazione.

Complessit che si rivela in un quesito: se la conoscenza il prodot-to di un insieme di regole meccaniche organizzate in programmi, comesi fa a applicare queste regole in modo da ottenere qualcosa che sia di-verso da quanto stato finora ottenuto seguendole? Come si fa a inte-grare la produttivit meccanica del sistema di regole con la creativit?

LIA e la semantica


12/37

202

Gli esseri umani sono in grado di eseguire questintegrazione; le arti e lescienze hanno una storia punteggiata di innovazioni rispetto a un pre-

esistente sistema di regole. Nel nostro stesso linguaggio la creativit simanifesta senza bisogno dessere coscienti e si manifesta solorelativamentea un sistema di regole. UnIA che volesse davvero riprodurre il modo incui sappiamo gestire i significati dovrebbe garantire la possibilit di cre-arne di nuovi, senza rinunciare a vincoli sulla loro gamma.

Stiamo girando intorno al frame problem, cio al problema dellacornice-contesto, formulato da McCarthy nel 1969. Applicando una tra-sformazione a un elemento di un sistema, lo stato del sistema cambia, main un modo che non facilmente circoscrivibile, perch il cambiamentosubto da un elemento ha effetti collaterali su altri elementi, anche ester-ni al sistema, che a loro volta hanno effettti retroattivi. Come si fa a tener

sotto controllo la catena di questifeedback? Nei modelli di IA si parte daun insieme finito dipattern basilari di dati e si sfrutta un insieme finito di

patterndi trasformazione. Con vincoli troppo rigidi, abbiamo unintelli-genza analoga a quella di un robot da catena di montaggio. Senza vincolisarriva alla casualit o alla paralisi. Nel caso del linguaggio: o per com-prendere una nuova frase tiriamo a indovinare oppure bisognerebbe gicomprendere tutto il linguaggio, e allora bisognerebbe comprendere qua-lunque altra cosa: assurdo.

Dobbiamo accettare questaut-aut? ovvio che per comprendereuna frase occorre disporre di informazioni aggiuntive a quelle espresse,

com ovvio che per comprenderetali informazioni bisogna avere a chefare col mondo. Non ne segue che siamo tenuti a misurarci con la totalitinfinita delle espressioni e dei fatti possibili. Possiamo rivedere una dellenostre aspettative, purch ne teniamo fisse altre (non sempre le stesse).Cos la semantica naturale riesce a essere un sistema relativamente sta-bile globalmente nonostante i cambiamenti locali e questa una carat-teristica dei sistemi apertiin fisica.

Eccone una spia rivelatrice: quando si fa un ragionamento, si dannoper buone molte cose. Accettiamo per default, cio fino a prova contra-ria, che valgano certi presupposti e non ci curiamo di esplicitarli.Questacomoda pratica non garantisce la validit logica delle inferenze. Be, nel-la vita quotidiana non ci aspettiamo garanzie assolute. Ci che interes-sante che sono stati messi a punto diversi sistemi di IA che incorpora-no proprio questidea.

Siete certi che uscendo di casa troverete la citt come lavete lasciataieri? No, nel frattempo buona parte di quel che cera potrebbe esserescomparso a causa di uninvasione aliena. Allora, uscendo, starete atten-ti al minimo passo che fate? No, non rivedrete la vostra aspettativa ditrovare tutto tale e quale, a meno chenon abbiate acquisito informazioni(attendibili) circa i cambiamenti. Ma il fatto di rivedere unassunzione

Alberto Peruzzi


13/37

203

non si propaga a catena in una revisione di tutte le vostre precedentiinformazioni. Ladozione di stereotipi di oggetti e di situazioni evita dun-

que lesplosione combinatoria ma ha un prezzo: rende il sistema abba-stanza rigido, cio, intollerante ai cambiamenti. Ladozione di una stra-tegia-modello tanto utile a velocizzare la ricerca di soluzioni quantodostacolo a risolvere problemi daltro tipo. Perch non costruire un si-stema in grado di impostare e risolvere tutti i problemi possibili? Questaera stata una delle speranze iniziali dellIA, ben presto ridimensionataentro i confini di un dominio specifico, cui appunto si rivolge un sistemaesperto.

Per questa via, a partire dallipotesi che il significato sia una rappre-sentazione simbolica e che la sua comprensione consista nellesecuzionedi una procedura conforme a un programma, si aperta la strada per la

simulazione, mediante computer, della semantica. Sono stati avanzatidiversi tipi di semantica procedurale che descrivono lattivit di com-prensione/interpretazione di enunciati sotto forma di procedure diinformation processing.

Unarchitettura che ha ricevuto particolare attenzione stata quel-la delle reti semantiche. Il lavoro originale di Quillian in cui venneroproposte risale al 1968. Anche le reti semantiche sono formulate in LISPe corrispondono a grafi formati da un insieme di vertici (nodi) occupatida voci lessicali e da un insieme di archi, detti link, che collegano unvertice a un altro, esprimenti propriet di un nodo o relazioni tra nodi.

Purtroppo, i modelli a rete semantica presentano diversi difetti, di ca-rattere teorico e applicativo. Accanto ai modelli a rete, ne sono statoelaborati altri, che per fanno s che anche la pi semplice analisisemantica richieda complicati calcoli (e tempi sempre pi lunghi). A uncerto punto si cominciato a dubitare che la rappresentazionecomputazionale di un enunciato possa mai garantire, e spiegare, la com-prensione del significato.

Le reti semantiche danno modo di precisare alcuni aspetti di unideafilosofica che va ancora per la maggiore: lolismo. Ha gi fatto capolinocon laut-aut di cui sopra e, per ragioni che qui non posso discutere, laconsidero unidea sventurata. Mi limito a un esempio. Gli olisti diconoche un qualunque costrutto concettuale non si riduce ai suoi componen-ti, ma la sua identit definita dalla rete dei suoi link con altri costrutti.Supponiamo che la vostra auto non funzioni. Viene il meccanico, la ri-morchia in officina e dopo qualche giorno vi chiama dicendo: il sistemadaccensione a posto, la trasmissione funziona, il motore non ha proble-mi, ... ma la macchina non va, evidentemente perch qualche suo rappor-to col resto delluniverso cambiato. Accettereste una simile diagnosi?Ovviamente, la composizionalit (il tutto funzione delle parti e di comesi combinano) ha senso solo se i componenti sono quelli della taglia giu-

LIA e la semantica


14/37

204

sta e se sono combinati nel modo giusto. Prendendo linsieme degli ato-mi che formano le parti dellauto e ridisponendoli a caso, improbabile

che lammasso risultante sia guidabile su una strada. Forse dobbiamotener conto di ci che esterno allauto per capire come funziona lauto?Ovviamente, le strade sono fatte perch le auto ci possano viaggiare e leauto sono fatte per viaggiare sulle strade. La buona filosofia fa ritrovarepresunte banalit, la cattiva filosofia le svende come spiegazioni.

Ricordate la domandina? La semantica in termini di reti non spie-ga il riferimento e le condizioni di verit. Lo stesso vale per la semanticain termini di atomi di significato o in termini di un sistema di postulati.Lapproccio logico alla semantica ha esplicitato e precisato le nozioni diriferimento e verit servendosi di modelli matematici, i quali hanno oc-cultato gli aspetti procedurali nella comprensione del significato quegli

aspetti che lIA privilegia.Perch non accontentarsi di unidea pi ecumenica della semanti-

ca? Affiancare dimensione referenziale e dimensione intensionale, lester-no e linterno, ambiente naturale-culturale e ambiente mentale. Ma possibile descrivere separatamente queste due dimensioni? possibilerisolvere i problemi connessi al riferimento e alla verit senza tener con-to delle strutture della mente, e viceversa? Non basta dire no: se unadimensione non si riduce allaltra, come interagiscono? La mia ipotesi che conoscenza del significato e conoscenza del riferimento sianoparame-trichee che i valori dei parametri pertinenti non possono essere anticipa-

ti una volta per tutte; eppure, in ogni contesto duso, significato e riferi-mento di qualunque espressione sono insaturi quanto basta. Ammet-tendo questipotesi, a portata di mano una soluzione del classico puzzle:(1) il significato del tutto funzione del significato delle parti, (2) il si-gnificato di un enunciato dato dalle sue condizioni di verit, ma (3) lapresenza, nel linguaggio, di operatori epistemici e modali sembra obbli-garci al sacrificio di (1) o di (2). Soluzione: la determinazione del signifi-cato del tutto un procedimento di back and forthtra significato delleparti e parametri, che porta a unequilibrazione dei rispettivi vincoli. Eci si applica anche ai modelli basati suframee script.

La nozione diframe stata introdotta da Minsky nei primi anni 70.Unframe una struttura di dati che rappresenta un oggetto o una situa-zione stereotipici, codificandone le caratteristiche consuete e le aspetta-tive che ne vengono indotte. Per esempio, unframeper SEDIAcodifica leinformazioni che associamo a una tipica sedia e unframeper PASSEGGIA-TAINMONTAGNAle informazioni su pendenza del terreno, tipo di paesag-gio, temperatura, abbigliamento insomma ci che si richiede per capi-re un discorso su una passeggiata in montagna.

Su questa base si sviluppa un ragionamento per default, che assu-mefino a prova contrariale informazioni codificate nel datoframe(o in

Alberto Peruzzi


15/37

205

pi di uno). Se linformazione espressa dap memorizzata come com-ponente di unframe, lenunciatop assunto come veroa meno chesi

verifichi qualcosa di diverso da quanto ci si aspettava. Le potenzialirevisioni non sono tutte allo stesso pari: i componenti di unframesonostrutturati gerarchicamente. I nodi pi alti sono occupati da informa-zioni assunte come quasi-costitutive delloggetto o situazione (per esem-pio, una sedia un solido, una passeggiata in montagna unazioneprolungata), i nodi meno alti da informazioni assunte per default mapi rivedibili. Insomma, la rivedibilit (flessibilit) decresce dai nodipi bassi a quelli pi alti. Una sedia a rotelle va ancora bene, mentre unoggetto su cui sedersi che non avesse schienale non sarebbe consideratouna sedia. Un computer munito del framerelativo pu elaborare unabuona rappresentazione simbolica del significato di frasi concernenti

luso comune delle sedie.Unframepu anche contenere (sub)framee far parte di scenari e

piani complessi dazione. Nel 1977, Schank ha introdotto il concetto discript(copione, sceneggiatura), per rappresentare in forma di program-ma stereotipi di eventi in sequenza, quali ingredienti indispensabili allacomprensione delle frasi. Mentre i modelli della semantica formale ela-borata allinterno della logica sono insiemi di dati strutturati chiusi, comemondi a se stanti, rigidamente definiti in ogni loro particolare, gli scriptlasciano spazio a flessibilit e indeterminatezza.

La valutazione di programmi del genere si fa in base alle inferenze

che essi traggono da un testo e in base alla qualit delle parafrasichesono in grado di generare. Ora, il compito di analizzare un comune testoe parafrasarlo richiede strutture cognitive aperte a tutte le possibilitinterpretative (infinite)? Se fosse cos, lesplosione combinatoria avreb-be la meglio, bloccando lazione non meno della comprensione. Le ideediframee scriptlimitano le opzioni di volta in volta significative e con-sentono di indagare sperimentalmente il carattere dinamicodella com-petenza semantica. Tuttavia vanno incontro alle stesse difficolt notatein rapporto ad altri modelli: la plasticit cheframee scriptconsentono sempre quella predefinita da un programma, perci si ripropone il pro-blema di come determinare ci che resta invariato quando c qualcosache varia. Se rompo un vaso pieno dacqua su una sedia, non cambia nil colore n la forma della sedia, per la sedia e il pavimento si bagnano,mentre il soffitto no. Banale? Per un sistema di IA, no. Per noi s, perchfacciamo affidamento a un repertorio di altri taciti presupposti. La no-stra comune background knowledgenon certo immune da rigidit, ep-pure ammette un ampio bricolage. Nel regno animale, se da un lato lascarsa flessibilit d pure un vantaggio adattativo, in non poche circo-stanze pu essere fatale. A differenza di quella darwiniana, la selezionedei programmi fatta dal mercato: pensate ai sistemi di OCR. Gli esseri

LIA e la semantica


16/37

206

umani riescono a destreggiarsi in ambienti mutevoli con una continuariequilibrazione di costanza e variazione, ottusit e apertura, rigidit e

flessibilit. Come riprodurre artificialmente unefficienza cos finementemodulata?

5. Conoscenze e programmi

Se lidea della mente come elaboratore di informazioni in forma sim-bolica ha i suoi limiti, i limiti non ne cancellano i meriti. Ora, la rivolu-zione tecnologica associata, prima, allo sviluppo e alla diffusione dei per-sonal computer e, poi, alla loro connessione in internet sta portandoanche a una rivoluzione nel modo di organizzare la conoscenza e... nelmodo di pensarci come esseri pensanti.

LIA rende i classici problemi dellepistemologia e della filosofia dellinguaggio sperimentali. Con ci cambiano anche i termini della classicaquestione circa il rapporto fra logica e psicologia. Una volta si diceva: cuno iato incolmabile tra lo status de iure, normativo, della logica, e lostatus de facto, descrittivo, della psicologia. difficile continuare a dirloquando laspetto normativo entra direttamente nella progettazione deisistemi di simulazione e laspetto descrittivo entra nella valutazione del-lefficacia di tali sistemi. LIA ha fatto s che le questioni de iuresullaconoscenza umana siano diventate indagabili mediante questioni de factosu modelli computazionali.

Anzi, potrebbero non esserci reali situazioni psicologiche in gradodi richiedere limpiego di alcune strutture logiche, epistemiche esemantiche e per motivi etici non possiamo sperimentare sulluomo. Ilcomputer pu allora rivelarsi indispensabileper far passare le dottrinefilosofiche dallo stato di idealizzazioni astratte allo stato di modelli peruna scienza sperimentale virtuale. Infatti, oltre che da banco di provaper testare teorie del significato e della conoscenza, lIA funge da genera-tore di metodologiecognitive, tramite le quali apprezzare la specificitdelle risorse usate dagli esseri umani (o da altri organismi).

Per esempio, la distinzione tradizionale fra sapere-come e sapere-che non dice nulla su come si realizzi una loro efficace integrazione. Nle dottrine semiotiche n la filosofia analitica del linguaggio che ha pun-tato sugli strumenti della logica sono riuscite a spiegare in maniera sod-disfacente questintegrazione. S cominciato a fare dei passi avantiallorch ci si posti il problema di quale linguaggio adoperare per gesti-re al meglio la rappresentazione della conoscenza in un sistema artificia-le un linguaggio procedurale o un linguaggio dichiarativo?

Teorie e problemi di filosofia della scienza si manifestano allora cometeorie e problemi di ingegneria della conoscenza. Le questioni relativealla conferma di unipotesi possono essere impostate per via simulativa;

Alberto Peruzzi


17/37

207

e la stessa formazione di una teoria simulabile mediante modellicomputazionali (dapprendimento e deuristica), cos come la formazio-

ne delle galassie o la formazione di cicli stabili in un sistema chimico. Delresto, lanalogia tra sviluppo della competenza del bambino in un domi-nio cognitivo e formazione di una teoria ha sollecitato limpiego dellin-formatica in psicologia (le teorie psicologiche come meta-teorie dellacognizione). E ne seguito un incremento di rigore nei modelli dellosviluppo mentale. Per essere implementata su calcolatore, infatti, unateoria deve prima essere assiomatizzata col che si ottiene gi un chiari-mento di quel che essa dice ma poi si deve anche elaborare un modello(parziale) della teoria come programma. Che il programma funzioni nongarantisce la coerenza della teoria, ma se il programma non gira bene,ci una spia che nella teoria qualcosa non quadra. Abbiamo cos un

modo abbreviato per trovare quali tipi di situazioni possono rivelare lafalsit della teoria relativamente, beninteso, alle caratteristiche deldominio inserite nel modello. In particolare, la teoria che sta alla base diun modello dellapprendimento pu essere studiata costruendo sistemiintelligenti che godono delle caratteristiche teorizzate. Perci potremotrovare programmi che incorporano principi empiristi o razionalisti,innatisti o comportamentisti.

In questo senso un sistema di IA risultafilosoficamenteeconomico: un veloce generatore di controesempi oltre che un generatore dimetodologie. La codifica di una teoria in forma di programma permette

di testare anticipatamente le previsioni della teoria, sondare quali cam-biamenti teoricipossono eliminare i controesempi e valutare ladegua-tezza di ciascuno di questi cambiamenti. Tutto, naturalmente, dipenderdalle risorse del linguaggio scelto, da che cosa stato considerato essen-ziale alla teoria, cio tale da ritrovarlo in qualunquesuo modello, e daquale fetta del mondo reale stata rappresentata in uno specificomodello. Le opzioni al riguardo non sono date a priori. Se alla fine iconti non tornano, la colpa potrebbe non essere n del programma ndella teoria ma di un errore di valutazione da parte del progettista. Dal-tronde, anche queste valutazioni possono essere riviste e corrette, pas-sando da un circolo vizioso a una spirale virtuosa.

opportuno ripeterlo: i calcolatori sanno svolgere bene compiti chetroviamo difficili e non sanno svolgere bene compiti che troviamo facili. proprio questo fatto curioso che ciaiuta a capire larchitettura dellamente umana, pi di quanto ci abbiano aiutato a capirla le teorie dellaconoscenza e del linguaggio elaborate in passato dai filosofi. Linsucces-so dei vari tentativi di traduzione automatica ha messo in chiaro i fattoricontestuali da tener presenti; e la chiusura dei micromondi ha mostratoche il mondo reale non pu essere facilmente scomposto in frammentitra loro indipendenti. Direte: forse ci si poteva arrivare anche senza i

LIA e la semantica


18/37

208

computer. S, ma ora ne abbiamo una prova sperimentale. In pi abbia-mo capito con precisione dovenascono i guai e ci siamo fatti unidea

meno vaga circa la comune intelligenza pratica, suggerendo le domandealle quali lIA chiamata a rispondere.Questo fatto curioso spesso visto come un paradosso: i calcolatori

progettati per simulare le nostre capacit sono utili solo per capire chesiamo diversi da loro e per capire quantosiamo diversi! Non direi che un paradosso e non mi sembra il caso di trarne conclusioni di principio(tanto meno, se olistiche). Senza dubbio, i programmi finora elaboratinel campo dellIA al fine di dar conto dellintelligenza naturale hanonumerosi difetti. Siamo legittimati a inferirne limpossibilit di simularein maniera efficace le capacit cognitive? Prima di rispondere a tale que-sito convieneindicare alcune differenze di struttura formale tra menti emacchine.

I linguaggi naturali in cui trova espressione la nostra attivit di pen-siero sono diversi dai linguaggi formali dei logici e dai linguaggi di pro-grammazione che gli informatici usano per far funzionare un computer.Ci sono, per, alcuni aspetti basilari dellarchitettura di un linguaggio edella sua semantica che fanno da ponte. Come avevano gi capito Gdele Turing, i programmi sono a loro volta configurazioni simboliche, per-ci si possono trattare come oggetti, anzi: come oggetti strutturati informa di tipi di dati (data types). Se questidea stata allorigine delladiffusione del LISP come linguaggio di programmazione funzionale, lesi-

genza di sistemare in maniera rigorosa limpiego del LISP e dei suoi ni-poti ha riportato allattenzione il linguaggio della teoria dei tipi, natacon Russell allinizio del Novecento. Che cosa mancava a quella teoria?Innanzitutto, la possibilit di avere pi di un tipo basedi dati (per esem-pio, INTper gli interi e BOOLper i valori di verit), poi la considerazionedelle funzionibasilari tra un tipo e laltro, e infine il fatto che la lorototalit pu parimenti diventare uno speciale oggetto del discorso. Ebbe-ne, la semantica per linguaggi che colmano queste lacune formalizzabilein termini di una recente branca della matematica, la teoria delle catego-rie, la quale raffina in misura significativa le risorse della teoria degliinsiemi. Si possono trattare i programmi come oggettiin opportune cate-gorie. (Lodierna didattica della matematica tutta centrata sullinsie-mistica, quindi non c da stupirsi che quanto ho appena detto sia pocoapprezzato dagli stessi informatici).

Che un programma possa diventare oggetto di se stesso decisivoper i modelli elaborati allinterno dellarea che prende il nome diknowledge representation, proprio perch mettono in evidenza il ruolodellautoriferimento e del ragionamento auto-epistemico. A partire dallaproblematica relativa al duplice Teorema di incompletezza di Gdel, ilcontributo della logica a questo riguardo stato fondamentale.La filo-

Alberto Peruzzi


19/37

209

sofia della mente se n servita a man basse: la logica avrebbe finalmentedimostrato i limiti della razionalit, nel senso che ogni progetto mirante

ad assiomatizzare la razionalit era un sogno (o un incubo) irrealizzabile.Non star a elencare i motivi che si possono addurre per legittimarequesta morale e non si riducono al solo teorema di Gdel. Piuttosto,vorrei ricordare (1) che la conoscenza dellimpossibilit di qualcosa una conoscenza positiva e dovrebbe suggerire rispetto per ci che si pufare con strumenti limitati (la termodinamica ci ha fatto capire che ilmoto perpetuo non possibile e ce ne siamo serviti per costruire frigori-feri); (2) che il modo in cui viene solitamente letto il teorema di Gdeldipende da presupposti che non siamo obbligati a condividere.

6.IA e logica

Ci sono diversi temi in relazione ai quali si determinato un fecon-do commercio di idee fra IA e logica. Uno dei primi a essere affrontato quello che riguarda, oltre allautomazione del controllo sulla correttezzadi uninferenza, lautomazione delle dimostrazioni di risultati gi noti(conseguiti da esseri umani) e luso del calcolatore come strumento perottenere nuovi teoremi. Forse lesempio pi famoso costituito dal Te-orema dei quattro colori, che fu ottenuto nel 1976 grazie appunto al-limpiego di un calcolatore cui si demand lincarico di vagliare un nu-mero enorme di casi, alcuni dei quali particolarmente complicati, al fine

di poter stabilire che ogni mappa piana, opportunamente suddivisa inregioni pu essere colorata con non pi di quattro colori (regioni distin-te adiacenti devono avere colori diversi). Questo ricorso al computer hasollevato unaccesa polemica: fino a che punto potremmo fidarci delcomputer qualora non fossimo concretamente capaci di controllare, passodopo passo, il lavoro deduttivo da esso svolto? ancora una dimostra-zioneun processo inferenziale che non siamo in grado di fare nostro?

Se gi queste domande ci costringono a tematizzare ulteriormente lepropriet generali che ascriviamo di norma al dimostrare, lIA ha anchecontribuito a evidenziare caratteristiche specifiche del ragionamento uma-no. Infatti, la necessit di servirsi di assegnazioni per default in sistemi di IAha condotto a riconoscere limportanza di una logica della meno che, chesia non-monotna (daprnon scende pi chepqr) e autoepistemica.

Inoltre lIA ha fornito nuove motivazioni teoriche ed applicazioniconcrete per la teoria, introdotta da Lofti Zadeh negli anni Sessanta, chetratta gli insiemifuzzy(sfumati) e la relativa logica. La fuzzy logictieneconto della vaghezza dei concetti mediante valori di verit intermedinellintervallo reale tra 1 (vero) e 0 (falso), dunque in maniera moltodiversa dalle valutazioni probabilistiche. In effetti, gi in comuni compi-ti di categorizzazione, la distinzione degli elementi x di un dominio tra

LIA e la semantica


20/37

210

quelli che sicuramente hanno una propriet P, cio [x P] = 1, e quelliche sicuramente non ce lhanno, cio [x P] = 0, non sempre cos

netta, e neppure corrisponde a una distribuzione di probabilit: il valoredi x P varia piuttosto nellintervallo unitario in maniera pi o menocontinua. Non che i raffinamenti allanalisi del linguaggio scaturiti daqueste (e altre consimili) linee di ricerca ispirate alla logica siano la solu-zione di tutti i problemi inferenziali in situazioni di incertezza e di varia-bilit dei dati. Anzi, in molti ricercatori si fatta strada la convinzioneche il privilegio accordato a unarchitettura puramente logico-linguisti-ca sia manchevole sotto pi rispetti. Lequazione pensiero = linguaggio,fatta propria da quasi tutte le varianti di cognitivismo e poi passata diret-tamente nellIA classica sta ormai mostrando i suoi limiti.

Il frame problem riguarda quali cambiamenti sono provocati da

unazione e cosa invece resta come prima. La via comunemente seguitaper risolverlo consiste nel mettere a punto un modello dinamico e, poi-ch si ha di mira la simulazione dei contesti pratici relativi alluso dellinguaggio naturale, ci si ritrova a fare i conti con la fisica ingenua. Nel1978 Pat Hayes fece circolare un ambizioso manifesto della fisica inge-nua in cui esponeva il progetto di formalizzare tutte le conoscenze pro-prie del senso comune circa lambiente fisico, usando come linguaggioquello della logica classica del primo ordine. LIA avrebbe cos catturatolontologiadel senso comune e lavrebbe anche rigorizzata grazie allasemantica tarskiana: il backgroundda cui tutti i vari micromondi traggo-

no il loro senso avrebbe finalmente trovato una codifica appropriata.Questo progetto ha assorbito le energie di molti ricercatori. DagLenat si impegnato a dotare un computer di uno dei pi giganteschidata basemai immaginati, concernente i pi familiari domini, dalla mec-canica dei macro-oggetti ai fatti storici, dallo sport alla letteratura, met-tendo a punto il sistema CYC (da En-CYC-lopedia). Come dicevo, oggisi ha la sensazione che questo tipo di progetti sia giunto a un impasse(semmai, si cerca di ricostruire ontologie dedicate). McDermott, che neera stato un convinto promotore, ha ammesso il fallimento, scorgendovila nemesi del logicismo iniziato da Frege e Russell e poi diventato abitomentale di molti filosofi analitici. Anche se, naturalmente, la logica non il logicismo e di linguaggi logici non c solo quello pi sfruttato in IA(il linguaggio del primo ordine), questa novella critica della ragione purasi estende anche a varianti pi sofisticate di logicismo. Be, se i ragiona-menti concreti delle persone non trovano una resa adeguata nella logica,lIA prender unaltra strada. Ma non cos facile, perch i limiti delleprospettive centrate sullanalisi logica sono anche limiti delle prospetti-ve cognitiviste, che trattano il pensiero come un linguaggio.

Senza una ben definita integrazione fra strutture epistemiche di tipodiverso (di percezione e dazione) che tenga conto della genesi di tali

Alberto Peruzzi


21/37

211

strutture in un sistema aperto (che interagisce con un ambiente non menostrutturato), difficile credere che lIA possa offrire qualcosa di pi che

strumenti ausiliari, fortemente vincolati a un prefissato dominio.Se queste relazioni strutturali non sono primariamente di caratterelogico-deduttivo, allora tutto si fonda su qualche forma dinduzione?Neppure. Una volta versato il bicchier dacqua sulla sedia, il bambinonon deduceche tutto rimasto comera (non pu pi bere dal bicchierelacqua versata), n che tutto cambiato (se ha sete, andr a cercare labottiglia dacqua dove laveva lasciata). Se dovesse dedurre prima di agi-re, non gli basterebbe tutto lo spazio di memoria pur reso disponibiledai suoi miliardi di neuroni per codificare i presupposti dellinferenza,eseguirla in tempo utile e comportarsi in conformit alla conclusione.Uninduzione sarebbe di nuovo un ragionamento (probabilistico)nonmeno complesso di una deduzione. Morale: non basta aggiornare la logi-ca (negazione per default e simili) n arricchire la deduzione con qualco-sa di pur sempre inferenziale (abduzione e simili).Possiamo quindi farea meno della logica? Neanche. solo che, lasciata a s, la logica gira avuoto. La revisione di una credenza non n puramente logica n indi-pendente dalla logica. I fattori che contano dipendono dalla strutturaassegnata agli oggetti, agli eventi e alle interazioni con essi. Questasse-gnazione non n arbitraria n determinata dalla logica, ma va esplicitataper prima.

Molti hanno erroneamente creduto che le conoscenze del senso co-

mune siano rappresentabili e regimentabili come fossero una (immensa)teoria e che una teoria sia nientaltro che un sistema linguistico: da cisono dipesi alcuni insuccessi dellIA classica ma la radice dellerrore stagi nella deificazione del linguaggio celebrata nella filosofia del Nove-cento. Anche il logicismo in IA non che una forma particolare difunzionalismo e il funzionalismo non che una variante del formalismo,cos come inteso in filosofia della matematica. C chi ha detto che ilmodo in cui ci rappresentiamo la nostra attivit di pensiero e i suoi pistabili prodotti in formato simbolico non che una meravigliosa realtvirtuale. Pu darsi, ma lefficacia di questa o di qualunque altra realtvirtuale parassitica rispetto a preesistenti schemi dellaspazialit chesono oggetto della topologia e riguardano configurazioni dinamiche.

Non c modo di simulare una teoria del contenuto senza un model-lo del processo. Unontologia senza una dinamica non funziona. E civale anche quando ontologia e dinamica sono riferite a quegli oggettiche chiamiamo proposizioni. Per superare i difetti della scollatura cheinvece persiste in buona parte dellIA attuale, penso che la progettazionedi un sistema intelligente debba correlare le risorse logiche agli invariantitra un dominio e laltro, trattando le proposizioni come un sottodominioimmerso in ciascun dominio-ambiente i cui stati esse codificano.

LIA e la semantica


22/37

212

Rappresentiamo la realt (e la finzione) rappresentando anche leconoscenze che ne abbiamo. E questautorappresentazione bene o male

funziona perch non una rappresentazione statica di conoscenze stati-che. Solo tenendo conto di ci, il gap tra sistemi naturali e artificialipotr essere ridotto. Ma tenerne conto non basta. Un concetto, cos comeogni oggetto simbolico, non contrapposto agli oggetti che rappresenta;e le procedure di manipolazione di simboli non sono che schemi di mani-polazione di oggetti. Le potenzialit di unanalisi costruttiva e variazionale,come quella resa possibile dalla teoria delle categorie, possono essereapprezzate, se non per altro, almeno per lintegrazione che questa consen-te di ottenere fra aspetti denotazionali e procedurali dellinformation pro-cessing. Se c una sintassi che possiamo comprendere, quella che deri-va per astrazione dagli schemi topologico-dinamici della corporeit. Ma

allora la mente non pu pi essere separata nettamente dal corpo.Tutto questo detto senza staccarsi definitivamente dal piano rappre-

sentazionale. C invece una linea alternativa di pensiero, legata al connes-sionismo, che se ne stacca in maniera ben pi decisa.

7.Reti neurali

Il connessionismo un tipo di filosofia cresciuto con il progressivopotenziamento delle reti neurali artificiali, a partire dalla met degli anniOttanta. Una rete del genere composta da un insieme di nodi intercon-

nessi (o unit) ciascuno dei quali ha una soglia dattivazione; inoltre, seun nodo a connesso a un nodo bda un link, questo unidirezionale, unico, e ha associato unpeso che misura il contributo dellattivazione dia allattivazione di b. I nodi iniziali di ogni sequenza di link sono quellisensibili a segnali di input esterni alla rete; quelli finali forniscono loutputdella rete.

A parte le analogie della prima cibernetica fra auto-organizzazionedel cervello e sistemi basati su feedback, il primo modello si pu farrisalire agli assembramenti (o assemblee) cellulari, studiati da DonaldHebb nellimmediato secondo dopoguerra. Partendo dallidea secondocui nellapprendimento si viene selezionando una opportuna matrice dipesi, una prima regola diselezione : se le unit A e B sono eccitatesimultaneamente, la forza di connessione tra A e B aumenta. La Regoladi Hebb stabilisce, appunto, che se il prodotto delle forze (pesi) posi-tivo la connessione diventa eccitatoria, e se negativo inibitoria.

I primi tentativi in questa direzione si erano scontrati col fatto che,se una rete ha solo due strati di unit (dunque, si riduce a unit di inpute di output) i tipi di computazione che riesce a eseguire sono nettamen-te inferiori a quelli consentiti da unarchitettura sequenziale classica. Lascienza cognitiva dispirazione funzionalista aveva dunque buon gioco.

Alberto Peruzzi


23/37

213

Tuttavia, da quando si cominciato a costruire reti con numerosi stratiintermedi di unit nascoste, capaci di un massiccio parallelismo, il qua-

dro cambiato. Il principale modello di reti neurali stato delineato dalgruppo di ricerca PDP, che deve il suo nome alle iniziali di PartialDistributed Processing.

Indubbiamente, una rete neurale somiglia al reale funzionamentodel cervello pi di quanto gli somigli una macchina di Turing. Anche ineuroni hanno una soglia di attivazione; analogamente alle sinapsi, leconnessioni tra nodi possono essere eccitatorie o inibitorie; e una rete, adifferenza di un programma di computer, plastica, proprio come ilcervello. Inoltre, ammessa una sufficiente ridondanza, il carattere distri-buito della codifica compensa meglio eventuali danni subiti da singolinodi. Il pattern complessivo di attivazione di una rete descrivibile come

composizione funzionale a partire dallo stato di attivazione di ciascunnodo e la risultante tipicamente espressa da una funzione non lineare.La flessibilit di una rete pu essere sfruttata mediante algoritmi dilearning, supervisionato o no.

Nel primo caso, alla rete si forniscono esempi del pattern sul qualesintonizzarsi e via via si correggono, in base allalgoritmo dato, i pesi suilink in modo che loutput converga a quello giusto. Il pi diffuso di que-sti algoritmi quello di backpropagation, introdotto da Paul Werbos nel1974, che riduce progressivamente lo scarto dellerrore nelloutput partendodalle unit dello strato finale e risalendo allindietro di strato in strato.

Operando correzioni che si propagano in senso inverso a quello deisegnali nella rete, questalgoritmo retrogrado ha linconveniente di ri-correre a un istruttore esterno. Si potrebbe passare dallesterno allinter-no del sistema solo se la rete cui lalgoritmo si applica fosse una sottoretedi una rete ricorsiva (con autoaccesso). A prescindere dalla difficolt diriprodurre in questo modo gli stessi effetti dellalgoritmo retrogado, ilguaio che, per determinare lerrore, si presupposto di sapere qualefosse il risultato giusto. Ma lintelligenza di noi esseri umani sta anchenelle capacit di autoapprendimento, le quali non sono una nostra risor-sa esclusiva: sono noti esempi dapprendimento autonomo in numerosespecie. (Peraltro, i connessionisti hanno contribuito alla nascita di quelnuovo ambito di ricerca in IA che va sotto il nome di vita artificiale, incui si pu simulare unampia gamma di strategie composite di learning).

Lapprendimento non-supervisionato corrisponde a reti che si auto-organizzano: le regolarit su cui sintonizzarsi sono lasciate estrarre allarete stessa. Perch ci si realizzi, bisogna che lambiente sia carico din-formazione e che non sia progettato da un ... genio maligno daltronde,se cos fosse, la rete come farebbe a sopravvivere? Gli algoritmi di que-sto tipo funzionano in base a un principio di coerenza per risonanza:unit adiacenti tendono a rinforzarsi o a inibirsi a vicenda.

LIA e la semantica


24/37

214

Ora, questi vari modi di organizzare una rete neurale si prestanoanche a simulare, pi o meno bene, il comportamento simbolico sequen-

ziale ma certo in una rete non c alcun insieme di regole(logiche) perelaborare rappresentazioninel senso tradizionale. Si va piuttosto da unar-chitettura totalmente distribuita a una sempre pi localizzata modular-mente. Quanto alla variegata fenomenologia cui si presta la coppia loca-le/globale, i relativi modelli sono di natura geometrica, non logica; e perminimizzare lerrore non ci serve la classica teoria della computabilitma lancor pi classica Analisi.

8.Dinamiche subsimboliche

Ciascuna rete neurale si pu descrivere come un sistema dinamico

S, la cui traiettoria nello spazio delle fasi F(S) determinata da una fun-zione evolutiva. I valori di questa funzione dipendono dallo stato diattivazione di ciascun nodo e dai pesi sui relativi link. Pertanto la di-mensione di F(S)pu essere enorme se la rete costituita da un ampionumero di nodi, disposti in pi strati e fortemente interconnessi. Anchese la dinamica che interessa discrta (le transizioni di stato sono fun-zioni di un tempo discretizzato e tra due punti vicini in F(S)non cnecessariamente un punto intermedio), si possono ottenere buone ap-prossimazioni servendosi della matematica del continuo. La funzioneevolutiva si esprime in una legge (solitamente non lineare) di moto in

F(S), ma ci che pi conta che ogni punto (stato, fase) di questo spazioabbia un bacino dattrazione. Un attrattore globale un punto verso ilquale tende lintero sistema: se esiste, corrisponde alla stabilit struttu-rale del sistema rispetto a eventuali perturbazioni delle soglie di atti-vazione e dei link. La topologia che ne risulta indotta su F(S)d infor-mazioni essenziali per una descrizione qualitativa dellevoluzione che ilsistema subisce nel tempo, nel corso dellesecuzione di un compitocognitivo.

Una simile impostazione ha dato buoni risultati nellarea della patternrecognition, nella simulazione dei processi decisionali e in compiti dimemorizzazione e categorizzazione. Il punto se la dinamica di una retepossa catturare tutto ci che descriviamo in termini di rappresentazionisimboliche e regole ricorsive per la manipolazione dei simboli. Pu lor-dine logico emergere autonomamente dal funzionamento parallelo di unsistema i cui stati non sono disposti come quelli di una macchina diTuring? Sintassi e semantica possono essere ascritte a una rete in cui nonc alcun vero simbolo?

Senza dubbio, un notevole vantaggio teorico disporre di sistemi ingrado di sviluppare da s capacit di alto livello a partire da pochi sche-mi distribuiti, ma se poi non riusciamo a spiegare ci per cui un filosofo

Alberto Peruzzi


25/37

215

come Ernst Cassirer defin luomo come animal symbolicum, cio, lamultiforme e finissima organizzazionelogico-linguistica dei concetti, il

vantaggio non ci aiuta a progredire verso un sistema di IA paragonabilealla mente umana.Alle precedenti domande Jerry Fodor e Zenon Pylyshyn hanno dato

una risposta negativa in un articolo del 1988 che ha innescato una pole-mica dai toni molto accesi.

Fodor e Pylyshyn mettevano in dubbio due cose: (1) che il modellodella cognizione basato sullarchitettura delle reti neurali sia davvero di-verso dal modello classico allorch si propone come esplicativodella com-petenza sintattica e semantica, e (2) che, se davvero diverso, non riescea spiegare quel che deve spiegare. La forma del loro ragionamento dunque quella di un sillogismo disgiuntivo: o il connessionismo non dif-

ferisce dallapproccio classico (cognitivista) se non nel modo di imple-mentare i programmi, oppure ne differisce. Nel primo caso non unavera alternativa, nel secondo lo ma ripropone un associazionismo or-mai superato. Ergo, il connessionismo non pu essere quella rivoluzioneche i suoi profeti vogliono farci credere. (NB: talvolta si legge che il con-trasto fra IA classica e connessionismo quello tra unarchitettura top-down e una bottom-up, ma proprio le obiezioni di Fodor e Pylyshynfanno capire che ci improprio, se solo si riflette che la prima , inbuona parte, composizionale, la seconda no).

I connessionisti hanno contestato questo sillogismo disgiuntivo di-

cendo che le reti neurali possono avere unarchitettura molto pi riccadel vecchio associazionismo e non implementano soltanto programmi dimacchine classiche pur essendo in grado di fornire prestazioni equiva-lenti. In particolare, Smolensky ha replicato che una rete neurale pureggere il peso di una struttura combinatoria, in cui un intero sia funzio-ne delle parti che lo compongono, bench la causalit stia tutta nellatti-varsi o no dei nodi della rete, e non nelle rappresentazioni che attribu-iamo al suo comportamento. Per i cognitivisti (e per lIA classica) le rap-presentazioni sono simboli formali e i processi cognitivi sono lesecuzio-ne di programmi, per i connessionisti le rappresentazioni sono tuttalpi reinterpretabili come vettori che specificano parzialmente lo stato diun sistema dinamico, e i processi cognitivi sono levoluzione di un siste-ma fisico governata da equazioni del tipo di quelle che governano flussie campi.

prematuro dire se, in linea di principio, i tipi di computazionieseguibili da una rete connessionista, che si evolve in base a principidinamici (e probabilistici), siano o no pi estesi dei tipi di computazionieseguibili da una macchina di Turing. Fatto sta che in fisica sono statiindividuati sistemi dinamici la cui evoluzione non Turing-computabile.Se si riuscisse a mostrare che tali sistemi sono adeguatamente simulabili

LIA e la semantica


26/37

216

da una rete, la famosa Tesi di Church-Turing che, parlando alla buona,afferma che qualunque procedura meccanica eseguibile da un calcola-

tore idealmente equivalente a una macchina di Turing, risulterebbe fal-sa. Sono stati proposti anche modelli ibridi, ove sono presenti, su pianidiversi dellarchitettura cognitiva, entrambi i tipi di computazioni. InCalifornia, da tempo il gruppo di ricerca di Feldman ha portato avantimodelli con questarchitettura doppia: ai livelli pi bassi della microco-gnizione una struttura connessionista, ai livelli pi alti della macrocogni-zioneuna sequenzialit di tipo classico.

Mentre le unit minime del cognitivista erano simboli semantica-mente interpretabili, cos non per le unit del connessionista; la sintassisi colloca a un livello, la semantica a un altro, quindi non ci sono elemen-ti che hanno simultaneamente un ruolo sintattico e semantico. Al para-

digma simbolico classico si viene contrapponendo un paradigma sub-simbolico, in cui le unit delaborazione non sono localizzate: la codifi-ca associata a ununit di significato distribuita nella rete. Come giaccennato, ci consente una maggiore robustezza della rete rispetto allavariabilit dei contesti duso dei simboli. Il problema ancora irrisolto se il complessodelle regole della grammatica e della logica sia riducibilea pattern dattivazione e attrattori. Manca una descrizione matematicadella struttura degli stati proposizionali atomici e di come essi si combi-nino per dare stati molecolari.

Pensiamo alla competenza visiva: com che emergono proprio cer-

te gestaltstabili e non altre astrattamente possibili? Il fatto che una retepossa autostrutturarsisenza bisogno di predefiniti programmi non bastaa selezionare gestalt stabili. Occorrono vincoli di campo che restringa-no la gamma degli esiti possibili ed ragionevole supporre che questivincoli sianofisiologici. Ma se c una tale correlazione tra struttura ma-teriale e funzione diventa arduo separare il software dallo hardware del-la mente.

Ammesso che la spiegazione sia analoga per la competenza semantica,lintegrazione tra reti neurali e meccanismi robotici dovrebbe portare asistemi che possiedono una qualche, autonoma, semantica intrinseca.Tuttavia, per ottenere un risultato del genere non basta servirsi di reti,perch la forte non localizzazione in contrasto con le prove a favoredellautonomia reciproca dei diversi domini cognitivi. Se larchitetturadi un sistema intelligente fosse un tuttuno inseparabile, ogni singolocambiamento in un nodo potrebbe generare una reazione a catena, coneffetti devastanti sulla stabilit del sistema. Ladozione di un approccioparallelistico non spiega, da s sola, come evitare un simile effetto valan-ga. Limpiego di modelli ibridi, in cui si combinano aspetti connessionistie cognitivisti, migliora il quadro della situazione, ma presto per dire seil miglioramento decisivo.

Alberto Peruzzi


27/37

217

Una misura dellottusit dei sistemi classici era lesplosione combina-toria. Come si pu evitare lesplosione combinatoria senza pagarla col

ritorno a meri riflessi condizionati? Come ottenere robustezza e possibi-lit di una combinatoria?Si dice: un pattern dattivazione pu anche essere ci che chiamia-

mo rappresentazione, ma, di per s, ogni suo componente non rappre-senta nulla. E si dice: un programma fatto di simboli, gi gi fino aisimboli elementari (non importa per cosa stiano). Lemergere di un sim-bolo da qualcosa che non lo costituisce un problema solo per il connes-sionismo. Ma questo problema, invece di essere un difetto, non forseun pregio? Non dimentichiamo che n le parti di una A sono letteredellalfabeto, n lattivit di camminare scomponibile in cose che cammi-nano. Il ginocchio si flette, il bacino si solleva, la pianta del piede ruota.

Le singole molecole dacqua non sono liquide, gli archi a volta sonofatti di mattoncini diritti, e potremmo continuare allinfinito.

La differenza tra una rete che funziona a partire da microcaratte-ristiche e una che funziona in modo totalmente distribuito una diffe-renza di grado di interconnessione. analoga alla differenza tra un mo-saico e un ologramma. Abbiamo una teoria che ci faccia capire cosa suc-cede via via che giriamo la manopola dallatomismo alla globalit? No.Quindi, invece di continuare a dibattere, sarebbe pi proficuo impe-gnarci a costruire una teoria del genere.

9. Fuori dalla stanza cinesePensieri, concetti, significati, sono entit materiali? Scommetto che

direte: No: infatti non hanno n massa n volume n posizione. Ilconnessionista che si preoccupa di rispondere a domande cognitive intermini, diciamo, subsimbolici o non alleato del materialista che vuolridurre la cognizione umana a scariche di neuroni e flussi di ioni sodio epotassio?

Alcuni dei pi accesi sostenitori di una filosofia materialista dellamente hanno visto nel connessionismo un alleato. I Churchland hannoavanzato una teoria neurocomputazionale della mente che si propone dieliminare dal linguaggio scientifico tutti i fossili mentalisti legati alla psi-cologia del senso comune: in questo modo non si pu pi dire che crede-requalcosa ha effetti causali, perch nel mondo fisico non esistono enti-t come le credenze.

Ma una rete neurale non forse tanto formale quanto un diagram-ma di flusso? Ci sono forse differenze di principiotra reti artificiali e retinaturali? Non potrebbe servirsi delle reti neurali anche un funzionalista?Come potete immaginare, ci sono diverse opinioni al riguardo, suffragatecon argomenti poco concludenti in un senso o nellaltro.

LIA e la semantica


28/37

218

Alcuni, come Domenico Parisi, vedono nellautostimolazione in-terna di una rete una condizione fondamentale perch emergano co-

gnizioni complesse. Daltro lato, lidea che si possa capire la mente at-traverso modelli artificiali, siano quelli dellIA classica o quelli di reticonnessioniste, stata negata da Edelman, secondo il quale c un solomodo per arrivare a una spiegazione della mente ed lo studio dellafisiologia delloggetto pi complicato di tutto luniverso conosciuto: ilcervello umano. Attraverso la formazione e la selezione di particolaripopolazioni di neuroni, il cervello diventa il supporto di innumerevolimappeneurali, che non solo si aggiornano di continuo ma soggiacciono auna selezione che sfocia nella capacit di categorizzare. Il materialismoche ne risulta sui generis, perch non elimina la mente n la identificacon le unit che la compongono. Invece che una cosa,fa della mente un

processo ovviamente, un processo speciale, reso possibile da non menospeciali sottoprocessi. Ma allora lunica vera IA si avr assemblando verineuroni.

Ora, Edelman un neurobiologo. Ci sono stati molti filosofi chehanno manifestato un diverso tipo di scetticismo nei confronti dellIAcome progetto generale, ancor prima che nei confronti di questo o quelsistema di di IA.

In un articolo del 1980, John Searle ha contestato radicalmente lipo-tesi che un qualunque sistema di IA possa raggiungere la minima com-petenza semantica. Con ci, Searle non intendeva negare lutilit di pro-

grammi per computer come strumenti ausiliari alla simulazione di que-sto o quel processo cognitivo; piuttosto, intendeva negare che un com-puter, quantunque potente e ben programmato, possa mai arrivare a com-

prenderequalcosa, e intendeva negare che le simulazioni mediante pro-grammi possano essere prese come spiegazionidelle capacit cognitivecos simulate. (Il famoso, o famigerato, Argomento della Stanza Cinese ormai diventato un tema di conversazione nei salotti e quindi lo darper noto).

Con questargomento Searle si propone dunque di stabilire la du-plice tesi negativa che ho appena enunciato (NB: bench aspirasse allamassima generalit, largomento aveva come bersaglio il modello diSchank per la comprensione di testi). Searle non mette in dubbio che ilTest di Turing sia superabile da un computer, bens suppone che il Testsia stato superato da un sistema che esegue esclusivamente manipola-zioni sintattiche, in conformit a un qualche programma prestabilito.Se, ciononostante, il sistema non capisce il significato dei messaggi (enun-ciati) in ingresso e in uscita, vuol dire che la sintassi di un programmanon basta ad avere una semantica. (Searle aggiunge: non c neanchebisogno di un algoritmo di calcolo per averla, tant vero che gi nelcaso della sintassi contesta lidea chomskiana di una grammatica uni-

Alberto Peruzzi


29/37

219

versale). La mente umana ha invece accesso al significato e, se i nostripensieri sono causati dal funzionamento del cervello, allora la simula-

zione artificiale delle reti nervose mediante procedure ricorsive non puspiegare i meccanismi causali che permettono al cervello di secernerepensieri e la stessa cosa pu dirsi per le reti connessionistiche, guidateda algoritmi di (auto)apprendimento, in quanto anchesse puramenteformali e dunque indipendenti dallo hardware. Ci che conta sono glispeciali poteri causali di quello speciale hardware che consiste nellamateria grigia.

Nel 1990 Searle ha precisato le ipotesi e le conclusioni dellArgo-mento della Stanza Cinese nel modo che segue.

Assioma 1. I programmi di calcolatore sono formali (sintattici)Assioma 2. La mente umana ha contenuti mentali (una semantica)Assioma 3. La sintassi non condizione necessaria, n sufficiente,

per la determinazione della semantica.Assioma 4. Il cervello umano causa la mente.

Conclusione 1. I programmi non sono condizione necessaria,n sufficiente, perch sia data una mente.

Conclusione 2. Qualunque sistema in grado di causare una men-

te deve possedere poteri causali almeno equiva-lenti a quelli del cervello umano.

Conclusione 3. Qualunque sistema artificiale, se svolgesse soltan-to un programma, non sarebbe in grado di pro-durre fenomeni mentali.

Conclusione 4. Il modo in cui il cervello umano produce feno-meni mentali non si riduce allo svolgimento diun programma.

Se lessenza di ci che autenticamente mentale la capacit di rife-rirsi-a, cio, lintenzionalit, e questa preclusa ai sistemi di IA in virt deipoteri causali del cervello, allora chiaro che la descrizione di questessen-za dovrebbe essere alquanto diversa da tutto ci che Brentano, prima, eHusserl, poi, hanno scritto al riguardo, perch lindividuazione delle strut-ture pure dellintenzionalit secondo la linea della psicologia descrittiva,prima, e della fenomenologia, poi, comporta la sospensione di qualunquelegame col sostrato fisico (fisiologico) delle strutture mentali.

Largomento di Searle, beninteso, non vuol negare che il funziona-mento concreto di un programma di computer abbia effetti causali. Il

LIA e la semantica


30/37

220

punto che i cervelli hanno i giustipoteri causali, mentre ogni altra cosasia stata finora trovata per simularne i prodotti (di pensiero) non li ha.

Ma allora largomento rischia di voler provare troppo. Infatti la relazio-ne dequivalenza avere gli stessi poteri causali di usata da Searle perraffinare in maniera decisiva la relazione dequivalenza associata al Testdi Turing, cio quella di equiestensionalit (stessi input stessi output).Ma ci da un lato rischia di ridurre a un singoletto la classe dequivalen-za di sistemi in grado di aver accesso a una semantica il singoletto ovviamente composto dalla mente umana, con predarwiniano sciovini-smo. Dallaltro, sembra sottostimare limpegno teorico richiesto per adot-tare come metro una tanto fine relazione, svalutando a priori tutte lericerche rivolte a indagare sistemi, naturali o artificiali, che grazie al lorostesso hardware (pur diverso da quello specifico di homo sapiens sapiens)

presentano un qualche grado di comprensione. I giusti poteri causalinon detto in alcun modo che siano limitati alle propriet dellhardwarecerebrale, perch queste stesse propriet si definiscono attraverso leinterazioni dellintero corpo con aspetti percettivamente salienti dellam-biente esterno.

Inoltre potremmo anche accogliere lArgomento della Stanza Cine-se e limitarci a ricavarne, come morale, chelidea secondo cui un com-puter-robot appropriatamente programmato sia (indiscernibileda) unamente (ovvero capisce, ha stati realmentecognitivi, ecc.) non ancorariuscita a trovare la via giusta. Quale potrebbe essere questa via? Forse

non una riguardante lingegneria dei circuiti stampati, bensla bio-inge-gneria. E non detto che si debba imporre a un cyborg una condizionecosstretta come vorrebbe Searle. Il cervello di un delfino o quello di unelefante hanno sicuramente qualche giustopotere causale semmainon hanno abbastanza ... sintassi!

Vi ho appena suggerito che i giustipoteri causali non sono soloquelli del cervello ma anche quelli relativi alle interazioni fra un organi-smo e il suo ambiente come inteso da chi ci vive dentro. Su questopunto, le critiche di Searle erano state precedute da quelle di Dreyfus.Nel 72, infatti, Dreyfus pubblicun libro il cui sottotitolo suonava:ACritique of Artificial Reason, con richiamo evidente al titolo della celebreopera di Kant, e ne scaturunaccesa polemica ben prima che scoppiassequella sullargomento della stanza cinese.

Dreyfus riproponeva la tesi husserliana secondo cui lattivitinten-zionale affonda le radici nel mondo-della-vitae in particolare si richia-mava alla nozione di orizzonteintenzionale, affermando che le macchi-ne (in quanto tali, non solo quelle finora costruite) ne sono prive, per-chi programmi sono privi di aspettative e di anticipazioni guidate dalcontesto pratico e dagli obiettivi vitali, come invece succede con verisistemi intelligenti.

Alberto Peruzzi


31/37

221

Se per Searle il cervello che fa la differenza, per Dreyfus il corpo(quello umano, beninteso) ci che consente di avere intenzionalit

unidea gisviluppata da un fenomenologo francese, Merleau-Ponty, neglianni 40. dunque sul terreno delle esperienze vissute che andrebbecercato ciche permette alluomo di capiresenza dover formalizzare tut-to, e di comportarsi in maniera appropriata alle pidiverse situazionisenza bisogno di regole precise, come invece i computer. Da un lato lemiracolose peculiaritdella materia grigia, dallaltro la non meno miraco-losa frattura tra natura e spirito, che si ottiene svincolando lintenzionalitda qualunque meccanismo fisico-chimico.

Gli argomenti di Dreyfus e Searle puntano il dito su importanti de-ficienze dellIA, non cancellate dafuzzy logic, connessionismo, ecc. Per-fino Winograd si pentito, ridimensionando le iniziali speranze e orien-tandosi verso una pimodesta concezione, centrata sul miglioramentodellinterfaccia utente. Il guaio di questa ritirata non tanto nelle poten-zialitdellIA che trascura, quanto nel tipo di filosofia che plaude a unoiato incolmabile tra intelligenza naturale e IA:

Documents

L'IA e la semantica.pdf