Fabio Ciotti
Abstract (italiano)
L’articolo discute criticamente la tesi avanzata da Gary Marcus secondo cui Claude Code, l’agente di programmazione di Anthropic, costituirebbe una conferma empirica del neurosimbolismo come paradigma per l’intelligenza artificiale. Attraverso l’analisi dell’architettura di Claude Code condotta da Liu et al. (2026), si mostra che lo harness deterministico del sistema è infrastruttura operativa, non logica di ragionamento. Su questa base si sviluppa una critica più radicale al neurosimbolismo forte, ovvero alla tesi che la cognizione richieda necessariamente un kernel logico-formale: il frame problem e le aporie correlate della Teoria della Rappresentazione Mentale mostrano che tale tesi non è un limite contingente dell’IA classica ma un errore teorico di principio, confutato empiricamente dal successo dei sistemi neurali. Si propone infine la distinzione tra neurosimbolismo forte e neurosimbolismo debole, quest’ultimo inteso come versione computazionale della tesi della mente estesa, in cui gli strumenti simbolici amplificano un kernel cognitivo non simbolico senza modificarne la natura.
Abstract (English)
This article offers a critical assessment of Gary Marcus’s claim that Claude Code, Anthropic’s agentic coding system, provides empirical confirmation of neurosymbolic AI as a viable paradigm. Drawing on the architectural analysis of Claude Code conducted by Liu et al. (2026), we argue that the system’s deterministic harness constitutes operational infrastructure rather than cognitive reasoning, and that Marcus’s argument rests on a category mistake. This finding motivates a broader critique of strong neurosymbolism, the thesis that genuine cognition requires a logico-formal kernel: the frame problem and the related aporias of the Representational Theory of Mind reveal this not as a contingent limitation of classical AI but as a theoretical error of principle, empirically refuted by the success of neural systems. We conclude by proposing a distinction between strong and weak neurosymbolism, the latter understood as a computational rendering of the extended mind thesis, in which symbolic tools amplify a non-symbolic cognitive kernel without altering its fundamental nature.
Nei giorni scorsi (siamo nell’aprile 2026), il noto scienziato cognitivo Gary Marcus, uno tra i più attivi critici della nuova generazione di AI generativa, ha pubblicato su Communications of the ACM un articolo dal titolo “The Biggest Advance in AI Since the LLM” (Marcus 2026), in cui sostiene che Claude Code (https://claude.com/product/claude-code), l’agente di programmazione sviluppato da Anthropic, costituirebbe il singolo più importante avanzamento nell’intelligenza artificiale dall’avvento dei Large Language Model. La tesi di Marcus è la seguente: Claude Code non è migliore dei sistemi precedenti grazie allo scaling, ma perché è, nella sua architettura profonda, un sistema neurosimbolico, vale a dire un sistema che integra tecniche di IA classica di tipo simbolico-formale con componenti neurali sub-simboliche. La prova addotta è di natura empirica, resa possibile dal fatto che qualche giorno fa il codice sorgente di Claude Code è stato reso pubblico, in parte (non è chiaro se per errore, imperizia o volontà): secondo l’analisi di Marcus, quel codice conterrebbe al suo centro un kernel di 3.167 righe denominato print.ts, strutturato come un grande condizionale IF-THEN con 486 branch point e 12 livelli di annidamento, all’interno di un loop deterministico che i padri fondatori dell’IA classica (da John McCarthy a Marvin Minsky a Herbert Simon) avrebbero immediatamente riconosciuto come proprio.
Marcus conclude con una dichiarazione esplicita di valenza autobiografica: Anthropic avrebbe fatto esattamente ciò che egli stesso ha sostenuto per venticinque anni essere necessario (Marcus 2020; Marcus 2001), ovvero abbracciare il neurosimbolismo come paradigma per l’IA, e per superare quelli che egli ritiene limiti decisivi e insuperabili delle architetture neurali: la tendenza ineliminabile a produrre errori (allucinazioni), la mancanza di robustezza e continuità delle prestazioni attraverso i contesti, l’incapacità di vero ragionamento consapevole, alla System 2 di Kahneman (Kahneman 2011).
La foga con cui Marcus vuole celebrare questo suo presunto successo lo porta tuttavia a fare poca giustizia dei principi teorici e delle complesse soluzioni tecniche che la ricerca in IA ha negli anni messo in atto per cercare di creare sistemi software dotati di un barlume di capacità cognitiva e, in particolare, capaci di operare sul linguaggio naturale. Ridurre quegli immensi sforzi intellettuali a una serie di ramificazioni condizionali if-then (che semmai sono una struttura generale di tutta la programmazione, a partire dalle quintuple di Turing) sembra francamente eccessivo.
Ma in questo articolo la comunicazione di Marcus è solo il punto di partenza di una riflessione più vasta. Le sue tesi sono, piuttosto, un caso esemplare e particolarmente nitido di una posizione teorica più generale che chiamerò neurosimbolismo forte: la tesi secondo cui un sistema di intelligenza artificiale generale genuino debba avere nel suo nucleo funzionale dei moduli simbolici che operano in modo paritario, o addirittura prioritario, rispetto ai componenti sub-simbolici, in modo tale che il lavoro cognitivo vero (il ragionamento, l’inferenza, la pianificazione) sia svolto da un kernel logico-formale, mentre i componenti neurali assolvono funzioni ausiliarie di percezione, pre-classificazione o elaborazione statistica del segnale. È questa tesi che intendo discutere criticamente. La mia argomentazione procederà su due piani argomentativi: un livello empirico-architetturale, che utilizza una analisi tecnica del codice di Claude Code per smontare l’argomento specifico di Marcus, e un livello teorico-filosofico, che argomenta circa l’erroneità di principio del progetto cognitivo classico di cui il neurosimbolismo forte è erede.

Come funziona davvero Claude Code
Per valutare la correttezza della tesi di Marcus su Claude Code è necessario disporre di una descrizione accurata e indipendente dell’architettura del sistema agente coding di Anthropic. Per fortuna la diffusione del codice ha permesso a ricercatori indipendenti di condurre questa analisi, ora disponibile sotto forma di un dettagliato preprint pubblicato su arXiv da Jiacheng Liu, Xiaohan Zhao, Xinyi Shang e Zhiqiang Shen nell’aprile 2026, con il titolo “Dive into Claude Code: The Design Space of Today’s and Future AI Agent Systems” (Liu et al. 2026). Il paper, basato sull’analisi del codice sorgente TypeScript della versione v2.1.88, costituisce la descrizione architetturale indipendente più dettagliata e sistematicamente fondata di Claude Code attualmente disponibile.
La struttura del sistema si articola in sette componenti funzionali: l’utente, le interfacce di interazione, il loop agentivo centrale, un sistema di permessi, un insieme di strumenti eseguibili, un sistema di stato e persistenza, e un ambiente di esecuzione. Il nucleo operativo è un ciclo asincrono, denominato queryLoop(), che chiama il modello, raccoglie le richieste di invocazione di strumenti, le filtra attraverso un sistema di permessi, esegue le azioni autorizzate, e ripete l’operazione fino al completamento del task. Attorno a questo loop risiede la maggior parte del codice: un sistema di permessi con sette modalità e un classificatore ML, una pipeline a cinque livelli per la gestione della finestra di contesto, quattro meccanismi di estensibilità (MCP, plugin, skill e hook), un meccanismo di delega a subagenti, e uno storage di sessione ad aggiornamento incrementale.
La domanda architettonica fondamentale che il paper di Liu et al. pone esplicitamente è: dove risiede il ragionamento? La risposta è netta: il modello ragiona su cosa fare; lo harness (un ennesimo caso di termine tecnico la cui traduzione letterale in italiano, “imbrago”, funziona poco: si tratta dell’insieme dell’infrastruttura operativa che avvolge il modello e ne governa l’esecuzione agentiva) è responsabile dell’esecuzione delle azioni. Il modello genera blocchi tool_use come parte della sua risposta, e lo harness li analizza, verifica i permessi, li invia alle implementazioni degli strumenti, e raccoglie i risultati. Il modello non accede mai direttamente al filesystem, non esegue comandi shell, non effettua richieste di rete: la sua unica interfaccia con il mondo esterno è il protocollo strutturato tool_use, che lo harness valida prima dell’esecuzione.
Le stime sulla distribuzione funzionale del codice che Liu et al. citano sono illuminanti riguardo il ruolo di tutta la impalcatura agentiva intorno al modello linguistico: circa l’1,6% del codice complessivo costituisce logica decisionale dell’agente IA, mentre il restante 98,4% è infrastruttura operazionale. Questa proporzione non è accidentale: lo harness crea le condizioni affinché il modello possa decidere bene, senza vincolare le sue scelte. Il sistema segue il pattern ReAct (Yao et al. 2022), in cui il modello genera ragionamento e invocazioni di strumenti, lo harness esegue le azioni, e i risultati alimentano l’iterazione successiva. Tale scelta si contrappone esplicitamente ai framework tradizionali per lo sviluppo di agenti software, come LangGraph, che codificano la logica decisionale come grafi di stato espliciti con archi tipizzati, investendo nel ragionamento lato scaffolding piuttosto che nel ragionamento lato modello.
Alla luce di questa descrizione, la tesi di Marcus può chiaramente essere rivalutata criticamente. Il suo argomento si basa sull’identificazione del kernel deterministico print.ts, con i suoi condizionali if-then e i suoi branch point, come la componente “simbolica” che trasforma Claude Code in un sistema neurosimbolico. Si tratta di un errore di reverse engineering nel senso tecnico del termine: Marcus attribuisce all’harness operazionale le funzioni di ragionamento che invece nell’architettura pertengono al modello linguistico, confondendo due livelli architetturali che il sistema stesso mantiene separati per ragioni di sicurezza prima ancora che di design cognitivo.
Il sistema di permessi deny-first, il loop deterministico, le regole if-then che governano l’autorizzazione degli strumenti: tutto ciò costituisce un’infrastruttura di supporto e potenziamento operativo, non la logica di ragionamento. Come Liu et al. sottolineano, la separazione tra reasoning e enforcement dell’agente è una scelta architettonica deliberata con conseguenze di sicurezza precise: poiché i due moduli occupano percorsi di codice separati, un modello compromesso o manipolato avversarialmente non può aggirare il sandboxing, i controlli sui permessi, o le regole deterministiche implementate nell’infrastruttura agentica. Chiamare “neurosimbolico” questo sistema perché il suo strato di esecuzione è deterministico è evidentemente una sovradeterminazione, o una estensione tale del termine da renderlo cognitivamente irrilevante.
Vi è poi un problema concettuale: la nozione di “neurosimbolico” nel senso forte ha un significato tecnico preciso nella letteratura. Essa designa sistemi in cui componenti simboliche e sub-simboliche sono integrate a livello di rappresentazione e di inferenza, in modo tale che il kernel logico-formale guida i processi di ragionamento strutturato mentre il componente neurale svolge funzioni di supporto. Un sistema di permessi basato su regole if-then che avvolge e rende operativo in un ambiente esteso un LLM non soddisfa questo criterio: le due componenti non si integrano a livello cognitivo, operano su livelli architetturali separati e con funzioni radicalmente diverse. Lo harness non determina il ragionamento del modello in modo cognitivamente rilevante: il modello produce istruzioni, le estensioni agentiche le eseguono e tengono traccia dei risultati, i quali infine rientrano nel contesto del modello come dati di ritorno; per questa ragione sistemi come Claude Code tendono a consumare token e a raggiungere molto rapidamente i limiti d’uso, ciò di cui molti utilizzatori sono ben consapevoli.
I fallimenti dell’IA classica e il successo degli LLM: un dato empirico da cui partire
La critica all’eccessivo semplicismo sottinteso nella comunicazione di Marcus, tuttavia, come avevo anticipato, non è il tema centrale di queste riflessioni. Intendo avanzare una critica molto più radicale al progetto stesso dell’IA neurosimbolica come progetto scientifico teorico, almeno nella variante che Marcus e molti altri sembrano sostenere. La mia posizione è che il neurosimbolismo forte, anche nelle sue versioni teoricamente più sofisticate, è un progetto scientificamente errato dal punto di vista cognitivo. Per sostenere questa tesi farò ampio uso di argomenti concettuali, ma il punto di partenza è strettamente empirico, quasi autoevidente, direi.

I sistemi di IA classica, anche nelle loro realizzazioni più ambiziose, non sono mai riusciti a produrre agenti conversazionali e cognitivi generali capaci di operare in modo naturale e flessibile su un’ampia gamma di compiti linguistici e cognitivi. SHRDLU, il celebre programma di Terry Winograd del 1970 (Winograd 1972), dimostrava una notevole competenza nel ragionamento su un mondo di blocchi descritto in linguaggio naturale, ma era interamente dipendente da un dominio chiuso e da una rappresentazione esplicita e completa di quel dominio: fuori da quel perimetro, il sistema era radicalmente incompetente. CYC, il progetto enciclopedico avviato da Douglas Lenat (Lenat 1995) negli anni Ottanta con l’obiettivo di codificare la conoscenza del senso comune in una base di conoscenza logico-formale di proporzioni sufficienti a fondare un ragionamento generale, ha impiegato decenni e risorse enormi per produrre un sistema che non ha mai mostrato le capacità cognitive generali operative che il progetto prometteva.
In un lasso di tempo incomparabilmente più breve, e senza un controllo teorico forte sulla natura delle rappresentazioni apprese, i sistemi neurali basati su architetture Transformer hanno realizzato ciò che il progetto classico non era riuscito a fare: sistemi capaci di conversare in modo naturale, di ragionare per analogia, di trasferire competenze tra domini, di comprendere testi complessi, e, fatto particolarmente significativo, di eccellere nel ragionamento matematico, che era stato a lungo considerato il dominio per eccellenza del ragionamento formale e quindi il terreno più favorevole ai sistemi simbolici. Questo successo empirico non è una questione di grado: non è che i sistemi neurali hanno fatto un po’ meglio dei sistemi simbolici sugli stessi compiti. Essi hanno mostrato un tipo di competenza cognitiva che i sistemi simbolici non avevano mai raggiunto, e lo hanno fatto con un approccio radicalmente diverso sul piano della rappresentazione e dell’inferenza, che fa a meno di ogni regola formalizzata a priori inserita nel sistema sotto forma di formule di un qualche linguaggio formale e operata da sistemi di inferenza soggetti ai vincoli della decidibilità reale.
Questo dato empirico non confuta di per sé il neurosimbolismo forte: un sostenitore di quella posizione potrebbe sostenere che i sistemi attuali sono buoni ma migliorabili con l’aggiunta di moduli simbolici. Tuttavia, di fronte ai critici dei modelli neurali, esso sposta radicalmente l’onere della prova. Per molti anni il confronto tra i sostenitori degli approcci computazionalisti simbolici classici e quelli degli approcci connessionisti alla cognizione artificiale si è basato su scarsi risultati empirici e grandi polemiche teoriche e filosofiche: oggi il connessionismo ha prodotto risultati straordinari, e chi sostiene che la cognizione richieda necessariamente un kernel simbolico deve spiegare perché sistemi privi di quel kernel hanno raggiunto le competenze che hanno raggiunto, e non limitarsi a puntualizzare dove essi falliscono.
Il frame problem: perché la logica non può essere la base della cognizione
La presa di atto di come stanno le cose nei fatti non è tuttavia sufficiente a fondare una critica concettuale. Contro il neurosimbolismo forte si può evocare un argomento teorico molto forte, che ha caratterizzato la fase crepuscolare della storia dell’IA classica e che oggi è stranamente poco presente nella discussione filosofica sull’IA, in tutte le fazioni in cui essa si articola. Si tratta del cosiddetto frame problem, una questione che nasce come un’osservazione molto tecnica sui possibili problemi cui potevano andare incontro sistemi IA basati su sistemi formali equivalenti alla logica dei predicati, ma che ben presto assunse una rilevanza filosofico-concettuale ben più profonda. Vale la pena esporre i contorni di quel dibattito con la precisione che merita, anche perché è spesso citato in modo superficiale.
Il frame problem, nella sua formulazione originale, viene proposto in un articolo di McCarthy e Hayes (1969), dove si osserva il problema che sorge quando si tenta di descrivere gli effetti di un’azione o di un evento usando la logica classica. Il problema, nella sua forma tecnica, è il seguente: per ragionare correttamente sugli effetti di un’azione in un mondo formalmente descritto, non è sufficiente descrivere ciò che cambia; è necessario descrivere anche ciò che non cambia. In assenza di questa descrizione esplicita, il sistema non può inferire che le proprietà del mondo non menzionate nella descrizione dell’azione restano inalterate. Ma l’insieme delle conseguenze logiche di un’azione è potenzialmente infinito, e questo rende in linea di principio impossibile costruire un agente intelligente artificiale basato sulla logica e su qualsiasi formalismo ad essa riducibile. Murray Shanahan (1997), nella sua trattazione sistematica del problema, illustra questa difficoltà con l’esempio del Blocks World (lo stesso ambiente in cui operava SHRDLU): se descriviamo l’effetto di spostare il blocco A sul blocco D usando assiomi di effetto in logica del primo ordine, riusciamo a derivare che A è ora su D, ma non riusciamo a derivare che B è ancora su C, perché nulla nel sistema formale garantisce la persistenza dei fluenti non menzionati dall’azione. Per ovviare a questo, è necessario aggiungere assiomi di frame (assiomi che enumerano esplicitamente ciò che non cambia) ma questo elenco è in linea di principio infinito, perché ogni azione potenzialmente non altera un numero illimitato di proprietà del mondo.

Le soluzioni tecniche proposte nel corso dei decenni (la circumscription di McCarthy, il default reasoning, il calcolo degli eventi, le logiche non monotone) affrontano il problema in modo parziale ma non lo risolvono in modo generale. Per questo un fatto in apparenza tecnico, legato alla natura del ragionamento deduttivo formalizzato, attirò l’attenzione di molti filosofi della mente e scienziati cognitivi. Tra i molti, Daniel Dennett nel suo saggio “Cognitive Wheels: The Frame Problem of AI” (1984) offre la migliore caratterizzazione concettuale del problema: il frame problem non è un problema tecnico che attende una soluzione tecnica migliore, ma il sintomo di un errore concettuale nell’approccio stesso. Un sistema basato su rappresentazioni formali esplicite deve, in linea di principio, decidere per ogni fatto del mondo e per ogni azione potenziale se quel fatto è rilevante per l’azione in questione. Ma la rilevanza non è una proprietà logica: è una proprietà contestuale, olistica, che dipende da una comprensione del mondo che non può essere catturata da nessun sistema di regole finite. Dennett introduce a questo proposito la nozione di “cognitive wheel”: le soluzioni formali al frame problem sono soluzioni ingegneristiche eleganti che non hanno nulla a che fare con il modo in cui la cognizione naturale gestisce il problema — o meglio, con il fatto che la cognizione naturale non si trova mai di fronte a quel problema nella sua forma pura, perché opera con rappresentazioni distribuite e contestuali che non richiedono la codifica esplicita di ciò che non cambia.
Il frame problem è dunque l’emergenza tecnico-formale di una difficoltà più generale che ha caratterizzato l’intero paradigma dell’IA classica e della psicologia cognitiva di ispirazione computazionale. La Teoria della Rappresentazione Mentale (TRM), nella sua versione standard, assume che la cognizione consista nella manipolazione di rappresentazioni simboliche secondo regole formali: quello che Jerry Fodor ha chiamato il “linguaggio del pensiero”, l’ipotesi che i processi cognitivi abbiano la struttura sintattica delle inferenze logiche (Fodor 1975; Rescorla 2024). Su questa assunzione si è fondato il progetto dell’IA classica: se la cognizione è computazione simbolica, allora è possibile costruire sistemi artificiali cognitivamente competenti implementando quella computazione in un sistema formale. Le difficoltà empiriche di questo progetto non si sono limitate al frame problem. Il problema della qualificazione (come rappresentare in modo finito e completo tutte le condizioni necessarie affinché un’azione abbia l’effetto desiderato) è strutturalmente analogo al frame problem e altrettanto irrisolvibile in termini puramente formali. Il problema della rilevanza, che Fodor stesso ha riconosciuto come il problema centrale della psicologia cognitiva classica in The Modularity of Mind (Fodor 1983) e poi nel suo parziale autodafé The Mind Doesn’t Work That Way (Fodor 2000), riguarda la capacità di determinare, tra le infinite credenze potenzialmente pertinenti in un contesto dato, quali siano effettivamente rilevanti per un compito cognitivo specifico: questa capacità, che ogni agente cognitivo naturale esercita in modo automatico e per lo più non consapevole, non ha una formulazione formale soddisfacente. Lo stesso vale per il problema del grounding formulato da Harnad (1990), ovvero come le rappresentazioni simboliche acquisiscano il loro contenuto semantico estensionale, come le forme sintattiche si colleghino al mondo. Si tratta, in realtà, di difficoltà tra loro connesse: sono varianti di una medesima concezione fallace, e sono connesse in modo tale che, se cade una, cadono tutte. Ciò che il successo dei moderni modelli linguistici su base neurale artificiale ha dimostrato è che queste aporie non erano un limite contingente dovuto all’insufficienza dei formalismi computazionali disponibili, ma il frutto di una concezione erronea dei processi cognitivi: la cognizione non è intrinsecamente logico-simbolica, e i processi che la realizzano non hanno il formato delle inferenze formali. Per dirlo con uno slogan: la logica e la grammatica non esistono in natura.
I sistemi neurali artificiali, infatti, hanno mostrato come sia possibile realizzare competenze cognitive di secondo livello basate sul linguaggio (comprensione, ragionamento analogico, trasferimento, generalizzazione, ma anche rigoroso ragionamento logico-matematico) attraverso processi di tipo radicalmente diverso: apprendimento probabilistico su distribuzioni di dati empirici, linguistici e non linguistici, rappresentazioni distribuite in spazi ad alta dimensionalità, inferenza contestuale che non richiede la codifica esplicita di regole. Questo non significa che tali sistemi siano cognitivamente identici o isomorfi ai cervelli umani, né che non abbiano limiti significativi, in particolare in relazione alla ricchezza delle relazioni con l’ambiente che viene garantita dall’embodiment e da un intricato sistema di percezione, propriocezione ed effettori. Significa che il tipo di competenza cognitiva che essi mostrano è irriducibile al modello logico-formale, e che la sua emergenza da un substrato non simbolico è la prova più diretta che la cognizione non richiede un kernel simbolico.
L’IA neurosimbolica: ritorno al passato
La fin troppo rapida discussione che ho proposto su una questione teorica che sembrava ormai al di fuori del dibattito filosofico dovrebbe rendere chiaro perché ritengo che essa sia al contrario assai importante anche per le discussioni di oggi sull’IA neurosimbolica: il frame problem non è un limite dell’IA classica che nuovi approcci o soluzioni più eleganti potrebbero superare ricorrendo a tecniche di programmazione migliori o più efficaci, ma la manifestazione più evidente di un errore teorico di fondo di quel progetto, ovvero l’assunzione che la cognizione sia intrinsecamente o prioritariamente una forma di ragionamento logico-formale su rappresentazioni esplicite. I sistemi neurali non risolvono il frame problem: lo aggirano semplicemente non operando con rappresentazioni esplicite di stati del mondo — sulla cui natura peraltro non abbiamo un’idea chiara nonostante oltre un secolo di teorie semantiche — e regole di transizione. La competenza cognitiva che essi mostrano emerge da rappresentazioni distribuite e da processi di inferenza contestuale che non hanno il formato logico che il problema presuppone.
Tra i teorici che oggi propongono un approccio neurosimbolico come terza via filosofica e ingegneristica alla creazione di sistemi intelligenti artificiali, mi pare vi sia una scarsa consapevolezza, o una sottovalutazione, del limite cui il frame problem allude. Tuttavia, per non rischiare di incorrere nell’atteggiamento argomentativo fallace di costruirsi un nemico ad hoc, voglio avanzare una distinzione di massima tra i fautori di questo approccio. Esistono, infatti, due versioni del neurosimbolismo che è opportuno tenere distinte, perché la prima è a mio parere teoricamente infondata, mentre la seconda è non solo accettabile ma descrive accuratamente la situazione cognitiva tanto degli esseri umani quanto dei sistemi di IA agentivi come Claude Code.
Il neurosimbolismo forte, la posizione che Marcus rivendica come propria, sostiene che un sistema cognitivo genuinamente capace debba avere nel suo nucleo moduli simbolici che svolgono il lavoro cognitivo vero: il ragionamento, l’inferenza, la pianificazione, la gestione della conoscenza. In questa prospettiva, il componente sub-simbolico svolge funzioni ancillari di percezione, pre-classificazione, o elaborazione del segnale grezzo, mentre il modulo logico-formale opera con il “linguaggio della mente” per realizzare i processi cognitivi di ordine superiore. Questa posizione è, a mio avviso, teoricamente infondata per le ragioni esposte nelle sezioni precedenti: il frame problem e le aporie correlate mostrano che un kernel logico-formale non può costituire la base della cognizione generale senza incorrere in difficoltà strutturali irrisolvibili, e il successo empirico dei sistemi neurali mostra che quelle difficoltà non erano contingenti ma riflettevano un errore di principio.
Il neurosimbolismo debole sostiene invece che il simbolico si colloca come supporto esteso della cognizione, come è avvenuto per l’intelligenza naturale umana dopo l’acquisizione del linguaggio e, in modo massivo, dopo l’invenzione delle registrazioni esterne sistematiche e delle tecnologie culturali. In questa prospettiva, il kernel cognitivo non è simbolico: la cognizione è un processo probabilistico distribuito, sia nell’intelligenza naturale umana — certamente più complessa e ricca di quella delle reti neurali artificiali attuali, ma non qualitativamente diversa nel tipo di computazione che la realizza — sia nei sistemi di IA basati su architetture neurali. Gli strumenti simbolici, dalla scrittura alla logica formale ai sistemi di verifica automatica, si collocano nella sfera degli strumenti cognitivi estesi: essi amplificano le capacità del sistema cognitivo centrale per compiti che eccedono le sue capacità native, ma non ne modificano la natura computazionale di fondo.

Un sistema agentivo come Claude Code, in questa prospettiva, non è un sistema neurosimbolico in senso forte: è un sistema neurale, il modello linguistico, dotato di scaffolding operativo esteso: il cosiddetto harness, i file di memoria, gli strumenti eseguibili. Si tratta di estensioni operative che amplificano le capacità agentive del modello senza modificarne il nucleo cognitivo. La distinzione di ruoli all’interno del sistema è essenziale: il modello ragiona, l’interfaccia agentica esegue, la memoria esterna in forma di file Markdown e skill garantisce la persistenza di conoscenze e competenze, gli strumenti ampliano le capacità operative.
Mente estesa e inferenza materiale: ulteriori scaffolding concettuali
Un modo teoricamente produttivo di caratterizzare il neurosimbolismo debole è legarlo alle teorie sulla mente estesa, formulate inizialmente da Andy Clark e David Chalmers nel loro ormai classico articolo del 1998 (Clark e Chalmers 1998), e successivamente approfondite in particolare da Clark in Natural-Born Cyborgs (Clark 2003), nonché ampliate da altri filosofi e teorici in direzioni che in parte meritano discussione critica.
Nella versione originale di Clark e Chalmers, la tesi fondamentale è che i processi mentali che costituiscono la cognizione non sono confinati entro i limiti della scatola cranica ma si estendono nell’ambiente, nella misura in cui oggetti e sistemi esterni svolgono funzioni cognitive che, se fossero realizzate internamente, non esiteremmo ad attribuire alla mente stessa. L’argomento si fonda sulla nozione di “accoppiamento attivo”: quando un agente cognitivo si accoppia in modo stabile e affidabile con un componente esterno, il sistema cognitivo rilevante è l’insieme accoppiato, non il componente neurale isolato.
Questa tesi è compatibile con il neurosimbolismo debole, ma richiede una precisazione che nelle trattazioni correnti della mente estesa non è articolata con sufficiente chiarezza: all’interno del sistema accoppiato, i ruoli e le funzioni non sono equivalenti. Vi è una asimmetria funzionale irriducibile tra il sistema che pensa e gli strumenti che estendono quel pensiero. Il matematico che usa Lean per verificare una dimostrazione sta ancora facendo matematica: la competenza cognitiva che guida la formalizzazione risiede nel matematico, non in Lean. Lean è uno strumento di verifica e di esecuzione, non una componente del processo inferenziale che ha prodotto la congettura, identificato la strategia dimostrativa, e compreso perché il teorema è vero. Lean amplifica le capacità del matematico per il compito specifico della verifica formale, che eccede le capacità della mente non assistita, ma non modifica il tipo di processo cognitivo che il matematico realizza. La stessa struttura vale per Claude Code: il modello decide quale strumento invocare, come interpretare il risultato, come procedere nell’iterazione successiva. Lo harness, i file CLAUDE.md, i resoconti sull’uso degli strumenti sono componenti operative di una cognizione distribuita ma governata da un nucleo cognitivo.
Un’ultima considerazione teorica rafforza l’argomento contro il neurosimbolismo forte. Robert Brandom, nel suo Making It Explicit (1994) e nel più accessibile Articulating Reasons (2000), ha elaborato la nozione di inferenza materiale come alternativa all’idea che il ragionamento sia riducibile a inferenza formale. Un’inferenza materiale è un’inferenza la cui correttezza dipende dal contenuto dei concetti in gioco, non dalla forma logica dell’argomento. L’inferenza da “sta piovendo” a “le strade saranno bagnate” è corretta in virtù del contenuto dei concetti di pioggia e bagnato, non in virtù di una forma logica che la contiene come istanza: non vi è alcuna premessa nascosta che, se resa esplicita, trasformi questa inferenza in un’istanza di modus ponens.
Questa prospettiva ha implicazioni dirette per la questione del neurosimbolismo. Il ragionamento naturale, sia quello umano sia quello di un sistema che voglia replicarlo in modo funzionalmente adeguato, non è riducibile a un sistema di regole formali perché la sua normatività è immanente alle pratiche sociali e linguistiche, contestuale, rivedibile e sensibile a relazioni materiali tra contenuti che nessun sistema assiomatico può catturare in modo esaustivo. È precisamente per questa ragione che gli LLM mostrano una competenza nel ragionamento contestuale che i sistemi simbolici classici non hanno mai raggiunto: essi operano con rappresentazioni distribuite che catturano, in modo approssimativo ma funzionalmente efficace, le relazioni materiali tra concetti che Brandom descrive come il tessuto del ragionamento discorsivo. La logica formale, in questa prospettiva, non è la base della cognizione ma uno strumento cognitivo sviluppato culturalmente per rendere esplicite e verificabili le inferenze in domini specifici. Come tale, essa appartiene alla sfera degli strumenti cognitivi estesi descritti dal neurosimbolismo debole: amplifica le capacità del sistema cognitivo centrale per compiti che richiedono precisione e verificabilità formale, ma non ne costituisce il substrato.
Conclusione
La comunicazione su Claude Code di Marcus da cui siamo partiti è tecnicamente erronea. Ma l’errore è filosoficamente sintomatico, perché rivela la struttura soggiacente di una posizione teorica più generale che, a mio parere, è concettualmente errata e rischia di replicare errori del passato. Quello che ho chiamato neurosimbolismo forte (la tesi che un sistema di IA genuinamente cognitivo debba avere nel suo nucleo un kernel logico-formale) è infondata sia empiricamente sia teoricamente. Empiricamente, il successo degli LLM ha dimostrato che competenze cognitive basate sul linguaggio, compreso il ragionamento matematico, possono emergere da sistemi radicalmente non simbolici. Teoricamente, il frame problem e le aporie correlate mostrano che un kernel logico-formale non può costituire la base della cognizione generale senza incorrere in difficoltà strutturali irrisolvibili: la rilevanza contestuale, la persistenza dei fluenti non modificati, la gestione del senso comune non sono problemi tecnici che attendono soluzioni migliori, ma manifestazioni di una incompatibilità di fondo tra il formato delle rappresentazioni formali e il funzionamento della cognizione in ambienti complessi, incompatibilità che vale tanto per gli esseri umani quanto per qualsiasi agente artificiale che aspiri a operare in modo efficace in un ambiente complesso.
Riferimenti bibliografici
Brandom, Robert B. 1994. Making It Explicit: Reasoning, Representing, and Discursive Commitment. Cambridge, MA: Harvard University Press.
Brandom, Robert B. 2000. Articulating Reasons: An Introduction to Inferentialism. Cambridge, MA: Harvard University Press.
Clark, Andy. 2003. Natural-Born Cyborgs: Minds, Technologies, and the Future of Human Intelligence. Oxford: Oxford University Press.
Clark, Andy, e David J. Chalmers. 1998. «The Extended Mind». Analysis 58 (1): 7–19.
Dennett, Daniel C. 1984. «Cognitive Wheels: The Frame Problem of AI». In Minds, Machines and Evolution: Philosophical Studies, a cura di Christopher Hookway, 129–151. Cambridge: Cambridge University Press.
Fodor, Jerry. 1975. The Language of Thought. Cambridge, MA: Harvard University Press.
Fodor, Jerry A. 1983. The Modularity of Mind. Cambridge, MA: MIT Press.
Fodor, Jerry A. 2000. The Mind Doesn’t Work That Way: The Scope and Limits of Computational Psychology. Cambridge, MA: MIT Press.
Harnad, Stevan. 1990. «The Symbol Grounding Problem». Physica D 42: 335–46.
Kahneman, Daniel. 2011. Thinking, Fast and Slow. London: Allen Lane.
Lenat, Douglas B. 1995. «CYC: A Large-Scale Investment in Knowledge Infrastructure». Communications of the ACM 38 (11): 33–38. https://doi.org/10.1145/219717.219745.
Liu, Jiacheng, Xiaohan Zhao, Xinyi Shang, e Zhiqiang Shen. 2026. «Dive into Claude Code: The Design Space of Today’s and Future AI Agent Systems». Versione 1. Preprint, arXiv. https://doi.org/10.48550/ARXIV.2604.14228.
Marcus, Gary. 2020. «The Next Decade in AI: Four Steps Towards Robust Artificial Intelligence». Versione 3. Preprint, arXiv. https://doi.org/10.48550/ARXIV.2002.06177.
Marcus, Gary. 2026. «The Biggest Advance in AI Since the LLM». Communications of the ACM, 13 aprile 2026. https://cacm.acm.org/blogcacm/the-biggest-advance-in-ai-since-the-llm/.
Marcus, Gary F. 2001. The Algebraic Mind: Integrating Connectionism and Cognitive Science. Cambridge, MA: MIT Press.
McCarthy, John, e Patrick J. Hayes. 1969. «Some Philosophical Problems from the Standpoint of Artificial Intelligence». In Machine Intelligence 4, a cura di B. Meltzer e D. Michie, 463–502. Edinburgh: Edinburgh University Press.
Rescorla, Michael. 2024. «The Language of Thought Hypothesis». In The Stanford Encyclopedia of Philosophy, Summer 2024, a cura di Edward N. Zalta e Uri Nodelman. Stanford: Metaphysics Research Lab, Stanford University. https://plato.stanford.edu/archives/sum2024/entries/language-thought/.
Shanahan, Murray. 1997. Solving the Frame Problem: A Mathematical Investigation of the Common Sense Law of Inertia. Cambridge, MA: MIT Press.
Winograd, Terry. 1972. «Understanding Natural Language». Cognitive Psychology 3 (1): 1–191. https://doi.org/10.1016/0010-0285(72)90002-3.
Yao, Shunyu, Jeffrey Zhao, Dian Yu, Nan Du, Izhak Shafran, Karthik R. Narasimhan, e Yuan Cao. 2022. «ReAct: Synergizing Reasoning and Acting in Language Models». In The Eleventh International Conference on Learning Representations.

