Abstract – Uno studio su Nature suggerisce che nei dendriti corticali esistano segnali locali di errore, specifici per neurone, simili per funzione ai gradienti del deep learning. Utilizzando un’interfaccia cervello-computer con funzione di errore definita sperimentalmente, i ricercatori mostrano che l’informazione sull’errore viene distribuita in modo strutturato e differenziato. Il cervello non esegue la backpropagation classica, ma potrebbe implementarne un principio fondamentale. Un risultato che riavvicina neuroscienze e intelligenza artificiale.
Per decenni una delle principali obiezioni rivolte al deep learning è stata la sua scarsa plausibilità biologica. L’algoritmo di retropropagazione dell’errore, cuore dell’apprendimento nelle reti neurali artificiali, distribuisce all’indietro lungo la rete un segnale matematico che indica a ogni unità in che misura ha contribuito all’errore finale. È una procedura estremamente efficace, ma è sempre sembrata difficilmente compatibile con il funzionamento reale del cervello.
Un articolo pubblicato su Nature da Valerio Francioni e colleghi https://www.nature.com/articles/s41586-026-10190-7 offre ora evidenze sperimentali che suggeriscono l’esistenza, nei dendriti corticali, di segnali istruttivi specifici per singolo neurone, comparabili per struttura funzionale ai gradienti di errore delle reti artificiali. In sostanza, sembra che il cervello possieda un meccanismo biologico per distribuire l’informazione di errore in modo differenziato, cellula per cellula.
Quello che sta sullo sfondo è noto come credit assignment problem, il problema di attribuzione. Se un sistema composto da migliaia o milioni di elementi produce un errore, come stabilire quali componenti ne sono responsabili e in quale misura? Senza una risposta a questa domanda, l’apprendimento complesso diventa inefficiente o impossibile.
Una funzione di errore definita sperimentalmente
Uno dei limiti storici nello studio biologico dell’“assegnazione del credito” è che nel cervello naturale la funzione di errore non è esplicitamente accessibile all’osservatore. Non sappiamo con precisione quale combinazione di attività neuronali venga valutata come corretta o scorretta dal sistema. Per superare questo ostacolo, gli autori hanno utilizzato una interfaccia cervello-computer. Sono stati addestrati topi capaci di controllare l’orientamento di uno stimolo visivo modulando l’attività di due gruppi distinti di neuroni nella corteccia retrospleniale. L’attività di un gruppo ruotava lo stimolo in una direzione, quella dell’altro gruppo nella direzione opposta. Il target era definito sperimentalmente, così come la regola che determinava la ricompensa.
In questo modo la funzione di errore diventa una mappatura esplicita tra attività neurale e successo del compito. Il sistema viene messo nella condizione di ottimizzare una funzione formalmente nota. Per la prima volta si può chiedere se e come il cervello distribuisca localmente l’informazione relativa a quella funzione.
Il ruolo dei dendriti: una segregazione spaziale dell’errore
Un’ipotesi teorica, sviluppata negli ultimi anni in neuroscienze computazionali, sostiene che il cervello possa separare informazione “in avanti” e informazione di errore non nel tempo ma nello spazio. Nei modelli artificiali, il segnale di errore viene calcolato in un momento distinto rispetto all’attivazione. Nel cervello questo tipo di separazione temporale è difficile da giustificare. I neuroni piramidali corticali, tuttavia, hanno una struttura compartimentata. Il soma, il corpo cellulare, riceve principalmente input di tipo feedforward. I dendriti apicali, ramificazioni distali che si estendono verso la superficie corticale, ricevono in larga misura input di feedback provenienti da altre aree. L’idea è che questi compartimenti possano svolgere funzioni computazionali diverse.
Gli autori dello studio, svolto nel laboratorio di Mark Harnett, al McGovern Institute for Brain Research del MIT, hanno registrato simultaneamente l’attività del soma e quella dei dendriti apicali. Hanno osservato che, pur verificandosi spesso eventi coincidenti nel tempo, l’ampiezza relativa della risposta dendritica rispetto a quella somatica varia in modo sistematico. Questa differenza, chiamata “residuo somato-dendritico” può essere prevista in parte dall’attività della rete circostante e contiene informazione che non è riducibile alla sola attività del soma. In termini più semplici, il dendrite non replica passivamente ciò che accade nel corpo del neurone ma introduce una modulazione che riflette lo stato globale della rete e la dinamica del compito.
Segnali firmati e specifici per neurone
Il risultato più significativo emerge quando si analizza il comportamento del residuo dendritico in relazione all’errore del compito. I due gruppi di neuroni controllavano lo stimolo in direzioni opposte. Se l’errore diminuiva, l’attività dendritica risultava relativamente amplificata in un gruppo e attenuata nell’altro. Quando l’errore aumentava, la relazione si invertiva. Questo significa che il segnale non è globale. Non è un semplice “bene” o “male” diffuso uniformemente. È differenziato e con segno opposto secondo il contributo causale del neurone alla prestazione richiesta. In termini matematici, si comporta come un gradiente firmato: indica in quale direzione modificare l’attività per migliorare il risultato.
Un ulteriore elemento interessante è che il segnale dendritico sembra correlare con la variazione dell’errore nel tempo, cioè con la sua derivata, più che con l’errore statico. Ciò lo avvicina a forme biologicamente plausibili di apprendimento basato su obiettivi, senza implicare che il cervello implementi la retropropagazione classica.
La prova causale: interrompere il segnale interrompe l’apprendimento
Per verificare che questi segnali non siano semplici correlati epifenomenici, gli autori hanno manipolato l’attività dei dendriti attivando specifici interneuroni inibitori nello strato superficiale della corteccia. Questa manipolazione riduce selettivamente l’elaborazione nei dendriti apicali. In questo caso, l’informazione su errore e ricompensa non è più decodificabile dal residuo dendritico e l’apprendimento del compito si blocca. Si osserva così la perdita di un segnale strutturato che sembra necessario per il miglioramento della prestazione.
Che cosa resta aperto
Molte questioni rimangono comunque irrisolte. Non è ancora chiaro se i segnali dendritici siano generati localmente attraverso circuiti ricorrenti oppure trasmessi da aree corticali superiori. Il ruolo della modulazione dopaminergica, già implicata nell’apprendimento basato sulla ricompensa, deve essere chiarito in questo contesto. Non sappiamo se il meccanismo osservato si estenda a compiti più complessi o a gerarchie corticali multiple.
Resta anche aperta la questione algoritmica. I segnali osservati corrispondono a una vera propagazione multilivello dell’errore oppure a una forma locale di approssimazione? Si tratta di un meccanismo impiegato solo durante l’apprendimento o anche durante l’esecuzione online del comportamento? Infine, occorre comprendere in che misura questa organizzazione dendritica possa ispirare nuove architetture artificiali. Se il neurone biologico integra compartimenti funzionalmente distinti, l’astrazione di un’unità puntiforme potrebbe essere troppo povera per catturare la potenza computazionale della corteccia.
Un possibile cambio di paradigma
Il risultato centrale dello studio non consiste nell’aver dimostrato che il cervello esegue la retropropagazione. Consiste nell’aver mostrato che esiste un meccanismo biologico in grado di distribuire segnali di insegnamento specifici per neurone, coerenti con la struttura causale del compito.
Il problema dell’“assegnazione del credito”, per lungo tempo considerato un limite delle analogie tra reti artificiali e cervello, entra così in una nuova fase. Non è più soltanto una questione ingegneristica né una metafora neuroscientifica. È un problema empirico con una soluzione parziale osservabile a livello subcellulare.
Se questa linea di ricerca verrà confermata e ampliata, il dialogo tra neuroscienze, intelligenza artificiale e filosofia della mente dovrà essere riformulato su basi più integrate. Il cervello potrebbe non implementare la matematica della backpropagation, ma sembra condividere con essa un principio fondamentale: l’apprendimento efficace richiede che l’errore venga distribuito localmente in modo strutturato.
Conseguenze per l’intelligenza artificiale
Per chi lavora nell’ambito dell’intelligenza artificiale, questo studio tocca uno dei nodi teorici più discussi degli ultimi decenni: la plausibilità della retropropagazione dell’errore.
La retropropagazione, nella sua formulazione matematica classica, richiede simmetrie e calcoli differenziali che sembrano difficili da attribuire a un tessuto biologico. Lo studio qui discusso rende meno plausibile l’idea che il cervello operi soltanto con segnali globali e indistinti. Se nei dendriti esistono segnali firmati, specifici per neurone, che riflettono il contributo causale di ciascuna unità alla riduzione dell’errore, allora il principio fondamentale della retropropagazione — la distribuzione locale e differenziata dell’informazione di errore — non è più biologicamente inverosimile in linea di principio. Non è necessario che il cervello implementi l’algoritmo di Rumelhart e Hinton; è sufficiente che realizzi un meccanismo funzionalmente equivalente nella sua struttura informazionale.
Un secondo punto riguarda la concezione del neurone. Nei modelli artificiali standard, l’unità è spesso trattata come un nodo puntiforme che applica una funzione non lineare a una somma pesata di input. I dati presentati in questo studio rafforzano invece l’immagine del neurone biologico come entità multilivello, dotata di compartimenti funzionalmente distinti. Il soma e i dendriti apicali non svolgono la stessa operazione; integrano flussi informativi diversi e possono contribuire in modo differenziato all’apprendimento. Questo suggerisce che una maggiore attenzione a modelli di neurone a compartimenti multipli potrebbe aprire nuove strade nella progettazione di reti artificiali più espressive e forse più efficienti.
Un terzo elemento riguarda l’architettura. Nei modelli artificiali, la separazione tra informazione in avanti e informazione di errore è ottenuta tipicamente nel tempo: prima si calcola l’output, poi si calcola il gradiente. Nel cervello, secondo l’ipotesi sostenuta da Francioni e colleghi, la separazione è spaziale: feedforward e feedback sono instradati in compartimenti distinti della stessa cellula. Questo mostra che alcune difficoltà attribuite alla plausibilità biologica degli algoritmi derivano forse da un confronto troppo stretto tra architetture diverse.
Infine, lo studio osserva durante l’apprendimento una dinamica di progressiva “sparsificazione”, cioè una riduzione selettiva dell’attività di alcune popolazioni neuronali. Questo dato suggerisce che il sistema non ottimizza soltanto la performance rispetto al compito, ma tende anche a una configurazione più parsimoniosa dal punto di vista energetico. In un’epoca in cui i costi computazionali dei modelli di intelligenza artificiale sono crescenti, il fatto che il cervello, com’è noto su scala macro, integri ottimizzazione funzionale ed efficienza energetica nella stessa dinamica di apprendimento rappresenta un punto di grande interesse.
Implicazioni filosofiche: normatività, struttura e continuità
Le implicazioni riguardano in primo luogo la naturalizzazione della normatività. In filosofia della mente, parlare di errore, di correttezza o di adeguatezza rispetto a uno scopo implica introdurre una dimensione normativa. Spesso questa dimensione è interpretata come una descrizione esterna, attribuita dall’osservatore. Qui, invece, la funzione di costo è definita esplicitamente e il sistema neurale sembra accedervi a livello subcellulare. Un singolo neurone riceve un segnale che riflette il suo contributo alla riduzione dell’errore globale. Questo significa che la distinzione tra “giusto” e “sbagliato”, rispetto al compito, è implementata attraverso meccanismi locali e fisicamente realizzati. La normatività non rimane soltanto un concetto descrittivo, ma assume una forma operativa nel tessuto biologico.
Una seconda questione concerne l’opposizione tradizionale tra apprendimento puramente associativo e apprendimento orientato a obiettivi. L’idea che il cervello apprenda soltanto attraverso meccanismi hebbiani locali, basati sulla coincidenza di attività, viene messa in discussione dall’evidenza di segnali strutturati di errore. Se esistono segnali che riflettono la prestazione globale e che sono distribuiti in modo differenziato ai singoli neuroni, allora il sistema non è riducibile a una semplice accumulazione di associazioni. È organizzato in modo tale da integrare informazione globale con modificazioni locali. Questo ridimensiona una contrapposizione talvolta rigida tra modelli simbolici orientati a obiettivi e modelli neurali considerati puramente statistici.
Infine, emerge una questione di continuità teorica tra apprendimento biologico e apprendimento artificiale. Se meccanismi simili ai gradienti, cioè variazioni locali proporzionali al contributo causale di ciascuna unità, compaiono in sistemi biologici, allora il deep learning non appare più come una costruzione puramente ingegneristica priva di ancoraggio naturale. Potrebbe intercettare principi computazionali più generali, che si manifestano in forme diverse in substrati differenti.
È probabile che molte delle questioni aperte richiederanno anni di lavoro sperimentale e teorico. Tuttavia, sembra acquisito è che il problema dell’“assegnazione del credito” non appartiene più esclusivamente al dominio dell’ingegneria delle reti artificiali. Ha una dimensione biologica osservabile. Il punto è che il principio strutturale del deep learning — distribuire l’errore in modo differenziato e locale — non appare più un artificio ingegneristico privo di plausibilità biologica. E ciò può modificare il modo in cui pensiamo al rapporto tra cervello e intelligenza artificiale.
Redazione Sepai

