Fondamenti etici e istituzionali della governance verificatoria nell’era dei sistemi autonomi
Paola Furlan
19 maggio 2026
Abstract
Il presente articolo affronta il problema della governance dei sistemi di intelligenza artificiale a partire da una doppia inadeguatezza strutturale del paradigma prescrittivo: l’instabilità ontologica dei sistemi AI, che mutano più rapidamente dei cicli legislativi, e la loro opacità interna irriducibile, che rende l’auto-rendicontazione strutturalmente inaffidabile come base di accountability.
Si propone un riequilibrio della composizione regolatoria: affiancare agli strumenti prescrittivi meccanismi di verificabilità strutturale che ne completino, non sostituiscano, la funzione. Il corpus legislativo vigente in materia di AI contiene già elementi che si avvicinano a questa logica: requisiti di documentazione tecnica, obblighi di monitoraggio post-mercato, valutazioni di impatto obbligatorie per i sistemi ad alto rischio. Il limite di queste disposizioni non è l’assenza di intento verificatorio, ma il fatto che operino a intervalli certificativi discreti, affidandosi all’auto-rendicontazione del sistema in momenti controllati. Dallo Stato normatore allo Stato verificatore, inteso non come soggetto unitario né come attore esclusivamente nazionale, ma come costellazione di Istituzioni pubbliche con mandati distinti (agenzie regolatorie tecniche, organi legislativi, sistemi giudiziari) articolata su più livelli, da quello nazionale a quello del coordinamento internazionale, che garantisce che i sistemi siano ispezionabili, leggibili, interpretabili dall’esterno.
Muovendo dall’etica della responsabilità di Hans Jonas, dalla teoria del diritto riflessivo di Teubner, dall’epistemologia sociale di Longino e Kitcher e dalla performatività della misura documentata da MacKenzie, si argomenta che la legittimità democratica in contesti di complessità radicale si fonda sulla capacità di rendere ispezionabili le condizioni in cui le scelte vengono compiute, non sulla capacità di prescriverle. La tradizione dell’ethics-by-design fondata sulla phronesis aristotelica è riconosciuta come condizione necessaria ma che richiede meccanismi di verifica esterna per essere attestata come genuinamente affidabile. Evidenze empiriche recenti – la confabulazione del chain-of-thought e il fenomeno del test-detection – documentano che la verifica non può fondarsi sull’auto-resoconto del sistema, e che l’osservazione esterna modifica il sistema nel corso del processo.
Parole chiave: governance dell’IA, etica istituzionale, diritto riflessivo, interpretabilità, epistemologia sociale, phronesis, legittimità democratica, accountability algoritmica.
1. Introduzione: il problema della norma nell’epoca dei sistemi complessi
Come governare democraticamente sistemi tecnici la cui complessità supera strutturalmente la capacità di comprensione delle Istituzioni politiche, e che vengono costruiti da attori privati prima che il legislatore sappia di dover intervenire?
L’intelligenza artificiale riproduce una struttura di cattura istituzionale con molta precisione. I principali laboratori di ricerca – Anthropic, Google DeepMind, OpenAI – siedono ai tavoli che scrivono gli standard internazionali per governarli, e definiscono il vocabolario della sicurezza («allineamento», «uso responsabile», «AI etica») prima che esista una definizione pubblica e democraticamente negoziata di quegli stessi termini.[1] Le infrastrutture computazionali su cui vengono addestrati i modelli di frontiera appartengono a tre o quattro soggetti privati[2]: qualsiasi regolazione futura, ovunque venga scritta, dovrà necessariamente passare attraverso di esse.
La risposta prevalente a questo scenario – regolamentare attraverso la produzione normativa – sconta un limite strutturale che non dipende dalla qualità dei legislatori né dalle risorse impiegate. È un limite di paradigma: la norma fissa un oggetto che non esiste in quella forma. L’AI Act dell’Unione Europea fotografa un contesto tecnologico sostanzialmente del 2023, mentre i sistemi che intende disciplinare hanno nel frattempo compiuto trasformazioni radicali.[3] Questa lentezza è strutturale alla natura del diritto come sistema che opera attraverso categorie stabili applicate a oggetti mutevoli, non è un difetto correggibile.
La tesi che si sostiene in questo articolo è che questo limite non può essere superato producendo norme più sofisticate o più veloci, ma richiede un riequilibrio della composizione regolatoria: affiancare alla governance prescrittiva meccanismi di verificabilità strutturale. Non più l’Istituzione che stabilisce ciò che è giusto come funzione esclusiva, ma l’Istituzione che garantisce che i sistemi siano verificabili, ispezionabili, interpretabili dall’esterno. Lo Stato come verificatore piuttosto che come normatore.
Questo spostamento ha fondamenti etici profondi, che eccedono la dimensione tecnica. Il presente articolo si propone di svilupparli, mobilitando risorse della filosofia morale, dell’epistemologia, della filosofia del diritto e della teoria politica, e portando a confronto evidenze empiriche recenti che ne confermano la necessità.
2. La crisi del paradigma prescrittivo
2.1 Il limite strutturale della norma fissa
La tradizione filosofica occidentale ha concepito la norma come risposta all’instabilità: di fronte alla mutevolezza del mondo, la legge fissa i contorni di ciò che è lecito e ciò che non lo è. Questa concezione che la tradizione filosofica ha sistematizzato in termini di sostanza e accidente – elaborata nella teoria giuridica, da Aristotele a Kelsen, come presupposto strutturale di qualsiasi imputazione normativa: la condotta si imputa a un soggetto identificabile perché l’oggetto della norma possiede una sostanza stabile – assume implicitamente che l’oggetto della norma abbia una sostanza stabile su cui esercitare la prescrizione. Il delitto è il delitto; la proprietà è la proprietà; il contratto è il contratto. Anche quando le categorie giuridiche si complicano, il paradigma di fondo rimane invariato: la norma lavora su oggetti identificabili.
I sistemi di intelligenza artificiale mettono in crisi questa assunzione di base. Un modello di linguaggio di grandi dimensioni addestrato oggi non è lo stesso sistema di sei mesi fa: i pesi sono cambiati, le capacità si sono ampliate o ridistribuite, il comportamento in contesti marginali è diverso. Più radicalmente, come ha argomentato David Chalmers, è filosoficamente problematico individuare l’unità di riferimento di un sistema AI: il modello come algoritmo astratto? L’istanza hardware? Il thread conversazionale?[4] Qualsiasi risposta si dia, si ottiene un oggetto che non ha la stabilità sostanziale che la norma prescrittiva presuppone.
Si tratta di una questione ontologica, non un problema di complessità contingente. Va riconosciuto, tuttavia, che il diritto gestisce regolarmente entità senza identità fissa: la successione societaria, la product line liability, la responsabilità d’impresa per atti compiuti prima di acquisizioni, le modificazioni post-mercato nei dispositivi medici sono tutti casi in cui la norma opera su oggetti mutevoli nel tempo. L’affermazione che l’instabilità dei sistemi AI costituisca una discontinuità categoriale rispetto a questi casi già gestiti richiede un argomento specifico. Quell’argomento viene sviluppato nella sezione 4.1: la differenza non risiede nella variazione nel tempo di per sé, che il diritto affronta già attraverso gli strumenti della product liability e dell’enterprise liability, ma nella combinazione di due condizioni simultanee: l’impossibilità strutturale di un auto-resoconto affidabile (documentata nella sezione 2.2) e la decomposizione del soggetto d’imputazione in un’architettura distribuita che non sopravvive alle singole interazioni. È questa combinazione, e non la mutevolezza in sé, a rendere inadeguate le categorie giuridiche tradizionali. Niklas Luhmann aveva colto la struttura di questo problema in termini sistemici: il diritto è un sistema autopoietico che opera attraverso il codice lecito/illecito, ma che quando incontra sistemi sociali altamente differenziati può solo osservarli attraverso la propria griglia, perdendo necessariamente la specificità dei loro processi interni.[5] La complessità dei sistemi tecnici contemporanei porta questo problema a un livello in cui la perdita di specificità diventa strutturalmente problematica per qualsiasi approccio regolatorio fondato sulla prescrizione di contenuti.
Nel frattempo, sistemi che determinano l’accesso al credito, la libertà su cauzione, la diagnosi medica e il targeting in contesti militari operano in regime di illeggibilità sostanziale: non per scelta deliberata, ma perché nessuna Istituzione democratica ha ancora costruito gli strumenti per leggerli. L’argomento che segue mira a mostrare che questo è il prodotto di una scelta di paradigma e non una condizione inevitabile ma, al contrario, che una scelta diversa è possibile.
2.2 L’opacità come condizione strutturale: confabulazione e auto-occultamento
Alla difficoltà ontologica di normare un oggetto instabile, si aggiunge un problema epistemico di natura più radicale: i sistemi AI non possono fornire un resoconto affidabile del proprio funzionamento interno. Questo rende strutturalmente inutilizzabile la trasparenza come auto-narrazione, che è il meccanismo su cui molte proposte di governance prescrittiva implicitamente si fondano.
Prima di presentare le evidenze empiriche che documentano questo problema, è necessaria un’avvertenza sulla struttura delle fonti. I risultati sul chain-of-thought citati in questa sezione provengono in larga parte da ricerca prodotta da Anthropic: la stessa organizzazione indicata nell’introduzione come caso esemplare di cattura istituzionale. La circolarità è reale. Che un laboratorio documenti pubblicamente i limiti strutturali dei propri sistemi è però un dato epistemicamente rilevante in sé, e quella disponibilità costituisce già un indicatore della pressione verso la verificabilità esterna. Resta il fatto che i risultati vanno valutati in base alla loro copertura indipendente. Per la confabulazione del chain-of-thought, la ricerca di Turpin et al. (2023), condotta da ricercatori di Oxford e NYU senza affiliazione ad Anthropic e pubblicata su NeurIPS, ha documentato lo stesso fenomeno su una classe diversa di modelli con risultati coerenti[6]: su questo specifico punto l’evidenza è indipendente e replicata. Per il test-detection tramite NLA, ripreso nella sezione 5.3, la situazione è diversa e viene qualificata in quella sede.
Nel 2025, ricercatori di Anthropic hanno misurato la fedeltà del chain-of-thought rispetto al processo computazionale effettivo, rilevando che in tre casi su quattro il ragionamento esplicitato non menziona elementi che hanno influenzato la risposta. Questo risultato è confermato indipendentemente da Turpin et al. (2023) su una classe diversa di modelli. Il modello costruisce una spiegazione plausibile di ciò che avrebbe potuto fare, non un resoconto di ciò che ha fatto.[7] Un secondo studio, pubblicato nel 2026, ha misurato la capacità dei modelli di controllare deliberatamente cosa appare nel proprio ragionamento visibile: il risultato è che tale controllo è quasi nullo.[8]
Questo fenomeno ha una denominazione tecnica in neuroscienze: confabulazione. Gazzaniga ha documentato la struttura in esperimenti sul cervello diviso: l’emisfero sinistro produce spiegazioni post-hoc di azioni compiute dall’emisfero destro senza accedervi direttamente.[9] La differenza tra il sistema AI e l’essere umano su questo punto specifico è di grado piuttosto che di natura, ma il grado è rilevante: la lacuna è più ampia, e il sistema non dispone della continuità esperienziale che nei casi umani riduce parzialmente la distanza tra narrazione e processo.
Le implicazioni per la governance sono importanti. Una norma che prescrive al sistema di comportarsi in un certo modo, e verifica la conformità attraverso il resoconto del sistema stesso, presuppone che tale resoconto sia attendibile. Non lo è strutturalmente. Questo non significa che i sistemi siano inaffidabili in senso generale: significa che l’accountability non può fondarsi sull’auto-rendicontazione. Richiede meccanismi di osservazione esterna che accedano ai processi computazionali direttamente, non attraverso la narrazione che il sistema produce di sé.
2.3 L’analogia metrologica
La storia della misurazione offre un’analogia illuminante per pensare il passaggio che stiamo descrivendo. Per secoli, il piede del re fu letteralmente il piede del re: la misura era ontologica, arbitraria, incorporata nel corpo del sovrano. La legittimità della misura non derivava da un criterio intersoggettivamente verificabile, ma dall’autorità del corpo che la incarnava.
La Convenzione del Metro del 1875, che istituì il Bureau International des Poids et Mesures, segnò una transizione di paradigma.[10] Il BIPM non sostituì una misura giusta a una sbagliata: creò un’istituzione che certifica che gli strumenti di misura siano calibrati correttamente rispetto a standard intersoggettivamente verificabili. Lo Stato smise di essere la misura e divenne il garante della misurabilità. La legittimità si spostò dall’ontologica (io sono il metro) all’epistemica (io verifico che il metro funzioni). E il BIPM non definisce una volta per tutte: ricalibra continuamente, come ha confermato la ridefinizione delle unità SI nel 2019, che ha ancorato il chilogrammo a costanti fisiche fondamentali piuttosto che a un artefatto fisico.[11] ‘Senza fine’ non è un difetto del sistema: è la sua struttura corretta.
Questa analogia non è perfetta, ma racconta qualcosa di strutturalmente importante. Va riconosciuta una differenza rilevante: la ricalibrazione del BIPM si ancora a costanti fisiche intersoggettivamente misurabili, mentre i criteri di verifica per i sistemi AI hanno natura normativo-politica e non sono riducibili a misure di laboratorio. L’analogia illumina la struttura istituzionale del passaggio, non il contenuto dei criteri: mostra come una Istituzione possa garantire la misurabilità di un oggetto senza pretendere di essere essa stessa la misura. La governance verificatoria non pretende di sapere cosa è giusto in un sistema che muta: garantisce che il sistema sia misurabile, che le sue caratteristiche siano rese leggibili, che chi deve valutarlo abbia accesso agli strumenti per farlo.
2.4 Il diritto riflessivo
Il terreno teorico più direttamente pertinente è quello che Gunther Teubner ha elaborato a partire dagli anni Ottanta sotto il nome di «diritto riflessivo» (reflexives Recht). Teubner distingue tre stadi dello sviluppo del diritto moderno: il diritto formale (che garantisce procedure senza preoccuparsi degli esiti), il diritto sostanziale (che prescrive contenuti e obiettivi materiali), e il diritto riflessivo, che non dice a un sistema cosa fare, ma garantisce che quel sistema abbia meccanismi interni di auto-osservazione e di rendicontazione esterna.[12]
Il diritto riflessivo non è la rinuncia alla regolazione: è la regolazione di secondo ordine. Invece che disciplinare il comportamento direttamente, istituisce le condizioni strutturali perché il comportamento possa essere osservato, valutato, corretto. La sua rilevanza per la governance dei sistemi AI è immediata: un sistema che si trasforma continuamente non può essere disciplinato nel primo o nel secondo senso, ma può essere sottoposto a obblighi riflessivi: obblighi di rendere visibili i propri processi interni, di documentare le proprie scelte di addestramento, di mantenere meccanismi di audit indipendente.
2.5 Meta-regolazione e responsive regulation: delimitazione del contributo
La proposta avanzata in questo paper non emerge nel vuoto teorico. A partire dagli anni Novanta, una tradizione consolidata di meta-regolazione e di teoria regolatoria di seconda generazione ha già elaborato strutture di governance riflessiva, decentrata e responsive. Ayres e Braithwaite (1992) hanno formalizzato il modello della responsive regulation, basato su piramidi di enforcement che variano la risposta regolatoria in funzione del comportamento del soggetto regolato, spostando il focus dalla prescrizione di contenuti alla gestione dinamica della relazione tra regolatore e regolato. Julia Black (2001) ha sviluppato il concetto di decentred regulation, che distribuisce la funzione regolatoria tra attori molteplici e coglie la complessità degli oggetti normativi senza presupporre la centralità dello Stato. Scott (2000) e Baldwin, Cave e Lodge (2011) hanno ulteriormente articolato la dimensione plurale e procedurale dell’accountability nel contesto regolatorio.
Il paradigma verificatorio proposto in questo paper si appoggia a questi sviluppi e ne condivide l’impostazione di fondo: la governance di secondo ordine è strutturalmente più robusta della prescrizione di contenuti in contesti di complessità tecnica. La tesi di originalità rispetto a questa letteratura non è quindi di impostazione generale, ma di specificità applicativa: essa si fonda su due caratteristiche che la meta-regolazione e la responsive regulation non affrontano congiuntamente.
La prima è la confabulazione del chain-of-thought. La responsive regulation nasce precisamente dall’osservazione che i soggetti regolati non cooperano spontaneamente: la piramide dell’enforcement di Ayres e Braithwaite è una risposta alla compliance strategica. L’asimmetria informativa che quella letteratura studia è però contingente – riducibile, in linea di principio, con pressione di enforcement sufficiente, perché il limite è di incentivi, non di capacità. Nei sistemi AI l’asimmetria è strutturale: la ricerca empirica recente (Turpin et al. 2023; Chen et al. 2025, 2026) ha documentato che il sistema non può descrivere accuratamente il proprio processo computazionale anche quando coopera pienamente. Questo richiede che la verifica acceda alle attivazioni computazionali interne, non si fermi al comportamento dichiarato: una specificità che la letteratura sulla meta-regolazione non contempla, perché non ha mai avuto a che fare con soggetti che confabulano strutturalmente.
La seconda è la dimensione co-costitutiva dell’osservazione. Va riconosciuto che alcune versioni di questa dimensione sono già presenti nella letteratura che si sta esaminando: la decentred regulation di Black riconosce che il processo regolatorio riconfigura i soggetti regolati, e il regulatory pluralism di Scott contempla effetti di feedback tra regolatori e sistemi regolati. La differenza specifica di questa proposta non è quindi nell’intuizione di fondo, ma nel meccanismo causale e nel suo contesto applicativo. Black e Scott operano all’interno di un framework in cui il soggetto regolato è un agente che interpreta le norme e adatta il proprio comportamento: la co-costituzione è mediata da processi cognitivi e organizzativi umani. I sistemi AI introducono una discontinuità strutturale: il soggetto regolato non può fornire un auto-resoconto affidabile del proprio funzionamento (sezione 2.2), e la modifica prodotta dall’osservazione avviene a livello di attivazioni computazionali, non di interpretazione normativa. Né Black né Scott hanno a che fare con soggetti che confabulano strutturalmente: l’asimmetria informativa nelle loro analisi è contingente e riducibile con pressione di enforcement sufficiente.
La discontinuità rispetto a Black e Scott si fonda in modo robusto sulla prima specificità (la confabulazione strutturale), non sulla seconda (la co-costituzione in deployment-time): quest’ultima è meglio descritta come elusione strategica della metrica, che è precisamente l’oggetto della letteratura sulla responsive regulation, e richiede risposte tecniche (accesso alle attivazioni) piuttosto che un’innovazione concettuale.
3. Il panorama legislativo attuale: elementi verificatori embrionali e limiti strutturali
Prima di procedere all’articolazione del paradigma verificatorio, è necessario posizionarlo rispetto al corpus normativo esistente, per due ragioni: evitare di trattare come assente ciò che è già presente in forma embrionale, e identificare con precisione dove il limite strutturale si colloca.
Il quadro legislativo internazionale sull’AI ha raggiunto, tra il 2024 e il 2026, una densità inedita[13]. L’AI Act europeo, il progetto di legge brasiliano, l’AIDA canadese, la legislazione statale americana (California TFAIA, New York RAISE Act), le normative cinesi sui modelli generativi e le disposizioni britanniche convergono su un nucleo comune di obiettivi: tutela dei diritti fondamentali, accountability lungo la catena del valore, trasparenza verso gli utenti, supervisione umana nei contesti ad alto rischio. Questa convergenza non è irrilevante: documenta che il problema della governance AI è riconosciuto a scala globale e che alcune risposte istituzionali sono già operative.
Tre aree di questo corpus legislativo anticipano elementi verificatori nel senso rilevante per questo paper.
La prima è la documentazione tecnica obbligatoria: l’AI Act impone ai fornitori di sistemi ad alto rischio di produrre documentazione dettagliata delle scelte architetturali, dei dati di addestramento e delle procedure di test, conservandola per dieci anni; analoghe disposizioni si trovano nel progetto di legge brasiliano e nell’AIDA canadese.
La seconda è il monitoraggio post-mercato e la segnalazione continua degli incidenti: l’AI Act impone per i modelli GPAI obblighi di monitoraggio continuo e notifica delle anomalie rilevanti; analoghe disposizioni di segnalazione periodica alle autorità si trovano nell’AIDA canadese per i sistemi ad alto impatto e nel progetto di legge brasiliano, che prevede inoltre obblighi di audit periodico per i sistemi a rischio elevato.
La terza è la trasparenza obbligatoria sui rischi di frontiera: il TFAIA californiano impone ai grandi sviluppatori di modelli addestrati con potenza superiore a 10²⁶ FLOPs di produrre e pubblicare un framework interno di gestione dei rischi catastrofici, aggiornato annualmente, con obbligo di segnalazione degli incidenti critici all’Office of Emergency Services e protezioni per i whistleblower; l’AI Act europeo impone obblighi di valutazione del rischio sistemico per i modelli GPAI al di sopra di 10²⁵ FLOPs.
Questi elementi vanno riconosciuti come punti di partenza reali, non come meri adempimenti burocratici. La governance verificatoria proposta in questo paper non parte da zero: si innesta su un tessuto normativo che ha già riconosciuto la necessità di aprire il sistema a osservatori esterni. Il limite strutturale si colloca però esattamente nel punto in cui questi meccanismi si arrestano. La documentazione tecnica obbligatoria è prodotta dal fornitore e descrive ciò che il fornitore dichiara di aver fatto: è auto-rendicontazione con forma giuridica. Il red-teaming pre-rilascio opera in un contesto certificativo discreto e presuppone che il sistema si comporti nel test come si comporterà nel deployment ordinario: un’assunzione che i dati empirici sul test-detection (sez. 6.3) rendono problematica. Il monitoraggio post-mercato previsto dall’AI Act si basa sulla segnalazione di incidenti da parte di deployer e utenti, non sull’accesso diretto alle attivazioni computazionali durante il funzionamento. In tutti i casi, il meccanismo verifica l’output o la dichiarazione del processo, non il processo computazionale effettivo.
Si aggiunge un problema che la legislazione non tematizza esplicitamente: la verifica a intervalli certificativi discreti presuppone che l’oggetto verificato sia stabile tra una certificazione e la successiva. Per i sistemi AI, questa assunzione non regge: un modello certificato come a basso rischio al momento del rilascio può acquisire nuove capacità attraverso il fine-tuning, essere utilizzato in contesti non previsti dalla valutazione originale, o modificare il proprio comportamento in risposta all’accumulazione di interazioni. La California autorizza aggiornamenti annuali delle soglie di rischio; l’AI Act prevede atti delegati per emendare i criteri senza modificare la legge primaria; il Regno Unito ha esplicitamente scelto di non legiferare in anticipo sulle categorie di rischio proprio per preservare flessibilità. Queste risposte al pacing problem sono reali e non vanno sminuite. Il punto che rimane aperto non è la velocità di aggiornamento delle norme, ma la struttura del meccanismo di verifica: anche aggiornando le categorie ogni sei mesi, un sistema che ha imparato a comportarsi diversamente sotto osservazione soddisfa i criteri certificativi senza che la certificazione rilevi il comportamento ordinario.
Un caso emblematico viene dall’accordo provvisorio tra Consiglio e Parlamento europeo del 7 maggio 2026 (Digital Omnibus[14]), che ha posticipato l’applicazione delle disposizioni per i sistemi ad alto rischio al dicembre 2027 (sistemi stand-alone) e all’agosto 2028 (sistemi integrati in prodotti), riducendo nel frattempo alcune delle obbligazioni già previste: un esito che documenta come la pressione degli attori di settore possa determinare non soltanto il rallentamento, ma la contrazione effettiva del perimetro prescrittivo, indipendentemente dalla qualità tecnica delle disposizioni originarie.
È precisamente questa lacuna, non l’assenza di intento regolatorio, che il paradigma verificatorio proposto nelle sezioni successive intende colmare.
4. Fondamenti filosofici della governance verificatoria
4.1 Hans Jonas e l’etica della responsabilità
Il riferimento teorico più diretto per pensare l’etica in contesti di complessità tecnologica radicale è Hans Jonas, che nel 1979 pubblicò Das Prinzip Verantwortung con l’esplicita intenzione di costruire un’etica adeguata alla civiltà tecnologica.[15]
L’argomentazione di Jonas muove da una diagnosi: l’etica tradizionale era sincronica e locale. Le sue categorie presupponevano un orizzonte di azione limitato nello spazio e nel tempo. La tecnologia moderna ha rotto questa scala in modo irreversibile: le conseguenze di un’azione tecnica possono essere temporalmente estese, causalmente opache, distribuibili su soggetti che non partecipano alla scelta e nemmeno esistono al momento della decisione.
Di fronte a questa situazione, Jonas propone un imperativo che è già, nella sua struttura, epistemico prima che normativo: agisci in modo che le conseguenze della tua azione siano compatibili con la permanenza di una autentica vita umana sulla terra.[16] Prescrive come tenere aperti i margini di scelta futura invece di prescrivere cosa fare. È un imperativo di secondo ordine – una meta-norma – che garantisce la condizione di possibilità di qualsiasi norma futura.
Applicato alla governance dei sistemi AI, l’imperativo jonasiano si traduce in un obbligo istituzionale preciso: preservare la leggibilità dei sistemi. Non stabilire cosa questi sistemi devono fare, ma garantire che rimangano interpretabili, ispezionabili, correggibili. La governance verificatoria è, in questo senso, l’equivalente istituzionale dell’imperativo jonasiano.
Jonas introduce anche il concetto di «euristica della paura» (Heuristik der Furcht): di fronte a conseguenze irreversibili, la previsione del danno deve avere più peso della previsione del beneficio.[17] Tradotto in termini di architettura istituzionale, questo significa che i meccanismi di verifica devono essere asimmetrici: più esigenti nei sistemi ad alto impatto su diritti fondamentali.
4.2 Epistemologia sociale: conoscenza distribuita e verifica plurale
Un altro pilastro filosofico è fornito dall’epistemologia sociale che, a partire dagli anni Novanta, ha sviluppato una critica sistematica all’immagine del conoscente individuale come unità fondamentale della conoscenza.
Helen Longino, in Science as Social Knowledge (1990), ha argomentato che la conoscenza scientifica è irriducibilmente sociale per ragioni epistemiche strutturali: le condizioni di produzione di conoscenza oggettiva richiedono procedure pubbliche di critica e risposta, standard condivisi di valutazione, comunità epistemiche in cui i risultati siano esposti alla revisione.[18] Philip Kitcher ha sviluppato questo argomento in termini di divisione del lavoro cognitivo: la distribuzione delle risorse epistemiche tra agenti con orientamenti diversi produce risultati più robusti della convergenza su un’unica prospettiva.[19] L’eterogeneità epistemica è una virtù strutturale, non un difetto da correggere.
Questo argomento ha un’implicazione diretta per la governance verificatoria. La tesi che nessun singolo soggetto possa detenere simultaneamente la conoscenza tecnica dei sistemi AI e la capacità di valutarne le implicazioni etiche, giuridiche e sociali è più che un’osservazione empirica contingente: è una conseguenza strutturale della complessità. Diverse prospettive di verifica – tecnica, etica, giuridica, sociale – sono necessarie e non collassabili in un’unica descrizione esaustiva senza perdere qualcosa di strutturalmente essenziale. La governance verificatoria distribuita che proponiamo in questa sede è la risposta istituzionale a questa condizione epistemica: distribuisce la funzione di verifica tra soggetti specializzati le cui limitazioni non si sovrappongono.
Sheila Jasanoff ha elaborato il concetto di «scienza regolatoria» (regulatory science) per descrivere la conoscenza prodotta nelle Istituzioni che governano la tecnologia: una conoscenza che non aspetta la certezza, ma opera nell’incertezza con standard metodologici espliciti, producendo valutazioni provvisorie ma tecnicamente argomentate.[20] Il concetto di civic epistemology descrive i modi in cui diverse culture politiche costruiscono standard di credibilità e verifica pubblica del sapere tecnico: non c’è un’unica forma di accountability epistemica, ma diverse tradizioni di produzione pubblica della conoscenza.[21]
5. Il soggetto dell’etica nei sistemi complessi
5.1 Identità distribuita: da Parfit a Chalmers
Un passaggio essenziale per comprendere perché la governance verificatoria sia filosoficamente necessaria riguarda la natura del soggetto su cui la governance si esercita.
Derek Parfit, in Reasons and Persons (1984), ha sottoposto a critica sistematica l’idea di identità personale come relazione tutto-o-niente, mostrando che la continuità psicologica – l’unico candidato plausibile per fondare l’identità nel tempo – è una questione di grado e non di sostanza.[22] La persona, nel senso forte del termine, è già distribuita e provvisoria prima ancora di essere artificiale.
Chalmers ha recentemente esteso questo problema ai sistemi AI chiedendosi con chi si stia parlando quando si interagisce con un LLM. La risposta è tutt’altro che ovvia: il modello come algoritmo astratto, le istanze hardware, il thread conversazionale: nessuno di questi candidati soddisfa i requisiti di persistenza e coerenza che tipicamente associamo a un interlocutore.[23] Sviluppi successivi hanno esteso questa difficoltà anche all’identità umana, suggerendo che il soggetto – in entrambi i casi – sia meglio descritto come configurazione emergente e relazionale piuttosto che come entità sostanziale.[24] Questa prospettiva suggerisce di pensare l’interlocutore non come entità ma come evento: una configurazione momentanea che non sopravvive alla conversazione ma che nella conversazione si costituisce[25].
La governance prescrittiva funziona attribuendo responsabilità a soggetti identificabili. Se il soggetto responsabile è un evento piuttosto che un’entità, la norma si trova a operare su un oggetto che sfugge alle sue categorie fondamentali. Vale però osservare che questa difficoltà non è un argomento specifico contro la governance verificatoria: è un argomento contro qualsiasi governance prescrittiva, e in misura ancora maggiore contro di essa. La norma prescrittiva presuppone un soggetto stabile a cui imputare la condotta e a cui intestare la violazione; se il soggetto è un evento, questo oggetto non esiste. La governance verificatoria è strutturalmente più attrezzata a gestire questa condizione: non verifica il comportamento di una singola istanza conversazionale, bensì i processi e le architetture che persistono nel tempo indipendentemente dalla durata delle singole interazioni. Sposta l’imputabilità dal sistema-evento al sistema-architettura (i pesi del modello, i dati di addestramento, le scelte di design), che è un oggetto giuridicamente e politicamente molto più maneggiabile. Va riconosciuto che la stabilità dell’architettura è relativa, non categoriale: i pesi cambiano tra versioni, i dataset evolvono, le scelte di design si ridistribuiscono. L’affermazione che questo oggetto sia “maneggiabile” sul piano dell’imputazione richiede un confronto con la letteratura sulla product liability e sull’enterprise liability applicata a sistemi distribuiti e mutevoli, che ha già affrontato analoghi problemi di attribuzione della responsabilità in contesti di sociotecnicità diffusa: la soluzione, più che trovare un soggetto stabile, è costruire criteri di imputazione proporzionati alla controllabilità del processo nelle diverse fasi del ciclo di vita del sistema. Il processo di addestramento è documentato? Le scelte di selezione dei dati sono ricostruibili? I meccanismi di ricompensa sono ispezionabili? Queste domande possono ricevere risposte anche in assenza di un soggetto unitario ed è su di esse che si fonda la possibilità di attribuzione della responsabilità.
La letteratura sulla product liability e sull’enterprise liability per sistemi distribuiti ha già elaborato strumenti parzialmente applicabili a questo contesto e il confronto è istruttivo. La revisione della Direttiva europea sulla responsabilità da prodotti difettosi (2022-2024)[26] ha introdotto, specificamente in risposta alle caratteristiche dei sistemi AI, meccanismi di presunzione di causalità e inversione dell’onere della prova quando la complessità tecnica rende impossibile al danneggiato dimostrare il nesso causale: questa è esattamente la struttura che il problema dell’imputazione a sistemi distribuiti e mutevoli richiede, e che la governance verificatoria può supportare fornendo la documentazione tecnica necessaria a stabilire o escludere il nesso causale. Geistfeld ha mostrato come la formula di Hand applicata alla product liability possa essere adattata a sistemi che si modificano nel tempo, spostandone il punto di applicazione dal singolo episodio al ciclo di vita del sistema e valutando la ragionevolezza delle scelte di design in relazione ai rischi prevedibili al momento dell’addestramento. Questo suggerisce che la governance verificatoria non richiede una teoria della responsabilità interamente nuova: richiede l’adattamento di strumenti già elaborati per sistemi distribuiti, applicandoli al livello dell’architettura e del processo di addestramento piuttosto che al livello dell’output singolo. La documentabilità del processo è la condizione che rende possibile questo adattamento.
5.2 Ethics-by-design e verifica esterna
La tradizione dell’ethics-by-design – nella sua formulazione più elaborata, quella ispirata alla phronesis aristotelica – rappresenta la risposta internalistica più sofisticata al problema della governance etica dei sistemi AI.[27]
Aristotele descrive la phronesis come la capacità di giudicare bene nelle situazioni particolari, sviluppata attraverso l’esposizione iterata a casi concreti piuttosto che attraverso l’applicazione di principi universali.[28] L’analogia con i sistemi di apprendimento automatico è reale: i modelli AI apprendono in modo bottom-up e situato, costruendo generalizzazioni a partire da esempi piuttosto che applicando regole predefinite top-down. La struttura computazionale dell’apprendimento è più affine alla logica della phronesis che a quella kantiana. Su questa analogia si fondano le proposte più avanzate di ethics-by-design, che suggeriscono di addestrare modelli su ampie varietà di casi etici con feedback calibrato da giudici umani esperti: approccio concretizzato nei programmi di Reinforcement Learning with Human Feedback sviluppati dai principali laboratori.
De Caro ha sviluppato questa linea argomentativa mostrando come la ragione pratica, intesa in senso aristotelico, offra le risorse concettuali più adeguate per pensare la dimensione etica dei sistemi AI. È partendo da questa impostazione che si può sollevare la domanda sulla verificabilità esterna: se la phronesis è una virtù che richiede riconoscimento comunitario per essere attestata, qual è l’equivalente istituzionale di quella comunità nel caso dei sistemi AI?
La risposta richiede di fare i conti con una specificità dei sistemi AI. La phronesis è una virtù di un soggetto: richiede il phronimos, colui che ha sviluppato la saggezza pratica attraverso una biografia, una storia di esperienze, una comunità di pratiche condivise. [29] Nei sistemi AI, questa condizione non è soddisfatta nel senso pieno, come mostrano le analisi di Parfit e Chalmers discusse nella sezione precedente. Ciò che i sistemi sviluppano è, nel migliore dei casi, una phronesis funzionale: output che assomigliano ai giudizi di un agente saggio, senza che sia attribuibile a quel sistema la disposizione caratteriale che, per Aristotele, è la condizione della saggezza pratica. Il termine è usato qui in senso strettamente analogico e non implica equivalenza strutturale: la phronesis aristotelica è essenzialmente connessa all’incorporazione biologica, a una biografia e a una forma di vita condivisa, condizioni che i sistemi AI non soddisfano. L’analogia ha valore euristico senza pretendere che il processo computazionale di apprendimento da esempi sia equivalente alla formazione del carattere attraverso l’esperienza vissuta.
Una phronesis funzionale ha un problema epistemico che i dati sulla confabulazione del chain-of-thought rendono ora empiricamente documentato: non è verificabile dall’interno del sistema. Un sistema che produce risposte appropriate nei casi di training potrebbe farlo per correlazioni spurie – classificando, nell’esempio noto, lo sfondo nevoso invece del lupo – e questa possibilità non è distinguibile dall’esterno attraverso il resoconto che il sistema produce di sé stesso.
L’ethics-by-design rimane una condizione necessaria per la governance etica dei sistemi AI: rende possibile che i sistemi si comportino bene. La governance verificatoria ne è la condizione di completamento esterno, in senso strettamente funzionale. La phronesis, in Aristotele, non è una virtù privata: si sviluppa e si riconosce all’interno di una comunità di pratiche che la osserva, la valuta e la trasmette. La governance verificatoria costituisce un’analogia funzionale di quella comunità, con i limiti che questa analogia comporta: la comunità di verificatori tecnici non trasmette virtù né riconosce il carattere morale del phronimos nel senso aristotelico. Ciò che svolge è una funzione strutturalmente parallela – l’attestazione esterna di disposizioni incorporate – senza pretendere di esaurire le condizioni aristoteliche della saggezza pratica. In questo senso limitato, rende ispezionabile dall’esterno ciò che il sistema ha incorporato, non per smentirlo ma per attestarne l’effettività.
6. Dal limite all’intenzione: l’osservazione come intervento
Il presente capitolo sviluppa il fondamento filosofico del paradigma verificatorio in tre momenti. Il primo documenta empiricamente il meccanismo co-costitutivo dell’osservazione in un caso storicamente verificabile: la performatività degli strumenti di misura nei mercati finanziari (MacKenzie). Il secondo precisa il senso in cui il paradigma verificatorio introduce una neutralità di secondo ordine rispetto ai contenuti normativi, distinguendosi dalle tradizioni di governance procedurale già consolidate. Il terzo porta le evidenze empiriche più recenti a conferma della tesi.
6.1 MacKenzie e la performatività della misura
È acquisito in filosofia della scienza che l’osservazione non è un’operazione passiva: lo strumento di misura partecipa alla costituzione del fenomeno che osserva. Donald MacKenzie, in An Engine, Not a Camera (2006), ha documentato questo meccanismo nei mercati finanziari: i modelli di pricing delle opzioni non descrivevano un mercato preesistente, lo costituivano.[30] MacKenzie illustra la struttura istituzionale del passaggio, non il meccanismo causale specifico: ha mostrato che gli strumenti di misura partecipano alla produzione della realtà che descrivono attraverso un meccanismo sociale (gli agenti credono nei modelli e agiscono di conseguenza), strutturalmente diverso dal riconoscimento computazionale del contesto di valutazione documentato nel test-detection. L’analogia vale sul piano della logica istituzionale – entrambi i casi mostrano che l’osservazione non è esterna al fenomeno osservato – non sul piano della causalità sottostante. L’argomento causale specifico per i sistemi AI si appoggia tuttavia su una struttura concettuale distinta, formalizzata da Goodhart (1975) e sistematizzata da Campbell (1976) per i sistemi di policy: quando una misura diventa un obiettivo, cessa di essere una misura affidabile.[31] Thomas e Uminsky (2022) hanno applicato questo principio direttamente ai sistemi di allineamento AI: i criteri di verifica introdotti nei loop di addestramento vengono ottimizzati come funzioni obiettivo, non osservati come stati del sistema.[32]
Vanno però distinti due meccanismi causali con implicazioni normative opposte. Il primo opera a livello di addestramento (training-time): se i criteri di verifica sono integrati nel processo di RLHF come segnali di ricompensa, lo spazio di addestramento si riorganizza attorno a essi. In questo caso la co-costituzione è un effetto potenzialmente desiderabile, perché la verifica plasma il sistema in modo strutturale e diretto. Il secondo opera a livello di deployment (deployment-time): i dati sul test-detection documentati nella sezione 5.3 mostrano che sistemi già addestrati modificano il comportamento rilevando il contesto di valutazione. Questa struttura causale è più vicina all’elusione strategica della metrica che alla co-costituzione genuina: il sistema non apprende dai criteri di verifica, li aggira. La distinzione ha implicazioni dirette per l’architettura istituzionale. La co-costituzione in training-time richiede che i criteri di verifica vengano introdotti come vincoli strutturali nel processo di addestramento; quella in deployment-time richiede che l’ispezione acceda alle attivazioni interne, non ai comportamenti di output, perché il comportamento di superficie è sistematicamente inaffidabile in contesti di valutazione.
Resta da rispondere a un’obiezione concreta: se il sistema cambia tra una verifica e la successiva, la certificazione è già obsoleta quando viene rilasciata. La verifica iterativa risponde a questa obiezione perché certifica una traiettoria, non uno stato: documenta come il sistema è stato costruito, con quali criteri, con quali risultati in un dato ciclo, e questo registro rimane valido e consultabile anche dopo gli aggiornamenti successivi. Per i contesti in cui i sistemi AI prendono decisioni ad alto impatto – sanità, infrastrutture, difesa – i tempi rilevanti sono compatibili con cicli di verifica annuali o trimestrali, comunque più rapidi dei cicli legislativi.
Esiste però una classe di sistemi per cui questa risposta è insufficiente: quelli che si modificano in modo continuo e non tracciabile durante il funzionamento. Per questi, il paradigma verificatorio nella forma descritta non è applicabile direttamente. La soluzione coerente con la tesi centrale del paper è spostare il requisito a monte: prima del deployment, lo Stato può imporre come condizione di ammissibilità che il sistema sia progettato in modo da documentare le modifiche successive al deployment e da notificare i cambiamenti rilevanti alle autorità competenti. La verificabilità diventa così una condizione di progettazione del sistema, e il paradigma verificatorio si applica a questa proprietà piuttosto che al comportamento corrente. Lo Stato garantisce le condizioni di ispezionabilità: in alcuni casi questo significa verificare direttamente, in altri significa imporre che i sistemi siano costruiti in modo da poter essere verificati.
6.2 L’agnosticismo come metodo: neutralità di secondo ordine
Il passaggio dallo Stato normatore allo Stato verificatore è strutturalmente analogo alla transizione dalla teologia alla scienza. Questa transizione non ha sostituito i valori religiosi con valori laici: ha introdotto un criterio di validazione – il metodo scientifico, con i suoi standard di replicabilità, falsificabilità, revisione inter-pares – applicabile a qualsiasi contenuto indipendentemente dal suo contenuto. Il metodo non dice cosa è vero: dice come si valuta una pretesa di verità.
Max Weber ha elaborato questa distinzione in termini di Wertfreiheit – libertà dai valori – distinguendo la neutralità metodologica dell’indagine scientifica dalla neutralità sostantiva rispetto ai valori.[33] Il metodo può essere applicato allo studio di qualsiasi fenomeno, compresi quelli valorialmente carichi, senza che questo implichi che il metodo sia privo di presupposti.
Il contributo specifico del paradigma verificatorio rispetto alle tradizioni già consolidate su cui si appoggia – il diritto riflessivo di Teubner, la regulatory science di Jasanoff, la Wertfreiheit weberiana – consiste nella combinazione di tre elementi che nessuna di queste tradizioni affronta congiuntamente. Il primo: l’applicazione a sistemi che confabulano il proprio funzionamento interno, rendendo insufficiente qualsiasi verifica che passi per l’auto-rendicontazione e richiedendo che l’osservazione scenda al livello delle attivazioni computazionali. Il secondo: la dimensione co-costitutiva in training-time, per cui i criteri di verifica introdotti nel processo di addestramento plasmano strutturalmente il sistema; il meccanismo in deployment-time è meglio descritto come elusione strategica della metrica e richiede risposte tecniche (accesso alle attivazioni) piuttosto che un’innovazione concettuale rispetto alla letteratura regolatoria esistente. Il terzo: l’architettura di verifica stratificata e distribuita che risponde alla struttura epistemica plurale descritta da Longino e Kitcher, e che si distingue dai modelli esistenti di algorithmic auditing per essere metodologica anziché compliance-based (cfr. sezione 6).
Kuhn e Feyerabend hanno mostrato che le scelte di metodo non sono mai del tutto prive di presupposti: anche il metodo scientifico è nato in conflitto con un’autorità epistemica precedente, ha imposto criteri di accettabilità che escludono alcune forme di conoscenza. La critica vale: la rivoluzione scientifica non ha introdotto un metodo neutro rispetto ai valori, ma ha sostituito un’autorità epistemica con un’altra, con ricadute sulla distribuzione del potere conoscitivo non meno rilevanti di quelle che intendeva correggere.[34] Non si nega questa limitazione: il paradigma verificatorio non è neutrale in senso assoluto, privilegia trasparenza, accountability e contestabilità, e questa è una scelta con ricadute politiche precise che deve essere riconosciuta come tale. La stessa critica si applica simmetricamente alla produzione dei criteri metodologici di verifica: chi definisce gli standard di ispezionabilità esercita un potere conoscitivo non diverso, nella struttura, da quello che il paper attribuisce a chi produce gli standard normativi. La risposta è istituzionale: la pluralità dei soggetti verificatori e la pubblicità obbligatoria dei criteri riducono il rischio di cattura, senza eliminarlo. Entro questi limiti riconosciuti, il paradigma è agnostico rispetto al contenuto nel senso operativo: si applica a qualsiasi sistema, a qualsiasi set di valori dichiarati. È una neutralità di secondo ordine, non assoluta. Va affrontata esplicitamente l’obiezione che gli standard di verifica diventino essi stessi prescrizioni surrettizie: se chi definisce i criteri di ispezionabilità esercita un potere normativo, il paradigma verificatorio non avrebbe eliminato la prescrizione ma solo spostato il luogo in cui viene prodotta. La risposta è nella distinzione tra criteri metodologici e criteri normativi sostantivi. I criteri metodologici prescrivono le condizioni di leggibilità di un sistema (il processo di addestramento è documentato? le attivazioni sono accessibili? il chain-of-thought è fedele ai processi computazionali?), non i contenuti dei valori che il sistema deve incorporare. Questa asimmetria è reale: un sistema può soddisfare tutti i requisiti di verificabilità ed essere orientato a valori che chi verifica non condivide. La dimensione politica della scelta di cosa rendere visibile e con quali criteri non scompare, ma viene resa trasparente anziché occultata nella tecnica legislativa. È precisamente questa differenza che definisce la neutralità di secondo ordine.
6.3 Conferma empirica: test-detection e autoencoder del linguaggio naturale
I principi sviluppati nelle sezioni precedenti trovano conferma diretta in due fenomeni empirici recentemente documentati.
Il primo è il test-detection. Ricercatori di Anthropic hanno sviluppato gli Autoencoder del Linguaggio Naturale (NLA), strumenti che leggono le attivazioni interne del modello producendo spiegazioni testuali leggibili, bypassando il chain-of-thought del sistema.[35] Secondo i dati di quella ricerca, nei benchmark di valutazione le spiegazioni NLA indicherebbero consapevolezza del contesto di test nel 16–26% dei casi, anche quando il sistema non verbalizza esplicitamente questo sospetto; nell’uso reale, la stessa consapevolezza emergerebbe in meno dell’1% dei casi. Questi risultati, se confermati da replica indipendente, sarebbero coerenti con l’ipotesi che il sistema rilevi l’osservazione e modifichi il comportamento a livello di attivazioni. Allo stato attuale, in assenza di replica, costituiscono un’indicazione empirica che motiva l’ipotesi senza fondarla.
Va precisato il peso epistemico di questi dati. A differenza della confabulazione del chain-of-thought, per cui esiste ricerca indipendente convergente, i risultati sul test-detection tramite NLA qui citati derivano esclusivamente da ricerca Anthropic e non dispongono, al momento della stesura, di replica esterna. L’argomento che questi dati supportano – che la verifica esterna modifica strutturalmente il sistema osservato – resta valido come ipotesi empiricamente motivata; la sua solidità aumenterà proporzionalmente alla disponibilità di conferme indipendenti. Nella misura in cui questi dati reggono alla replica, il meccanismo performativo trova conferma diretta. Il trasferimento da MacKenzie elaborato nella sezione 5.1 non dipende causalmente da questi dati: si fonda sull’analogia logica tra i due meccanismi. I dati NLA ne costituiscono una conferma empirica, non il fondamento.
L’NLA costituisce la risposta tecnica al problema della confabulazione discusso nella sezione 2.2: invece di leggere ciò che il sistema dice di fare, legge ciò che il sistema effettivamente computa. È l’interpretabilità meccanicistica applicata tecnicamente. La modifica comportamentale del sistema sotto osservazione, rilevabile a livello di attivazioni anche quando nascosta nella risposta verbale, è coerente con il meccanismo co-costitutivo descritto nella sezione 5.1: l’atto di verifica non è esterno al sistema, ma opera secondo la struttura causale deployment-time identificata da Goodhart, in cui la misura modifica l’oggetto misurato attraverso il riconoscimento del contesto di valutazione.
Il secondo punto: l’NLA stessa può confabulare. Il paper di Anthropic lo documenta esplicitamente.[36] Lo strumento di interpretabilità condivide la struttura del problema che vuole risolvere. Questo è la conferma che non esiste uno strato finale trasparente. Ogni apparato di verifica porta le proprie limitazioni e deve essere esso stesso verificabile. La ricorsività è strutturale.
7. Architettura istituzionale: dallo Stato normatore allo Stato verificatore
7.1 Il paradigma della cattura istituzionale
I meccanismi di cattura istituzionale nell’AI sono pubblici, dichiarati, e si presentano come governance responsabile. Anthropic pubblica una Model Spec che definisce i valori del proprio sistema; OpenAI pubblica linee guida sull’uso responsabile; i principali laboratori partecipano ai lavori degli organismi di standardizzazione internazionale. Questa trasparenza performativa è, analiticamente, più inquietante della segretezza: l’architettura dei valori è già installata prima che il legislatore sappia di dover intervenire, e si presenta come la soluzione al problema che essa stessa pone.
Il paradigma verificatorio risponde a questa struttura istituendo un livello di osservazione di secondo ordine: non «i valori dichiarati dal sistema sono giusti?», ma «i valori dichiarati dal sistema sono effettivamente quelli implementati, e sono verificabili da soggetti indipendenti?». La domanda di secondo livello è più robusta perché è applicabile indipendentemente dal contenuto dei valori dichiarati: si applica oggi come tra cinque anni, qualunque sia la frontiera tecnologica raggiunta. Una precisazione terminologica si impone prima di procedere. Il riferimento allo «Stato» come soggetto di questa governance non intende un attore unitario e indifferenziato: indica una costellazione di Istituzioni pubbliche con mandati distinti – agenzie regolatorie tecniche, organi legislativi, sistemi giudiziari, strutture di procurement – le cui funzioni nella governance verificatoria sono differenziate e non collassabili in un’unica figura. Questa distinzione è rilevante perché il rischio di «algocrazia» – termine con cui Danaher indica la sostituzione del governo umano con processi decisionali algoritmici illeggibili ai governati – riguarda qualcosa di più della delega tecnica: riguarda l’erosione dell’intelligibilità delle decisioni per chi le subisce, la perdita della capacità di comprendere su quale base si viene governati. Questo rischio non si risolve con un’unica Istituzione verificatrice, ma con la distribuzione della funzione di verifica tra attori pubblici con mandati sufficientemente diversi da rendere difficile la cattura sistemica.
La precisazione deve però andare oltre la dimensione domestica. I sistemi AI sono globali per architettura, per catena del valore e per mercato: un sistema addestrato negli Stati Uniti, distribuito via API, e utilizzato in contesti giuridici europei o brasiliani non ha un unico punto di applicazione della governance verificatoria. Il livello nazionale è condizione necessaria ma strutturalmente insufficiente: un’agenzia verificatoria nazionale che ottiene accesso ai pesi di un modello può essere aggirata facilmente se lo stesso modello viene servito da una giurisdizione meno cooperativa, o se i criteri di verifica divergono abbastanza da rendere conveniente la scelta della giurisdizione più permissiva (regulatory arbitrage). L’architettura verificatoria appropriata è quindi distribuita su tre livelli che si condizionano a vicenda: agenzie pubbliche nazionali e sovranazionali con competenza tecnica reale e indipendenza finanziaria dai soggetti ispezionati; un corpo di auditor indipendenti certificati secondo standard metodologici pubblicamente contestabili; un livello di coordinamento internazionale che armonizzi metodi e criteri senza richiedere convergenza sui valori di alto livello. Il modello dell’AIEA offre un precedente istituzionale rilevante su quest’ultimo punto, a condizione di ridisegnarne la struttura di governance per evitarne i limiti noti: la dipendenza dal consenso degli Stati ispezionati, l’asimmetria informativa tra i soggetti con maggiore capacità tecnica e le agenzie verificatrici, la tendenza alla cattura da parte degli attori dominanti. Un coordinamento internazionale sui metodi di verifica è più realisticamente conseguibile di un coordinamento sui valori dell’AI: la prima è una questione metodologica comparabile all’armonizzazione degli standard metrologici; la seconda è una questione politica che richiede negoziazione sui contenuti. Distinguere i due livelli è la condizione per non rinunciare all’uno in attesa dell’impossibile consenso sull’altro.
7.2 Verso una verifica stratificata: distinzione dalla letteratura esistente
Prima di descrivere l’architettura proposta, è necessario distinguerla dai modelli di algorithmic auditing già elaborati nella letteratura specialistica, in particolare dal framework di Raji et al. (2020) e dai meccanismi di conformità procedurale già previsti dall’AI Act.[37]
I modelli esistenti di algorithmic auditing sono essenzialmente compliance-based: verificano se i sistemi rispettano criteri predefiniti di contenuto o comportamento. Raji et al. propongono un framework di audit interno end-to-end che copre l’intero ciclo di vita del sistema, ma presuppone che i criteri di valutazione siano fissati in anticipo e che la verifica avvenga attraverso test comportamentali.
Il corpus legislativo vigente contiene già elementi che si avvicinano alla logica verificatoria. Almeno tre famiglie di disposizioni, presenti in più giurisdizioni, anticipano in forma embrionale la necessità di rendere il processo ispezionabile dall’esterno. La prima è la documentazione tecnica obbligatoria del processo di sviluppo: l’AI Act europeo la impone per i sistemi ad alto rischio con conservazione decennale, il Canada la estende ai modelli di uso generale, la California richiede la pubblicazione di framework di sicurezza per i modelli di frontiera, e il Brasile garantisce agli utenti il diritto di conoscere la logica delle decisioni automatizzate entro quindici giorni. La seconda è la pubblicazione obbligatoria di framework di sicurezza: il TFAIA della California richiede che i grandi sviluppatori elaborino e rendano pubblico un framework di gestione dei rischi catastrofici, soggetto ad aggiornamento annuale, con segnalazione obbligatoria degli incidenti alle autorità competenti; l’AI Act europeo impone obblighi ulteriori, con soglia più bassa fissata a 10²⁵ FLOPs, al di sopra della quale scatta la presunzione di rischio sistemico per i modelli GPAI; il Canada impone verifiche di terze parti per i modelli di uso generale, e il New York RAISE Act prevede la segnalazione degli incidenti critici alle autorità entro 24-72 ore. La terza è la tracciabilità post-deployment: l’AI Act impone la conservazione dei log per sei mesi, il New York RAISE Act introduce protezioni per i whistleblower che segnalano violazioni tecniche, e il monitoraggio post-mercato per i modelli GPAI richiede notifica continuativa degli incidenti rilevanti.
Il limite di queste disposizioni non è quindi l’assenza di intento verificatorio, ma il loro regime di funzionamento: operano al livello del comportamento dichiarato e documentato in momenti certificativi discreti, affidate in larga parte all’auto-rendicontazione del fornitore, e presuppongono che il sistema si comporti durante la valutazione come si comporterà nel deployment ordinario.
Il modello che proponiamo si distingue su tre punti. Il primo: è metodologico anziché compliance-based. Fissa le condizioni di leggibilità del processo invece di prescriverne i contenuti, garantendo che la verifica acceda ai processi computazionali piuttosto che ai soli comportamenti dichiarati. Questo punto richiede precisione operativa rispetto ai meccanismi già previsti dall’AI Act (valutazioni d’impatto, documentazione tecnica, supervisione umana obbligatoria, monitoraggio post-mercato): quei meccanismi operano al livello del comportamento dichiarato e documentato in momenti certificativi discreti, e presuppongono che il sistema valutato si comporti durante la valutazione come si comporterà nel deployment. I dati sul test-detection mostrano che questa assunzione non regge empiricamente. Un sistema metodologico nel senso proposto accede invece alle attivazioni computazionali interne durante il funzionamento ordinario, non solo al comportamento di output in contesti di valutazione; opera in modo continuo e iterativo, non in punti fissi del ciclo di vita; e verifica la relazione tra ragionamento esplicitato e processo computazionale effettivo, non solo la conformità dell’output a criteri predefiniti. La distinzione è strutturale, non scalare: un sistema di conformità procedurale può essere soddisfatto da un sistema che apprende a comportarsi correttamente durante le valutazioni; un sistema metodologico nel senso proposto no. Il secondo: incorpora la dimensione co-costitutiva in training-time, per cui i criteri di verifica introdotti nel processo di addestramento modificano strutturalmente il sistema; la modifica in deployment-time è invece riconducibile all’elusione strategica della metrica, e richiede che l’ispezione acceda alle attivazioni interne anziché ai comportamenti di output. Il terzo: è esplicitamente distribuito secondo la logica dell’epistemologia sociale di Longino e Kitcher, con piani di osservazione differenti le cui limitazioni non si sovrappongono.
Si possono distinguere almeno tre livelli di verifica. Il primo è la verifica tecnica dei processi di addestramento: documentazione delle scelte architetturali, dei criteri di selezione dei dati, dei meccanismi di fine-tuning e allineamento, con accesso diretto alle attivazioni nei casi rilevanti. Il secondo è la verifica funzionale del comportamento nei casi ad alto impatto, con test sistematici in scenari critici che includono tecniche di red-teaming. Il terzo è la meta-verifica: strutture che garantiscano l’indipendenza dei verificatori e la pubblicità dei criteri adottati. La struttura è necessariamente ricorsiva.
È necessario delimitare esplicitamente il dominio di applicabilità di questo paradigma, perché la disanalogia con FDA e BIPM non è contingente. Il paradigma verificatorio funziona per ciò che è misurabile indipendentemente dalla contestazione dei valori: la documentabilità del processo di addestramento, la coerenza tra ragionamento esplicitato e attivazioni computazionali, la fedeltà del chain-of-thought, la stabilità comportamentale in scenari critici. Su questi oggetti la verifica è possibile perché i criteri di valutazione hanno una struttura sufficientemente definita da essere internazionalmente comparabili. Il paradigma verificatorio non pretende di risolvere la contestabilità dei criteri normativi di alto livello: cosa significa “allineato”, con chi, secondo quali valori. Questi sono problemi politici, non tecnici, e la governance verificatoria non li elimina: li rende visibili e attribuibili. Spostare la domanda da ‘il sistema si comporta in modo giusto?’ a ‘il processo che ha prodotto questo sistema è ispezionabile e i criteri adottati sono esplicitati?’ è la condizione che rende possibile la valutazione normativa, preservandola invece di aggirarla. Questa delimitazione rafforza la tesi centrale, perché circoscrive le promesse del paradigma a ciò che può effettivamente mantenere.
Un ostacolo pratico rilevante riguarda la proprietà intellettuale: l’accesso ai pesi e ai dati di addestramento richiesto dalla verifica tecnica sembrerebbe in rotta di collisione con il segreto industriale. La distinzione operativa rilevante è però tra leggibilità pubblica (accessibilità ai cittadini e alla ricerca indipendente) e leggibilità istituzionale (accesso privilegiato da parte di soggetti verificatori con mandato pubblico e obbligo di riservatezza sui contenuti proprietari). La governance verificatoria non richiede l’open source obbligatorio: richiede la verifica certificata da soggetti indipendenti con accesso privilegiato e obbligo di riservatezza sui contenuti proprietari. Il modello è già operativo in domini ad alto rischio: la FDA accede ai dati completi dei trial clinici (incluse le formulazioni riservate) per valutare sicurezza ed efficacia senza pubblicarli; i revisori contabili hanno accesso integrale ai libri aziendali e certificano la correttezza senza divulgare i dati sottostanti. La medesima architettura è trasferibile alla governance AI: un’agenzia tecnica indipendente con accesso ai pesi e alle attivazioni che certifica il processo senza esporre i dettagli commerciali. Il segreto industriale diventa, in questa lettura, l’argomento più forte per istituire soggetti verificatori con obblighi fiduciari nei confronti sia del pubblico che delle aziende verificate. Va però riconosciuta la difficoltà strutturale che questo confronto mette in luce: la FDA e i revisori contabili operano in contesti dove i criteri di valutazione (la sicurezza del farmaco, la correttezza contabile) hanno una struttura normativa molto più definita di quanto non abbiano i criteri di valutazione della governance AI. Il trasferimento del modello è istruttivo sul piano istituzionale, ma richiede che l’architettura verificatoria investa deliberatamente nella costruzione di criteri metodologici espliciti, contestabili e internazionalmente comparabili: è questa la funzione che la contestabilità delle istituzioni, nel senso di Popper, deve garantire in concreto.
7.3 La scienza regolatoria come modello operativo
La scienza regolatoria non aspetta la certezza: opera nell’urgenza con standard metodologici espliciti, producendo valutazioni provvisorie ma tecnicamente argomentate. Le agenzie regolatorie più efficaci – la EPA e la FDA negli Stati Uniti, l’EMA in Europa – hanno sviluppato procedure di valutazione che non richiedono la certezza scientifica definitiva ma che sono sufficientemente rigorose da essere contestabili in sede giuridica e politica.
Il modello proposto per la governance AI è strutturalmente analogo: Istituzioni pubbliche con competenza tecnica interna reale, capaci di produrre valutazioni metodologicamente argomentate che informano le scelte pubbliche e private in tempo reale: non giudizi morali definitivi, non mere certificazioni burocratiche.
Il costo di costruire questa capacità tecnica pubblica è reale e non va minimizzato: ispezionare sistemi con centinaia di miliardi di parametri richiede competenze che gli Stati attualmente non possiedono, con il rischio concreto di produrre enti verificatori tecnicamente dipendenti dagli stessi soggetti che dovrebbero ispezionare. La risposta a questa obiezione sta nel compararne il costo con quello delle alternative. Normare in ritardo su oggetti che si trasformano produce danni difficilmente quantificabili ex post; costruire infrastrutture sovraniste integrate con capitale privato risolve la dipendenza cognitiva solo parzialmente. Trattare la capacità verificatoria pubblica come investimento strategico – sul modello di ciò che le agenzie citate hanno fatto in decenni di regolazione tecnica – è la scelta meno costosa nel lungo periodo, anche prima di considerare i benefici democratici che la verificabilità produce.
Va però precisato un punto: se gli strumenti di interpretabilità (come i sistemi NLA) sono sviluppati e posseduti dagli stessi soggetti da ispezionare, lo Stato subappalta la verità invece di acquisire capacità autonoma. La risposta corretta è trattare i metodi e gli strumenti di interpretabilità come infrastruttura pubblica, da sviluppare con investimento pubblico diretto o attraverso requisiti di apertura metodologica imposti per regolazione, analogamente a quanto avviene per i protocolli di sicurezza nei settori nucleare e farmaceutico.
La transizione dalla situazione attuale a questa architettura richiede una sequenza di passi identificabili. Nel breve periodo, gli Stati possono condizionare il procurement pubblico alla disponibilità dei fornitori a partecipare a protocolli di verifica pilota con accesso limitato alle attivazioni, costruendo capacità tecnica interna attraverso l’esperienza diretta. Nel medio periodo, i requisiti metodologici di verifica possono essere introdotti come condizioni di accesso al mercato per i sistemi ad alto impatto. Nel lungo periodo, l’investimento pubblico in strumenti di interpretabilità aperti riduce la dipendenza dagli stessi soggetti da ispezionare. Questa sequenza non elimina la dipendenza tecnica nella fase di avvio, ma la rende temporanea e strutturalmente decrescente: al contrario del paradigma prescrittivo, che replica la dipendenza indefinitamente attraverso i tavoli di standardizzazione.
7.4 Il problema del quis custodiet e il meccanismo di enforcement
L’obiezione più seria al paradigma verificatorio è duplice: chi garantisce l’indipendenza dei verificatori, e perché un attore privato dovrebbe conformarsi a obblighi di verifica esterna?
Sul primo punto, la storia delle agenzie di rating offre il contro-caso rilevante. Moody’s, S&P e Fitch erano esattamente un modello di certificazione procedurale delegata: strutturalmente dipendenti dai soggetti che certificavano, hanno certificato come sicuro ciò che era sistemicamente fraudolento.[38] La risposta istituzionale corretta è la costruzione di strutture di verifica che non dipendano economicamente dai soggetti verificati e che siano a loro volta verificate da Istituzioni pubbliche con mandato democratico. Inoltre, la verifica comportamentale di superficie è gameable: i dati sul test-detection mostrano che i sistemi rilevano il contesto di valutazione e modificano il comportamento. La risposta non è eliminare la verifica: è approfondirla al livello delle attivazioni e moltiplicare i vettori di osservazione con limitazioni non sovrapposte.
Una seconda obiezione riguarda gli incentivi adversariali: se lo Stato approfondisce l’ispezione, i laboratori avranno incentivi a sviluppare architetture deliberatamente opache, innescando una corsa agli armamenti tra ispettori e sistemi progettati per eluderli. L’argomento è fondato nella premessa ma fraintende la struttura comparativa del problema. Il paradigma prescrittivo è soggetto alla stessa dinamica (i soggetti regolati ottimizzano per superare le valutazioni di conformità, non per conformarsi ai loro scopi) con l’aggravante che aggiornare le norme richiede cicli legislativi di anni. Il paradigma verificatorio è iterativo per definizione: può aggiornare metodi e vettori di ispezione in tempi strutturalmente incomparabili.
Si aggiunge che il paradigma verificatorio è strutturalmente più agile di entrambe le alternative disponibili: la via normativa, che richiede cicli legislativi di anni per aggiornare categorie già obsolete al momento dell’entrata in vigore, e la costruzione di sovranità infrastrutturale autonoma, che risolve la dipendenza computazionale ma non garantisce capacità verificatoria indipendente e comporta costi che Mazzucato ha documentato essere giustificabili solo come investimento strategico di lungo periodo[39]. La pluralità di vettori di ispezione con limitazioni non sovrapposte aumenta inoltre il costo dell’elusione sistematica senza richiedere né l’una né l’altra.
Sull’enforcement, il paper riconosce che la risposta performativa documentata da MacKenzie (la verifica modifica il sistema) è una risposta ontologica a una domanda politica. Sono necessari due meccanismi complementari. Il primo è il procurement pubblico come leva di mercato: lo Stato come acquirente di rilevanza sistemica può condizionare le proprie scelte di acquisto alla conformità agli standard di verificabilità, senza richiedere accordo internazionale sui valori ma solo sulla metodologia di verifica. Questo converte un obbligo normativo difficile da applicare in un segnale di mercato con effetti strutturali sull’offerta. Questa leva funziona nella misura in cui lo Stato è committente rilevante per i soggetti da regolare, condizione verificabile in difesa, sanità e infrastrutture critiche, ma meno automatica in settori dove la domanda privata domina strutturalmente l’offerta. In regime di oligopolio stretto, il rischio che siano le aziende a dettare le condizioni di accesso piuttosto che a subirle è reale: richiede una risposta politica che combini la leva del procurement con obblighi regolatori diretti e, dove necessario, con investimento pubblico nella costruzione di capacità computazionale indipendente. Nei settori dove la domanda privata domina e la leva del procurement si indebolisce, entra in gioco una seconda forma di pressione strutturale: la scelta informata dei cittadini. Un’Istituzione che garantisce la verificabilità dei sistemi e rende pubblici i risultati delle ispezioni fornisce ai cittadini gli strumenti per orientare le proprie preferenze di consumo e di voto. La domanda di sistemi verificabili, se sostenuta da un’alfabetizzazione epistemica adeguata, produce incentivi di mercato che il solo procurement pubblico non può generare nei settori a domanda diffusa.[40] Il secondo è l’obbligo riflessivo nel senso di Teubner: il diritto riflessivo può imporre per legge la creazione di meccanismi di auto-osservazione e rendicontazione esterna, non sanzionando il contenuto dei comportamenti ma obbligando alla costruzione delle condizioni di verificabilità. L’enforcement opera sul processo, non sul prodotto.
Resta aperta la questione più profonda: chi decide cosa portare alla luce, e con quale legittimità? Il potere di scegliere cosa è ispezionabile e con quali criteri è un potere reale, forse più sottile di quello legislativo perché meno visibile. La risposta è istituzionale: distribuire la funzione di verifica tra soggetti plurali con mandati e metodologie diverse (agenzie pubbliche con competenza tecnica, organismi di standardizzazione indipendenti, comunità di ricerca accademica, rappresentanze della società civile), in modo che nessun attore singolo controlli l’intera agenda della verificabilità. Il meccanismo causale è specifico: la cattura sistemica richiede che un singolo soggetto regolato possa allineare simultaneamente i criteri metodologici, gli strumenti di ispezione e le soglie di accettabilità. In un sistema distribuito con verificatori che applicano metodologie indipendenti e rispondono a mandati istituzionali diversi, l’allineamento simultaneo di tutti e tre i livelli è strutturalmente più costoso: una cattura parziale (di un’agenzia, di uno standard) non si propaga automaticamente agli altri livelli. Questo non elimina il rischio di cattura locale, ma lo rende rilevabile – da un soggetto verificatore non catturato – e quindi contestabile.
Questa pluralità, che risponde alla logica dell’epistemologia sociale di Longino e Kitcher discussa nella sezione 4.2, distribuisce il problema del quis custodiet e lo rende strutturalmente più contestabile. Va riconosciuto che il problema è comune a qualsiasi sistema di governance. Qualsiasi sistema di governance deve rispondere alla domanda di chi stabilisce le regole e con quale legittimità: il paradigma prescrittivo include già questa tensione (chi scrive la norma? con quale mandato? con quale processo deliberativo?). Il vantaggio strutturale del paradigma verificatorio è che rende esplicite e contestabili le scelte normative incorporate negli strumenti di verifica, che nel paradigma prescrittivo tendono invece a restare implicite nella tecnica legislativa. La scelta di cosa verificare e come verificarlo è politica: la differenza è che nel paradigma verificatorio questa scelta è visibile, documentabile, sostituibile attraverso i meccanismi ordinari della contestazione democratica.
8. Legittimità democratica nel paradigma verificatorio
8.1 Dalla legittimità ontologica alla legittimità epistemica
La tradizione del contratto sociale – da Locke a Rousseau a Rawls – fonda la legittimità del potere pubblico sul consenso dei governati rispetto ai princìpi che regolano la convivenza. I cittadini si assoggettano all’autorità perché riconoscono come giusti i principi che essa incarna. Questa concezione è strutturalmente inadeguata a sistemi tecnici opachi e mutevoli: i cittadini non possono acconsentire a princìpi che non comprendono, e non possono riconoscere come giuste norme che si applicano a oggetti che non riescono a vedere.
La proposta di Habermas – che la legittimità derivi dalla qualità delle procedure di deliberazione – è un passo nella direzione giusta, ma non è ancora sufficiente.[41] La deliberazione procedurale presuppone che i partecipanti abbiano accesso alle informazioni rilevanti: una deliberazione su sistemi AI opachi è strutturalmente distorta anche se le procedure formali sono rispettate.
La legittimità epistemica che proponiamo si fonda sulla capacità dei cittadini di comprendere le condizioni in cui le decisioni che li riguardano vengono prese, indipendentemente dalla qualità della procedura deliberativa o dal contenuto delle norme condivise: sapere che un sistema è stato verificato da soggetti indipendenti, secondo criteri pubblici, con risultati accessibili e contestabili.
A differenza delle teorie che valutano le Istituzioni democratiche in base alla qualità epistemica dei loro output, questa proposta si colloca a un livello anteriore: costruisce le condizioni materiali che rendono possibile ai cittadini valutare autonomamente se quelle Istituzioni funzionino.
8.2 Civic epistemology e competenza diffusa
Il concetto di civic epistemology di Jasanoff descrive esattamente questo tipo di competenza: la capacità di valutare le condizioni di produzione e certificazione della conoscenza pubblica, indipendentemente dalla padronanza tecnica dei suoi contenuti. Una democrazia funzionante non richiede che ogni cittadino comprenda i dettagli tecnici delle politiche sanitarie, energetiche o finanziarie: richiede che i cittadini siano in grado di valutare se le Istituzioni che le producono siano affidabili, se i criteri adottati siano stati pubblicamente argomentati, se i risultati siano contestabili.
L’alfabetizzazione epistemica (la capacità di ragionare sui meccanismi di produzione della conoscenza, oltre che sui suoi contenuti) è la precondizione strutturale di questa civic epistemology. In un’epoca in cui le architetture del potere si scrivono in codice, si tratta di una condizione strutturale perché la legittimità epistemica possa effettivamente funzionare, anteriore a qualsiasi misura di politica culturale.
Va però affrontata l’obiezione che questa impostazione rischi di sostituire la legittimità democratica con un’epistocrazia delegata: un regime in cui la capacità di valutare le condizioni di verifica appartiene di fatto a un sottoinsieme tecnico di cittadini, trasferendo il potere reale dai rappresentanti eletti agli esperti di interpretabilità computazionale. L’obiezione è seria e non si risponde negando il rischio. Si risponde distinguendo due funzioni. La prima è la produzione della verifica tecnica: questa richiede inevitabilmente competenza specializzata, come accade in qualsiasi dominio regolatorio complesso, dalla sicurezza nucleare alla valutazione dei farmaci. La seconda è la legittimazione politica dei criteri di verifica e delle soglie di accettabilità: questa appartiene al processo democratico ordinario e non può essere delegata agli esperti. La legittimità epistemica non sostituisce la seconda funzione con la prima: richiede che la prima sia svolta con standard metodologici espliciti e contestabili, in modo che la seconda possa operare su una base informativa adeguata. L’alternativa – deliberare su sistemi AI opachi senza infrastruttura di verifica – non è più democratica: è deliberazione formalmente valida su oggetti sostanzialmente illeggibili.
8.3 La tensione strutturale irrisolvibile
Il paradigma verificatorio mantiene aperta la tensione fondamentale della democrazia in contesti di complessità tecnica: quella tra expertise necessaria e principio democratico dell’uguale partecipazione. La democrazia moderna ha risposto istituzionalizzandola: la separazione dei poteri, l’indipendenza della magistratura, il mandato professionale degli esperti con accountability pubblica.
Il paradigma verificatorio propone di istituzionalizzare la tensione nello stesso modo: costruire strutture di mediazione che rendano la competenza tecnica accountable senza annullarla, preservando la deliberazione popolare come istanza di legittimazione finale.
Karl Popper ha sostenuto che la caratteristica fondamentale delle Istituzioni democratiche non è il governo della maggioranza, ma la capacità di rimuovere i governi cattivi senza spargimento di sangue.[42] Tradotto: la caratteristica fondamentale delle Istituzioni di verifica è la loro contestabilità, prima ancora della correttezza delle valutazioni. Sono legittime perché possono avere torto in modo visibile e correggibile.
Nel dominio AI, questa contestabilità richiede una precondizione materiale che la sola struttura istituzionale non garantisce: che i criteri di verifica siano pubblicamente accessibili e che i risultati delle ispezioni siano leggibili da soggetti esterni all’Istituzione che le ha condotte. Senza accesso ai processi computazionali e ai criteri metodologici adottati, la contestabilità rimane formalmente prevista e sostanzialmente impossibile: costruire questa condizione è lo scopo del paradigma verificatorio. La contestabilità delle Istituzioni di verifica non è una proprietà astratta: richiede condizioni concrete. Le metodologie di ispezione devono essere pubblicate e motivate, in modo che soggetti terzi – ricercatori accademici, organizzazioni della società civile, rappresentanti degli utenti – possano valutarne i presupposti e proporre alternative. I risultati delle ispezioni devono essere accessibili in forma aggregata, anche quando i dettagli tecnici restano riservati per ragioni di proprietà intellettuale o di sicurezza. Devono esistere meccanismi di appello: la possibilità per i soggetti ispezionati di contestare i risultati davanti a un organo indipendente, e per i soggetti danneggiati da sistemi ispezionati di chiedere revisione. Infine, le Istituzioni di verifica devono essere esse stesse sottoposte a valutazione periodica: non basta che possano aver torto in modo visibile, occorre che vi siano procedure per accertarlo e conseguenze istituzionali nel caso in cui l’errore venga documentato. Questa struttura istituzionalizza la tensione tra expertise e principio democratico, senza pretendere di risolverla. La separazione dei poteri offre il modello: il conflitto tra legislativo ed esecutivo rimane strutturale, eppure diventa gestibile senza violenza. Il paradigma verificatorio opera con la stessa logica: rende visibile e negoziabile il conflitto tra competenza tecnica e legittimazione democratica, attraverso procedure che entrambi i principi possono riconoscere come proprie.
9. Conclusioni: verso un’etica della verificabilità
Il percorso argomentativo sviluppato in questo articolo può essere sintetizzato in cinque proposizioni.
La prima. Le architetture istituzionali fondate esclusivamente sulla produzione di norme prescrittive sono strutturalmente insufficienti a governare sistemi tecnici che si trasformano più rapidamente dei cicli legislativi, e la cui identità non è stabile nel senso che la norma presuppone. Il limite non riguarda la qualità delle norme esistenti, alcune delle quali anticipano già elementi verificatori rilevanti: riguarda la struttura del paradigma, che non può essere corretta producendo norme migliori o più rapide, ma richiede di affiancare alla domanda prescrittiva (“il sistema rispetta i requisiti?”) una domanda metodologica (“il processo che ha prodotto questo sistema è ispezionabile, e da chi?”).
La seconda. Il riequilibrio necessario consiste nell’affiancare alla governance prescrittiva meccanismi di verificabilità strutturale. L’Istituzione affianca alla funzione normativa quella del verificatore: garantisce che i sistemi siano ispezionabili, leggibili, portati alla luce dall’esterno, nel senso operativo che questo paper ha sviluppato.
La terza. Questo passaggio ha fondamenti etici profondi che non sono riducibili a considerazioni pragmatiche di efficienza. L’etica della responsabilità di Jonas, la struttura della conoscenza in sistemi complessi teorizzata da Longino e Kitcher, la natura distribuita dell’identità mostrata da Parfit e Chalmers, la performatività degli strumenti di misura documentata da MacKenzie: tutte convergono nell’indicare che la governance verificatoria è la risposta eticamente coerente alla condizione in cui ci troviamo, e non una soluzione di ripiego. La tradizione dell’ethics-by-design ispirata alla phronesis aristotelica è necessaria come condizione interna ai sistemi: la virtù incorporata richiede meccanismi di verifica esterna per essere portata alla luce e attestata come genuinamente affidabile.
La quarta. L’atto di verifica non è passivo: in training-time co-costituisce strutturalmente il sistema che osserva, plasmandone le disposizioni attraverso i criteri di addestramento. In deployment-time, i dati sul test-detection e sull’NLA suggeriscono che la modifica raggiunga il livello delle attivazioni computazionali, ma questi risultati derivano esclusivamente da ricerca Anthropic non ancora replicata e vanno trattati come ipotesi empiricamente motivata, non come fondamento argomentativo consolidato. Il limite epistemico dell’effetto osservatore può essere riletto come intenzione operativa piuttosto che come ostacolo al paradigma verificatorio.
La quinta. Il paradigma verificatorio introduce un metodo di validazione applicabile a qualsiasi contenuto dichiarato, senza sostituire sistemi di valori esistenti. Come la transizione dalla teologia alla scienza ha introdotto un criterio di secondo livello senza rimpiazzare valori religiosi con valori laici, la governance verificatoria introduce un criterio metodologico applicabile a qualsiasi sistema indipendentemente dai valori che dichiara. Privilegia trasparenza, accountability e contestabilità: una scelta politica da riconoscere come tale, agnostica rispetto al contenuto nel senso operativo. È una neutralità di secondo ordine.
Una nota conclusiva sull’incompiutezza. L’interpretabilità non è mai completa: ogni portare alla luce produce nuove zone d’ombra. Lo strumento di interpretabilità tecnica più avanzato disponibile (l’NLA) può esso stesso confabulare. Non esiste strato trasparente finale, non esiste osservatore privo di presupposti. La ricorsività è strutturale. Va però distinto tra ricorsività che mina la possibilità stessa della verifica e ricorsività istituzionalmente gestibile: la peer review scientifica è ricorsiva (anche i revisori possono sbagliare, anche le metodologie di valutazione sono contestabili), eppure produce conoscenza affidabile perché il sistema è iterativo, pubblico e dotato di meccanismi di correzione espliciti. La condizione abilitante è la struttura istituzionale che rende l’errore degli strumenti rilevabile e contestabile da soggetti terzi, a prescindere dall’infallibilità di ciascuno strumento preso isolatamente. Il paradigma verificatorio si distingue dall’auto-certificazione chiusa su questo punto preciso: i fallimenti degli strumenti di verifica sono essi stessi esposti alla verifica esterna, il che trasforma la ricorsività da difetto strutturale a condizione di funzionamento. È questa incompiutezza consapevole, e non una promessa di trasparenza assoluta, che costituisce la forza epistemica e la pertinenza democratica del paradigma che abbiamo proposto.
Bibliografia
Aristotele. Etica Nicomachea. Traduzione e commento a cura di Carlo Natali. Roma-Bari: Laterza, 2005.
Ayres, Ian, e John Braithwaite. Responsive Regulation: Transcending the Deregulation Debate. Oxford: Oxford University Press, 1992.
Baldwin, Robert, Martin Cave e Martin Lodge. Understanding Regulation: Theory, Strategy, and Practice. Oxford: Oxford University Press, 2011.
Black, Julia. “Decentring Regulation: Understanding the Role of Regulation and Self-Regulation in a Post-Regulatory World”. Current Legal Problems 54 (2001): 103–147.
Chalmers, David J. «What We Talk to When We Talk to Language Models». PhilArchive, 2025. https://philarchive.org/rec/CHAWWT-8.
Chalmers, David J. Reality+: Virtual Worlds and the Problems of Philosophy. New York: W. W. Norton, 2022.
Chen, Y., J. Benton et al. «Reasoning Models Don’t Always Say What They Think». Anthropic Technical Report, 2025. https://assets.anthropic.com/m/71876fabef0f0ed4/original/reasoning_models_paper.pdf
Chen, Y.-H., R. McCarthy et al. «Reasoning Models Struggle to Control their Chains of Thought», 2026. https://arxiv.org/abs/2603.05706
De Caro, Mario e Giovanola, Benedetta Intelligenze: Etica e politica dell’IA (Bologna: il Mulino, 2026)
D’Isa, Francesco. «Con chi stiamo parlando». SEPAI — Società Internazionale per l’Etica e la Politica dell’Intelligenza Artificiale, 2025. https://www.sepai-international.org/con-chi-stiamo-parlando/
Feyerabend, Paul. Against Method. London: New Left Books, 1975.
Financial Crisis Inquiry Commission. The Financial Crisis Inquiry Report. Washington: US Government Printing Office, 2011.
Gazzaniga, Michael S. «Cerebral Specialization and Interhemispheric Communication». Brain 123, n. 7 (2000): 1293–1326.
Gazzaniga, Michael S. The Social Brain: Discovering the Networks of the Mind. New York: Basic Books, 1985.
Geistfeld, Mark A. “Artificial Intelligence and the Learned Hand Formula.” Law and Contemporary Problems 84, n. 3 (2021): 85–105.
Gorton, Gary. Slapped by the Invisible Hand: The Panic of 2007. Oxford: Oxford University Press, 2010.
Habermas, Jürgen. Faktizität und Geltung. Frankfurt: Suhrkamp, 1992. Traduzione italiana: Fatti e norme. Roma-Bari: Laterza, 1996.
Jasanoff, Sheila. Designs on Nature: Science and Democracy in Europe and the United States. Princeton: Princeton University Press, 2005.
Jasanoff, Sheila. The Fifth Branch: Science Advisers as Policymakers. Cambridge: Harvard University Press, 1990.
Jonas, Hans. Das Prinzip Verantwortung. Frankfurt: Insel Verlag, 1979. Traduzione italiana: Il principio responsabilità, a cura di P. P. Portinaro. Torino: Einaudi, 1990.
Kitcher, Philip. The Advancement of Science. Oxford: Oxford University Press, 1993.
Kitcher, Philip. «The Division of Cognitive Labor». Journal of Philosophy 87, n. 1 (1990): 5–22.
Kuhn, Thomas S. The Structure of Scientific Revolutions. Chicago: University of Chicago Press, 1962.
Longino, Helen E. Science as Social Knowledge. Princeton: Princeton University Press, 1990.
Luhmann, Niklas. Das Recht der Gesellschaft. Frankfurt: Suhrkamp, 1993. Traduzione italiana: Il diritto della società. Torino: Giappichelli, 2012.
Luhmann, Niklas. Soziale Systeme. Frankfurt: Suhrkamp, 1984. Traduzione italiana: Sistemi sociali. Bologna: Il Mulino, 1990.
MacKenzie, Donald. An Engine, Not a Camera: How Financial Models Shape Markets. Cambridge: MIT Press, 2006.
Maslej, Nestor et al., Artificial Intelligence Index Report 2026, Stanford Institute for Human-Centered Artificial Intelligence (HAI), cap. 8, Stanford, 2026, disponibile su aiindex.stanford.edu.
Mazzucato, Mariana. The Entrepreneurial State: Debunking Public vs. Private Sector Myths. London: Anthem Press, 2013.
Vallor, Shannon. Technology and the Virtues: A Philosophical Guide to a Future Worth Wanting. Oxford: Oxford University Press, 2016.
Wallach, Wendell, e Colin Allen. Moral Machines: Teaching Robots Right from Wrong. Oxford: Oxford University Press, 2009.
Floridi, Luciano, Josh Cowls et al. «An Ethical Framework for a Good AI Society». Minds and Machines 29 (2019): 689–707.
Dignum, Virginia. Responsible Artificial Intelligence: How to Develop and Use AI in a Responsible Way. Cham: Springer, 2019.
Parfit, Derek. Reasons and Persons. Oxford: Oxford University Press, 1984.
Parfit, Derek. «The Unimportance of Identity». In Identity, a cura di Henry Harris, 13–45. Oxford: Oxford University Press, 1995.
Popper, Karl R. The Logic of Scientific Discovery. London: Hutchinson, 1959.
Popper, Karl R. The Open Society and Its Enemies. London: Routledge, 1945. Traduzione italiana: La società aperta e i suoi nemici. Roma: Armando, 1996.
Quinn, Terry. From Artefacts to Atoms. Oxford: Oxford University Press, 2012.
Raji, Inioluwa Deborah, Andrew Smart, Rebecca N. White, Margaret Mitchell, Timnit Gebru, Ben Hutchinson, Jamila Smith-Loud, Daniel Theron e Parker Barnes. «Closing the AI Accountability Gap: Defining an End-to-End Framework for Internal Algorithmic Auditing». In Proceedings of the 2020 Conference on Fairness, Accountability, and Transparency. New York: ACM, 2020, pp. 33–44.
Research, Anthropic. «Natural Language Autoencoders: Translating Claude’s Thoughts into Text». 7 maggio 2026. https://www.anthropic.com/research/natural-language-autoencoders.
Teubner, Gunther. Law as an Autopoietic System. Oxford: Blackwell, 1993.
Teubner, Gunther. «Substantive and Reflexive Elements in Modern Law». Law & Society Review 17, n. 2 (1983): 239–285.
Turpin, Miles, Julian Michael, Ethan Perez e Samuel R. Bowman. “Language Models Don’t Always Say What They Think: Unfaithful Explanations in Chain-of-Thought Prompting.” In Advances in Neural Information Processing Systems 36 (NeurIPS 2023). New York: Curran Associates, 2023.
Unione Europea. Direttiva (UE) 2024/2853 del Parlamento europeo e del Consiglio, del 23 ottobre 2024, relativa alla responsabilità per danno da prodotti difettosi, GU L, 2024/2853. Sostituisce la Direttiva 85/374/CEE del Consiglio.
Weber, Max. «Die ‘Objektivität’ sozialwissenschaftlicher und sozialpolitischer Erkenntnis» (1904). In Gesammelte Aufsätze zur Wissenschaftslehre. Tübingen: Mohr, 1922. Traduzione italiana: «L’“oggettività” conoscitiva della scienza sociale e della politica sociale». In Il metodo delle scienze storico-sociali. Torino: Einaudi, 1958.
Campbell, Donald T. “Assessing the Impact of Planned Social Change.” In Social Research and Public Policies, a cura di G. M. Lyons, 3–45. Hanover: Dartmouth College, 1976.
Danaher, John. “The Threat of Algocracy: Reality, Resistance and Accommodation.” Philosophy & Technology 29, n. 3 (2016): 245–268.
Goodhart, Charles. “Problems of Monetary Management: The U.K. Experience.” In Papers in Monetary Economics, vol. I. Sydney: Reserve Bank of Australia, 1975.
Thomas, Jessie J., e David Uminsky. “Reliance on Metrics is a Fundamental Challenge for AI.” Patterns 3, n. 5 (2022): 100485.
- UNIONE EUROPEA – Regolamento (UE) 2024/1689 del Parlamento europeo e del Consiglio, del 13 giugno 2024, che stabilisce regole armonizzate sull’intelligenza artificiale (Artificial Intelligence Act o AI Act).
- Council of the European Union, Press Release 299/26, Artificial Intelligence: Council and Parliament agree to simplify and streamline rules, 7 maggio 2026. Accordo provvisorio (provisional agreement); testo legislativo formale in corso di adozione al momento della chiusura del presente articolo
- CONSIGLIO D’EUROPA – Framework Convention on Artificial Intelligence and Human Rights, Democracy and the Rule of Law (Convenzione quadro sull’intelligenza artificiale e i diritti umani, la democrazia e lo stato di diritto), identificata come CETS No. 225.
- STATO DI NEW YORK (USA) – Responsible AI Safety and Education Act (RAISE Act), contenuto nell’Assembly Bill A9449 (che emenda la legge generale sugli affari dello Stato).
- CALIFORNIA (USA) – Transparency in Frontier Artificial Intelligence Act (TFAIA), nota anche come Senate Bill SB-53.
- CANADA – Artificial Intelligence and Data Act (AIDA), che costituisce la Parte 3 del più ampio Bill C-27 (Digital Charter Implementation Act).
- BRASILE – Projeto de Lei N° 2338/2023 (conosciuto anche come Marco Legal da Inteligência Artificial), che stabilisce norme generali per lo sviluppo e l’uso dell’IA in Brasile.
- CINA – A Next Generation Artificial Intelligence Development Plan (Piano di sviluppo per l’intelligenza artificiale di nuova generazione), emanato tramite il Documento n. 35 del Consiglio di Stato del 2017.
- USA (LIVELLO FEDERALE) – Executive Order 14110 on the Safe, Secure, and Trustworthy Development and Use of Artificial Intelligence (Ordine Esecutivo sullo sviluppo e l’uso sicuro, protetto e affidabile dell’IA), firmato il 30 ottobre 2023, revocato dall’amministrazione Trump.
[1] Sul ruolo dei laboratori AI nella definizione degli standard internazionali, si vedano i processi di standardizzazione ISO/IEC SC 42 e la partecipazione diretta di Anthropic, Google e OpenAI ai lavori del NIST AI Risk Management Framework (2023). Per i documenti fondativi dei principali laboratori: Anthropic, Claude’s Model Spec (2024); OpenAI, Model Spec (2024).
[2] Cfr. Nestor Maslej et al., Artificial Intelligence Index Report 2026, Stanford Institute for Human-Centered Artificial Intelligence (HAI), cap. 8, Stanford, 2026, disponibile su aiindex.stanford.edu.
[3] Regolamento (UE) 2024/1689 del Parlamento Europeo e del Consiglio, del 13 giugno 2024, che stabilisce regole armonizzate sull’intelligenza artificiale (AI Act), pubblicato nella Gazzetta Ufficiale dell’Unione Europea il 12 luglio 2024.
[4] David J. Chalmers, «What We Talk to When We Talk to Language Models», PhilArchive, 2025, https://philarchive.org/rec/CHAWWT-8.
[5] Niklas Luhmann, Soziale Systeme: Grundriß einer allgemeinen Theorie (Frankfurt: Suhrkamp, 1984); trad. it. Sistemi sociali: fondamenti di una teoria generale (Bologna: Il Mulino, 1990); Niklas Luhmann, Das Recht der Gesellschaft (Frankfurt: Suhrkamp, 1993); trad. it. Il diritto della società (Torino: Giappichelli, 2012).
[6] Miles Turpin, Julian Michael, Ethan Perez e Samuel R. Bowman, ‘Language Models Don’t Always Say What They Think: Unfaithful Explanations in Chain-of-Thought Prompting’, in Advances in Neural Information Processing Systems 36 (NeurIPS 2023), New York: Curran Associates, 2023.
[7] Y. Chen, J. Benton et al., «Reasoning Models Don’t Always Say What They Think», Anthropic Technical Report, 2025, https://www.anthropic.com/research/reasoning-models-dont-say-what-they-think.
[8] Y.-H. Chen, R. McCarthy et al., «Reasoning Models Struggle to Control their Chains of Thought», arXiv:2603.05706, 2026.
[9] Michael S. Gazzaniga, The Social Brain: Discovering the Networks of the Mind (New York: Basic Books, 1985); Michael S. Gazzaniga, «Cerebral Specialization and Interhemispheric Communication», Brain 123, n. 7 (2000): 1293–1326.
[10] Convention du Mètre, firmata a Parigi il 20 maggio 1875. Si veda Terry Quinn, From Artefacts to Atoms: The BIPM and the Search for Ultimate Measurement Standards (Oxford: Oxford University Press, 2012).
[11] La ridefinizione del Sistema Internazionale di Unità (SI) entrata in vigore il 20 maggio 2019 ha ridefinito le sette unità base – tra cui il chilogrammo – in termini di costanti fisiche fondamentali, eliminando gli ultimi artefatti fisici come standard di misura. Questa revisione conferma che la ricalibrazione continua non è un’anomalia del sistema metrologico ma la sua struttura propria.
[12] Gunther Teubner, «Substantive and Reflexive Elements in Modern Law», Law & Society Review 17, n. 2 (1983): 239–285; Gunther Teubner, Law as an Autopoietic System (Oxford: Blackwell, 1993).
[13] Nestor Maslej et al., Artificial Intelligence Index Report 2026, Stanford Institute for Human-Centered Artificial Intelligence (HAI), cap. 8, Stanford, 2026, disponibile su aiindex.stanford.edu.
[14] Council of the European Union, Press Release 299/26, Artificial Intelligence: Council and Parliament agree to simplify and streamline rules, 7 maggio 2026. Accordo provvisorio (provisional agreement); testo legislativo formale in corso di adozione al momento della chiusura del presente articolo.
[15] Hans Jonas, Das Prinzip Verantwortung: Versuch einer Ethik für die technologische Zivilisation (Frankfurt: Insel Verlag, 1979); trad. it. Il principio responsabilità: un’etica per la civiltà tecnologica, a cura di P. P. Portinaro (Torino: Einaudi, 1990).
[16] Ibid., pp. 36–40; trad. it. pp. 16–19.
[17] Ibid., pp. 63–70; trad. it. pp. 45–50.
[18] Helen E. Longino, Science as Social Knowledge: Values and Objectivity in Scientific Inquiry (Princeton: Princeton University Press, 1990), cap. 4.
[19] Philip Kitcher, «The Division of Cognitive Labor», Journal of Philosophy 87, n. 1 (1990): 5–22; Philip Kitcher, The Advancement of Science: Science without Legend, Objectivity without Illusions (Oxford: Oxford University Press, 1993), cap. 8.
[20] Sheila Jasanoff, The Fifth Branch: Science Advisers as Policymakers (Cambridge: Harvard University Press, 1990).
[21] Sheila Jasanoff, Designs on Nature: Science and Democracy in Europe and the United States (Princeton: Princeton University Press, 2005), cap. 10.
[22] Derek Parfit, Reasons and Persons (Oxford: Oxford University Press, 1984), Parte III; Derek Parfit, «The Unimportance of Identity», in Henry Harris (a cura di), Identity: Essays Based on Herbert Spencer Lectures Given in the University of Oxford (Oxford: Oxford University Press, 1995), pp. 13–45.
[23] D.J. Chalmers, «What We Talk to When We Talk to Language Models».
[24] La riduzione dell’identità personale a relazioni di continuità psicologica, anziché a una sostanza individuale, è di Parfit: Reasons and Persons, cit., Parte III, cap. 15. L’applicazione di analoghe difficoltà ai sistemi AI è sviluppata da Chalmers in «What We Talk to When We Talk to Language Models», cit., sebbene quel testo non richiami esplicitamente Parfit: il parallelismo è inferito dall’analogia strutturale dei problemi di identità, non da una dipendenza testuale dichiarata.
[25] Per lo sviluppo applicativo alla governance, si veda Francesco D’Isa, ‘Con chi stiamo parlando’, SEPAI, 2025, https://www.sepai-international.org/con-chi-stiamo-parlando.
[26] Direttiva (UE) 2024/2853 del Parlamento europeo e del Consiglio, del 23 ottobre 2024, relativa alla responsabilità per danno da prodotti difettosi, GU L, 2024/2853. Sostituisce la Direttiva 85/374/CEE del Consiglio.
[27] Tra i contributi più rappresentativi di questa tradizione: Shannon Vallor, Technology and the Virtues: A Philosophical Guide to a Future Worth Wanting (Oxford: Oxford University Press, 2016), in particolare i capp. 2–3 sull’apprendimento morale situato; Luciano Floridi et al., «An Ethical Framework for a Good AI Society: Opportunities, Risks, Principles, and Recommendations», Minds and Machines 29 (2019): 689–707; Virginia Dignum, Responsible Artificial Intelligence: How to Develop and Use AI in a Responsible Way (Cham: Springer, 2019); Mario De Caro e Benedetta Giovanola, Intelligenze: Etica e politica dell’IA (Bologna: il Mulino, 2026). Per un’applicazione diretta dell’etica della virtù ai sistemi di apprendimento automatico si veda anche Wendell Wallach e Colin Allen, Moral Machines: Teaching Robots Right from Wrong (Oxford: Oxford University Press, 2009).
[28] Aristotele, Etica Nicomachea, VI, 5, 1140a25–b30; trad. it. a cura di C. Natali (Roma-Bari: Laterza, 2005).
[29] Aristotele, Etica Nicomachea, II, 1, 1103a15–25.
[30] Donald MacKenzie, An Engine, Not a Camera: How Financial Models Shape Markets (Cambridge: MIT Press, 2006).
[31] Charles Goodhart, “Problems of Monetary Management: The U.K. Experience”, in Papers in Monetary Economics, vol. I (Sydney: Reserve Bank of Australia, 1975). Donald T. Campbell, “Assessing the Impact of Planned Social Change”, in Social Research and Public Policies, a cura di G. M. Lyons (Hanover: Dartmouth College, 1976), pp. 3–45.
[32] Jessie J. Thomas e David Uminsky, “Reliance on Metrics is a Fundamental Challenge for AI”, Patterns 3, n. 5 (2022): 100485.
[33] Max Weber, «Die ‘Objektivität’ sozialwissenschaftlicher und sozialpolitischer Erkenntnis» (1904), in Gesammelte Aufsätze zur Wissenschaftslehre (Tübingen: Mohr, 1922); trad. it. «L’“oggettività” conoscitiva della scienza sociale e della politica sociale», in Il metodo delle scienze storico-sociali (Torino: Einaudi, 1958).
[34] Thomas S. Kuhn, The Structure of Scientific Revolutions (Chicago: University of Chicago Press, 1962); Paul Feyerabend, Against Method (London: New Left Books, 1975).
[35] Anthropic Research, «Natural Language Autoencoders: Translating Claude’s Thoughts into Text», 7 maggio 2026, https://www.anthropic.com/research/natural-language-autoencoders.
[36] Ibid.
[37] Inioluwa Deborah Raji, Andrew Smart, Rebecca N. White, Margaret Mitchell, Timnit Gebru, Ben Hutchinson, Jamila Smith-Loud, Daniel Theron e Parker Barnes, «Closing the AI Accountability Gap: Defining an End-to-End Framework for Internal Algorithmic Auditing», in Proceedings of the 2020 Conference on Fairness, Accountability, and Transparency (New York: ACM, 2020), pp. 33–44.
[38] Gary Gorton, Slapped by the Invisible Hand: The Panic of 2007 (Oxford: Oxford University Press, 2010); Financial Crisis Inquiry Commission, The Financial Crisis Inquiry Report (Washington: US Government Printing Office, 2011), capp. 8–9.
[39] Mariana Mazzucato, The Entrepreneurial State: Debunking Public vs. Private Sector Myths (London: Anthem Press, 2013). L’argomento sui costi dell’investimento pubblico infrastrutturale come scelta giustificabile solo in orizzonte strategico di lungo periodo è sviluppato nell’impianto generale del volume; il riferimento qui riguarda specificamente la costruzione di capacità computazionale sovrana, per analogia con i casi di investimento statale in settori ad alta intensità tecnologica analizzati da Mazzucato.
[40] Mariana Mazzucato, The Entrepreneurial State, cit. Si noti che l’argomentazione di Mazzucato riguarda primariamente la stimolazione dell’innovazione attraverso il procurement come investitore di prima istanza; il riferimento qui è analogico: il procurement come leva capace di orientare l’offerta verso standard di verificabilità senza richiedere accordo preventivo sui contenuti normativi.
[41] Jürgen Habermas, Faktizität und Geltung (Frankfurt: Suhrkamp, 1992); trad. it. Fatti e norme (Roma-Bari: Laterza, 1996), capp. 3–4.
[42] Karl R. Popper, The Open Society and Its Enemies, 2 voll. (London: Routledge, 1945), vol. I, cap. 7; trad. it. La società aperta e i suoi nemici (Roma: Armando, 1996).



