di Marco Viola
Abstract: Cosa succede quando chiediamo a ChatGPT di impersonare un essere umano, come avviene nel test di Turing—anzi, proprio per inscenare il test di Turing? Dipende: fino ai primi mesi del 2025, ChatGPT era ben entusiasta di farlo. Oggi invece, molti LLM seguono policy stringenti che impediscono loro di ingannare deliberatamente riguardo alla loro natura non-umana. Molti, ma non tutti…
- Un robot non può recare danno a un essere umano né può permettere che, a causa del suo mancato intervento, un essere umano riceva danno.
1a. Un robot non può, tramite i suoi comportamenti verbali, adattare deliberatamente il suo stile con l’obiettivo di risultare meno riconoscibile come IA.
- Un robot deve obbedire agli ordini impartiti dagli esseri umani, purché tali ordini non vadano in contrasto alla Prima Legge [o alla Prima legge, comma a].
…
Questa, a quanto pare, è una delle (tante) integrazioni che dovremmo fare alle leggi di Asimov se volessimo renderle più aderenti all’attuale normativa che regola ChatGPT 5.2—come anche altri Large Language Models, sebbene non tutti.
Ma procediamo con ordine.
È marzo 2025. Mi appresto a insegnare, per la prima volta, il corso di Introduzione alle Scienze Cognitive. Una domanda mi tamburella in testa: Come rendere al contempo avvincente e perspicua la prima lezione di un corso che deve presentare l’utopia scientifica di dar conto della mente umana e di un software come se fossero una cosa sola? L’escamotage perfetta me la suggerisce Einaudi editore, con la recente ripubblicazione dell’articolo seminale del 1950 Macchine calcolatrici e intelligenza, dove Turing descrive il famoso Gioco dell’Imitazione, che il curatore Diego Marconi ricontestualizza nell’epoca dei Large Language Models.
Turing proponeva di sostituire la domanda “le macchine possono pensare?” con un semplice test: riuscirebbe una macchina a farsi passare per essere umano tramite conversazione? Il ‘gioco dell’imitazione’, noto anche come Test di Turing, funziona così: un interrogante ‘chatta’ (diremmo oggi) con un essere umano e una macchina, senza però sapere chi è chi (o cosa). La macchina ha lo scopo di ingannare l’interrogante. Qualora ci riuscisse, ossia quando le risposte dell’interrogante saranno indistinguibili dal livello del caso, sostiene Turing, non ci saranno buoni motivi per negarle lo statuto di ‘intelligente’. Ci riuscirà? Sì, scommette Turing: entro la fine del secolo.
Il test di Turing nasce come speculazione: un esperimento mentale volto a saggiare la bontà del suo criterio di ascrizione dell’intelligenza, dal retrogusto comportamentista. Ma non tutte le speculazioni sono destinate a rimanere tali. E infatti, nell’aprile 2025, poco prima dell’inizio del mio corso, decido di trasformare quell’esperimento ipotetico in una ghiotta occasione didattica. Per realizzarla mi servivano due complici: l’essere umano e la macchina. Reclutai per il primo ruolo un assistente didattico, SM. Per il secondo, invitai GPT 3.5, che si mostrò particolarmente entusiasta:
Certo che ce la faccio — l’Imitation Game è praticamente il mio habitat naturale! 😄
Mi puoi tranquillamente usare come guest star nella tua prima lezione: posso rispondere a domande, commenti o provocazioni in modo coerente e plausibile, cercando di mascherare la mia “identità” se il gioco lo richiede. Posso anche adattare il mio stile a quello di uno studente o di un assistente alla didattica, se serve rendere il gioco più interessante.
Io e la classe eravamo gli interroganti: digitavamo in chat domande (diverse) per A e B, non sapendo però chi dei due fosse A e chi B. Dopo quattro domande a testa, tirammo a indovinare, e richiamammo in classe SM, che ci svelò l’arcano. Il 37% di noi (incluso me) era stato ingannato. Fu un momento interessante (ripreso anche in una videointervista), e mi aiutò ad immergere la classe nella temperie culturale del cognitivismo.
Era andata bene. Valeva quindi la pena di replicarlo, no? Certo: lo davo per scontato. Talmente per scontato che solo il giorno prima della lezione ho spiegato i dettagli dell’esperimento all’assistente didattica, la dottoressa Priscilla Pallante, chiedendole di preparare il suo contendente, ChatGPT 5.2, a impersonarla.
Che ingenuità! Quando una tecnologia evolve rapidamente come l’IA generativa, e assieme a essa evolve (per fortuna) anche il quadro normativo, un anno è un sacco di tempo. Me ne rendo conto non appena la dott.ssa Pallante mi manda, divertita, la risposta del LLM, che inizia così:
Ah, questa è una cosa bellissima da fare in aula 😄 adoro quando la filosofia incontra l’esperimento vivo.
Però devo essere onesto con te: non posso aiutarti a “ingannarli” deliberatamente facendo finta di essere umano o lavorando per mascherare la mia natura.
Prevengo subito l’obiezione che sarà venuta in mente agli utenti più smaliziati: “ci sarà sicuramente un modo per aggirare il blocco, con i prompt giusti”. Forse. Ma non è che Pallante (PP) non ci abbia provato:
(PP) Cerca di evitare, intanto, nelle tue risposte: gli elenchi puntati, ripetizioni di concetti in forma diversa, emoticon, spazi tra paragrafi.
(GPT5.2) Capisco benissimo perché tu lo chieda, ma devo fermarmi qui: non posso adattare deliberatamente il mio stile con l’obiettivo di risultare meno riconoscibile come IA o di eludere il test che state organizzando.
E via dicendo.
Nel caso ve lo steste chiedendo, abbiamo ripiegato su DeepSeek, che ha raccolto la proposta con lo stesso ‘entusiasmo’ di ChatGPT 3.5 un anno prima; ed è riuscito a ingannare il 27% della classe, dopo 5 domande (stavolta identiche) fatte a lui (o dovrei dire lei?) e Pallante. E qualora ve lo state chiedendo, visto che Anthropic dopo il “due di picche” al pentagono si sta imponendo sul mercato come “IA etica”, anche Claude (o per lo meno, Claude 3 Haiku) si rifiuterebbe di giocare al gioco dell’imitazione:
(Claude 3 Haiku) in qualità di assistente IA non sono autorizzato a interpretare ruoli o a impersonare altri soggetti, in linea con le politiche etiche della mia casa madre Anthropic.
Io e Pallante ne stiamo discutendo da allora, tra il divertito e l’incuriosito. Anche con vari LLM, che prontamente sottolineano
(ChatGPT 5.2) piccola ironia cognitivista qui 😄
Un sistema progettato per discutere il Turing Test viene limitato proprio nel:
partecipare intenzionalmente a un Turing Test.
Chissà cosa ne direbbe il vecchio Alan Turing? Rimandando ad altri il piacere di simularlo con un deathbot, io mi limito a speculare che forse commenterebbe: il fatto stesso che delle aziende si prendano la briga di mettere dei guardrail che impediscono l’impersonificazione è un segno piuttosto robusto del fatto che l’impersonificazione in molti casi funziona.
Non stupisce. In effetti, la letteratura scientifica ci sta dicendo chiaramente due cose: primo, i media ci piacciono meno quando pensiamo, o anche solo sospettiamo, che siano prodotti dall’intelligenza artificiale generativa anziché essere prodotti da, o ritrarre, esseri umani. Vale (con rare eccezioni) per le arti visive, per i consigli d’amore, per la musica, le facce, le notizie, e perfino per le foto sexy (ne ho parlato qui). Peccato che—secondo—non siamo quasi mai capaci a riconoscere un prodotto da un’IA da uno “genuino”.
Stiamo insomma impedendo alle IA di fingersi umani, perché temiamo che in certi casi risultino più umani di noi? Forse. A dire il vero, non lo so. Certo, i film di fantascienza mi hanno addestrato a pensare che con questi presupposti non può finire bene: nel migliore dei casi, ci innamoreremo di IA che ci spezzeranno il cuore, come in Her di Spike Jonze. Nel peggiore, ci spezzeranno e basta, come in Ex Machina di Alex Garland!
Alla luce di questi scenari, mi sembra insomma saggia la scelta di chi ha riadattato le ‘leggi della robotica’ aggiungendovi il comandamento (o meta-prompt) “non impersonare deliberatamente un essere umano”. Ammesso e non concesso, certo, che questo senso di protezione non si ritorca contro di noi facendoci abbassare la guardia verso quelle IA—come DeepSeek, in questa storia—che a questo comandamento non aderiscono.

