A. Dina
Mentre il mercato applaudiva con la solita compostezza teatrale l’arrivo di modelli proprietari come Claude Opus 4.7 e GPT-5.5, la settimana più interessante si è consumata altrove, nel territorio meno glamour ma spesso più fertile dell’open source. È lì che DeepSeek-v4 e Kimi-K2.6 hanno ridefinito la conversazione. Non perché siano perfetti, non perché abbiano superato ogni benchmark, ma perché stanno spostando il potere dai fornitori centralizzati agli sviluppatori che vogliono costruire sistemi reali, non demo da conferenza.
Il punto essenziale è semplice: il mercato dell’intelligenza artificiale sta entrando nella fase in cui il modello conta meno dell’architettura complessiva. Per due anni la narrativa dominante è stata quasi infantile: modello più grande uguale futuro migliore. Più parametri, più miliardi bruciati, più slide con gradienti blu e parole come “alignment”. Oggi la realtà bussa alla porta con scarpe pesanti. Un modello open weights sufficientemente buono, ben orchestrato, integrato con tool, memoria, retrieval e agenti specializzati, può generare più valore di un modello frontier usato male e pagato a token come champagne in aeroporto.
DeepSeek-v4 rappresenta perfettamente questa transizione. È il classico heavyweight contender: enorme, sofisticato, progettato con una logica ingegneristica più che narrativa. Utilizza un’architettura Mixture-of-Experts, il che significa che non tutti i parametri vengono attivati a ogni token. È un dettaglio tecnico che vale miliardi. In pratica si aumenta la capacità teorica del modello senza pagare ogni volta il prezzo pieno in inferenza. Una lezione che molti incumbent hanno imparato tardi, forse perché erano impegnati a raccogliere round.
La versione Pro, con 1,6 trilioni di parametri complessivi e 49 miliardi attivi, mostra quanto l’open source non sia più il campionato minore. La versione Flash, molto più agile, rende il concetto commerciabile: meno costo, più velocità, compromesso razionale. In azienda il compromesso razionale batte spesso la perfezione teorica. È una frase poco romantica, ma i CFO la adorano.
Il vero colpo di scena però non è la dimensione, bensì il contesto da un milione di token. Qui molti manager annuiscono senza capire. Un milione di token non è solo “tanta memoria”; è la possibilità di caricare interi repository software, documentazione tecnica sterminata, contratti, basi di conoscenza industriali, storici di conversazioni e processi operativi complessi dentro un unico ciclo cognitivo. È l’embrione di sistemi che lavorano su problemi lunghi, noiosi e remunerativi. Quelli che contano.
Naturalmente c’è un problema fisico: il KV cache. La memoria necessaria per gestire finestre contestuali immense può diventare una voragine di VRAM. DeepSeek ha risposto con meccanismi di compressione dell’attenzione come CSA e HCA, che riducono il costo operativo del contesto estremo. Dietro l’acronimo tecnico si nasconde una verità manageriale limpida: chi controlla il costo marginale dell’intelligenza controlla il mercato.
Molti parlano di AGI, pochi parlano di memoria GPU. Questo spiega parecchio dello stato del settore.
Altro elemento strategico: licenza MIT. Nessun cappio commerciale, nessuna clausola creativa scritta da un reparto legale in vena di poesia. Per le imprese è ossigeno. Si può integrare, modificare, distribuire, monetizzare. In un’epoca in cui molti vendor chiamano “aperto” ciò che richiede quattro avvocati e tre audit, la semplicità diventa vantaggio competitivo.
DeepSeek-v4 non è perfetto. È più lento di altri concorrenti e oggi resta text-only. Ma qui conviene essere adulti. Le aziende non comprano perfezione, comprano ROI. Se un modello consente automazione interna, coding assistito, analisi documentale e controllo dell’infrastruttura, i limiti multimodali sono spesso secondari. Le presentazioni parlano di video understanding; i bilanci parlano di costi operativi.
Poi arriva Kimi-K2.6, e cambia il tono della conversazione. Se DeepSeek è il motore diesel di una nave industriale, Kimi è il direttore d’orchestra di un sistema multiagente. Multimodale nativo, forte nel coding, affidabile nel tool use, eccellente nel rispetto dei system prompt. Quest’ultimo dettaglio sembra banale finché non si lavora davvero con agenti autonomi. Un modello brillante ma indisciplinato è come un genio assunto senza governance: affascinante il primo giorno, devastante il terzo.
Kimi emerge soprattutto come orchestratore di swarm agentici. Qui siamo oltre il chatbot. Il paradigma non è più una singola intelligenza che risponde in sequenza, ma una struttura che divide il lavoro, crea sotto-agenti, assegna compiti, sincronizza dipendenze e consolida risultati. In pratica, un middle management che funziona davvero. Evento raro nella storia aziendale.
Immaginiamo lo sviluppo di una web app. Un agente definisce schema database, uno costruisce frontend, un altro disegna API, un quarto testa sicurezza, un quinto documenta il codice. L’orchestratore supervisiona. Il tempo si comprime. Gli errori si isolano. Il contesto si specializza. È Taylorismo cognitivo applicato al software, con meno sigari e più JSON.
Chi sottovaluta il modello swarm non ha compreso il prossimo ciclo di produttività. Le aziende non hanno bisogno di un oracolo che scrive poesie su Marte. Hanno bisogno di cento micro-lavoratori sintetici che chiudano ticket, puliscano codice legacy, riconcilino dati e producano output verificabili.
Interessante anche la licenza modificata di Kimi. Se superi determinate soglie di utenti o ricavi, devi esporre il brand in interfaccia. È una tassa reputazionale, non economica. Una mossa intelligente. Nel capitalismo digitale la distribuzione vale quanto il modello, e la visibilità forzata è marketing embedded. Silicon Valley vende API; altri iniziano a vendere presenza.
Nel frattempo Qwen3.6-27B entra quasi in silenzio, e forse proprio per questo merita attenzione. Modello dense da 27 miliardi, Apache 2.0, ideale per macchine locali di fascia alta. Non tutti vogliono dipendere dal cloud. Non tutti possono spedire dati sensibili a terzi. Non tutti amano pagare per token come se fossero tartufi bianchi. Il local AI crescerà più di quanto il mercato ammetta, soprattutto in finanza, legale, sanità, manifattura avanzata e pubblica amministrazione.
C’è una lezione storica da ricordare. Nei primi anni dell’informatica aziendale, i mainframe sembravano invincibili. Poi arrivarono sistemi distribuiti, PC, server commodity, cloud. Ogni ciclo tecnologico parte centralizzato e tende a decentralizzarsi quando il costo dell’hardware scende e il software matura. L’AI non farà eccezione. I monopolisti di oggi dovrebbero rileggere IBM anni Ottanta.
Il vero gap tra modelli open e frontier closed esiste ancora. I migliori sistemi proprietari restano superiori in alcune capacità di reasoning, robustezza generale, multimodalità raffinata e affidabilità edge-case. Ma il vantaggio assoluto conta meno del differenziale economico. Se il closed model è il 15% migliore ma costa cinque volte tanto, il board farà domande spiacevoli. E giustamente.
La metrica che dominerà il prossimo biennio non sarà “chi ha il benchmark più alto”, ma “chi produce più margine per unità di intelligenza impiegata”. Frase poco sexy. Frase molto reale.
Molti founder continueranno a vendere “AI-native” come nel 2024 si vendeva “metaverse-ready”. Alcuni investitori fingeranno entusiasmo professionale. Intanto gli operatori seri costruiranno stack ibridi: modello open per bulk processing, modello premium per task critici, orchestrazione interna, memoria proprietaria, toolchain verticale. È lì che nasceranno i vincitori silenziosi.
Un’altra ironia del settore merita nota. Per anni si è detto che l’open source non avrebbe mai retto contro i budget colossali dei giganti. Ora gli stessi giganti osservano con attenzione release open che comprimono costi, accelerano innovazione e attraggono community tecniche. La folla che rideva dalla tribuna inizia a guardare il tabellone.
Il futuro immediato non sarà dominato da un singolo modello onnipotente. Sarà un ecosistema di modelli specializzati, agenti coordinati, memorie persistenti, strumenti verticali e policy aziendali robuste. Il modello base è solo il motore. Senza telaio, sterzo e freni, resta ferro costoso.
Chi continua a pensare che la partita sia ChatGPT contro il resto sta osservando il parabrezza mentre l’auto è già stata smontata e ricostruita come flotta autonoma.
DeepSeek-v4 e Kimi-K2.6 non sono solo release tecniche. Sono segnali di mercato. L’intelligenza artificiale sta uscendo dalla fase spettacolare e entrando nella fase industriale. È meno scintillante, molto più interessante, e spesso decisamente più redditizia.

