Antropico ha lanciato Claude Opus 4.8l’aggiornamento del suo modello di intelligenza artificiale di punta, pensato per migliorare le prestazioni, ragionamento e collaborazione nelle attività complesse di programmazione, nel lavoro intellettuale e nell’esecuzione di processi tramite agenti autonomi. Uno degli aspetti più interessanti della nuova versione è che, nella configurazione standard, mantiene lo stesso prezzo e lo stesso numero di token rispetto al modello precedente.
La società ha spiegato che “Opus 4.8 si basa su Opus 4.7, con una capacità di valutazione più precisa, una maggiore onestà sui propri progressi e la capacità di lavorare in modo indipendente più a lungo rispetto ai suoi predecessori”.
Stando ai prova interni dell’azienda, Claudio Opus 4.8 mostra i risultati migliori dei modelli precedenti di Anthropic e dei sistemi sviluppati da altri concorrenti in diversi indicatori di prestazione.
Un modello più autonomo
Nelle attività di programmazione agentica, per esempio, il nuovo modello ha ottenuto un punteggio del 69,2%, maggiore rispetto a Opus 4.7, GPT-5.5 e Gemelli 3.1 Pro. Ma ha ottenuto risultati più alti anche nel ragionamento multidisciplinare. Senza il supporto di strumenti esterni, Opus 4.8 ha ottenuto un punteggio del 49,8%, superando di oltre cinque punti percentuali i sistemi più avanzati di OpenAI e Google.
Tra i miglioramenti più rilevanti, il team di Anthropic ha citato anche “l’onestà del modello”. Secondo l’aziendaOpus 4.8 è stato addestrato a riconoscere più efficacemente eventuali anomalie ea evitare affermazioni non corroborate da risultare sufficienti.
Un’ulteriore novità è l’introduzione dei cosiddetti flussi di lavoro dinamiciflussi di lavoro dinamici che consentono a Claude Code di pianificare attività ed eseguire centinaia di subagenti in parallelo all’interno di una singola sessione di lunga durata. A questo si aggiunge anche la modalità veloceprogettato per lavorare fino a 2,5 volte più rapidamente.
