Claude Opus 4.8, il nuovo modello di punta di Anthropic è più autonomo, veloce e “onesto”

Antropico ha lanciato Claude Opus 4.8l’aggiornamento del suo modello di intelligenza artificiale di punta, pensato per migliorare le prestazioni, ragionamento e collaborazione nelle attività complesse di programmazione, nel lavoro intellettuale e nell’esecuzione di processi tramite agenti autonomi. Uno degli aspetti più interessanti della nuova versione è che, nella configurazione standard, mantiene lo stesso prezzo e lo stesso numero di token rispetto al modello precedente.

La società ha spiegato che “Opus 4.8 si basa su Opus 4.7, con una capacità di valutazione più precisa, una maggiore onestà sui propri progressi e la capacità di lavorare in modo indipendente più a lungo rispetto ai suoi predecessori”.

Stando ai prova interni dell’azienda, Claudio Opus 4.8 mostra i risultati migliori dei modelli precedenti di Anthropic e dei sistemi sviluppati da altri concorrenti in diversi indicatori di prestazione.

Un modello più autonomo

Nelle attività di programmazione agentica, per esempio, il nuovo modello ha ottenuto un punteggio del 69,2%, maggiore rispetto a Opus 4.7, GPT-5.5 e Gemelli 3.1 Pro. Ma ha ottenuto risultati più alti anche nel ragionamento multidisciplinare. Senza il supporto di strumenti esterni, Opus 4.8 ha ottenuto un punteggio del 49,8%, superando di oltre cinque punti percentuali i sistemi più avanzati di OpenAI e Google.

Tra i miglioramenti più rilevanti, il team di Anthropic ha citato anche “l’onestà del modello”. Secondo l’aziendaOpus 4.8 è stato addestrato a riconoscere più efficacemente eventuali anomalie ea evitare affermazioni non corroborate da risultare sufficienti.

Un’ulteriore novità è l’introduzione dei cosiddetti flussi di lavoro dinamiciflussi di lavoro dinamici che consentono a Claude Code di pianificare attività ed eseguire centinaia di subagenti in parallelo all’interno di una singola sessione di lunga durata. A questo si aggiunge anche la modalità veloceprogettato per lavorare fino a 2,5 volte più rapidamente.

Claude Opus 4.8, il nuovo modello di punta di Anthropic è più autonomo, veloce e “onesto”

Un modello più autonomo

Revolut mette fine alla politica Remote-First per le assunzioni di laureati a partire dal 2027

Triplice omicidio a Roma, uccisi a coltellate genitori e figlia minorenne – Notizie

Trailer dell’uscita del 25° anniversario di “Wet Hot American Summer”.

Temptation Island batte il calcio

L’Unison sostiene Ed Miliband alla carica di Cancelliere sotto il governo di Burnham

IN EVIDENZA
Related

Revolut mette fine alla politica Remote-First per le assunzioni di laureati a partire dal 2027

Triplice omicidio a Roma, uccisi a coltellate genitori e figlia minorenne – Notizie

Trailer dell’uscita del 25° anniversario di “Wet Hot American Summer”.

Temptation Island batte il calcio

Chi Siamo

Gruppo

Ultimi Articoli

Revolut mette fine alla politica Remote-First per le assunzioni di laureati a partire dal 2027

Triplice omicidio a Roma, uccisi a coltellate genitori e figlia minorenne – Notizie

Trailer dell’uscita del 25° anniversario di “Wet Hot American Summer”.

Claude Opus 4.8, il nuovo modello di punta di Anthropic è più autonomo, veloce e “onesto”

Un modello più autonomo

IN EVIDENZARelated

Chi Siamo

Gruppo

Ultimi Articoli

IN EVIDENZA
Related