Anthropic ha recentemente presentato Claude Sonnet 4.5, un modello di AI che promette di trasformare l'approccio al lavoro autonomo e alla programmazione software. La principale novità risiede nella durata e nell'indipendenza operativa che questo strumento è in grado di garantire.
La caratteristica più sorprendente del nuovo modello è infatti la sua capacità di operare ininterrottamente per 30 ore consecutive, mantenendo concentrazione e focus con una supervisione umana ridotta al minimo. Durante questo arco temporale, Claude Sonnet 4.5 è riuscito a costruire un'intera applicazione software da zero, dimostrando un livello di autonomia che segna un salto qualitativo rispetto al passato. Per comprendere l'entità di questo progresso, basta confrontarlo con il suo predecessore Opus 4: appena quattro mesi fa, quel modello riusciva a lavorare autonomamente per sole sette ore.
I risultati ottenuti da Claude Sonnet 4.5 nei test di benchmark industriali confermano la superiorità del modello rispetto ai concorrenti. Sul SWE-Bench Verified, considerato il punto di riferimento per valutare le performance nell'sviluppo software, il nuovo modello di Anthropic ha raggiunto risultati considerati all'avanguardia del settore. Oltre a scrivere codice, identifica miglioramenti, segue istruzioni complesse e genera soluzioni pronte per l'ambiente di produzione.
Le applicazioni pratiche vanno oltre la programmazione: nel settore dei servizi finanziari, Claude Sonnet 4.5 ha dimostrato capacità superiori nella ricerca, nella costruzione di modelli finanziari e nelle previsioni economiche. Questi risultati suggeriscono che l'AI sta evolvendo da strumento di supporto a vero e proprio collaboratore specializzato.
Secondo i dati forniti, Claude sta emergendo come l'AI preferita per applicazioni professionali e aziendali, differenziandosi nettamente da ChatGPT di OpenAI, sempre più orientato verso il mercato consumer. I dati mostrano che il 36% degli utilizzi globali di Claude.ai si concentra su attività matematiche e di programmazione, mentre le applicazioni aziendali tramite API vedono la programmazione rappresentare il 44% del totale.
Ancora più significativo è il dato sull'automazione: circa il 77% delle richieste che arrivano attraverso l'API aziendale non chiede suggerimenti o consigli, ma richiede al sistema di eseguire compiti specifici in completa autonomia. Segno che le aziende stanno usando l'AI eliminare completamente determinate attività dai carichi di lavoro umani.
Anche OpenAI ha riconosciuto che tanto il proprio GPT-5 quanto Claude Opus 4.1 stanno "già avvicinandosi alla qualità del lavoro prodotto da esperti del settore". Tuttavia, le 30 ore di operatività autonoma di Claude Sonnet 4.5 rappresentano un traguardo concreto che va oltre le valutazioni teoriche.
Le conseguenze per il mondo del lavoro potrebbero essere profonde, specialmente in settori come l'ingegneria del software dove i progetti richiedono concentrazione prolungata e competenze specialistiche. La capacità di ridurre la supervisione umana e automatizzare flussi di lavoro ripetitivi non solo accelera le operazioni aziendali, ma potrebbe anche ridefinire la composizione dei team di sviluppo e le strategie di assunzione delle imprese.