image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Black Friday

Novità!

Prova la nuova modalità di navigazione con le storie!

Accedi a Xenforo
Immagine di Windows 26 riprende l’eredità di Vista e 7, ma con stile Windows 26 riprende l’eredità di Vista e 7, ma con stile...
Immagine di Scatta il blocco sui siti porno: cosa succede ora? Scatta il blocco sui siti porno: cosa succede ora?...

Altro che aiuto: l'AI rallenta i programmatori open source

I programmatori hanno impiegato più tempo a gestire l'AI e rivedere il codice generato rispetto al tempo risparmiato nella programmazione.

Advertisement

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Marco Pedrani

a cura di Marco Pedrani

Caporedattore centrale

Pubblicato il 15/07/2025 alle 12:55

La notizia in un minuto

  • La ricerca METR dimostra che gli assistenti AI non migliorano la produttività degli sviluppatori su progetti complessi reali, poiché il tempo risparmiato nella scrittura viene assorbito dalla gestione dei prompt e revisione degli output
  • L'AI fallisce nell'utilizzare la conoscenza tacita dei codebase maturi, mentre gli sviluppatori esperti traggono vantaggio dalla loro familiarità con convenzioni non documentate e requisiti impliciti
  • Nonostante le limitazioni attuali, tecniche come il prompt scaffolding e nuovi modelli come Claude 3.7 mostrano potenziale per miglioramenti futuri dell'efficacia dell'AI nella programmazione
Riassunto generato con l'IA. Potrebbe non essere accurato.

Il paradosso dell'efficienza nell'era dell'intelligenza artificiale emerge con particolare evidenza nel mondo della programmazione, dove gli strumenti di AI promettono di rivoluzionare la produttività degli sviluppatori. Una nuova ricerca condotta da METR ha però messo in discussione queste aspettative, analizzando l'impatto reale degli assistenti AI su progetti di codifica complessi e pre-esistenti. I risultati mostrano che il tempo risparmiato nella scrittura attiva del codice viene completamente assorbito dalle ore necessarie per formulare prompt, attendere le risposte dell'AI e rivedere accuratamente gli output generati.

Il divario tra laboratorio e realtà

Gli esperimenti precedenti che celebravano l'efficacia dell'AI nella programmazione si basavano spesso su metriche fuorvianti come il numero totale di righe di codice prodotte o la quantità di task completati. Questi parametri, tuttavia, si rivelano proxy inadeguati per misurare la vera efficienza nella codifica. La maggior parte dei benchmark esistenti si concentra su compiti sintetici e algoritmicamente valutabili, creati appositamente per i test, rendendo difficile il confronto con il lavoro su codebase reali e consolidate.

I repository utilizzati nello studio METR raccontano una storia diversa: con un'età media di 10 anni e oltre un milione di righe di codice ciascuno, rappresentano la complessità del mondo reale. Gli sviluppatori coinvolti nella ricerca hanno riferito attraverso sondaggi che proprio questa complessità ha limitato significativamente l'utilità dell'AI.

Conoscenza tacita versus intelligenza artificiale

L'elemento cruciale emerso dalla ricerca riguarda l'incapacità dell'AI di utilizzare quella che i ricercatori definiscono "conoscenza tacita o contesto importante" relativa al codebase. Mentre l'elevata familiarità degli sviluppatori con i repository ha potenziato la loro efficienza umana in questi compiti, l'intelligenza artificiale si è trovata spiazzata di fronte a sfumature e convenzioni non documentate che caratterizzano progetti software maturi.

La conoscenza tacita batte l'intelligenza artificiale sui progetti complessi

Questa limitazione porta i ricercatori a concludere che gli attuali strumenti di AI per la codifica potrebbero essere particolarmente inadatti a "contesti con standard qualitativi molto elevati, o con molti requisiti impliciti". Tali requisiti includono aspetti relativi alla documentazione, alla copertura dei test, o alle convenzioni di linting e formattazione che richiedono agli sviluppatori umani tempo considerevole per essere appresi.

Prospettive future e ottimismo tecnologico

Nonostante i risultati attuali, i ricercatori mantengono un cauto ottimismo riguardo al potenziale futuro degli strumenti AI nella programmazione. Sistemi caratterizzati da maggiore affidabilità, latenza ridotta o output più pertinenti potrebbero accelerare significativamente il lavoro degli sviluppatori. Tecniche come il prompt scaffolding o il fine-tuning rappresentano strade promettenti per superare le limitazioni attuali.

Esistono già prove preliminari che la recente release di Claude 3.7 riesca spesso a implementare correttamente le funzionalità principali di problemi presenti in diversi repository inclusi nello studio. Tuttavia, mentre questi fattori limitanti potrebbero non applicarsi in "molti contesti realistici ed economicamente rilevanti" che coinvolgono codebase più semplici, la ricerca di METR fornisce evidenze concrete che l'utilità dell'AI in scenari complessi del mondo reale presenta ancora significative limitazioni.

Fonte dell'articolo: arstechnica.com

Leggi altri articoli

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca triangoli

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione
Advertisement

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    Lavorare 72 ore a settimana, il nuovo modello che piace a USA e Cina
  • #2
    BMW X3 20d: il SUV più desiderato d'Italia cambia forma
  • #3
    Sono già 8 milioni gli utenti che programmano con Lovable AI
  • #4
    22% di sconto su Amazon con appena 25€ di spesa
  • #5
    Può esistere massa senza il bosone di Higgs?
  • #6
    Quando gli sconti diventano follia: scopri il Single Day di AliExpress
Articolo 1 di 5
Scatta il blocco sui siti porno: cosa succede ora?
Da oggi 12 novembre, in Italia i siti per adulti devono adottare sistemi di verifica dell'età sicuri e indipendenti, così da rispettare le nuove norme AGCOM.
Immagine di Scatta il blocco sui siti porno: cosa succede ora?
40
Leggi questo articolo
Articolo 2 di 5
Windows 26 riprende l’eredità di Vista e 7, ma con stile
Il designer Abdi propone un Windows 26 che recupera l'estetica di Vista e 7 con il Liquid Glass, mentre Microsoft punta su AI e piattaforme agentiche.
Immagine di Windows 26 riprende l’eredità di Vista e 7, ma con stile
7
Leggi questo articolo
Articolo 3 di 5
Addio visori ingombranti: l’AR fa un salto avanti
Un team dell’Università di Rochester ha creato un nuovo componente ottico che promette di rendere gli occhiali AR più luminosi, efficienti e compatti.
Immagine di Addio visori ingombranti: l’AR fa un salto avanti
Leggi questo articolo
Articolo 4 di 5
AMD Ryzen 5 7500X3D: la 3D V-Cache economica costa troppo? | Test & Recensione
L'ultimo nato con 3D V-Cache ha le carte in regola per finire in tutti i PC da gaming entry level, ma dovrà avere il giusto prezzo.
Immagine di AMD Ryzen 5 7500X3D: la 3D V-Cache economica costa troppo? | Test & Recensione
6
Leggi questo articolo
Articolo 5 di 5
Quante ne sai su i monitor CRT? Mettiti alla prova con il nostro quiz
Sono passati quasi quarant'anni dalla loro epoca d'oro, ma la magia dei monitor CRT è ancora vivida. Quante ne sapete su questi prodotti?
Immagine di Quante ne sai su i monitor CRT? Mettiti alla prova con il nostro quiz
3
Leggi questo articolo
Advertisement
Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.