image/svg+xml
Logo Tom's Hardware
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Tom's Hardware Logo
  • Hardware
  • Videogiochi
  • Mobile
  • Elettronica
  • EV
  • Scienze
  • B2B
  • Quiz
  • Forum
  • Sconti & Coupon
Black Friday

Novità!

Prova la nuova modalità di navigazione con le storie!

Accedi a Xenforo
Immagine di Windows “agentico”: bufera sulla nuova visione di Microsoft Windows “agentico”: bufera sulla nuova visione di Micros...
Immagine di I prezzi della RAM ormai sono fuori controllo (e i produttori fanno scorta) I prezzi della RAM ormai sono fuori controllo (e i produttor...

Altro che aiuto: l'AI rallenta i programmatori open source

I programmatori hanno impiegato più tempo a gestire l'AI e rivedere il codice generato rispetto al tempo risparmiato nella programmazione.

Advertisement

Quando acquisti tramite i link sul nostro sito, potremmo guadagnare una commissione di affiliazione. Scopri di più
Avatar di Marco Pedrani

a cura di Marco Pedrani

Caporedattore centrale

Pubblicato il 15/07/2025 alle 12:55

La notizia in un minuto

  • La ricerca METR dimostra che gli assistenti AI non migliorano la produttività degli sviluppatori su progetti complessi reali, poiché il tempo risparmiato nella scrittura viene assorbito dalla gestione dei prompt e revisione degli output
  • L'AI fallisce nell'utilizzare la conoscenza tacita dei codebase maturi, mentre gli sviluppatori esperti traggono vantaggio dalla loro familiarità con convenzioni non documentate e requisiti impliciti
  • Nonostante le limitazioni attuali, tecniche come il prompt scaffolding e nuovi modelli come Claude 3.7 mostrano potenziale per miglioramenti futuri dell'efficacia dell'AI nella programmazione
Riassunto generato con l'IA. Potrebbe non essere accurato.

Il paradosso dell'efficienza nell'era dell'intelligenza artificiale emerge con particolare evidenza nel mondo della programmazione, dove gli strumenti di AI promettono di rivoluzionare la produttività degli sviluppatori. Una nuova ricerca condotta da METR ha però messo in discussione queste aspettative, analizzando l'impatto reale degli assistenti AI su progetti di codifica complessi e pre-esistenti. I risultati mostrano che il tempo risparmiato nella scrittura attiva del codice viene completamente assorbito dalle ore necessarie per formulare prompt, attendere le risposte dell'AI e rivedere accuratamente gli output generati.

Il divario tra laboratorio e realtà

Gli esperimenti precedenti che celebravano l'efficacia dell'AI nella programmazione si basavano spesso su metriche fuorvianti come il numero totale di righe di codice prodotte o la quantità di task completati. Questi parametri, tuttavia, si rivelano proxy inadeguati per misurare la vera efficienza nella codifica. La maggior parte dei benchmark esistenti si concentra su compiti sintetici e algoritmicamente valutabili, creati appositamente per i test, rendendo difficile il confronto con il lavoro su codebase reali e consolidate.

I repository utilizzati nello studio METR raccontano una storia diversa: con un'età media di 10 anni e oltre un milione di righe di codice ciascuno, rappresentano la complessità del mondo reale. Gli sviluppatori coinvolti nella ricerca hanno riferito attraverso sondaggi che proprio questa complessità ha limitato significativamente l'utilità dell'AI.

Conoscenza tacita versus intelligenza artificiale

L'elemento cruciale emerso dalla ricerca riguarda l'incapacità dell'AI di utilizzare quella che i ricercatori definiscono "conoscenza tacita o contesto importante" relativa al codebase. Mentre l'elevata familiarità degli sviluppatori con i repository ha potenziato la loro efficienza umana in questi compiti, l'intelligenza artificiale si è trovata spiazzata di fronte a sfumature e convenzioni non documentate che caratterizzano progetti software maturi.

La conoscenza tacita batte l'intelligenza artificiale sui progetti complessi

Questa limitazione porta i ricercatori a concludere che gli attuali strumenti di AI per la codifica potrebbero essere particolarmente inadatti a "contesti con standard qualitativi molto elevati, o con molti requisiti impliciti". Tali requisiti includono aspetti relativi alla documentazione, alla copertura dei test, o alle convenzioni di linting e formattazione che richiedono agli sviluppatori umani tempo considerevole per essere appresi.

Prospettive future e ottimismo tecnologico

Nonostante i risultati attuali, i ricercatori mantengono un cauto ottimismo riguardo al potenziale futuro degli strumenti AI nella programmazione. Sistemi caratterizzati da maggiore affidabilità, latenza ridotta o output più pertinenti potrebbero accelerare significativamente il lavoro degli sviluppatori. Tecniche come il prompt scaffolding o il fine-tuning rappresentano strade promettenti per superare le limitazioni attuali.

Esistono già prove preliminari che la recente release di Claude 3.7 riesca spesso a implementare correttamente le funzionalità principali di problemi presenti in diversi repository inclusi nello studio. Tuttavia, mentre questi fattori limitanti potrebbero non applicarsi in "molti contesti realistici ed economicamente rilevanti" che coinvolgono codebase più semplici, la ricerca di METR fornisce evidenze concrete che l'utilità dell'AI in scenari complessi del mondo reale presenta ancora significative limitazioni.

Fonte dell'articolo: arstechnica.com

Leggi altri articoli

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite . Vuoi accedere?

Invia

Per commentare come utente ospite, clicca cerchi

Cliccati: 0 /

Reset

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Segui questa discussione
Advertisement

Non perdere gli ultimi aggiornamenti

Newsletter Telegram

I più letti di oggi


  • #1
    Extra risparmio su Aliexpress: torna lo sconto speciale con PayPal
  • #2
    Sconti record BLUETTI! Fino al 73% e regali imperdibili
  • #3
    L'IA è una bolla che non scoppia? E quando arriva l'AGI?
  • #4
    Il ransomware è diventato un problema sistemico
  • #5
    Smettiamo di idolatrare Hideo Kojima, grazie
  • #6
    Quantum computing, c’è un salto storico
Articolo 1 di 5
I prezzi della RAM ormai sono fuori controllo (e i produttori fanno scorta)
I produttori accumulano scorte mentre i data center per l'intelligenza artificiale assorbono l'offerta globale di chip DRAM e NAND, creando difficoltà per il settore consumer.
Immagine di I prezzi della RAM ormai sono fuori controllo (e i produttori fanno scorta)
Leggi questo articolo
Articolo 2 di 5
Windows “agentico”: bufera sulla nuova visione di Microsoft
Microsoft spinge sull’AI, ma gli utenti lamentano da anni gli stessi difetti: prestazioni instabili, UI frammentata e scarsa attenzione al workflow.
Immagine di Windows “agentico”: bufera sulla nuova visione di Microsoft
1
Leggi questo articolo
Articolo 3 di 5
Windows 11, Microsoft ammette che c'è ancora lavoro da fare
Microsoft risponde alle critiche su Windows: il responsabile Pavan Davuluri ammette i problemi di stabilità, interfaccia e performance del sistema operativo.
Immagine di Windows 11, Microsoft ammette che c'è ancora lavoro da fare
7
Leggi questo articolo
Articolo 4 di 5
Intel Arrow Lake refresh, un rumor svela i nuovi modelli
Intel conclude il ciclo LGA 1851 con tre processori Arrow Lake-S 'Plus': miglioramenti limitati a frequenze e memoria DDR5 prima del passaggio a LGA 1954.
Immagine di Intel Arrow Lake refresh, un rumor svela i nuovi modelli
1
Leggi questo articolo
Articolo 5 di 5
Prometheus, la maxi-scommessa AI di Bezos da 6,2 miliardi
La nuova startup guidata da Bezos punta a un’AI capace di apprendere dal mondo fisico, con applicazioni in robotica, industria e aerospazio.
Immagine di Prometheus, la maxi-scommessa AI di Bezos da 6,2 miliardi
2
Leggi questo articolo
Advertisement
Advertisement

Advertisement

Footer
Tom's Hardware Logo

 
Contatti
  • Contattaci
  • Feed RSS
Legale
  • Chi siamo
  • Privacy
  • Cookie
  • Affiliazione Commerciale
Altri link
  • Forum
Il Network 3Labs Network Logo
  • Tom's Hardware
  • SpazioGames
  • CulturaPop
  • Data4Biz
  • TechRadar
  • SosHomeGarden
  • Aibay

Tom's Hardware - Testata giornalistica associata all'USPI Unione Stampa Periodica Italiana, registrata presso il Tribunale di Milano, nr. 285 del 9/9/2013 - Direttore: Andrea Ferrario

3LABS S.R.L. • Via Pietro Paleocapa 1 - Milano (MI) 20121
CF/P.IVA: 04146420965 - REA: MI - 1729249 - Capitale Sociale: 10.000 euro

© 2025 3Labs Srl. Tutti i diritti riservati.