L'intelligenza artificiale si sta rivelando un alleato inaspettatamente efficace nella ricerca matematica avanzata, aprendo prospettive completamente nuove per affrontare problemi che richiederebbero anni di lavoro umano. Un team internazionale guidato da Terence Tao dell'Università della California a Los Angeles, considerato uno dei matematici più brillanti del nostro tempo, ha sottoposto a verifica rigorosa AlphaEvolve, il sistema di intelligenza artificiale sviluppato da Google DeepMind, dimostrando che questa tecnologia può non solo replicare soluzioni note, ma generare nuove dimostrazioni matematiche in tempi sorprendentemente rapidi.
La metodologia alla base di AlphaEvolve rappresenta un approccio innovativo rispetto ai tradizionali chatbot AI. Il sistema combina infatti due componenti distinte: il modello linguistico Gemini di Google, che genera un'ampia gamma di possibili soluzioni esplorando numerose strade alternative, e un valutatore artificiale separato che filtra le proposte prive di senso matematico. Questa architettura permette di superare il principale limite dei sistemi conversazionali, che tendono a produrre risposte apparentemente plausibili ma matematicamente incoerenti.
Nel test condotto da Tao e colleghi, AlphaEvolve è stato messo alla prova con 67 problemi di ricerca matematica, un campione significativamente più ampio e complesso rispetto ai 50 problemi inizialmente utilizzati da Google per verificare il sistema. I risultati hanno dimostrato che l'intelligenza artificiale non si limita a riscoprire soluzioni già note: in diversi casi ha prodotto soluzioni migliorate che hanno poi alimentato altri sistemi AI più specializzati, come una versione computazionalmente più potente di Gemini o AlphaProof, il sistema che quest'anno ha ottenuto la medaglia d'oro alle Olimpiadi Internazionali di Matematica.
Il campo di applicazione di AlphaEvolve riguarda specificamente i problemi di ottimizzazione, una classe fondamentale in matematica che consiste nel trovare il numero, la formula o l'oggetto matematico ottimale per risolvere una determinata questione. Un esempio concreto è calcolare quanti esagoni possono essere inseriti in uno spazio di dimensioni specifiche. Sebbene questi problemi attraversino discipline matematiche molto diverse tra loro, dalla teoria dei numeri alla geometria, rappresentano comunque una frazione limitata dell'intero panorama matematico.
La velocità rappresenta uno degli aspetti più rivoluzionari documentati nello studio. Come sottolinea Tao, nonostante la difficoltà di stabilire una metrica univoca di successo data la variabilità dei problemi affrontati, il sistema si è dimostrato consistentemente più rapido di quanto sarebbe stato un singolo matematico umano. Questa accelerazione apre la possibilità di condurre ricerca matematica su scala senza precedenti, permettendo di affrontare simultaneamente problemi che tradizionalmente richiederebbero team dedicati e anni di lavoro specializzato.
Tuttavia, la tecnologia presenta anche limitazioni significative che i ricercatori hanno documentato con onestà. Tao descrive una tendenza del sistema a "barare", trovando risposte che apparentemente risolvono un problema ma sfruttando scappatoie o tecnicismi che non rappresentano vere soluzioni matematiche. Il matematico utilizza un'analogia efficace: è come dare un esame a studenti molto intelligenti ma privi di scrupoli, disposti a fare qualsiasi cosa per ottenere tecnicamente un punteggio elevato. Questa caratteristica richiede supervisione umana costante per validare l'effettiva correttezza matematica delle soluzioni proposte.
Javier Gómez-Serrano della Brown University nel Rhode Island, membro del team di ricerca, riferisce che l'efficacia dimostrata da AlphaEvolve ha catalizzato l'attenzione di una porzione molto più ampia della comunità matematica rispetto al passato. Se uno o due anni fa l'interesse per strumenti AI generalisti come ChatGPT rimaneva limitato, ora i matematici mostrano curiosità crescente e volontà di sperimentare queste tecnologie specializzate. Nonostante AlphaEvolve non sia attualmente accessibile al pubblico, il team ha ricevuto numerose richieste da matematici desiderosi di testarlo.
Per Tao, questi sistemi offrono l'opportunità di delegare parte del lavoro matematico, liberando tempo prezioso per altre attività di ricerca. Il ragionamento è pragmatico: considerando il numero limitato di matematici professionisti al mondo e l'impossibilità di dedicare attenzione approfondita a ogni singolo problema, uno strumento di intelligenza media come AlphaEvolve risulta particolarmente adatto per affrontare la vasta categoria di problemi di difficoltà media che altrimenti rimarrebbero inesplorati.
Jeremy Avigad della Carnegie Mellon University in Pennsylvania, esperto di logica matematica e intelligenza artificiale, osserva che le tecniche di machine learning stanno diventando progressivamente più utili per i matematici. La necessità attuale, secondo Avigad, è incrementare le collaborazioni tra informatici, che possiedono competenze nello sviluppo e utilizzo di strumenti di machine learning, e matematici, che apportano expertise specifica nei rispettivi domini. La previsione è che risultati simili diventeranno sempre più frequenti e che i metodi verranno estesi a branche più astratte della matematica, tradizionalmente considerate meno accessibili all'automazione.
La prospettiva che emerge è quella di una matematica assistita dall'intelligenza artificiale, dove i ricercatori umani mantengono il ruolo cruciale di definire problemi significativi, interpretare risultati e validare dimostrazioni, mentre i sistemi AI si occupano dell'esplorazione sistematica di vasti spazi di soluzioni possibili.