L’IA E L’ASSALTO AL LAVORO DEI MATEMATICI A SUON DI PROBLEMI RISOLTI

Il 17 e 18 maggio si è riunito a Berkley, California, un “conclave matematico”, composto da 30 dei matematici più blasonati al mondo, per cercare di sconfiggere in una battaglia faccia a schermo un chatbot pensante. La sfida consisteva nel proporre all’IA dei problemi da loro ideati e testarne le abilità; il chatbot in questione è basato su o4-mini, un modello LLM estremamente abile nel ragionamento logico-deduttivo e nei quesiti matematici, anche complessi. Per monitare i progressi di o4-mini, OpenAI aveva incaricato in precedenza Epoch AI, una organizzazione no-profit che si occupa di benchmarking per gli LLM, di proporre problemi di vari livelli di difficoltà ai diversi modelli di IA e monitorarne i risultati. Entro aprile 2025 è stato scoperto che o4-mini aveva risposto correttamente a circa il 20% dei quesiti di livello di laurea magistrale e di ricerca. Nel conclave sopra citato invece è stato proposto un livello ulteriore di difficoltà: i matematici coinvolti, divisi in gruppi da sei, dovevano ideare problemi che avrebbero messo in estrema difficoltà accademici comuni e che solo un ristretto numero di menti al mondo poteva risolvere. Ogni problema che l’IA non riusciva a risolvere fruttava 7500 dollari all’ideatore. Il gruppo è riuscito a trovare 10 domande che hanno bloccato il bot, ma l’impressione generale è stata di stare assistendo ad un’entità provvista di “genio” matematico, in quanto di fronte a problemi che gli esperti del settore avrebbero riconosciuto come “questioni aperte”, il sistema o4-mini ha saputo fornire una risposta in tempo reale e con un tono anche impertinente:”Non è necessaria alcuna citazione perchè il numero misterioso è stato calcolato da me!”. La velocità di risposta inoltre era impressionante… pochi minuti per risolvere quesiti che avrebbero richiesto settimane o mesi di lavoro di professionisti. Durante il conclave si è incominciato inoltre a ragionare sul fatidico “livello finale”, ovvero le domande alle quali nemmeno i migliori matematici del mondo avrebbero saputo rispondere. Se l’intelligenza artificiale dovesse raggiungere quel livello, allora il ruolo dei matematici e quindi in generale dei ricercatori Stem cambierebbe drasticamente. I matematici potrebbero semplicemente porre domande all’IA per scoprire nuove formule o dimostrare nuovi teoremi. Questo futuro non è da escludere, ora come ora o4-mini ha già superato la maggior parte dei migliori laureati al mondo, secondo quanto riportato da Scientific American sul suo resoconto di questo incontro.

Quello che l’intelligenza artificiale per ora non riesce a replicare è il pensiero creativo, l’intuizione che ti porta a intraprendere determinate vie di ricerca piuttosto che altre. E’ sicuramente molto brava a risolvere problemi con dietro un’ampia letteratura da cui attingere o risolvibili attraverso processi standardizzati. Ad esempio i problemi delle Olimpiadi della Matematica, seppur necessitino l’utilizzo di “trucchetti” per la loro risoluzione, spesso e volentieri si assomigliano molto in quanto a struttura e metodi di risoluzione. Una volta che si è visto un’ampia gamma di soluzioni, i trucchetti utilizzati sono sempre gli stessi.. la difficoltà sta nel saperli applicare nel giusto contesto, ma nello stesso modo in cui vengono allenati gli studenti per imparare a riconoscere e risolvere queste problematiche, anche una macchina può essere tranquillamente allenata per farlo. Di diversa natura sono i problemi di ricerca, che richiedono una profondità di pensiero e calcolo estremamente maggiore, basandosi su una lunghissima serie di passaggi tecnici che spesso non si conoscono, come nel caso dell’ipotesi di Riemann, uno dei problemi aperti del millennio. I percorsi di dimostrazione di quesiti molto complessi, possono presentare un numero di possibili sequenze con mille o addirittura un milione di zeri, il che non è assolutamente alla portata di qualsiasi motore oggi esistente. Il lavoro dei matematici in questo momento e per queste tipologie di problemi è quello di creare delle “supermosse” combinando più mosse di una sequenza in una singola mossa e accorciando così le righe di codice, in modo tale da riuscire a ottimizzare e snellire il lavoro compiuto dalle macchine.

Quindi per ora l’intelligenza artificiale batte l’uomo quando conosce le regole del gioco, come negli scacchi, ma le innovazioni nascono da modi nuovi di pensare. E’ presente quindi ancora un solido lato intuitivo nella ricerca matematica che non sembrerebbe possibile sostituire nè ora nè mai.. Alcuni strumenti di IA come AlphaEvolve e PatternBoost si possono considerare come buoni esploratori dell’intuizione umana, ma le grandi scoperte sembrerebbero essere ancora in mano agli esseri umani. Cosa ci riserverà il futuro?

https://www.technologyreview.com/2025/06/04/1117753/whats-next-for-ai-and-math

https://www.scientificamerican.com/article/inside-the-secret-meeting-where-mathematicians-struggled-to-outsmart-ai

altri post