L’IA cambierà il modo in cui facciamo chimica: il test con GPT-3

I ricercatori dell’EPFL hanno perfezionato l'AI generativa e scoperto che funziona meglio dei modelli appositamente addestrati per la scienza

GPT-3 potrebbe rivoluzionare la chimica
I ricercatori dell’EPFL hanno perfezionato GPT-3 e hanno scoperto che funziona anche meglio dei modelli appositamente addestrati per la ricerca chimica (Foto: EPFL/iStock)

L’Intelligenza Artificiale sta diventando uno strumento fondamentale nella ricerca chimica: la progettazione di molecole o la predizione delle loro caratteristiche possono essere affidati a modelli di linguaggio appositamente addestrati, e la tecnica del machine learning ha già trovato un suo spazio nei laboratori chimici.

Quello che hanno scoperto i ricercatori del Politecnico Federale di Losanna, però, ha il potenziale per rivoluzionare completamente la ricerca chimica: GPT-3, questo era il primo titolo dello studio appena pubblicato su “Nature Machine Intelligence”, potrebbe essere “tutto quello di cui c’è bisogno per l’indagine chimica a partire da set limitati di dati”.

Nonostante non conosca la maggior parte della letteratura chimica, la versione di GPT-3 perfezionata dal team di Berend Smit ha dato prova di poter competere con le tradizionali e dispendiose tecniche di apprendimento automatico, aprendo la strada a un approccio completamente nuovo alla chimica, che potrebbe cambiare per sempre il modo in cui si fa ricerca.

AI generativa: “Ecco i mestieri che non ci saranno più grazie a me”
Il Sacro Graal della chimica verde: fluorochimici privi di tossicità
GPT-3, l’algoritmo che scrive come un essere umano arriva in Italia

Chimica: GPT-3 può cambiare il modo di fare ricerca
I modelli base di intelligenza artificiale come GPT-3 potrebbero cambiare per sempre il modo di fare ricerca chimica: lo studio dell’EPFL (Foto: Envato)

La chimica in parole: il test con la AI di GPT-3

L’Intelligenza Artificiale ha fatto il suo ingresso nella ricerca chimica ormai da tempo: l’apprendimento automatico, in particolare, è stato negli anni molto apprezzato per la sua capacità di prendere decisioni basate sui dati e di fare predizioni molto accurate, che possono essere usate anche per la creazione di nuovi farmaci.

Il machine learning, però, richiede grandi quantità di dati per fare previsioni affidabili, cosa che in chimica non è così scontata: spesso i dati a disposizione non sono sufficienti affinché gli algoritmi possano esercitarsi, quindi l’efficacia dell’apprendimento automatico “labeled”, o supervisionato, è soggetta a gravi limitazioni.

Così alcuni scienziati dell’EPFL hanno pensato di testare le potenzialità di GPT-3, alla base della celebre applicazione ChatGPT: “Il fatto che i modelli di base (foundation models) potessero eseguire compiti per cui non erano esplicitamente addestrati”, si legge nello studio appena pubblicato su ‘Nature Machine Intelligence’, “ci ha portato a chiederci se fossero anche in grado di rispondere a domande scientifiche per cui non abbiamo una risposta”.

Visto che nella ricerca chimica la maggior parte dei problemi può essere espressa in parole, i ricercatori hanno pensato di addestrare questi enormi modelli a rispondere ad alcune domande “da chimico” che sono impossibili da risolvere senza ricorrere a complicate simulazioni ed esperimenti (per esempio: “Se sostituisco il metallo nella mia struttura metallo-organica, sarà stabile in acqua?”).

Intelligenza artificiale e ologrammi: la nuova frontiera della sanità
Al debutto un “olotrasporto” integrato con l’Intelligenza Artificiale
SwissGPT: l’AI svizzera che rivoluziona la sicurezza aziendale

GPT-3 potrebbe semplificare la ricerca chimica
Riuscire a interrogare un modello come GPT-3 significa poter sfruttare molto meglio la conoscenza raccolta dagli scienziati nel corso degli anni (Foto: Envato)

Chimica: un GPT-3 potenziato per risposte impossibili

Contrariamente a quello che suggerirebbe un certo scetticismo iniziale, il metodo sviluppato dai ricercatori dell’EPFL non pone direttamente domande sulla chimica GPT-3. “GPT-3 non conosce la maggior parte della letteratura chimica, quindi se poniamo una domanda chimica a ChatGPT, le risposte sono generalmente limitate a ciò che si può trovare su Wikipedia“, spiega Kevin Maik Jablonka, autore principale dello studio.

Invece”, spiega Jablonka,”abbiamo ottimizzato GPT-3 con un piccolo set di dati convertito in domande e risposte, e abbiamo ottenuto un nuovo modello in grado di fornire informazioni chimiche molto accurate”.

Nel corso del cosiddetto fine-tuning, i ricercatori hanno fornito a GPT-3 un elenco curato di domande e risposte: “Per esempio, per le leghe ad alta entropia, è importante sapere se una lega si presenta in un’unica fase o ha più fasi”, spiega Berend Smit, docente di Ingegneria Chimica alla School of Basic Sciences dell’EPFL.

Un problema del genere, spiega Smit, viene tradotto in un elenco curato di domande e risposte del tipo “D = ‘Il <nome della lega ad alta entropia> è monofase?’ R= ‘Sì/No’”.

In letteratura abbiamo trovato diverse leghe per cui la risposta è nota, e abbiamo utilizzato questi dati per mettere a punto GPT-3”, continua Smit, “ciò che abbiamo ottenuto è un modello di intelligenza artificiale perfezionato addestrato a rispondere a questa domanda soltanto con un sì o un no”.

L’Intelligenza Artificiale anche per lo sviluppo di nuovi farmaci
Sviluppo di nuovi farmaci, librerie potenziate grazie alla chimica
Verso l’Umanesimo Digitale: analisi di una rivoluzione con riscatto

GPT-3 può specializzarsi e rivoluzionare la chimica
Uno studio del Politecnico Federale di Losanna esamina diversi task: dalla classificazione (data la rappresentazione testuale di una molecola, di un materiale o di una reazione) alla regressione (Foto: Jablonka, K.M., Schwaller, P., Ortega-Guerrero, A. et al. Leveraging large language models for predictive chemistry, Nat Mach Intell, 2024)

I modelli base come GPT-3 nella routine dei ricercatori

Il modello “potenziato”, addestrato con relativamente poche domande e risposte, ha risolto correttamente oltre il 95 per cento delle questioni su problemi chimici molto diversi, spesso superando in precisione i modelli di apprendimento automatico appositamente programmati per quel compito.

Il punto è che è facile come fare una ricerca bibliografica”, spiega Smit, “che però funziona con molti problemi chimici”. Inoltre, l’approccio sviluppato da Kevin Maik Jablonka è straordinariamente rapido e non richiede alcuna competenza specifica, a differenza dei modelli tradizionali di machine learning.

Le implicazioni di questo studio potrebbero essere decisive: la possibilità di formulare domande come “Qual è la resa di un [prodotto chimico] preparato con questa [ricetta]?” e ricevere una risposta accurata potrebbe rivoluzionare il modo in cui la ricerca chimica viene pianificata e gestita.

Come si legge nello studio, “poter interrogare un modello base come GPT-3 potrebbe diventare un metodo di routine per avviare un progetto di ricerca sfruttando la conoscenza collettiva codificata in questi modelli fondamentali o per fornire una base di riferimento per attività predittive”.

Cambierà il modo in cui facciamo chimica”, commenta senza mezzi termini il Professor Smit.

Acqua, erba e umanità: i limiti conoscitivi dell’Intelligenza Artificiale
L’Intelligenza Artificiale ci aiuterà a ripulire gli oceani dalla plastica
I 100 Big della chimica e le sfide dell’economia globale

Ricerca chimica con GPT-3: lo studio
In futuro potremmo riuscire a chiedere all’IA qual è la resa di un dato prodotto chimico usando una certa ricetta, e sarà semplice come fare una ricerca bibliografica (Foto: Envato)

GPT-3 è “soltanto” uno strumento: la ricerca continua

I risultati dello studio sollevano una questione non secondaria: come è possibile che un modello di linguaggio naturale, senza alcun addestramento specifico in chimica, possa essere più accurato di modelli appositamente programmati?

In base alle nostre conoscenze”, si legge nel paper, “non esiste una risposta rigorosa a questa domanda”.

Il fatto che si ottengano risultati molto promettenti anche utilizzando rappresentazioni chimiche del tutto ipotetiche, dimostra che questi modelli base sono “molto adatti ad estrarre correlazioni da qualsiasi testo”.

Ma la ricerca è appena iniziata. Come spiegano i ricercatori, il fatto che GPT-3 identifichi delle correlazioni che possono essere sfruttate con successo per fare previsioni non implica che le correlazioni siano sempre significative o legate a relazioni causa-effetto.

Al momento, concludono i ricercatori, GPT-3 “è soltanto uno strumento che ci permette di utilizzare in maniera più efficiente le conoscenze che gli scienziati hanno raccolto nel corso degli anni”.

E ancora: “Il prossimo passo sarà utilizzare GPT-3 per identificare queste correlazioni e ottenere in definitiva una comprensione più profonda”.

Ecco come l’AI sta rivoluzionando il comportamento d’acquisto
L’evoluzione dei motori di ricerca: l’impatto dell’AI, il ruolo di Google
Ecco come i sistemi basati sull’IA hanno valori morali nascosti…

"Che cosa significa essere un computer: intervista a GPT-3" (in lingua inglese)

"Che cosa significa essere un computer: intervista a GPT-3" (in lingua inglese)
GPT-3 nella ricerca chimica: i prossimi passi della ricerca
Il fatto che GPT-3 identifichi delle correlazioni che possono essere sfruttate con successo per fare previsioni non implica che le correlazioni siano sempre significative o legate a relazioni causa-effetto: la ricerca è appena iniziata (Foto: Envato)