
Image by Freepik
Il SEAL del MIT consente all’IA di auto-istruirsi e adattarsi continuamente
I ricercatori del Improbable AI Lab del MIT hanno sviluppato un innovativo framework chiamato SEAL (Self-Adapting LLMs). SEAL consente ai sistemi di intelligenza artificiale di apprendere nuove competenze dopo il loro addestramento iniziale attraverso l’autoinsegnamento.
Sei di fretta? Ecco i fatti rapidi:
- Il MIT ha sviluppato SEAL, un framework che permette all’IA di insegnare a sé stessa nuove abilità.
- SEAL riscrive il proprio allenamento utilizzando riassunti, quiz e appunti generati autonomamente.
- Ha raggiunto un miglioramento del 40% nella capacità di ricordo e il 72,5% di successo nei compiti di ragionamento.
Il nuovo sistema supera i modelli linguistici di grandi dimensioni esistenti, incluso ChatGPT, che i ricercatori spiegano rimanere generalmente fissi una volta addestrati e richiedere un’ampia riaddestramento per apprendere nuove informazioni.
Il principale progresso di SEAL risiede nella sua capacità di permettere all’IA di generare i propri materiali di allenamento e poi utilizzare questi materiali per affinarsi. Infatti, quando presentato con nuovi dati, come un articolo di notizie o compiti di esempio, il sistema crea spiegazioni semplificate, fatti correlati o domande di pratica.
I ricercatori spiegano che questo processo imita i metodi di apprendimento umano, dove le persone di solito scrivono appunti e flashcard per migliorare la loro comprensione e la ritenzione di nuove informazioni.
Durante la fase del “ciclo interno”, SEAL esegue un piccolo aggiornamento noto come “auto-correzione”. Il sistema conduce una valutazione del “ciclo esterno” per verificare il miglioramento delle sue prestazioni dopo l’aggiornamento. Quando l’IA identifica un cambiamento positivo, memorizza la modifica; altrimenti, tenta nuovi approcci.
I ricercatori affermano che questo processo iterativo consente all’IA di migliorare continuamente la sua conoscenza e di adattarsi a nuove sfide senza la necessità di una formazione completa.
I ricercatori sottolineano che il metodo utilizzato da SEAL si distingue da tutti gli approcci tradizionali di apprendimento rinforzato (RL). Gli agenti negli ambienti RL standard imparano attraverso il metodo di prova ed errore a massimizzare le loro ricompense quando interagiscono con il loro ambiente.
SEAL utilizza RL come strumento per addestrare il suo sistema AI a creare e implementare le sue risorse di apprendimento, il che rende il modello di linguaggio sia un istruttore che uno studente. Il sistema produce “auto-correzioni”, che includono istruzioni personalizzate insieme a dati sintetici per il suo processo di perfezionamento. Questo approccio consente aggiornamenti persistenti e autodiretti che i metodi RL convenzionali, che non adattano direttamente i parametri del modello, non possono raggiungere.
I ricercatori del MIT hanno testato SEAL su due fronti. Prima di tutto, nell’apprendimento di nuovi fatti, SEAL ha trasformato il testo grezzo in implicazioni e formati di domande e risposte, ottenendo un miglioramento dell’accuratezza del 47% che ha superato persino i materiali di addestramento di GPT-4.1. In secondo luogo, nei compiti di ragionamento astratto, SEAL ha raggiunto un tasso di successo del 72,5%, superando i modelli senza apprendimento rinforzato o formazione standard.
I ricercatori sostengono che le potenziali applicazioni sono molto varie. SEAL potrebbe consentire svariate applicazioni, che vanno da tutor AI personalizzati, a collaboratori di ricerca auto-evolutivi, fino a agenti autonomi che migliorano attraverso l’esperienza.
La tecnologia ha il potenziale di trasformare i sistemi di intelligenza artificiale aziendale permettendo loro di sviluppare capacità di pensiero interne, che sostituiscono la necessità di costosi processi di riaddestramento per gestire rapidi cambiamenti dei dati e le esigenze degli utenti.
Tuttavia, permangono delle sfide, ad esempio, SEAL può soffrire di quello che i ricercatori chiamano “dimenticanza catastrofica”, dove il nuovo apprendimento sovrascrive le conoscenze precedenti, e il processo di auto-correzione richiede significative risorse di calcolo.
Per mitigare questi problemi, il team propone sistemi ibridi che combinano SEAL con strumenti esterni per la memoria temporanea, riservando gli aggiornamenti di SEAL per la conoscenza essenziale e a lungo termine.
Nonostante questi ostacoli, i ricercatori del MIT credono che questa tecnologia aiuterà le macchine a raggiungere un’adattabilità simile a quella umana e capacità di apprendimento per tutta la vita.