Toolformer è l’AI di Meta che può usare strumenti esterni tramite API

Another ICT Guy

Toolformer è l’AI di Meta che può usare strumenti esterni tramite API

I ricercatori Meta hanno presentato Toolformer: si tratta di un modello di linguaggio AI che può auto-apprendere l’uso di strumenti esterno ad esso, come ad esempio motori di ricerca, calendari, calcolatrici e quant’altro, senza dover per questo compromettere le capacità di modellazione del linguaggio di base.

Questo è reso possibile grazie alla capacità di utilizzare le API: i ricercatori Meta, durante l’allenamento di Toolformer, gli hanno fornito un piccolo insieme di esempi scritti dall’essere umano a dimostrazione di come ciascuna API doveva essere utilizzata, consentendo successivamente all’AI di scrivere un set di dati di modellazione del linguaggio con potenziali chiamate API. Tramite la tecnica della formazione “auto-supervisionata”, l’AI ha potuto apprendere senza che fosse necessario esplicitamente un essere umano che la “prendesse per mano” nel suo percorso di apprendimento.

Grazie a questo processo, l’AI ha imparato a interpretare ogni chiamata API basata su testo come fosse una qualsiasi altra forma di testo: in questo modo può inserire le chiamate alle API quando è necessario, passar loro gli argomenti opportuni e, durante le “risposte” ad un essere umano, di scegliere lo strumento più adatto al contesto e come utilizzarlo. Strumenti che possono essere, beh…di tutto: traduttori, motori di ricerca, calcolatori, calendari e tutto quanto possa essere controllato tramite API.

Toolformer si basa in particolare su un modello GPT-J preaddestrato con 6,7 miliardi di parametri: a titolo di confronto il modello GPT-3 si basa su 175 miliardi di parametri, ma dai test condotti dai ricercatori Toolformer riesce a esprimere prestazioni migliori proprio in virtù della possibilità di usare strumenti esterni.

La novità del modello di Meta sta nella capacità di imparare ad utilizzare gli strumenti in maniera generica, senza dover passare da una formazione specializzata. Si tratta di un approccio abbastanza interessante, poiché se al momento esistono già modelli di AI in grado di eseguire ricerche sul Web (la recente Bing Chat, ad esempio), sono stati fino ad ora basati su grandi quantità di indicazioni umane o di impostazioni specifiche per eseguire task specifici. 

L’approccio seguito con Toolformer può portare ad un futuro in cui modelli AI che utilizzano applicazioni esterne potranno agire come assistenti personali versatili e trasformare il modo in cui l’uomo interagisce e si interfaccia con la macchina. E’ comunque una strada che andrà percorsa con una necessaria cautela, dato che maggiori potenzialità e capacità si portano dietro, inevitabilmente, anche maggiori rischi.

Fonte: http://feeds.hwupgrade.it/

 

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *