Meta riscalda la corsa agli armamenti dell’intelligenza artificiale della grande tecnologia con un nuovo modello di linguaggio

24 febbraio (Reuters) – Meta Platforms Inc ( META.O ) ha rilasciato venerdì ai ricercatori un nuovo modello di linguaggio di grandi dimensioni, il software di base di un nuovo sistema di intelligenza artificiale, riscaldando una corsa agli armamenti di intelligenza artificiale mentre le grandi aziende tecnologiche si affrettano a Integrare la tecnologia nei loro prodotti e attrarre investitori.

La battaglia pubblica per dominare lo spazio della tecnologia AI è iniziata alla fine dello scorso anno con il lancio di ChatGPT di OpenAI supportato da Microsoft e ha spinto i pesi massimi della tecnologia da Alphabet Inc (GOOGL.O) alla cinese Baidu Inc (9888.HK) a strombazzare la propria offerte. .

LAMA di Meta, abbreviazione di Large Language Model Meta AI, è disponibile con una licenza non commerciale per ricercatori e organizzazioni affiliate al governo, alla società civile e al mondo accademico. Un blog.

I modelli di linguaggio di grandi dimensioni estraggono grandi quantità di testo per riassumere informazioni e generare contenuti. Possono rispondere a domande e, ad esempio, leggere frasi come se fossero state scritte da esseri umani.

Ultimi aggiornamenti

Guarda altre 2 storie

Il modello, che secondo Meta richiede una potenza di calcolo “molto inferiore” rispetto alle offerte precedenti, è stato addestrato in 20 lingue con alfabeti latino e cirillico.

“L’annuncio di Meta oggi sembra essere un passo avanti nel testare le loro capacità di intelligenza artificiale creativa in modo che possano implementarle nei loro prodotti in futuro”, ha affermato Gil Luria, analista software senior presso DA Davidson.

“L’IA generativa è una nuova applicazione dell’IA con cui Meta ha poca esperienza, ma che è chiaramente importante per il futuro della loro attività”.

READ  Alcuni abitanti delle montagne della California potrebbero sperimentare la neve entro una settimana

L’intelligenza artificiale è emersa come un punto luminoso per gli investimenti nel settore tecnologico, la cui crescita rallentata ha provocato licenziamenti diffusi e una riduzione delle gare sperimentali.

Meta ha affermato che LAMA può superare i concorrenti che esaminano più parametri o variabili che l’algoritmo prende in considerazione.

In particolare, ha affermato che una versione di LAMA con 13 miliardi di parametri avrebbe superato GPT-3, un recente predecessore del modello strutturato ChatGPT.

Ha descritto il suo modello LAMA da 65 miliardi di parametri come “competitivo” con Chinchilla70B e PalM-540B di Google, che è più grande del modello utilizzato da Google per dimostrare la sua ricerca basata sulla chat di Bart.

Un portavoce di Meta ha attribuito le prestazioni a una grande quantità di dati “più puliti” e “miglioramenti architettonici” al modello che ha migliorato la coerenza dell’allenamento.

Meta ha rilasciato il modello in lingua larga OPT-175B nel maggio dello scorso anno, rivolto ai ricercatori, che ha costituito la base di una nuova iterazione del suo chatbot BlenderBot.

Successivamente ha introdotto un modello chiamato Galactica, in grado di scrivere articoli scientifici e risolvere problemi di matematica, ma ha rapidamente ritirato la demo dopo aver prodotto risposte errate che sembravano ufficiali.

Reportage di Yuvraj Malik ed Eva Mathews a Bangalore e Katie Paul a New York; Montaggio di Shailesh Kuber e Grant McCool

I nostri standard: Principi di fiducia di Thomson Reuters.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *