Pratite nas

Pozdrav, koji sadržaj vas zanima?

Internet

Meta otkriva svog konkurenta ChatGPT-u, AI LLaMA

Meta LLaMa AI

Tim Fundamental AI Research (FAIR) u Meti, Facebookovoj matičnoj tvrtki, predstavio je novi “najsuvremeniji” jezični model umjetne inteligencije (AI) pod nazivom Large Language Model Meta AI (LLaMA).

Model će biti dostupan istraživačima, a očekuje se da će pomoći znanstvenicima i inženjerima dok istražuju nove upotrebe umjetne inteligencije, najavio je u petak izvršni direktor Mark Zuckerberg.

“Objavljujemo novi vrhunski AI veliki jezični model nazvan LLaMA dizajniran da pomogne istraživačima da unaprijede svoj rad”, napisao je Zuckerberg u objavi na Facebooku.

“LLM-ovi su pokazali puno obećanja u generiranju teksta, razgovorima, sažimanju pisanog materijala i kompliciranijim zadacima poput rješavanja matematičkih teorema ili predviđanja strukture proteina.”

Napredak umjetne inteligencije postao je fokus i za velike tehnološke tvrtke i za startupe, s velikim jezičnim modelima kao što su Microsoftov Bing AI, OpenAI-jev ChatGPT i Googleov neobjavljeni Bard AI koji pomažu u podupiranju aplikacija.

Međutim, postoji niz načina na koje se Metin LLM razlikuje od ovih modela, posebice njegova veličina i otvorenost prema istraživačima, tvrdi Meta.

LLaMA će imati od 7 do 65 milijardi parametara

Prema Meti, veličine LLaMA-e kretat će se od 7 milijardi parametara do 65 milijardi parametara.

Unatoč činjenici da su veći modeli bili uspješni u proširenju mogućnosti tehnologije, njihovo korištenje može biti skuplje, što je faza poznata kao “zaključivanje”. Chat-GPT 3 iz OpenAI-ja, na primjer, uključuje 175 milijardi parametara.

“Manje modele obučene na više tokena — koji su dijelovi riječi — lakše je ponovno uvježbati i fino podesiti za određene potencijalne slučajeve upotrebe proizvoda”, objavila je Meta AI na blogu u petak.

“Obučili smo LLaMA 65B i LLaMA 33B na 1,4 bilijuna tokena. Naš najmanji model, LLaMA 7B, obučen je na jedan bilijun tokena.”

Za razliku od Googleove LaMDA i OpenAI-jevog ChatGPT-a, čiji su temeljni modeli privatni, Meta je također izjavila da će njihov LLM biti dostupan istraživačkoj zajednici AI.

“Za razliku od Chinchille, PaLM-a ili GPT-3, koristimo samo skupove podataka koji su javno dostupni, što naš rad čini kompatibilnim s otvorenim kodom i ponovljivim, dok se većina postojećih modela oslanja na podatke koji ili nisu javno dostupni ili su nedokumentirani”, tweetao je Guillaume Lample, znanstvenik istraživač u Facebooku AI.

AI halucinacije – nema garancije

Poput prethodnih velikih jezičnih modela, LLaMA generira tekst rekurzivno koristeći niz riječi kao ulaz i predviđajući sljedeći izraz.

Meta tvrdi da su koristili literaturu iz 20 jezika s najvećim brojem govornika za obuku modela, koncentrirajući se na jezike temeljene na latinici i ćirilici.

Međutim, Meta nije dala nikakva jamstva da njen jezični model neće iskusiti halucinacije kao drugi.

“Još uvijek je potrebno provesti dodatna istraživanja kako bi se riješili rizici od pristranosti, toksičnih komentara i halucinacija u velikim jezičnim modelima. Kao i drugi modeli, LLaMA dijeli te izazove”, izjavila je Meta na blogu.

Ostavi komentar

Možda će vas zanimati

Tech

Meta nastavlja snažno ulagati u vrste generativne umjetne inteligencije i povezane velike jezične modele koji su pomogli u stvaranju OpenAI-jevog ChatGPT-a

Biznis i posao

Donald Trump želi se vratiti u predsjedničku fotelju Bijele kuće. Iako je na prošlim izborima izgubio od Joea Bidena, već se ozbiljno priprema za...

Internet

Meta osporava odluku Europske komisije da regulira dvije njihove usluge, Messenger i Marketplace, kao gatekeepere prema novim strogim ograničenjima bloka za tehnološke platforme. Tvrtka...

Internet

'Milenijalci su posljednji sudionici analognog svijeta, most između onoga što je bilo i onoga što će biti'

Automoto

Tesla planira ugraditi novorazvijenog AI pomoćnika, Grok, čiji je koncept osmislio Elon Musk, u svoje električne automobile, kako je najavio izvršni direktor. Na početku...

Internet

Facebook i Instagram u većini Europe pokreću pretplate koje će za korisnike ukloniti oglase s platformi. Ljudi koji koriste platforme u vlasništvu Mete moći...

Biznis i posao

Elon Musk napisao je nekoliko sati nakon kupnje Twittera da to “nije učinio jer bi bilo lako”. Ta je izjava dokazala da je jedna...

Aplikacije i softver

Na početku ovog mjeseca, @aaronp613 pronašao je reference u X-ovom kodu o tri odvojene premium razine. Zasebno, Bloomberg je također izvijestio da tvrtka testira...