Pratite nas

Pozdrav, koji sadržaj vas zanima?

Internet

Meta otkriva svog konkurenta ChatGPT-u, AI LLaMA

Meta LLaMa AI

Tim Fundamental AI Research (FAIR) u Meti, Facebookovoj matičnoj tvrtki, predstavio je novi “najsuvremeniji” jezični model umjetne inteligencije (AI) pod nazivom Large Language Model Meta AI (LLaMA).

Model će biti dostupan istraživačima, a očekuje se da će pomoći znanstvenicima i inženjerima dok istražuju nove upotrebe umjetne inteligencije, najavio je u petak izvršni direktor Mark Zuckerberg.

“Objavljujemo novi vrhunski AI veliki jezični model nazvan LLaMA dizajniran da pomogne istraživačima da unaprijede svoj rad”, napisao je Zuckerberg u objavi na Facebooku.

“LLM-ovi su pokazali puno obećanja u generiranju teksta, razgovorima, sažimanju pisanog materijala i kompliciranijim zadacima poput rješavanja matematičkih teorema ili predviđanja strukture proteina.”

Napredak umjetne inteligencije postao je fokus i za velike tehnološke tvrtke i za startupe, s velikim jezičnim modelima kao što su Microsoftov Bing AI, OpenAI-jev ChatGPT i Googleov neobjavljeni Bard AI koji pomažu u podupiranju aplikacija.

Međutim, postoji niz načina na koje se Metin LLM razlikuje od ovih modela, posebice njegova veličina i otvorenost prema istraživačima, tvrdi Meta.

LLaMA će imati od 7 do 65 milijardi parametara

Prema Meti, veličine LLaMA-e kretat će se od 7 milijardi parametara do 65 milijardi parametara.

Unatoč činjenici da su veći modeli bili uspješni u proširenju mogućnosti tehnologije, njihovo korištenje može biti skuplje, što je faza poznata kao “zaključivanje”. Chat-GPT 3 iz OpenAI-ja, na primjer, uključuje 175 milijardi parametara.

“Manje modele obučene na više tokena — koji su dijelovi riječi — lakše je ponovno uvježbati i fino podesiti za određene potencijalne slučajeve upotrebe proizvoda”, objavila je Meta AI na blogu u petak.

“Obučili smo LLaMA 65B i LLaMA 33B na 1,4 bilijuna tokena. Naš najmanji model, LLaMA 7B, obučen je na jedan bilijun tokena.”

Za razliku od Googleove LaMDA i OpenAI-jevog ChatGPT-a, čiji su temeljni modeli privatni, Meta je također izjavila da će njihov LLM biti dostupan istraživačkoj zajednici AI.

“Za razliku od Chinchille, PaLM-a ili GPT-3, koristimo samo skupove podataka koji su javno dostupni, što naš rad čini kompatibilnim s otvorenim kodom i ponovljivim, dok se većina postojećih modela oslanja na podatke koji ili nisu javno dostupni ili su nedokumentirani”, tweetao je Guillaume Lample, znanstvenik istraživač u Facebooku AI.

AI halucinacije – nema garancije

Poput prethodnih velikih jezičnih modela, LLaMA generira tekst rekurzivno koristeći niz riječi kao ulaz i predviđajući sljedeći izraz.

Meta tvrdi da su koristili literaturu iz 20 jezika s najvećim brojem govornika za obuku modela, koncentrirajući se na jezike temeljene na latinici i ćirilici.

Međutim, Meta nije dala nikakva jamstva da njen jezični model neće iskusiti halucinacije kao drugi.

“Još uvijek je potrebno provesti dodatna istraživanja kako bi se riješili rizici od pristranosti, toksičnih komentara i halucinacija u velikim jezičnim modelima. Kao i drugi modeli, LLaMA dijeli te izazove”, izjavila je Meta na blogu.

Ostavi komentar

Možda će vas zanimati

Aplikacije i softver

Meta, tvrtka Marka Zuckerberga, radi na decentraliziranoj tekstualnoj aplikaciji. Aplikacija bi trebala biti samostalni proizvod na kojem će korisnici, slično kao na Twitteru, moći...

Internet

Helen Dixon, irska šefica za privatnost, koja vodi tamošnje Povjerenstvo za zaštitu podataka (DPC), najavila je za politički magazin, Politico, da će to tijelo...

Tutoriali

U digitalnom dobu u kojem živimo, društvene mreže poput Facebooka postale su bitan alat za tvrtke i pojedince koji žele promovirati svoj brend, podijeliti...

Internet

Trenutno se na internetu odvija utakmica koja za cilj ima provesti transformaciju načina na koji pretražujemo internet. A Microsoft je upravo dao autogol sa...

Internet

Kada je Elon Musk preuzeo Twitter, jedan od prvih poteza koje je povukao bilo je uvođenje pretplate za potvrdu računa. Radi se o onoj...

Biznis i posao

U prošloj godini više od 70.000 zaposlenika širom svijeta otpušteno je od strane velikih tehnoloških tvrtki. Tehnološke tvrtke uvijek su u vijestima, obično hvaleći...

Internet

Sa sve bržom evolucijom AI chatbot sustava kao što su ChatGPT, VALL-e i BlenderBot 3 te njihovim sve većim sposobnostima generiranja teksta u rangu...

Aplikacije i softver

ChatGPT je došao da ostvari dugotrajni strah čovječanstva od umjetne inteligencije (AI) i njenog skorog preuzimanja svijeta… Samo, tko je znao da će to...