Internet

Meta otkriva svog konkurenta ChatGPT-u, AI LLaMA

M. R. ažurirao 25/02/2023.

Tim Fundamental AI Research (FAIR) u Meti, Facebookovoj matičnoj tvrtki, predstavio je novi “najsuvremeniji” jezični model umjetne inteligencije (AI) pod nazivom Large Language Model Meta AI (LLaMA).

Model će biti dostupan istraživačima, a očekuje se da će pomoći znanstvenicima i inženjerima dok istražuju nove upotrebe umjetne inteligencije, najavio je u petak izvršni direktor Mark Zuckerberg.

“Objavljujemo novi vrhunski AI veliki jezični model nazvan LLaMA dizajniran da pomogne istraživačima da unaprijede svoj rad”, napisao je Zuckerberg u objavi na Facebooku.

“LLM-ovi su pokazali puno obećanja u generiranju teksta, razgovorima, sažimanju pisanog materijala i kompliciranijim zadacima poput rješavanja matematičkih teorema ili predviđanja strukture proteina.”

Napredak umjetne inteligencije postao je fokus i za velike tehnološke tvrtke i za startupe, s velikim jezičnim modelima kao što su Microsoftov Bing AI, OpenAI-jev ChatGPT i Googleov neobjavljeni Bard AI koji pomažu u podupiranju aplikacija.

Međutim, postoji niz načina na koje se Metin LLM razlikuje od ovih modela, posebice njegova veličina i otvorenost prema istraživačima, tvrdi Meta.

LLaMA će imati od 7 do 65 milijardi parametara

Prema Meti, veličine LLaMA-e kretat će se od 7 milijardi parametara do 65 milijardi parametara.

Unatoč činjenici da su veći modeli bili uspješni u proširenju mogućnosti tehnologije, njihovo korištenje može biti skuplje, što je faza poznata kao “zaključivanje”. Chat-GPT 3 iz OpenAI-ja, na primjer, uključuje 175 milijardi parametara.

“Manje modele obučene na više tokena — koji su dijelovi riječi — lakše je ponovno uvježbati i fino podesiti za određene potencijalne slučajeve upotrebe proizvoda”, objavila je Meta AI na blogu u petak.

“Obučili smo LLaMA 65B i LLaMA 33B na 1,4 bilijuna tokena. Naš najmanji model, LLaMA 7B, obučen je na jedan bilijun tokena.”

Za razliku od Googleove LaMDA i OpenAI-jevog ChatGPT-a, čiji su temeljni modeli privatni, Meta je također izjavila da će njihov LLM biti dostupan istraživačkoj zajednici AI.

“Za razliku od Chinchille, PaLM-a ili GPT-3, koristimo samo skupove podataka koji su javno dostupni, što naš rad čini kompatibilnim s otvorenim kodom i ponovljivim, dok se većina postojećih modela oslanja na podatke koji ili nisu javno dostupni ili su nedokumentirani”, tweetao je Guillaume Lample, znanstvenik istraživač u Facebooku AI.

AI halucinacije – nema garancije

Poput prethodnih velikih jezičnih modela, LLaMA generira tekst rekurzivno koristeći niz riječi kao ulaz i predviđajući sljedeći izraz.

Meta tvrdi da su koristili literaturu iz 20 jezika s najvećim brojem govornika za obuku modela, koncentrirajući se na jezike temeljene na latinici i ćirilici.

Međutim, Meta nije dala nikakva jamstva da njen jezični model neće iskusiti halucinacije kao drugi.

“Još uvijek je potrebno provesti dodatna istraživanja kako bi se riješili rizici od pristranosti, toksičnih komentara i halucinacija u velikim jezičnim modelima. Kao i drugi modeli, LLaMA dijeli te izazove”, izjavila je Meta na blogu.

Ostavi komentar

Pridruži se raspravi na forumu!

Možda će vas zanimati

Tech

Pogledajte što se dogodi s ljudskom rukom kada se uroni u tekući dušik

Što bi se dogodilo ako uronite ruku u posudu tekućeg dušika? Bi li vam se ruka smrzla do ozeblina? Bi li se razbila čim...

Marin Katušić05/11/2013

Internet

Najčudnije stvari uhvaćene na Google Street Viewu

Sigurno ste do sad naletjeli na neke od bizarnosti na koje je Googleovo auto naletjelo pri snimanju, a u ovom videu pogledajte kompilaciju najčudnijih...

Marin Katušić19/11/2013

Tech

Kako se računa postotak?

Trebate izračunati postotak od nekog broja, a ne znate kako? Pročitajte ovaj jednostavan članak i naučite kako se računa postotak. Postotci se koriste za...

Ante. V.05/10/2020

Tech

Pogledajte kako pojedine droge djeluju na pauka

1995. godine grupa znanstvenika NASA-e napravila je testove o tome kako pojedine droge utječu na paukovu sposobnost da izgradi mrežu.

Filip C16/01/2013

Internet

Koliko dugo čovjek može preživjeti ako je živ zakopan?

Odmah da vam kažemo – neizbježan kraj dogodio bi se iznenađujuće brzo. Ako je zapremnina prosječnog lijesa 886 litara, a prosječan volumen ljudskog tijela...

Marin Katušić31/10/2013

Automoto

Auto koji može voziti 100 godina bez ponovnog punjenja goriva

Tvrtka Laser Power Systems razvila je automobil pogonjen nuklearnom energijom. Napokon je pronađen način koji će vašem automobilu omogućiti vječni rad bez punjenja. No...

Filip C31/03/2014

Tech

Mir – rudnik dijamanata u Sibiru

Rudnik dijamanata Mir u Siberu jedna je od najvećih rupa u tlu koju je čovjek napravio. Duboka je 525 metara i široka 1200m. Let...

Filip C13/01/2013

Tech

Zašto se bumerang uvijek vraća vlasniku?

Bumerang je jedan od najstarijih letećih objekata koje je ljudska ruka stvorila. Svi znamo da su ih koristili Aboridžini, no malo je poznato je...

Marin Katušić04/11/2013

GeeK.hr

Internet

Meta otkriva svog konkurenta ChatGPT-u, AI LLaMA

LLaMA će imati od 7 do 65 milijardi parametara

AI halucinacije – nema garancije

Drugi upravo čitaju

Automoto

Budućnost električnih automobila (7 važnih predviđanja)

Tech

Programerske katastrofe: 8 najvećih softverskih grešaka u povijesti

Umjetna inteligencija

Kako AI može spasiti svijet (ili ga uništiti)?

Promo i akcije

Samo na Godeal24: Ljetna rasprodaja za Office pakete!

Tech

Zašto kupiti 3D printer? Razmislite o ovim razlozima

Možda će vas zanimati

Tech

Pogledajte što se dogodi s ljudskom rukom kada se uroni u tekući dušik

Internet

Najčudnije stvari uhvaćene na Google Street Viewu

Tech

Kako se računa postotak?

Tech

Pogledajte kako pojedine droge djeluju na pauka

Internet

Koliko dugo čovjek može preživjeti ako je živ zakopan?

Automoto

Auto koji može voziti 100 godina bez ponovnog punjenja goriva

Tech

Mir – rudnik dijamanata u Sibiru

Tech

Zašto se bumerang uvijek vraća vlasniku?