Pratite nas

Pozdrav, koji sadrลพaj vas zanima?

Umjetna inteligencija

Novi GPT-4.1 modeli umjetne inteligencije fokusiraju se na programiranje

chatgpt

OpenAI je poฤetkom tjedna predstavio novu generaciju svojih modela umjetne inteligencije pod imenom GPT-4.1, koja ukljuฤuje varijante mini i nano. Ovi modeli posebno su optimizirani za zadatke povezane s programiranjem i izvrลกavanjem uputa. Premda nisu dostupni putem ChatGPT-a, moguฤ‡e ih je koristiti preko OpenAI API-ja. Jedna od njihovih kljuฤnih znaฤajki je moguฤ‡nost obrade teksta od ฤak 750.000 rijeฤi.

Novi modeli stiลพu u trenutku kada konkurentske tvrtke poput Googlea i Anthropica ulaลพu dodatne napore u razvoj naprednih rjeลกenja za automatsko kodiranje. Googleov Gemini 2.5 Pro i Claude 3.7 Sonnet tvrtke Anthropic, kao i DeepSeekov V3 model, veฤ‡ su ostvarili zapaลพene rezultate na testovima vezanima uz programiranje.

Cilj OpenAI-ja i drugih tehnoloลกkih lidera je razviti modele koji mogu samostalno rjeลกavati sloลพene zadatke iz podruฤja softverskog inลพenjeringa. U tom smjeru ide i ambicija stvaranja AI sustava koji bi mogao funkcionirati kao samostalni โ€žsoftverski inลพenjer-agentโ€, sposoban za izradu kompletnih aplikacija, ukljuฤujuฤ‡i testiranje, dokumentaciju i kontrolu kvalitete.

OpenAI tvrdi da je GPT-4.1 znatno poboljลกan zahvaljujuฤ‡i povratnim informacijama korisnika. Fokus je bio na boljoj podrลกci za frontend programiranje, smanjenju nepotrebnih izmjena, preciznom praฤ‡enju zadanih formata i pouzdanijem koriลกtenju alata. Sve to omoguฤ‡uje razvoj uฤinkovitijih AI agenata za stvarne inลพenjerske zadatke.

Prema internim podacima OpenAI-ja, GPT-4.1 nadmaลกuje prethodne modele poput GPT-4o i njegovih varijacija u veฤ‡ini programerskih testova. Mini i nano verzije novog modela donose veฤ‡u brzinu i manju potroลกnju resursa, ali uz neลกto slabiju preciznost. GPT-4.1 nano ujedno je i najpovoljniji model u njihovoj ponudi.

Cijene koriลกtenja modela ovise o koliฤini obrade: GPT-4.1 koลกta 2 dolara za milijun ulaznih tokena i 8 dolara za milijun izlaznih, dok su cijene za mini i nano verzije znatno niลพe.

Na testu SWE-bench Verified, GPT-4.1 ostvario je rezultate izmeฤ‘u 52% i 54,6%, neลกto niลพe u odnosu na konkurente Google i Anthropic, ฤiji modeli prelaze 60%. Razlika djelomiฤno proizlazi iz tehniฤkih ograniฤenja platforme na kojoj su testovi izvoฤ‘eni.

Osim toga, model je testiran i u zadacima razumijevanja video sadrลพaja, gdje je pokazao iznimne rezultate โ€” posebno u kategoriji dugih videozapisa bez titlova.

Unatoฤ poboljลกanjima, GPT-4.1 dijeli neka ograniฤenja drugih naprednih modela. I dalje moลพe pogrijeลกiti pri zadacima koje bi iskusni struฤnjaci bez problema rijeลกili, poput otkrivanja ili popravljanja sigurnosnih propusta u kodu. Takoฤ‘er, njegova preciznost opada kada obraฤ‘uje velike koliฤine tokena โ€” s 84% pri 8.000 tokena na 50% pri milijun tokena. OpenAI priznaje da model moลพe biti previลกe doslovan, zbog ฤega ฤesto zahtijeva vrlo konkretne i precizno formulirane upite.

Moลพda ฤ‡e vas zanimati

Tech

ล to bi se dogodilo ako uronite ruku u posudu tekuฤ‡eg duลกika? Bi li vam se ruka smrzla do ozeblina? Bi li se razbila ฤim...

Internet

Sigurno ste do sad naletjeli na neke od bizarnosti na koje je Googleovo auto naletjelo pri snimanju, a u ovom videu pogledajte kompilaciju najฤudnijih...

Tech

Trebate izraฤunati postotak od nekog broja, a ne znate kako? Proฤitajte ovaj jednostavan ฤlanak i nauฤite kako se raฤuna postotak. Postotci se koriste za...

Tech

1995. godine grupa znanstvenika NASA-e napravila je testove o tome kako pojedine droge utjeฤu na paukovu sposobnost da izgradi mreลพu.

Internet

Odmah da vam kaลพemo โ€“ neizbjeลพan kraj dogodio bi se iznenaฤ‘ujuฤ‡e brzo. Ako je zapremnina prosjeฤnog lijesa 886 litara, a prosjeฤan volumen ljudskog tijela...

Automoto

Tvrtka Laser Power Systems razvila je automobil pogonjen nuklearnom energijom. Napokon je pronaฤ‘en naฤin koji ฤ‡e vaลกem automobilu omoguฤ‡iti vjeฤni rad bez punjenja. No...

Tech

Rudnik dijamanata Mir u Siberu jedna je od najveฤ‡ih rupa u tlu koju je ฤovjek napravio. Duboka je 525 metara i ลกiroka 1200m. Let...

Tech

Bumerang je jedan od najstarijih leteฤ‡ih objekata koje je ljudska ruka stvorila. Svi znamo da su ih koristili Aboridลพini, no malo je poznato je...