Novi GPT-4.1 modeli umjetne inteligencije fokusiraju se na programiranje

Objavljeno

15/04/2025

Napisao
Geek Hr
15/04/2025

3 min čitanja

OpenAI je početkom tjedna predstavio novu generaciju svojih modela umjetne inteligencije pod imenom GPT-4.1, koja uključuje varijante mini i nano. Ovi modeli posebno su optimizirani za zadatke povezane s programiranjem i izvršavanjem uputa. Premda nisu dostupni putem ChatGPT-a, moguće ih je koristiti preko OpenAI API-ja. Jedna od njihovih ključnih značajki je mogućnost obrade teksta od čak 750.000 riječi.

Novi modeli stižu u trenutku kada konkurentske tvrtke poput Googlea i Anthropica ulažu dodatne napore u razvoj naprednih rješenja za automatsko kodiranje. Googleov Gemini 2.5 Pro i Claude 3.7 Sonnet tvrtke Anthropic, kao i DeepSeekov V3 model, već su ostvarili zapažene rezultate na testovima vezanima uz programiranje.

Cilj OpenAI-ja i drugih tehnoloških lidera je razviti modele koji mogu samostalno rješavati složene zadatke iz područja softverskog inženjeringa. U tom smjeru ide i ambicija stvaranja AI sustava koji bi mogao funkcionirati kao samostalni „softverski inženjer-agent”, sposoban za izradu kompletnih aplikacija, uključujući testiranje, dokumentaciju i kontrolu kvalitete.

OpenAI tvrdi da je GPT-4.1 znatno poboljšan zahvaljujući povratnim informacijama korisnika. Fokus je bio na boljoj podršci za frontend programiranje, smanjenju nepotrebnih izmjena, preciznom praćenju zadanih formata i pouzdanijem korištenju alata. Sve to omogućuje razvoj učinkovitijih AI agenata za stvarne inženjerske zadatke.

Prema internim podacima OpenAI-ja, GPT-4.1 nadmašuje prethodne modele poput GPT-4o i njegovih varijacija u većini programerskih testova. Mini i nano verzije novog modela donose veću brzinu i manju potrošnju resursa, ali uz nešto slabiju preciznost. GPT-4.1 nano ujedno je i najpovoljniji model u njihovoj ponudi.

Cijene korištenja modela ovise o količini obrade: GPT-4.1 košta 2 dolara za milijun ulaznih tokena i 8 dolara za milijun izlaznih, dok su cijene za mini i nano verzije znatno niže.

Na testu SWE-bench Verified, GPT-4.1 ostvario je rezultate između 52% i 54,6%, nešto niže u odnosu na konkurente Google i Anthropic, čiji modeli prelaze 60%. Razlika djelomično proizlazi iz tehničkih ograničenja platforme na kojoj su testovi izvođeni.

Osim toga, model je testiran i u zadacima razumijevanja video sadržaja, gdje je pokazao iznimne rezultate — posebno u kategoriji dugih videozapisa bez titlova.

Unatoč poboljšanjima, GPT-4.1 dijeli neka ograničenja drugih naprednih modela. I dalje može pogriješiti pri zadacima koje bi iskusni stručnjaci bez problema riješili, poput otkrivanja ili popravljanja sigurnosnih propusta u kodu. Također, njegova preciznost opada kada obrađuje velike količine tokena — s 84% pri 8.000 tokena na 50% pri milijun tokena. OpenAI priznaje da model može biti previše doslovan, zbog čega često zahtijeva vrlo konkretne i precizno formulirane upite.

U ovom članku:chatgpt, gpt-4.1, programiranje, umjetna inteligencija

Možda će vas zanimati

Tech

Pogledajte što se dogodi s ljudskom rukom kada se uroni u tekući dušik

Što bi se dogodilo ako uronite ruku u posudu tekućeg dušika? Bi li vam se ruka smrzla do ozeblina? Bi li se razbila čim...

Geek Hr05/11/2013

Internet

Najčudnije stvari uhvaćene na Google Street Viewu

Sigurno ste do sad naletjeli na neke od bizarnosti na koje je Googleovo auto naletjelo pri snimanju, a u ovom videu pogledajte kompilaciju najčudnijih...

Geek Hr19/11/2013

Tech

Kako se računa postotak?

Trebate izračunati postotak od nekog broja, a ne znate kako? Pročitajte ovaj jednostavan članak i naučite kako se računa postotak. Postotci se koriste za...

Geek Hr05/10/2020

Tech

Pogledajte kako pojedine droge djeluju na pauka

1995. godine grupa znanstvenika NASA-e napravila je testove o tome kako pojedine droge utječu na paukovu sposobnost da izgradi mrežu.

Geek Hr16/01/2013

Internet

Koliko dugo čovjek može preživjeti ako je živ zakopan?

Odmah da vam kažemo – neizbježan kraj dogodio bi se iznenađujuće brzo. Ako je zapremnina prosječnog lijesa 886 litara, a prosječan volumen ljudskog tijela...

Geek Hr31/10/2013

Automoto

Auto koji može voziti 100 godina bez ponovnog punjenja goriva

Tvrtka Laser Power Systems razvila je automobil pogonjen nuklearnom energijom. Napokon je pronađen način koji će vašem automobilu omogućiti vječni rad bez punjenja. No...

Geek Hr31/03/2014

Tech

Mir – rudnik dijamanata u Sibiru

Rudnik dijamanata Mir u Siberu jedna je od najvećih rupa u tlu koju je čovjek napravio. Duboka je 525 metara i široka 1200m. Let...

Geek Hr13/01/2013

Tech

Zašto se bumerang uvijek vraća vlasniku?

Bumerang je jedan od najstarijih letećih objekata koje je ljudska ruka stvorila. Svi znamo da su ih koristili Aboridžini, no malo je poznato je...

Geek Hr04/11/2013

Novi GPT-4.1 modeli umjetne inteligencije fokusiraju se na programiranje

Drugi upravo čitaju

Tech

Metafizika: Živiš li u pravom svemiru ili pogrešnoj verziji?

Posao

Strojarstvo: Studij koji otvara vrata budućnosti!

Tech

5G mreža i zračenje: Trebamo li biti zabrinuti?

Posao

Zanima te online zarada? Evo 13 načina kako početi danas!

Igre i gaming

Ovo su Xbox igre koje će te prikovati za ekran!

Možda će vas zanimati

Tech

Pogledajte što se dogodi s ljudskom rukom kada se uroni u tekući dušik

Internet

Najčudnije stvari uhvaćene na Google Street Viewu

Tech

Kako se računa postotak?

Tech

Pogledajte kako pojedine droge djeluju na pauka

Internet

Koliko dugo čovjek može preživjeti ako je živ zakopan?

Automoto

Auto koji može voziti 100 godina bez ponovnog punjenja goriva

Tech

Mir – rudnik dijamanata u Sibiru

Tech

Zašto se bumerang uvijek vraća vlasniku?