OpenAI pokušava sjediti na dvije stolice: s jedne strane, tvrdi da je GPT-4.5 njegov “najveći i najpametniji model dosad”, dok istovremeno spušta očekivanja i upozorava da to “nije model budućnosti”.
Zašto? Vjerojatno zato što su u tvrtki znali kakva će biti reakcija javnosti: mlaka. Ukratko, izgleda da je ovaj previše nahajpani model ozbiljno zakinut za onu vrstu “soka” koja je od originalnog ChatGPT-a i njegovog nasljednika GPT-4 napravila kulturni i financijski fenomen.
A cijena? Prava sitnica – 75 dolara po milijunu ulaznih tokena i 150 dolara po milijunu izlaznih tokena, što ga čini 30 puta skupljim od GPT-4o, OpenAI-jevog “razumskog” modela. Osim što ubija budžet, navodno je prilično spor i umjesto analitičkih zadataka naglasak stavlja na – “emocionalnu inteligenciju”.
Naravno, hejteri će uvijek hejtati, a hype oko novih OpenAI modela ionako već neko vrijeme kopni, no ovaj put osjećaj razočaranja čini se sveprisutan.
Marcus je istaknuo da GPT-4.5 i dalje halucinira i griješi – čak je i OpenAI priznao (prema MIT Technology Reviewu) da u ključnom testu model izmišlja stvari 37% vremena. Stručnjaci su dodatno popljuvali ogromnu cijenu modela, tvrdeći da ne nudi performanse koje bi opravdale takav markup.
Mnoge od OpenAI-jevih samohvalnih tvrdnji o GPT-4.5 temelje se na njegovoj sposobnosti da komunicira s osjetljivošću i intuitivnošću – što je, čini se, nešto za što tvrtka misli da ljudi žele.
“Ima sposobnost vođenja toplih, intuitivnih, prirodnih i tečnih razgovora”, izjavila je OpenAI-jeva istraživačica Mia Glease za MIT Technology Review. “I mislimo da bolje razumije što korisnici žele, osobito kad su njihova očekivanja neizravna, što dovodi do nijansiranih i promišljenih odgovora.”
Drugim riječima, izgleda da je GPT-4.5 prošao AI tečaj emocionalne osjetljivosti kako bi bolje ćaskao s ljudima – što je internet, naravno, dočekao na nož.
“Znači, GPT-4.5 je model kojem se ideš izjadati?” našalio se jedan korisnik. “Ja želim pametan model, a ne model koji razumije moje osjećaje.”
U stvari, OpenAI-jev glavni istraživač Mark Chen nedavno je priznao da su benchmark testovi za napredak modela – “bazirani na vibri”. Da, dobro ste pročitali. Ludo priznanje koje savršeno ilustrira mindset kompanije oko ovog vrućeg novog modela.
