Rano sam pogledao ChatGPT Images 2.0 i impresivan je – uz jednu iznimku

Elyse Beters Picaro / ZDNET

Pratite ZDNET: Dodajte nas kao željeni izvor na Googleu.

Sadržaj objave

0.1 Ključni podaci ZDNET-a za van

1 Sposobnosti razmišljanja omogućuju složene tijekove rada
2 Preciznost i kontrola dizajna poboljšavaju upotrebljivost
3 Testiranje pregleda
4 Cijene i dostupnost

Ključni podaci ZDNET-a za van

OpenAI preoblikuje slike kao vizualni jezik.
Način razmišljanja gradi infografiku svjesnu konteksta.
Vjernost marke još uvijek je nedosljedna u ranim testiranjima.

Danas je OpenAI najavio ChatGPT Images 2.0, svoj model slike sljedeće generacije, za koji tvrtka kaže da je fokusiran na preciznost, upotrebljivost i složene vizualne zadatke.

Najistaknutija nova mogućnost je mogućnost kombiniranja teksta i slika za izradu složenih, lijepih stranica. OpenAI preoblikuje cijelu ideju stvaranja slike iz procesa koji stvara ukrase (njihova riječ) u jezik (također njihov termin).

Također: Najbolji AI generatori slika 2026.: Sada postoji samo jedan jasni pobjednik

OpenAI to opisuje kao: “Dobra slika čini isto što i dobra rečenica — odabire, slaže i otkriva. Može objasniti mehanizam, postaviti raspoloženje, testirati ideju ili dati argument.”

Sposobnosti razmišljanja omogućuju složene tijekove rada

Uz znatno poboljšanu sposobnost miješanja teksta i grafike, novi model koristi poboljšane sposobnosti razmišljanja. Može generirati više slika po upitu s kontinuitetom kroz izlaze. Ovaj je pristup moguć jer model zapravo integrira razmišljanje u izlaz slike.

Izradio ChatGPT/Snimak zaslona David Gewirtz/ZDNET

Ovaj pomak je velik. Umjesto da samo proizvede sliku koja prilično odgovara brzim detaljima, Images 2.0 može uzeti puno nejasniji upit, poput “Generiraj infografiku o aktivnostima koje bih trebao učiniti imajući na umu sutrašnje vrijeme u San Franciscu.”

Također: Kako se prebaciti s ChatGPT na Gemini

Iz ovog odziva, AI će prikupiti vremenske prilike i podatke o aktivnostima u San Franciscu, odrediti aktivnosti prikladne vremenskim prilikama, a zatim izgraditi sliku ili skup slika koje odgovaraju rezultatima.

Prema OpenAI-ju, “U ovom modelu, Images 2.0 više djeluje kao vizualni misaoni partner, pomažući u prenošenju projekta od grubog koncepta do gotovog sredstva uz znatno manje rada s vaše strane.”

Preciznost i kontrola dizajna poboljšavaju upotrebljivost

Mnogi od nas dugo su se borili uvjeriti ChatGPT da generira slike u određenom željenom omjeru. AI često tvrdoglavo proizvodi ono što želi. Ali sada, uz Images 2.0, model ima podršku za “omjere širine i visine do 3:1 i visine do 1:3.”

Model također podržava izlaze veće vjernosti koji (uglavnom) proizvode točan položaj objekata, detaljno iscrtavanje teksta i složene kompozicije. Vidjet ćemo možemo li ukloniti riječ “uglavnom” iz te rečenice nakon što proizvod bude službeno pušten u prodaju.

Također: isprobao sam Personal Intelligence i bio je točan (ali uznemirujući)

AI također podržava mali tekst, elemente korisničkog sučelja i stilska ograničenja u razlučivosti do 2K. Cool.

Testiranje pregleda

Dobio sam pristup pregledu dan prije izlaska, a model je uglavnom impresivan. Poslao sam mu snimak zaslona početne stranice ZDNET-a i nacrt priopćenja za tisak Images 2.0.

Zatim sam dao upute: “Na temelju sadržaja priopćenja za tisak, generirajte 16:9 infografiku o novom ažuriranju slike i generirajte je koristeći stil brenda ZDNET kao što je prikazano u dokumentu ZDNET početne stranice.”

Također: Isprobao sam novi alat Google Photos AI Enhance: kako izrezuje, ponovno osvjetljava i popravlja vaše fotografije – ponekad

Model je napravio odličan posao na infografici, ali koliko god se trudio, nije mogao reproducirati ZDNET logo. U prvom pokušaju renderirao je Z u ZDNET-u s blagim padanjem.

Izradio ChatGPT/Snimak zaslona David Gewirtz/ZDNET

Isprobao sam razne zahtjeve u sljedećem redoslijedu: “Popravite ZDNET logotip. Z pada u vašoj verziji, ali nije ovješeno u stvarnom logotipu.” Ali Images 2.0 to nikada nije uspio popraviti.

Pa sam započeo novu sesiju. Ovaj put sam uključio uputu “Budite posebno pažljivi za točnu reprodukciju ZDNET logotipa.”

Također: testirao sam ChatGPT Plus u odnosu na Gemini Pro da vidim koji je bolji – i isplati li se promijeniti

Ovdje su stvari postale vrlo čudne. Za svoju prvu vožnju, model je nekako iskopao kopiju ZDNET-ova logotipa prije našeg redizajna 2022. Ovaj logo se ne može naći nigdje na našoj trenutnoj početnoj stranici. Čudno, prikazao je taj stari logotip koristeći trenutnu shemu boja. Model je zatim gurnuo logo i infografske informacije s lijevog ruba slike. Također je odabrao svijetloplavu za “Images 2.0” koja nije boja marke ZDNET.

Izradio ChatGPT/Snimak zaslona David Gewirtz/ZDNET

Snažno sam ga pokušao uvjeriti da koristi trenutni logo. Uspio sam ga natjerati da gurne sliku udesno, tako da ništa nije odrezano. Ali dodavanje upita “Koristite logotip ZDNET-a koji se nalazi na navedenoj stranici. Ne tražite alternativni logotip”, ništa nije riješilo problem.

Još jednom sam pokušao s izazovom prije nego što sam se odlučio vratiti dovršavanju ovog članka. Još jednom sam započeo novu sesiju tako da umjetna inteligencija nije imala mišićnu memoriju zbog svojih prethodnih pogrešnih proračuna.

Također: Ova moćna Gemini postavka učinila je moje AI rezultate osobnijim i točnijim

Manekenka je opet zeznula logo. Ovaj put, AI je odlučio dodati oblik kormila na stablo ispruženog velikog D.

Izradio ChatGPT/Snimak zaslona David Gewirtz/ZDNET

Da budem pošten, koristim verziju Images 2.0 prije izdanja. Vratit ću se s mnogo opširnijim testom modela nakon službenog izdavanja proizvoda.

Također sam pokušao sličan test korištenjem drugog dokumenta s Googleovim Nano Banana Pro, ali budući da nije radio sintezu na način na koji radi ova nova verzija OpenAI proizvoda, nije mogao ponoviti rezultate koje sam ovdje dobio. Znat ćemo više kada budemo radili naprednije testove

Cijene i dostupnost

Novi model dostupan je danas svim korisnicima ChatGPT-a i Codexa. Napredni rezultati i sposobnost razmišljanja dostupni su ChatGPT Plus, Pro, Business i Enterprise korisnicima. Obavezno odaberite “Razmišljanje” s padajuće trake ChatGPT na vrhu zaslona.

U vrijeme pisanja, prije izdavanja, novi model Images 2.0 bio je dostupan samo na stolnom računalu. Ali OpenAI obećava da će ove mogućnosti biti iu mobilnoj verziji, zajedno s mogućnošću odabira slika prstima pomoću zaslona osjetljivog na dodir vašeg mobilnog telefona.

Slike su također dostupne putem API-ja pomoću modela gpt-image-2. API određivanje cijena varira ovisno o kvaliteti, promišljenosti (moja riječ) i željenoj rezoluciji slike.

Ako umjetna inteligencija može upravljati izgledom i sadržajem u kombinaciji, hoće li to promijeniti način na koji pristupate dizajnerskim projektima? Javite nam u komentarima ispod.

Možete pratiti moja svakodnevna ažuriranja projekta na društvenim mrežama. Svakako se pretplatite na moj tjedni ažurirani bilteni pratite me na Twitteru/X na @DavidGewirtzna Facebooku na Facebook.com/DavidGewirtzna Instagramu na Instagram.com/DavidGewirtzna Blueskyju u @DavidGewirtz.comi na YouTubeu na YouTube.com/DavidGewirtzTV.

Web izvor

Rano sam pogledao ChatGPT Images 2.0 i impresivan je – uz jednu iznimku

ByTomšić Damjan

Ključni podaci ZDNET-a za van

Sposobnosti razmišljanja omogućuju složene tijekove rada

Preciznost i kontrola dizajna poboljšavaju upotrebljivost

Testiranje pregleda

Cijene i dostupnost

By Tomšić Damjan

Anthropicovo ažuriranje Claude Code Artifacts donosi žive, zajedničke nadzorne ploče i interaktivne radne prostore u poduzeća

Pseudoznanstveno ‘liječenje’ raka uključuje izbjeljivanje golih ljudi u plastičnim vrećicama

Sennheiser mi je upravo dao uvjerljiv razlog da povučem svoje Bose i Sony slušalice

You missed

Anthropicovo ažuriranje Claude Code Artifacts donosi žive, zajedničke nadzorne ploče i interaktivne radne prostore u poduzeća

Pseudoznanstveno ‘liječenje’ raka uključuje izbjeljivanje golih ljudi u plastičnim vrećicama

Sennheiser mi je upravo dao uvjerljiv razlog da povučem svoje Bose i Sony slušalice

Čini se da vlasnici Pixela nisu impresionirani ažuriranjem Androida 17

Rano sam pogledao ChatGPT Images 2.0 i impresivan je – uz jednu iznimku

ByTomšić Damjan

Ključni podaci ZDNET-a za van

Sposobnosti razmišljanja omogućuju složene tijekove rada

Preciznost i kontrola dizajna poboljšavaju upotrebljivost

Testiranje pregleda

Cijene i dostupnost

By Tomšić Damjan

Related Post

Anthropicovo ažuriranje Claude Code Artifacts donosi žive, zajedničke nadzorne ploče i interaktivne radne prostore u poduzeća

Pseudoznanstveno ‘liječenje’ raka uključuje izbjeljivanje golih ljudi u plastičnim vrećicama

Sennheiser mi je upravo dao uvjerljiv razlog da povučem svoje Bose i Sony slušalice

You missed

Anthropicovo ažuriranje Claude Code Artifacts donosi žive, zajedničke nadzorne ploče i interaktivne radne prostore u poduzeća

Pseudoznanstveno ‘liječenje’ raka uključuje izbjeljivanje golih ljudi u plastičnim vrećicama

Sennheiser mi je upravo dao uvjerljiv razlog da povučem svoje Bose i Sony slušalice

Čini se da vlasnici Pixela nisu impresionirani ažuriranjem Androida 17