OpenAI objavio je novu verziju za DALL-E, trenutno dostupnu malom broju korisnika, koja se od prethodnih varijanti razlikuje po tome što ne funkcionira isključivo zasebno, već je tehnologija generiranja slika uključena u OpenAI-jev popularni chatbot, ChatGPT. Kakav je rezultat prvih radova, možete pogledati na slikama kojima je članak opremljen, generiranima kroz DALL-E 3.
OpenAI, start-up za umjetnu inteligenciju iz San Francisca, prošlog je tjedna objavio novu verziju svog generatora slika DALL-E i tehnologiju integrirao u ChatGPT. Opcija je trenutno dostupna malom broju korisnika, a The New York Times piše da nova verzija može proizvoditi uvjerljivije slike od prethodnih verzija, a iz tvrtke kažu kako je posebno ‘talentirana’ za slike koje sadrže slova, brojeve i ljudske ruke.
DALL-E 3 postaje dio ChatGPT-ja
Aditya Ramesh, istraživač u tvrtki OpenAI, rekao je kako je novi DALL-E znatno bolji u razumijevanju i prezentaciji onoga što korisnik traži, dodajući da je tehnologija osmišljena kako bi preciznije razumjela engleski jezik. Dodavanjem najnovije verzije DALL-E u ChatGPT, OpenAI čini svoj chatbot središtem za umjetnu inteligenciju koja može samostalno generirati tekst, slike, zvukove, softver… Otkako je ChatGPT postao viralan prošle godine, pokrenuo je utrku među tehnološkim divovima u Silicijskoj dolini, kako bi bili na čelu razvoja umjetne inteligencije.
Prošlog je tjedna i Google predstavio jedan novitet za svoj chatbot, Bard. Naime, sada ga je moguće povezati s nekoliko najpopularnijih usluga tvrtke, uključujući Gmail, YouTube i Docs. Midjourney i Stable Diffusion, još dva generatora slika, ažurirali su svoje modele ovog ljeta.
OpenAI već dugo nudi različite načine povezivanja chatbota s drugim online uslugama, uključujući Expediju, OpenTable i Wikipediju. No, ovo je prvi put da su chatbot kombinirali s generatorom slika. DALL-E i ChatGPT ranije su bili odvojene aplikacije. No, s najnovijom verzijom, korisnici će moći koristiti ChatGPT za generiranje digitalnih slika, i to kroz jednostavne opise onoga što žele vidjeti. Uz to, mogu koristiti opise generirane od strane chatbota, čime se dodatno automatizira generiranje grafika.
Prilikom predstavljanja nove verzije DALL-E, Gabriel Goh, istraživač u OpenAI-ju, pokazao je kako ChatGPT sada može generirati detaljne tekstualne opise koji se zatim koriste za stvaranje slika. Na prezentaciji je pokazao i konkretan primjer: nakon što je stvorio opise logotipa restorana pod imenom Mountain Ramen, bot je generirao nekoliko slika na temelju tih opisa, u svega nekoliko sekundi. Nova verzija može generirati slike iz opisa u više paragrafa i pažljivo slijediti upute iznesene u minucioznim detaljima. Kao i svi generatori slike, te drugi sustavi umjetne inteligencije, i on je podložan pogreškama.
DALL-E 3 još je nedostupan široj javnosti
Dok radi na usavršavanju tehnologije, OpenAI ne dijeli DALL-E 3 sa širom javnosti do sljedećeg mjeseca. Tada će biti dostupan putem usluge ChatGPT Plus, koja košta 20 dolara mjesečno. Stručnjaci su upozorili da se tehnologija generiranja slika može koristiti za širenje velikih količina dezinformacija na internetu. Kako bi se zaštitili od toga, OpenAI je u DALL-E 3 uključio alate dizajnirane za sprječavanje problematičnih tema kao što je seksualno eksplicitan sadržaj i prikaz javnih osoba. Tvrtka također pokušava ograničiti sposobnost DALL-E 3 da imitira specifične umjetničke stilove.
Sandini Agarwal, istraživačica u OpenAI-ju fokusirana na sigurnost, izjavila je da DALL-E 3 često generira slike koje su više stilizirane, nego fotorealistične. Ipak, priznala je da se model može potaknuti da proizvede uvjerljive scene, recimo, zrnate slike koje imitiraju snimke sigurnosnih kamera. The New York Times piše kako OpenAI nema namjeru blokirati problematičan sadržaj koji dolazi iz DALL-E 3, što je Agarwal komentirala, rekavši kako je takav pristup jednostavno preopćenit jer se može dogoditi da su slike bezopasne ili opasne, ovisno o kontekstu u kojem se pojavljuju.
FOTOGRAFIJE: Instagram @openaidalle