“Zapaliti” ili “srušiti” internet u današnje vrijeme više nije jednostavan zadatak, no recimo da je barem malo tog efekta uspio postići OpenAI, predstavivši jučer svoj novi text-to-video alat Sora. Rezultat korištenja ovog alata? Videa koja su toliko realistična, da ćete ih zamijeniti za ona “prava” i snimana ljudskom rukom.
OpenAI, tvorac ChatGPT-a, predstavio je novi oblik umjetne inteligencije koji stvara realističan video na temelju tekstualnih upita, što je izazvalo val reakcija na internetu, piše Al Jazeera.
Model koji pretvara tekst u video nazvan je Sora. Ima “duboko razumijevanje jezika” i može generirati “uvjerljive likove koji izražavaju živahne emocije”, pojasnio je OpenAI u objavi na svom blogu.
“Sora može generirati složene scene s više likova, specifičnim vrstama pokreta i točnim detaljima subjekta i pozadine”, rekao je startup kojeg podržava Microsoft.
“Model razumije ne samo što je korisnik tražio u upitu, već i kako te stvari postoje u fizičkom svijetu.”
Izvršni direktor OpenAI-ja Sam Altman pozvao je korisnike društvene mreže X (nekadašnji Twitter) da predlože promptse za Soru, a zatim je na temelju njihovog feedbacka generirao realistične videozapise dvaju zlatnih retrivera koji podcastiraju na vrhu planine, bake koja pravi njoke i morskih životinja koje sudjeluju u biciklističkoj utrci na vrhu oceana.
Hiper-realistična kvaliteta videozapisa izazvala je zapanjene reakcije na društvenim mrežama, a korisnici su rezultate nazvali game changerima. Demonstracija novog OpenAI alata također je izazvala zabrinutost zbog potencijalnih rizika, posebno u godini pomno praćenih izbora diljem svijeta, uključujući američke predsjedničke izbore u studenom.
OpenAI je u svom postu na blogu rekao da će poduzeti nekoliko važnih sigurnosnih koraka prije nego što pusti Soru u javnost.
“Radimo sa stručnjacima u područjima kao što su dezinformacije, sadržaj pun mržnje i pristranosti – koji će suparnički testirati model,” rekla je tvrtka. “Također izrađujemo alate koji pomažu u otkrivanju obmanjujućeg sadržaja kao što je klasifikator detekcije koji može reći kada je Sora generirala video.”
OpenAI je također priznao da Sora ima slabosti, uključujući poteškoće s kontinuitetom i razlikovanjem lijevog od desnog. “Na primjer, osoba može zagristi kolačić, ali nakon toga kolačić možda neće imati trag ugriza”, rekao je startup iz San Francisca.
Konkurenti OpenAI-ja Meta i Google također su demonstrirali AI tehnologiju pretvaranja teksta u video, ali njihovi modeli nisu dali rezultate tako realistične kao Sorini.
FOTOGRAFIJE: Sora