
đïž Nu fungerar AI-bilder som de borde
AI-genererade bilder har tagit ett stort kliv framÄt och tidigare problem Àr nu nÀstan helt borta.
Dela artikeln
Det hÀr mejlet innehÄller flera bilder, sÄ om det kapas mitt i rekommenderas lÀsning direkt i webblÀsaren. Klicka hÀr.
AI-genererade bilder har blivit mycket bÀttre senaste tre Ären. FrÄn hyfsade men lite styltiga och luddiga, till fullt fotorealistiska och vÀldigt skarpa. PÄ vÀgen har problem med att producera rÀtt antal fingrar och konstiga ansiktsuttryck lösts.

Text i bilderna funkade först inte alls, men har gradvis blivit bÀttre, dock utan att fungera helt.

Nu har OpenAI slÀppt en ny bildgenerator som Àr ett stort kliv framÄt.
Tidigare nÀr du skrev i ChatGPT att du vill ha en bild av nÄgot sÄ gjorde den en textinstruktion som den skickade till ett separat bildverktyg, DALL-E, som gjorde bilden. I den nya versionen gör sprÄkmodellen i ChatGPT sjÀlv bilden enligt samma metod som den producerar text.
Det ger en helt ny nivÄ av exakthet och text funkar nÀstan helt perfekt nu (den har lite svÄrt med Ä, À, ö ibland.)
Tidigare innebar bildskapande att man ofta fick generera om bilderna flera gÄnger, för att hitta en variant man blev nöjd med. Inte sÀllan försvann nÄgot ur den nya bilden som man gillade, för den genererade bilden helt pÄ nytt varje gÄng. Det problemet Àr borta nu. Nu kan man med helt vanlig svenska göra exakta Àndringar i bilden.
đ€Ż
En kompis skickade en bild pÄ hur hans spisomrÄde sÄg ut efter att han renoverat det.
Snyggt men lite kalt, tyckte jag och laddade upp bilden till ChatGPT tillsammans med ett foto pÄ honom. Jag bad ChatGPT att lÀgga till bilden som en mÄlning pÄ vÀnstra vÀggen, addera lite köksutrustning och sÀtta upp en tavla med Carpe Diem pÄ högra vÀggen.
Eller sÄ funderar du pÄ hur en viss tapet skulle se ut i sovrummet.

Ladda upp bÄda bilderna och be ChatGPT att sÀtta upp tapeten i rummet. Och vips!

Men kanske vill du se hur det ser ut nÀr dörren Àr stÀngd och tv:n Àr pÄslagen. Voilà !

Kolla tapeten bakom dörren. Det hade ju inte varit konstigt om den delen hade blivit vit nÀr dörren stÀngdes, men icke.
Sinnes! Eller hur?
SĂ„ hĂ€r kan man hĂ„lla pĂ„. Annan tapet, blĂ„tt överkast, ta bort teven och sĂ€tt upp en tavla â och sĂ„ vidare.
Som sagt Àr den numera riktigt bra pÄ text ocksÄ.

Ett annat problem har varit att man inte kan anvÀnda samma karaktÀr eller pryl i flera bilder, dÄ de hela tiden sÄg rÀtt olika ut. Det problemet Àr nÀstan helt borta nu.
Vi tar denna skyltdocka.

Och sÀtter pÄ honom en Warp-tshirt, genom att ladda upp en bild pÄ en sÄdan t-shirt.

Den missar att texten ska vara ljusblÄ, inte vit, och sÀger till ChatGPT att Àndra, samtidigt som vi instruerar den att sÀtta pÄ honom jeans.

Nu kan vi placera honom i olika miljöer. Som pÄ Warp News redaktion.

Eller varför inte i djungeln?

Skyltdockan Àr inte exakt likadan i varje bild, men rÀtt nÀra.
Det som skapat mest kontrovers Àr att man nu kan hÀrma stilar. HÀr blir det grÄzon. Att hÀrma en stil tycker jag Àr okej, men att kopiera en stil Àr mer tveksamt. FrÄgan Àr var grÀnsen gÄr?
HÀr Àr Sveriges justitieminister, Gunnar Strömmer, i olika varianter.

SÄ gör du
Hur gör man allt detta, undrar du kanske? Det Àr enkelt. Logga in pÄ vanliga ChatGPT och instruera den med ditt vanliga sprÄk. Det krÀvs inga sÀrskilda kommandon, beskriv bara med vanlig svenska (eller annat sprÄk) hur du vill att bilden ska se ut. Vill du ha nÄgot vÀldigt specifikt behöver din beskrivning vara detaljerad, annars funkar det bra att vara kortfattad. Vill du att den ska utgÄ eller anvÀnda bilder sÄ laddar du upp dessa samtidigt som du skriver din instruktion.
Det Àr inte perfekt Ànnu, men inte lÄngt ifrÄn. De kvarvarande skavankerna kommer snart vara borta. NÀsta steg Àr att kunna göra samma sak med video.
Jag rekommenderar att scrolla igenom flödet pĂ„ Sora (som Ă€r bildvarianten av ChatGPT). Folks kreativitet Ă€r otrolig! Ăr du inloggad sĂ„ kan du se textinstruktionerna som skapade bilden eller videon.

Mathias Sundin
Arge optimisten