fbpx

Macska-polip hibrid a PRBK laborjából – Kalandozás a generatív AI világában

A következő írásban csak a kommunikációs szektorról, és azon belül is a tartalommarketing egy kis szegletéről lesz szó az AI vonatkozásában.  

Azt hiszem, hogy megvan 2023-2024 buzz word-je. Szinte bármit el lehet adni vele, rengeteg kattintást és like-ot be lehet gyűjteni, és persze trendi is. Igen, ez a mesterséges intelligencia. Vagy AI. Vagy ’éjáj’, ahogy tetszik. Legyen az szöveg, kép, hang vagy ezeknek a kombinációja, az AI itt van velünk. (ki tudja, lehet ezt is azzal írtam?) Vannak, akik féltik a munkájukat, akik fejlesztik a vállalkozásukat, egyesek a kreatív szakma minőségváltozásáról vitatkoznak. Nos, én cicákat készítettem vele. Igen, ez a cikk az AI cicákról fog szólni.  

Ahogy említettem, ez a téma velünk van, és alapjaiban fogja meghatározni a médiafogyasztásunkat (is), legyen az online vagy offline. A kommunikációs szakembereknek egyszerűen muszáj up to date-nek maradnia, pláne most. Mivel egy rohamosan gyorsan fejlődő jelenségről van szó, így előfordulhat, hogy a különböző, engedélyekhez kötött tanfolyamok már elindulásuk pillanatában elavultnak számítanak. Épp ezért úgy gondolom, hogy a folyamatos tájékozódás mellett muszáj egyfajta önszorgalomból is ismerkedni a különböző AI lehetőségekkel.  

Hogy tegyük élvezetessé a tanulást, ha nem úgy, hogy összekötjük valami szórakoztatóval és vidámmal? Mindenki tudja, hogy egy kis cicával mindent el lehet adni, miért ne lehetne általa tanulni is? 

Csupán egy Discord fiók kellett hozzá 

A folyamatban az egyik legfejlettebb generatív AI-al kezdtem ismerkedni, a Midjourney-vel. Ahogy más generatív AI esetében is, úgy a Midjourney-nél is szöveges utasítást adunk (prompt) arról, hogy konkrétan mit is szeretnénk kapni. Nincs szükség semmilyen speciális szoftverre vagy hardverre ahhoz, hogy valóra váltsuk a képzeletünkben fogant képeket, elég pusztán egy Discord fiók.  

Gondolhatod, hogy „oké, nem kell hozzá se erős számítógép, se fejlesztési tudás, de biztos egy vagyon”. Nos, még az se.  Havi díjas rendszerben különböző csomagok közül választhatunk az igényeknek megfelelően. Az alap csomag havi 10$, amivel könnyen és egyszerűen vághatsz bele a tesztelgetésbe. 

A promptolás művészete 

Sokat emlegetett topic, hogy a generatív AI-ok használatánál a kulcs a megfelelő promptolás. Ahogy egy kampány során is, ha nem elég részletes a brief, a kampány sem olyan lesz, ahogy elképzeltük, vagy legalábbis sok utómunkát igényel a véglegesítése. Ugyan ez érvényes itt is, hatványozottan. A legapróbb részletekig meg kell határozni, hogy konkrétan mit és hogyan szeretnénk látni. Számolni kell azzal, hogy a gép nem képes az önálló gondolkodásra, épp ezért minél részletesebben promptoljuk, annál közelebb lesz ahhoz, amit megálmodtunk. Gondoljunk csak bele, mennyi adatot dolgoz fel az agyunk egyetlen képnél! 

 

A bejegyzés megtekintése az Instagramon

 

Cattagram (@cattagram.ai) által megosztott bejegyzés

Mit látunk? Egy aranyos, törölközőbe tekert vörös kis cicát. Elsőre talán tényleg ennyi a szembeötlő, de mit mondhatunk még el a képről? A szem és törölköző színétől kezdve az arckifejezésen át a kép stílusáig és a textúrákig, valamint a háttérig sok szempontból bővíthetjük a leírást, és ezek csak a legegyértelműbbek. Egy kép üzenetét olyan elemek befolyásolják, mint a kompozíció, a színhasználat, a tekintetek és arckifejezések, valamint az, hogy mennyire illeszkedik bele vagy tér el a világról szerzett ismereteinktől.  

Kísérletezéseim során azt tapasztaltam, hogy ha ezeket a szempontokat tudatosabban építem bele a promptolásba, érezhetően jobb eredményeket kapok.   

Gyakorlás, gyakorlás, gyakorlás 

A cicáknak rengeteg fantasztikus tulajdonságuk van. Az emberek szeretik őket, aranyosak és minden létező kontextusban megállják a helyüket. Azt hiszem ők az egyetlen állatok a kutyák mellett, akik minden formában képesek viccesek lenni, vagy minimum érdekesek. Ahhoz, hogy kiaknázhassam a lehetőségeket tudtam, hogy gyakorolni kell a promptolást.  

Az elején, amolyan agent of chaos módjára próbálgattam, mire hogy reagál a modell. Volt egy elképzelés a fejemben, de természetesen köze nem volt a végeredménynek hozzá, így napokig csak kombinálgattam a parancsokat. Egy idő után elkezdtem kategorizálni a szempontokat, és picit tudatosabban utasítani a chatbotot. Először a kép stílusára koncentráltam és igyekeztem megtalálni a tökéletes leírásokat ahhoz, amit szeretnék. Így haladtam tovább a textúrákkal, a hátterekkel, a színárnyalatokkal és az érzésekkel.  Nagy segítségemre volt, hogy a több felületen is szerveződő (Instagram, Reddit, Discord) AI artist közösség nagyon segítőkész, nyitott és befogadó. A különböző fórumokon jól bevált, kipróbált promptokat és tanácsokat adnak egymásnak, illetve meg is osztják a saját munkájukat.  

Csak a kreativitás szabhat határt 

A generatív AI megoldások megteremtették a lehetőséget, hogy a megtévesztésig élethű vagy művészileg elfogadott eredményeket kapjunk. Amik eddig hosszú munkaórákkal teli photoshoppozással voltak csak elérhetőek (vagy azzal sem), azok most percek alatt megvalósulhatnak, ezeknek pusztán a képzelet és a kreativitás, na meg a promptolási technikánk szabhat határt. Létrehozhatunk például egy polip-cica hibridet, egy catburritót vagy egy kocsmapultot támasztó testépítő kandúrt is.  

 

A bejegyzés megtekintése az Instagramon

 

Cattagram (@cattagram.ai) által megosztott bejegyzés

 

A bejegyzés megtekintése az Instagramon

 

Cattagram (@cattagram.ai) által megosztott bejegyzés

 

A bejegyzés megtekintése az Instagramon

 

Cattagram (@cattagram.ai) által megosztott bejegyzés


Létezik? Nyilván nem (a cicák nem szeretik a vizet, mit keresne a polip közelében?), mégis itt van! Gondoljunk hát bele, mi lenne akkor, ha valós percepcióra épülve hoznánk létre tartalmat, ami akár igaz is lehetne? Megnyugtatok mindenkit: ez már létezik, és sok esetben észre sem vesszük. Lehet, hogy a 8 csápú kopasz egyiptomi macska még felakad a szűrőn, de egy hangzatos headline-al ellátott, kevésbé életidegen kép átcsúszhat. 

A tartalom jövője 

Az AI generált tartalmakról (legyen az kép, videó vagy hang) régebben (pár éve) egyszerűen meg lehetett állapítani, hogy nem ember alkotta őket vagy, hogy nem is valódi, amit látunk. Ez mára, ahogy sok minden, átalakult. Hónapról hónapra nehezebb eldönteni, hogy az, amit érzékelünk valódi-e vagy szimplán egy jól megírt prompt eredménye. Talán a legérzékelhetőbb fejlődés a portréképeknél figyelhető meg. Kezdetben a fogakról, az ujjakról és a szájról lehetett egyértelműen megmondani, hogy AI generált, de manapság már ezek is egyre kérdésesebbek. Hasonló támpont lehet a kontúrozottság, a kontrasztarány és az élesség. Valahogy mindig „tökéletesebbek”, mint ami elvárható egy valódi képtől, legyen akármennyire is szerkesztett. De, ha azt nézzük, hogy röpke fél-egy év alatt mekkora fejlődésen ment keresztül ez a terület, egyáltalán nem lepődnék meg, ha egy nap már egyáltalán nem tudnánk megmondani mi a valódi és mi nem (igaz, ez úgy hangzik, mint egy Black Mirror rész, de ehhez közeledünk.) 

Az AI számtalan kaput nyitott meg előttünk, és biztos, hogy párat be is fog zárni. A kérdés nem az, hogy használjuk-e majd, hanem hogy képesek vagyunk-e a lehető legjobb módon hasznosítani. Elcsépelt és talán klisés mondás, de a technológia rohamosan halad előre, és ha nem vagyunk képesek felvenni a tempót, lemaradunk. A lemaradás pedig napjaink felgyorsult világában végzetes is lehet.  

A szerző

Serzysko Jacek