Menu

Prompting New Realms

Van Harry Potter tot Breaking Bad en Lord Of The Rings: who needs a Kim Kardashian wanneer er nieuwe fictieve muzen zijn om in Balenciaga te kleden. Generatieve AI is hot topic en volgt momenteel haar inburgeringscursus voor onze samenleving. Daarom duik ik deze week dieper in AI-generatoren, algoritmes en prompting – op smaak gemaakt met mijn ongevraagde mening en de laatste gossip in tech.

Davy de Lepper | 25/05/2023

Vorige keer nam ik je mee in het feitelijke sprookje van generatieve AI en haar intrede in popcultuur. Middels virale voorbeelden – zoals de zaak “Drake & The Weeknd” – besprak ik de kansen en gevaren van nieuwe AI-technieken die plots uit de lucht komen vallen. Inmiddels zijn we drie weken verder en is generatieve AI nog steeds het gespreksonderwerp op het puntje van ieders tong. Daarom leg ik in dit artikel het productieproces van prompting – een vorm van AI-kunst – onder de loep aan de hand van illustrerende cases uit mijn sociale algoritmes en hulp van artificial friend ChatGPT. In hoeverre kunnen we nog spreken over originaliteit wanneer een beeld wordt “geschilderd” met behulp van bestaand materiaal op het web? But first things first: wat is prompting? ChatGPT, take it away:

In de context van AI verwijst “prompting” naar het verstrekken van een startzin, instructie of voorbeeldtekst aan een taalmodel om tekstgeneratie te sturen. Het dient als een trigger voor het model om de gewenste output te produceren. Prompting is een waardevol hulpmiddel om de uitvoer van taalmodellen te beheersen en hun generatieve capaciteiten vorm te geven.

De evolutie van media

Eén van de meest controversiële AI-cases de afgelopen tijd was die van Boris Eldagsen. De 52-jarige Duitse kunstenaar won de prestigieuze Sony World Photography Award (SWPA) met het beeld The Electrician. De door AI “prompted” foto in de stijl van Roger Ballen’s psychologische portretten – een fotograaf die bij de massa bekend werd door het Zuid Afrikaanse pop duo DIE ANTWOORD – won in de Creative Open Category. Sony gunde Elsdagen zijn prijs, maar ontzegde hem het debat waar hij naar streefde. Alsnog haalde Elsdagen haast iedere krantenkop en opende het debat over AI in het klassieke perspectief van wat fotografie is of zou moeten zijn.

‘The Electrician’ door Boris Eldagsen

De zaak ‘Eldagsen’ is inmiddels oud nieuws, maar in mijn ogen nog steeds een relevant voorbeeld dat illustreert hoe klassieke media over tijd veranderen: eentje waarin AI momenteel de hoofdrol vertolkt. Het beeld wat Eldagsen inzond voor de SWPA is gemaakt met behulp van DALL-E 2: een afbeeldingen generator door moederbedrijf OpenAI, dat onder meer ChatGPT op de markt zette. Het antwoord op het overkoepelende vraagstuk – is het nog fotografie wanneer het door AI is gegenereerd – blijft persoonlijk. Zelf noemt Eldagsen het promptograpy. Als klassiek geschoolde documentaire fotograaf, waar men op jacht moet naar een onderwerp voor de lens in the real world, kan ik me vinden in Eldagsen’s benaming voor een nieuw soort fotografie. Het maakt me nieuwsgierig naar hoe ik zelf zo’n beeld kan genereren. Om deze kennis te bemachtigen schakelde ik hulp in van mijn nieuwe vriend, de Google met een mening en AI-entiteit ChatGPT. Ik vroeg hen het volgende: hoe komt een beeld tot stand door een AI generator nadat de mens invoert wat hij wil genereren?

Er zijn verschillende methoden die AI-generatoren kunnen gebruiken om afbeeldingen te produceren, waaronder het gebruik van neurale netwerken en generatieve adversariële netwerken (GAN’s). Neurale netwerken werken door middel van gelaagde processen waarbij informatie door een reeks neuronen wordt doorgegeven, terwijl GAN’s bestaan uit twee concurrerende neurale netwerken die samenwerken om afbeeldingen te produceren die lijken op de trainingsgegevens. Kortom, AI-generatoren produceren afbeeldingen door middel van complexe algoritmes die patronen en kenmerken leren van trainingsgegevens, en deze vervolgens toepassen op nieuwe gegevens om een beeld te genereren dat lijkt op wat de mens heeft ingevoerd.

Dit antwoord genereert geen “eureka” moment in mijn menselijke brein, dus laat ik me verleiden door mijn Instagram-algoritme en verdiep ik me in de generator der generatoren: Midjourney.

Een journey door Midjourney

Ik start op het YouTube kanaal van PromtJungle, die in een tutorial instrueert hoe viral video’s als Demonflyingfox’ Harry Potter x Balenciaga-video zijn gemaakt. Mijn eerste openbaring vindt plaats wanneer ChatGPT en Midjourney worden gecombineerd voor de creatie van deze video’s. Mijn brein denkt verder: zou ik de stijve Nederlandse minister-president Mark Rutte kunnen kleden in de avant-garde punk van recent overleden Engelse mode-legende Vivienne Westwood? Ik gaf mijn ironische ingeving een poging in de step-by-step tutorial die voor meerdere viral video’s zorgde en kwam uit op de volgende prompt:

1990 screengrab of male model Mark Rutte wearing revolutionary Tartan Suit paired with a black leather belt adorned with silver spikes and chunky platform boots, fashion scene Vivienne Westwood commercial –ar 3:2 –ar v 5

De volgende stap was platform Discord uitvogelen en een Midjourney-abonnement bemachtigen. Na het vinden van het juiste Discord-kanaal voerde ik de bovenstaande prompt in. De resultaten die voor mijn ogen genereerden leken nauwelijks op de premier. Na het aanpassen van de prompt code en het toevoegen van een portret, sponsored by Google, genereerde Midjourney 4 versies van Rutte die verre van op elkaar leken. Dit bewijst dat ook Midjourney nog niet volledig consistent is in haar database, want alleen de meest beroemde figuren van onze wereld zullen hyperrealistisch worden nagebootst. Dit zal natuurlijk in de komende jaren, misschien zelfs maanden, veranderen als je kijkt naar wat de AI van app Lensa al toe in staat is met slechts een aantal selfies uit de galerij op je telefoon. Hieronder één van de resultaten:

Prompted met ChatGPT en Midjourney

Promptography, of gewoon prompting, is een trend-to-stay. Echter kan men zich afvragen of de AI-techniek waarmee ‘digitale kunst’ gegenereerd kan worden onderdoet aan de creativiteit van makers. Mijn Midjourney-prompt-experience liep misschien wat minder soepel omdat ik geen kaskrakende film koppelde aan Balenciaga, maar het liet me wel inzien hoe nauw het taalgebruik van een prompt moet zijn en waar het nog meer voor gebruikt kan worden. Probeer het zelf eens met een digitaal zelfportret, 3D-logo of interieur in jouw eigen handtekening: prompting is er niet alleen voor de viral YouTube-video’s. Zet het zoals ChatGPT naar eigen hand en verken de mogelijkheden van het programma buiten de gebaande paden. Mijn Mark Rutte meets Vivienne Westwood look mag dan wel niet helemaal gelukt zijn, maar het maakt me nieuwsgierig hoe ik als designer Midjourney kan inzetten voor mode- en styling opdrachten.

Up Next

Prompting is slechts een klein voorproefje van wat mogelijk is met AI in de kunst. In het volgende artikel zal ik AI-kunst bekijken vanuit de ogen van verschillende makers. Stay tuned and read all about it, hier op The Flash Drive van Nxt Museum.

Content Category
Brain Feeder
author
Davy de Lepper
date
25 mei 2023