AI-revolusjonen innen kunst: Disse bildene er ikke menneskeskapte

Skrevet av | 11. august 2022

«Å bekymre seg for at AI skal overta verden, er som å bekymre seg for overpopulasjon på Mars. Vi har ikke landet på planeten enda.»

Ordene tilhører den amerikanske dataingeniøren Andrew Ng, en av de ledende eksperter innen maskinlæring i vår tid. Overbevisningen om at supercomputere står på bevissthetens trapper, avslører typisk en dyp ignoranse om nevropsykologi, datamaskiner eller begge deler.

Bevisste datamaskiner – en prinsipiell umulighet?

Min intuisjon om at bevisste datamaskiner er umulig selv i prinsippet, har styrket seg betydelig etter en studie av hjernens oppbygning. Den menneskelige hjernen er den aller mest komplekse tingen vi kjenner til i hele universet. Bare å imitere én enkelt nervecelle i den, i seg selv intimiderende i sin kompleksitet, fremstår som en nærmest uoverkommelig oppgave. DNA-et vårt er en tekst tre milliarder bokstaver lang. I bokform blir dette over 2,3 millioner sider. Hvordan skal man i det hele tatt begynne å tilnærme seg 86 milliarder nevroner, koblet sammen ved hjelp av opp mot 1000 trillioner synapser?

Ettersom at hjernen vår består av elektrokjemiske prosesser, skiller den seg dessuten så dramatisk fra en datamaskin rent kvalitativt, at å gjøre sammenligningen ville være å begå en grov kategorifeil.

For å driste meg til en analogi, er forestillingen om at en kan kode inn bevissthet i en datamaskin ved hjelp av nuller og enere, omtrent like misforstått som at en kan programmere inn i den både konsistensen, duften, smaken, næringsinnholdet og den berusende effekten av et måltid pâté de foie gras servert med et glass italiensk hvitvin til. 

Det er til liten nytte hvor sofistikert softwaren er, om gapet i hardwaren nødig lar seg brolegge.

– Knapt forlatt krybben

Pessimister blir til stadighet minnet om den anerkjente fysikeren Lord Kelvin, som i sitt infame forsøk på å kikke inn i glasskulen erklærte at flyvemaskiner tyngre enn luft var en umulighet i 1895, åtte år før gjennombruddet til brødrene Wright.

Det ville imidlertid ha vært såre enkelt å tilbakevise Kelvin på tidspunktet. En behøvde kun å invitere han til å skue opp på himmelen, allerede vrimlende av livsformer som hadde overkommet problemet mekanisk. Finnes det en lignende bekjemper av pessimismen til maskinell bevissthet, har jeg enda til gode å få den pekt ut.  

Med dette sagt, ville det være høyden av arroganse å insistere at det aldri vil finnes noen løsning på problemet, simpelthen fordi ens dødelige selv ikke evner å tenke ut noen i nåtiden. Informasjonsteknologien har knapt forlatt krybben, men har innen sine første tiår allerede nådd en serie av utrolige milepæler.

På innsiden av lommen din bærer du med deg informasjonen til titusener av biblioteker, i tillegg til en samling av musikk, bilder og video helt uten sidestykke. 

Ved hjelp av Monte Carlo-metoden, kjennetegnet av at datamaskinen spiller utallige ganger mot seg selv for å komme fram til den beste løsningen, pulveriseres verdensmestere i strategispill som sjakk og Go. 

Ansiktsgjenkjenningsteknologien har nå blitt presis nok til at Kina nylig implementerte et aldeles orwellsk betalingssystem, der både bankkort og kontanter er gjort overflødige ved at penger trekkes fra kontoen ved å skanne kundenes ansikter i kassen. 

Et helt galleri laget i løpet av et døgn

Dette leder oss til det helt tankesprengende terrenget av AI-genererte illustrasjoner. 

Du trenger ikke å ha holdt en pensel i din hånd noen gang. Alt banebrytende AI-kunstapper som Midjourney og Dall-E krever av deg, er at du skriver inn en tekst av hva fantasien din lengter etter å se, eksempelvis «Julius Caesar conquers the moon in the style of Caravaggio» eller «hyperrealistic photo of animals with rifles storming the Bastille.» Algoritmene gjør så resten av jobben for deg. Innen sekunder har du fått et sett av bilder å velge mellom.    

Slik kan hvem som helst få opp et helt galleri i løpet av en ettermiddag. 

Så det er nøyaktig hva jeg gjorde. 

Etter å ha tilbragt noen timer i gratisappen Dream av WOMBO, gikk jeg over til den langt mer imponerende Midjourney, nylig gjort tilgjengelig for offentligheten på Discord mot en betalingsløsning. I disse to programmene produserte jeg et stort antall illustrasjoner, som ville ha tatt meg en hel livstid å skape helt for egen maskin. 

Innen et døgn ble hele galleriet under født, som jeg kurerte ved å plukke ut de femti verkene jeg ble mest tilfreds med: 

«Evolution of Man», «A Crufifixion Distant in Spacetime» (I, II & III), «Ministry of Truth» og «Mind of Freud» ble generert i appen Dream av WOMBO. Resten av bildene ble fremstilt i Midjourney.

Hvor kommer så alle disse bildene fra, sånn virkelig?

Hva man først må ta innover seg, er at hva algoritmene ikke gjør er å blande sammen allerede eksisterende bilder, slik en DJ sampler ulike sanger og setter dem sammen i en unik kombinasjon. Det som foregår her er langt mer bemerkelsesverdig enn som så. 

Disse programmene er et helt utsøkt tilfelle av maskinlæring. Mer presist læres de opp i en bestemt form for mønstergjenkjenning. Man mater dem eksempelvis med tusenvis av bilder av en elefant, slik at de vet omtrentlig hvordan man reproduserer et slikt motiv. Jo større databasene man mater dem med er, desto mer imponerende blir selvsagt resultatene. 

En kan innvende at dette er derivativt, men er ikke mennesker til syvende og sist også mønstersøkende? Artister skaper ingenting i et vakuum. De inspireres av andre artister og av sine omgivelser. Reis tilbake i tid og bestill av Rafael et maleri av et fly eller en dinosaur, og han ville ha vært fullstendig i villrede, siden han ikke hadde hatt noen som helst konsept av hva disse tingene var. For å kunne male dem, måtte han først ha sett dem. For å kunne male noe ikke-eksisterende, måtte han ha kombinert elementer av hva han allerede hadde sett.  

Introduksjonen av musikkinstrumenter som gitaren, fiolinen eller pianoet møtte en del motbør, især fra religiøst hold, siden de i motsetning til vokalmusikk ble oppfattet som karakteristisk umenneskelige. I nyere tid har vi bevitnet en skepsis til elektronisk musikk, ikke ansett som autentisk nok av eldre generasjoner mer vant til tradisjonelle instrumenter. Maskingenerert kunst vil utvilsomt også støte på en fiendtlig reaksjon. Med tiden er det imidlertid noe alle vil ta for gitt, enten man liker det eller ei. 

Selve kjernen ved det å være menneske

Jeg må innrømme at å skue på bildene over fyller meg med en form for urolig melankoli, en av samme slaget C. S. Lewis følte da han reflekterte over utsiktene for en menneskelig tilstedeværelse på månen. Lewis fryktet at all menneskelig romantikk og poesi om månen ville gå opp i flammer i det øyeblikket man løftet blikket opp på den og sa: «Der er den amerikanske basen, og der har vi den russiske.»

Langt mer ødeleggende ville det muligens være om enhver form for illustrasjon ikke lenger var et uttrykk for menneskelig skaperkraft og åndsliv, men heller ble produsert av en maskin som åpenlyst ikke kunne relatere til noen av følelsene de er ment å formidle. 

Å erstatte rutinearbeidet til bonden, lagermedarbeideren eller byråkraten er én ting. Dette føles radikalt annerledes. En kan ikke unnslippe følelsen av at noe kan være i ferd med å gå tapt. Noe viktig, som rører ved selve kjernen av det å være menneske. 

En potensiell inflasjon i vente?

Skulle noen ha spurt meg hvilke jobber som var truet av kunstig intelligens for bare noen uker siden, ville kreative yrker ha figurert temmelig langt nede på listen. Etter å ha erfart på egenhånd hvor kraftfull den nye teknologien er, er jeg ikke lenger så sikker. Hvorfor betale en grafisk designer eller en middels modernistisk kunstner eller maler for noe hvem som helst kan generere i en app?

Enn så lenge sitter storhetene komfortabelt – noe jeg tror de bestandig vil gjøre. Det vil nok bestandig være rom for en Munch eller en Rembrandt. Men implikasjonene av AI-revolusjonen for illustrasjoner kan være at mye av den flyttes inn i nye former, og at terskelen for mer tradisjonelle uttrykksformer betraktelig heves i møte med konkurransen. Og etter hvert som denne teknologien når ut til de store masser, står man ikke potensielt overfor en illustrasjonsinflasjon? 

En alternativ mulighet er at AI-kunsten devalueres i kraft av at den ikke er produsert av mennesker, og dermed ikke oppleves like genuin eller talentfull.  

Én ting er i alle fall sikkert, og det er at denne teknologien skal bli mye bedre. AI-programmer som Midjourney og DALL-E befinner seg fremdeles på betastadiet. De er dermed sammenlignbare med den aller første versjonen av (fotballspillet) FIFA, utgitt i 1993. Det har skjedd ufattelig mye med FIFA siden den tid. Tilsvarende har vi særdeles mye i vente innen sjangeren AI-genererte illustrasjoner i årene og tiårene som kommer. 

Hva vi har sett foreløpig, er kun begynnelsen på noe fryktinngytende vakkert. 

Når man besøker en klassisk utstilling, må man være ekstra var på ikke å komme ...
Konserten kommer krypende inn på deg. Den lister seg som en sulten hund. Åpningsmotivet er ...
– Det er feil at alle nybygg må se ut som bokser, sier Sigvald Freylander, ...