7.5.6.1 Praktisk generering av bilder

Innen bildegenerering har spesielt Generative Adversarial Networks (GANs) og modeller som DALL·E fra OpenAI, blitt sentrale. GANs arbeider ved at to nettverk konkurrerer mot hverandre; ett genererer bilder, mens det andre vurderer dem. Dette samspillet fører til stadig bedre og mer realistiske bilder. DALL·E, på sin side, genererer bilder basert på tekstbeskrivelser, og åpner for en kreativ tilnærming til bildeproduksjon.

Bildegenerering tar mye dataressurser og bruker ofte litt tid på å generere bilder. Derfor er dette ofte en betalingstjenester. Gratis tjenester har ofte en begrensning på hvor mage bilder du kan generere per dag/time. 


Verktøy for bildegenerering

Flere verktøy lar brukere, profesjonelle designere så vel som nybegynnere - inkludert lærere og studenter, skape bilder ved hjelp av KI. Disse inkluderer:

  • DALL·E: Et kraftig verktøy fra OpenAI for å generere bilder fra tekstlige beskrivelser, som lar lærere skape tilpasset undervisningsmateriell. Verktøyet har kommet i flere versjoner som stadig blir bedre. Du finner DALL·E både i betalingsversjonen av ChatGPT og i kreativ modus i Copilot/BingChat fra Microsoft
  • Artbreeder: Lar brukere kombinere og manipulere eksisterende bilder for å skape nye visuelle uttrykk. Mulig å bruke i en gratismodell, men er i hovedsak betaling.
  • Midjourney: Er en uavhengig forskningslab som har utviklet en avansert tekst-til-bilde KI-modell. Denne modellen lar brukere skape detaljerte og unike bilder og kunstverk basert på tekstbeskrivelser. Midjourney skiller seg ut ved å tilby en rekke stilistiske muligheter og stor fleksibilitet i bildegenerering, gjør det mulig for brukere å utforske en bred variasjon av visuelle uttrykk. Midjourney er tilgjengelig gjennom en Discord-server, der medlemmer kan sende inn tekstprompts og motta genererte bilder i retur. Betalingsmodell.
  • Stable Diffusion: En åpen kildekode modell som tilbyr høykvalitets bildegenerering, tilgjengelig for utdanningsformål. Her må du sette opp egen server.
  • Leonardo.ai: Er et av mange nettsteder som bruker teknologien til Stable Diffusion for å lage en fullverdig tjeneste for KI-generering av bilder og film. Denne typen nettsteder finnes i svært mange varianter, men Leonardo.ai er et godt eksempel på et nettsted som bruker denne teknologien på en god måte.
  • Adobe Firefly: Adobe har laget sin egen tjeneste som lager KI-bilder. Det spesielle med denne tjenesten er at den er trent på bilder Adobe eier rettighetene til og kan derfor si at bilder laget med Firefly er produsert på et etisk grunnlag. Firefly lager gode stock photo-aktige bilder, siden det er det den er trent på.

Disse verktøyene gir lærere muligheten til å integrere visuelle elementer i undervisningen på en måte som er engasjerende, relevant, og tilpasset de læringsmålene som er satt.

I videoen under viser Magnus Nohr hvordan du kan generere bilder i ChatGPT, Microsoft Copilot/BingChat, Leonardo.ai og Midjourney


I denne podcasten episoden fra oktober 2023 har Eva og Magnus besøk av Michael A. Lundsveen, senior ingeniør på Fakultet for informasjonsteknologi, ingeniørfag og økonomi på HiØ. Han har arbeidet mye med generering av bilder i ulike KI-verktøy, og deler noen erfaringer og tips fra området. Av spennende utvikling vi vil se i nær framtid kommer for eksempel muligheten for at ChatGPT lager ledetekst for generering av bilder for deg gjennom din tekstlige beskrivelse. Er tiden hvor vi kjøper bilder til bruk forbi – og hvor vi i stedet kan få skreddersydde, unike bilder tilpasset akkurat det vi ønsker å formidle? Og hva skjer med opphavsretten? Dette er noen av spørsmålene vi diskuterer i denne episoden. Vi ser også på kjente verktøy som Leonardo, Midjourney, Dall-E (2 og 3), Bing Image Creator og Stable Diffusion.

Episoden er frivillig pensum

Her finner du episoden som en podcast:

Spotify: https://open.spotify.com/episode/7mqSzzajHg9T1rsCaI2g3n?si=279f0282a94844ec
Soundcloud: https://soundcloud.com/pedagogisk-intelligens/episode-26-lage-bilder-med-kunstig-intelligens
Itunes: https://podcasts.apple.com/us/podcast/episode-26-lage-bilder-med-kunstig-intelligens/id1671558782?i=1000630144249