Bildergenerierung mit Künstlicher Intelligenz cont.: Stable Diffusion und DreamStudio
Es gibt bei meinen Erkundungen in die Welt der Bildergenerierung mit gekünstelter Intelligenzia noch einige Entdeckungen zu machen. So stolperte ich gestern bei meiner Vorstellung von Leonardo AI über Stable Diffusion, der Deep Learning Open Source Engine (MIT Lizenz), die bei Leonardo AI im Hintergrund werkelt. Stable Diffusion ist in Python geschrieben und der Quellcode ist auf GitHub verfügbar. Wer will, kann sich das Teil also auf seinem eigenen Rechner installieren. Das ist allerdings mit einigem Aufwand verbunden und so werden sicher die meisten – so wie ich für meine Tests auch – einen der öffentlich zugänglichen Webservices nutzen. Soweit ich das bisher beurteilen kann, stehen folgende Dienste im Netz (die alle von Stability AI, den Machern hinter Stable Diffusion betrieben werden):
- Stable Diffusion 2.1 Demo @ Huggin Face: Der Dienst ist ohne Einschränkung kostenlos zu nutzen, jedoch sind die Ergebnisse – ähnlich wie bei dem hier vorgestellten, ebenfalls freiem DALL-E mini oder dem (nur in der Grundversion kostenlosen Nachfolger Craiyon) doch oft recht gruselig anzuschauen.
- Stable Diffusion XL (sdxl) Playground @ Clipdrop: Dieser nur in der Grundversion kostenlose Dienst ist über dieses Wochenende leider offline. Daher kann ich noch keine Aussage darüber machen.
- DreamStudio beta: Mit diesem Dienst habe ich das obige Bannerbild generiert und noch einige weitere Tests gefahren (siehe unten). Die Ergebnisse – speziell mit dem Style »Anime« – sind für meine Zwecke (Bilder generieren für interaktive Geschichten mit Twine und/oder Ren’Py) ziemlich genial, jedoch sind die 25 »Credits« die man zum Start erhält, ziemlich schnell verbraucht. Danach muß man blechen (US-$ 10 (plus Nebenkosten/Märchensteuer = US-$ 11,90) je 1.000 »Credits«).
Da DreamStudio mir recht brauchbar erschien, habe ich Stability AI erst einmal die etwa zehn Euro für weitere 1.000 »Credits« in den Rachen gestopft und ein paar weitere Testbilder (alle ebenfalls mit dem Stil »Anime«) erstellt:
Mit einem Klick auf die Vorschaubilder kommt Ihr je auf eine Seite mit einer Vergrößerung.
Für die Generierung der Bilder habe ich folgenden Prompt (wieder-) verwendet: »Little girl Alice meets [eggheaded] Humpty Dumpty in a secret garden. Eggheaded Humpty Dumpty is sitting on a wall.« Das »eggheaded« hatte ich beim ersten Bild (ganz links) noch weggelassen und beim Bannerbild hatte ich zusätzlich noch »humansized« (vergleiche Bildbeschreibung unten) hinzugefügt. Während die erste Änderung kaum Einfluß auf die generierten Bilder hatte, machte das »humansized« schon einen gewaltigen Unterschied.
Mir haben die Ergebnisse jedenfalls gefallen und ich werde daher noch weitere Tests durchführen und berichten. Denn – hey – ich habe noch eintausend »Credits« zu verbraten!
War sonst noch was? Ach ja, da ich damit sicher noch weiter spielen werde, habe gestern ich neben der AI Comic Factory auch Playground AI, Leonardo AI, Stable Diffusion und auch Canva je eine Seite in meinem Wiki spendiert. So viel Zeit muß sein!
Bannerbild: Alice und Humpty Dumpty, erstellt mit DreamStudio. Prompt: »Little girl Alice meets humansized eggheaded Humpty Dumpty in a secret garden. Eggheaded Humpty Dumpty is sitting on a wall«. Style: Anime.