Test: Clipdrop oder DreamStudio – Ich bastele mir eine Sekretärin

Bilder
Stable Diffusion
Künstliche Intelligenz
Interactive Fiction
Autor:in

Jörg Kantel

Veröffentlichungsdatum

23. November 2023

Da ich ja das Erstellen von Bildern mit Hilfe gekünstelter Intelligenzia für eine großartige Möglichkeit halte, daß Menschen, denen – wie bei mir – ein Bleistift nicht in die Wiege gelegt wurde, sondern die eher von der Thalia geküßt wurden, ihre Geschichten mit Bildern gestalten können, habe ich heute weitere Tests mit den Stable-Diffusion-Anwendungen DreamStudio und Clipdrop gefahren.

Mein Ziel ist es, weiter herauszubekommen, wie diese Anwendungen sich schlagen, wenn es darum geht, interaktive Geschichten (speziell mit Twine, Ren’Py und/oder TuesdayJS) zu illustrieren. Ein paar (DreamStudio) erste (AI Comic Factory) Versuche (Clipdrop) hatte ich ja schon durchgeführt, wobei ich die erzeugten Bilder zu Smashing Pumpkins schon für ziemlich gelungen halte.

Also habe ich das Bild einer Sekretärin – genauer: den Prompt zu dem Bild –, das ich heute für die Meldung über ein Office-Update generiert hatte, verwendet, um DreamStudio und Clipdrop anzuweisen, eine Reihe von Bildern zu erzeugen, damit ich (und Ihr) Vergleiche anstellen kann (könnt).

Hier erst einmal ein paar der Bilder, die mit Clipdrops AI erstellt wurden (zur Erinnerung: Der Prompt war »A young, sexy secretary with red hair and green eyes, red painted lips, wearing a white blouse with a wide neckline and a red miniskirt sits at a desk in front of a computer in an old-fashioned looking office. There are shelves with files on the walls and the sun shines in through a large open window. It’s spring outside, you can see green trees and a few singing birds. colored french comic style.« und das Modell Stable Diffusion XL 1.0 mit dem Stil Comic Book:

  

 

Mit einem Klick auf die Vorschaubilder kommt Ihr je auf eine Seite mit einer Vergrößerung.

Und nun die Bilder, die mit DreamStudio erstellt wurden. Hier mußte ich das »sexy« im Prompt durch »female« ersetzen, weil der gestrenge Zensor sexy Sekretärinnen für unangebracht hielt, und ab der zweiten Versuchsreihe habe ich auch noch eine (offene) grüne Krawatte in den Prompt gemogelt. Der endgültige Prompt lautete also hier: »A young female secretary with red hair and green eyes, red painted lips, wearing a white blouse with a wide neckline, an open green tie, and a red miniskirt sits at a desk in front of a computer in an old-fashioned looking office. There are shelves with files on the walls and the sun shines in through a large open window. It’s spring outside, you can see green trees and a few singing birds. colored french comic style.« Das Modell heißt hier stable-diffusion-xl-1024-v1-0 und der Stil ist wieder Comic Book:

  

 

Mit einem Klick auf die Vorschaubilder kommt Ihr je auf eine Seite mit einer Vergrößerung.

Wenn man die beiden Bilderreihen miteinander vergleicht, sehen die erzeugten Bilder schon sehr ähnlich aus (das sollten sie auch, denn bei beiden werkelt Stable Diffusion XL mit dem Stil Comic Book im Hintergrund), aber die mit DreamStudio erzeugten Sekretärinnen sehen mir einen Hauch weniger nach Disney und/oder Manga aus, und die Farben scheinen ein wenig kräftiger.

Von der Geschwindigkeit bei der Bilderzeugung hat erst einmal Clipdrop die Nase vorn, will oder muß man die Zeichnung aber (zum Beispiel für Ren’Py aufblasen), ist dies wieder leichter in DreamStudio zu erledigen, da hier kein separates Modul zum Upscaling aufgerufen werden muß.

Von der Preisgestaltung ist – wenn man nur wenige Bilder erzeugen will – DreamStudio im Vorteil, hier kauft man eine feste Anzahl von »Credits« und muß kein Abo abschließen. Braucht man aber sehr viele Bilder, kommt wieder Clipdrop ins Spiel, denn die Anzahl der hier täglich erneuerten »Credits« ist gigantisch. Mein eigener Bedarf liegt irgendwo dazwischen: Bilder für Interactive Fiction brauchen schon eine ganze Reihe von Versuchen, aber bisher bin ich auch bei DreamStudio noch nicht an die Grenzen gekommen.

Für obige beiden Versuchsreihen habe ich insgesamt etwa einhundert Bilder erzeugt, von denen ich 28 aufgehoben und zum Vergleich in einem Flickr-Album abgelegt habe. Der Rest hat mir entweder nicht gefallen, oder die Sekretärinnen hatten drei Arme, seltsame Hände oder sonst war irgend etwas anatomisch nicht korrekt. Also gilt für meine Kalkulation: Etwa ein Viertel der momentan (das kann sich schnell ändern) von einer Künstlichen Intelligenz erzeugten Bilder ist brauchbar, der Rest ist Schrott.

Aber bei den brauchbaren Bildern sind schon auch etliche Perlen darunter. Und es macht Spaß, mit der gekünstelten Intelligenzia zu spielen. Ich habe da schon etliche Ideen für weitere interaktive Geschichten im Kopf, die ich in der nächsten Zeit unbedingt realisieren will. Still digging!


Bild: Sekretärin 17, erstellt mit DreamStudio. Prompt: »A young female secretary with red hair and green eyes, red painted lips, wearing a white blouse with a wide neckline, an open green tie, and a red miniskirt sits at a desk in front of a computer in an old-fashioned looking office. There are shelves with files on the walls and the sun shines in through a large open window. It’s spring outside, you can see green trees and a few singing birds. colored french comic style.«, Model: stable-diffusion-xl-1024-v1-0, Style: Comic Book.