Octopussy revisited: Scenario kann doch (auch) Datenkrake

Künstliche Intelligenz

Bilder

Stable Diffusion

Scenario

Autor:in

Jörg Kantel

Veröffentlichungsdatum

2. März 2024

Das bescheidene Abschneiden der eigentlich zur Zeit in meinen Augen ganz weit oben stehenden gekünstelten Intelligenzia und besonders für Spieleentwickler interessanten Bildgenerator-Anwendung Scenario bei meinem vorgestrigen, kurzen Versuchen hat mir keine Ruhe gegeben. Ich wollte wissen, ob meine Vermutung richtig war und es daran lag, daß der von mir gewählte Stil Stylized Fantasy + Whimsical Storybook ungeeignet für diese Aufgabenstellung war.

Also habe ich den Test mit den gleichen Prompts noch einmal mit drei anderen Stilen (LoRAs) wiederholt. Und die erzielten Ergebnisse waren in allen drei Fällen signifikant besser. Und die Bilder ließen sich auch ohne Probleme auf die vierfache Größe des Ausgangsbilds hochskalieren.

Bei meinen neuen Versuchen kam als erstes der Stil Illustrated Anime + Creepy Nordic Fairytale zum Einsatz, der mit überraschenden Ergebnissen aufwartete. Okay, daß der weibliche Android eher wie eine Siegfrieda denn wie eine Roboterfrau aussieht, ist wohl der beteiligten LoRA Creepy Nordic Fairytale zuzuschreiben (BTW: Sind nordische Märchen und Sagen eigentlich jemals anders als »gruselig« gewesen?), aber daß bei einigen Bildern die Datenkrake bewohnt ist, werte ich als ironischen Kommentar. Fast bin ich daher geneigt, der KI tatsächlich so etwas wie Kreativität zuzuschreiben.

Der Stil Illustrated Anime + Ethereal Realism dagegen neigte zur Blasenbildung und hatte einen Hang zu Barbie-Rosa. Beinahe so, als wollte er das Ergebnis der anstehenden Oskar-Verleihung übernächsten Sonntag vorwegnehmen.

Mit einem Klick auf die Vorschaubilder kommt Ihr je auf eine Seite mit einer Vergrößerung.

Zu guter letzt kam dann noch der Stil Scifi Magic + Belgian School zum Einsatz, den ich schon häufiger genutzt hatte. Und die dabei herausgekommenen Bilder enttäuschte mich auch dieses Mal nicht: So ungefähr sahen sie auch schon vor der Generierung vor meinem inneren Auge aus. Das hat mir jedenfalls meinen Glauben an Scenario wieder zurückgegeben.

Was lehrte mich das? Bei der Generierung von Bildern mit KI-Programmen scheinen die verwendeten Stile (LoRAs) eine größere Rolle zu spielen und die Ergebnisse stärker zu beeinflussen, als ich bisher vermutet hatte. Das werde ich also in Zukunft bei meinen nächsten Versuchen stärker berücksichtigen müssen. Aber ich lerne ja noch. Still digging!

Bild: Octopussy, generiert mit Scenario. Prompt: »A sexy female robot flees from a gigantic data octopus, colored french comic style«. Negative Prompt: »ugly, deformed, noisy, blurry, distorted, out of focus, bad anatomy, extra limbs, poorly drawn face, poorly drawn hands, missing fingers«. Modell: Stable Diffusion XL, Style: Scifi Magic + Belgian School.