Octopussy und die Künstliche Intelligenz: Immer wieder andere Bilder

Bilder

Künstliche Intelligenz

Stable Diffusion

Leonardo AI

SeaArt

Tensor Art

Playground AI

DreamStudio

Scenario

Autor:in

Jörg Kantel

Veröffentlichungsdatum

29. Februar 2024

Ich wollte es wissen: Welchen Einfluß haben die unterschiedlichen Modelle und welchen Einfluß haben die diversen »Stile« (LoRAs) auf die mit Hilfe einer gekünstelten Intelligenzia erzeugten Bilder? Dazu habe ich diverse Tests gefahren und mich als bekennender Open-Source-Evangelist auf einige der diversen Stable Diffusion-Ableger beschränkt. Daneben habe ich mich – da es sonst die Kapazität meines betagten MacBook Pro (von 2012) überfordert – auf Online-Tools beschränkt, die außerdem wenigstens einen eingeschränkten, kostenlosen Zugang ermöglichen.

Da ich wegen der Update-Häufigkeit von Googles Chrome sowieso ständig neue Bilder einer Datenkrake benötige, habe ich für meine Tests diesen Prompt verwendet:

A sexy female robot flees from a gigantic data octopus, colored french comic style.

Einem Dienst (DreamStudio) war das »sexy« schon zu schlüpfrig und er verweigerte die Generierung. Um den gestrengen Zensor zu beruhigen, habe ich in diesem Fall das »sexy« durch »beautiful« ersetzt. Wenn man die Ergebnisse mit den anderen vergleicht, hatte dies keine großen Auswirkungen.

Als negativen Prompt habe ich die Standardeinstellung der jeweiligen Dienste gewählt, wo kein Standard-Prompt zur Verfügung stand, habe ich

ugly, deformed, noisy, blurry, distorted, out of focus, bad anatomy, extra limbs, poorly drawn face, poorly drawn hands, missing fingers

eingesetzt. Bei den Stilen habe ich von den angebotenen jeweils einen ausgewählt, der der Idee eines Comics oder einer Illustration ziemlich nahe kam. Und wie immer habe ich etliche Bilder als unbrauchbar aussortieren müssen. Von denen, die mir brauchbar erschienen, habe ich je Dienst drei ausgewählt, die die Unterschiende zwischen ihnen möglichst deutlich hervorheben.

Ich beginne mit DreamStudio. Diese App des Stable-Diffusion-Schöpfers Stability.ai ist oft – auch wenn sie zensiert – mein Favorit, weil der Stil Comic Book (den ich auch bei diesen Bildern verwendet habe), meinen Anforderungen ziemlich nahe kommt.

Ein wenig enttäuscht war ich von den Bildern, die mir mein derzeitiger Favorit Scenario generierte. Sie sind so pfitzelig und detailverliebt, daß sich nicht nur in den Thumbnails oben kaum zur Geltung kommen (wie immer bringt Euch ein Klick darauf auf eine Seite mit Vergrößerungen), sondern sie waren dadurch auch so »fett«, daß der Dienst mit der Begründung »Bild zu groß« ein upscaling verweigerte. Vielleicht war der von mir verwendete Stil Stylized Fantasy + Whimsical Storybook für diese Aufgabenstellung doch nicht der geeignete.

Keine Überraschung dagegen boten die Bilder, die Playground AI für mich generierte, auch wenn die Ergebnisse nicht mit Stable Diffusion, sondern mit dem hauseigenen Playground v2.5 ohne eine zusätzliche LoRA erzeugt wurden.

Ähnlich verhielt sich der Klassier Leonardo AI. Die Bilder oben habe ich mit dem hauseigenen Modell Leonardo Diffusion XL erzeugt, das ebenfalls keine LoRA anbot.

Mit wieder teilweise ganz anderen Bildern überraschte mich SeaArt AI, obwohl hier als Engine wieder Stable Diffusion XL zum Einsatz kam. Die verwendete LoRA Realistic Fantasy Mix SDXL sollte ich mir auf jeden Fall auch für spätere Nutzungen merken.

Mit wieder einer ganz anderen, eigenwilligen Interpretation des Prompts wartete mein letzter Testkandidat Tensor.art auf. Auch hier war die Engine Stable Diffusion XL und der Stil (dem man durchaus einen gewissen Hang zur Symmetrie bescheinigen kann) hieß Realistic Comic Book - 1.0.

Ich habe mit diesen Versuchen jedenfalls wieder viel über die gekünstelte Intelligenzia im Allgemeinen und über Stable Diffusion im Besonderen gelernt. Und abseits dessen, daß ich dabei auch viel Spaß hatte, habe ich durch diese Testreihen wieder viele Datenkraken-Bilder generiert, mit denen ich auf Monate die nächsten Chrome-Updates illustrieren kann. Google kann kommen, ich bin gewappnet!

Bild: Octopussy, generiert mit SeaArt. Prompt: »A sexy female robot flees from a gigantic data octopus, colored french comic style«. Negative Prompt: Seart Standard. Modell: Stable Diffusion XL, Style: Realistic Fantasy Mix SDXL.