Noch ein Blick in meine KI-Werkstatt: (Let Me Be Your) Teddy Bear
Da ich letztens so viel Spaß bei meinen Vergleichen mit der Bildgenerierung von Elephanten in grünen Morgenmänteln mit verschiedenen Modellen der gekünstelten Intelligenzia hatte, wollte ich diese Versuche fortsetzen. In Anlehnung an einen alten Elvis-Song von 1957 und auf Wunsch der liebsten aller Freundinnen sollte dieses Mal das Objekt der Begierde ein Teddybär sein. Und da ich diese Versuche in der letzten Oktoberwoche begonnen hatte, sollten sie auch etwas mit Halloween zu tun haben.
Also habe ich mich erst einmal hingesetzt und einen entsprechenden Prompt gebastelt:
Illustration of a teddy bear wearing a bright yellow raincoat and a red sou’wester hat walks through a lit-up suburb at night. The streets are lined with Halloween pumpkins. The full moon shines through the clouds in the sky. Colored DC comic style.
Und diesen habe ich dann erst einmal auf das Modell Seedream 4.0 von OpenArt.ai losgelassen. Hier – wie auch bei den anderen Bildern – gilt: Mit einem Klick auf die Vorschaubilder kommt Ihr je auf eine Seite mit einer Vergrößerung.
Seedream 4.0 (OpenArt.ai)
Von dem Ergebnis war ich ein wenig enttäuscht. Zwar ist die Treue, mit der dem Prompt gefolgt wird, beeindruckend, aber die Bilder wirkten alle ein wenig eintönig und in der Summe dadurch langweilig. Ich habe viel mehr als die hier gezeigten generieren lassen, aber sie sehen sich alle ziemlich ähnlich, es gibt kaum Variationen. Lediglich bei der Frage, ob der Teddy barfuß läuft oder rote Schuhe oder schwarze oder gelbe Stiefel trägt, war sich die gekünstelte Intelligenzia nicht einig. Ansonsten hatte das Modell bei diesem Prompt keine Phantasie, es halluzinierte einfach nicht!
Stable Diffusion XL (Scenario)
Nach diesen für mich erst einmal enttäuschenden ersten Durchgang hatte ich aber auch gleich die Idee einer Alternative: Stable Diffusion XL ist zwar schon etwas betagt, aber da es meinen Erfahrungen nach mit langen Prompts nicht gut zurecht kommt, neigt es zu Halluzinationen. Also habe ich Scenario angeworfen, den gleichen Prompt verwendet und als Modell Stable Diffusion XL und als LoRA Stylized Fantasy + Whimsical Storybook ausgewählt. Das Ergebnis war wie erhofft: Stable Diffusion war mit den Anforderungen des Prompts völlig überfordert und fing an zu spinnen. Heraus kamen teils wunderschöne Bilder, die die Phantasie des Betrachters anregten. Was macht es dann schon, daß Stable Diffusion meist das »rot« des Südwesters ignoriert oder dem einsamen Teddy einen Begleiter an die Seite gesellt? Fast jedes der generierten Bilder war anders, doch fast jedes eignete sich zum Beispiel für eine Halloween-Postkarte oder -Poster. Ich hatte so viel Spaß damit, daß ich sehr viele Teddy-Bilder generieren ließ und die meisten davon dann auch den Weg in dieses Blog Kritzelheft schafften.
Zugabe: Googles Nano Banana (OpenArt.ai)
Zum Schluß wollte ich dann noch wissen, wie sich Googles Nano Banana, die aktuelle Sau, die momentan durch das Dorf der KI-Bildbearbeitung getrieben wird, in diesem Vergleich schlägt. Da Halloween mittlerweile vorbei war und auch, weil ich Abwechslung wünschte, habe ich den Prompt leicht abgeändert:
Illustration of a teddy bear wearing a bright yellow raincoat and a red sou’wester hat walks through a lit-up suburb at night. It’s snowing. The full moon shines through the clouds in the sky. Colored DC comic style.
Ausgeführt habe ich das wieder mit OpenArt.ai. Das Ergebnis unterscheidet sich nur in Nuancen von den Bildern, die mit Seedream 4.0 (siehe oben) generiert wurden. Aber diese Nuancen machen unter Umständen einen wichtigen Unterschied aus. So ist zum einen der Gesichtsausdruck des Bären nicht so monoton gleichartig wie bei Seedream. Der Bananen-Bär kann lächeln oder grimmig gucken oder auch ernst sein.
Zwar wird der Prompt auch hier korrekt und genau ausgeführt, aber bei dem, was nicht im Prompt steht, erlaubt sich Nano Banana etwas mehr Phantasie. Sei es eine Telephonzelle, ein Regenschirm oder eine Straßenbahn auf dem Trottoir – die Bilder wirken auf jeden Fall nicht so gleichförmig monoton.
Bild: Happy Teddy-Halloween, erstellt mit Scenario. Prompt: »Illustration of a teddy bear wearing a bright yellow raincoat and a red sou’wester hat walks through a lit-up suburb at night. The streets are lined with Halloween pumpkins. The full moon shines through the clouds in the sky. Colored DC comic style«. Modell: Stable Diffusion XL, Style: Stylized Fantasy + Whimsical Storybook.



























