Konsistente Charaktere: Mein Abenteuer mit bildgenerierender gekünstelter Intelligenzia geht weiter

Bilder

Künstliche Intelligenz

Interactive Fiction

Spieleprogrammierung

Scenario

Stable Diffusion

Autor:in

Jörg Kantel

Veröffentlichungsdatum

30. August 2024

In den letzten Tagen hatte ich viel zu viel Zeit verschwendet, um herauszubekommen, wie ich die gekünstelte Intelligenzia meines Vertrauens dazu bewegen kann, möglichst konsistente Spielcharaktere zu erzeugen, die als Illustration in interaktiven Geschichten oder anderen narrativen Spielen verwendet werden können. Aber hey, ich bin Rentner und wer, wenn nicht ich, kann die Zeit dafür aufbringen? Um Euch erste Ergebnisse zu präsentieren, die meiner Meinung nach schon recht ansehnlich sind, hier das, was bei Versuchen herausgekommen ist, die Künstliche Intelligenz zu überreden, eine möglichst konsistente weibliche Hauptfigur (bisheriger Arbeitsname »Sylvia Berlin«) für meine geplante »Räuberpistole« (Berlin Attack) zu generieren.

Es ist eine erster Versuch, der trotz einiger seltsamer Auslegungen des Prompts sehr vielversprechend wirkt. Für diese Auswahl habe ich aber mindestens die vierfache Menge an Bildern generieren müssen:

Mit einem Klick auf die Vorschaubilder kommt Ihr je auf eine Seite mit einer Vergrößerung.

Auch wenn der Prompt (»A young woman with red lips, blue eyes, slim, brown, curly hair and glasses in a blue shirt and brown vest, short dark grey skirt and high heels. full body, no background. colored french comic style, (((no background)))«) von der KI, die hinter Scenario werkelt (Stable Diffusion) doch recht eigenwillig ausgelegt wurde, sind die Bilder »in erster Näherung« doch recht brauchbar. (Zur Ehrenrettung der KI muß ich zugeben, daß sie auch etliche Bilder mit grauen, kurzen Röcken erzeugt hatte, lediglich zu braunen Westen war sie nicht zu überreden – auch wenn ich nicht glaube, daß dies einen politischen Hintergrund hat, macht dies die KI doch sympathisch. 🥸) Für eine interaktive Geschichte mit Twine (oder – eingeschränkt – auch in Tuesday JS) kann man sie schon verwenden, die kleinen Unterschiede fallen da nicht so ins Gewicht. Für die Nutzung in Ren’Py oder anderen Visaul Novel Engines scheint aber der einfache Text-to-Image-Prompt nicht auszureichen, hier muß ich mich wohl noch stärker in die Image-to-Image-Bildgenerierung und vor allen Dingen das Inpainting einarbeiten.

Auf jeden Fall scheint es sinnvoll zu sein, die Charkatere (jeweils getrennt) von den Hintergrundbildern in separaten Schritten von der KI generieren zu lassen (dabei kann es auch zu interessanten Ergebnissen kommen, wenn man für die Charaktere und den Hintergrund unterschiedliche KI-Programme oder LoRAs verwendet). Falls die verwendete Game-Engine (zum Beispiel Ren’Py oder Tuesday JS) es zulassen, kann man die (freigestellten) Charaktere und die Hintergrundbilder dort zu einer Scene zusammenfügen, ansonsten (Twine) muß man eine Bildbearbeitung seines Vertrauens bemühen.

Ihr seht also, mir stehen noch viele Möglichkeiten der sinnvollen kreativen Zeitvergeudung (™ Barbara Kantel) offen. Ich habe also zu tun. Still digging!

Bild: Sylvia Berlin (Entwurf), erstellt mit Scenario. Prompt: »A young woman with red lips, blue eyes, slim, brown, curly hair and glasses in a blue shirt and brown vest, short dark grey skirt and high heels. full body, no background. colored french comic style, (((no background)))« Negative Prompt: »ugly, deformed, noisy, blurry, distorted, out of focus, bad anatomy, extra limbs, poorly drawn face, poorly drawn hands, missing fingers, gloves, backpack, shoulder bag, bag, (((shoulder bag)))«. Modell: Stable Diffusion XL, Style: Creepy Nordic + Belgian + Semi-Realistic.