Flux und Scenario: Ein echter Game Changer?

Bilder
Künstliche Intelligenz
Interactive Fiction
Spieleprogrammierung
Scenario
Flux.1
Autor:in

Jörg Kantel

Veröffentlichungsdatum

22. Oktober 2024

Flux.1, der angeblich »neue Stern am Himmel der bildgenerierenden gekünstelten Intelligenzia«, war ja schon zwei mal Thema in diesem Blog Kritzelheft. Und auch Scenario, die derzeitige Künstliche Intelligenz meines Vertrauens, hat – erst vorsichtig, dann mit wachsender Begeisterung – Flux.1 in ihr Portfolio integriert.

Damit die Nutzer auch wissen, was sie mit Scenario und Flux.1 alles anstellen können, gibt es auf dem YouTube-Kanal von Scenario seit etwa zwei Wochen eine stetig wachsende Anzahl eher kompakter Video-Tutorials, die noch ständig ergänzt wird. Bis heute sind erschienen:

  1. Train A Character Model (vier Minuten)
  2. Exploring Model Merging in Scenario (drei Minuten)
  3. Generating Multi-Character Scenes (drei Minuten)
  4. Train A Style Model (vier Minuten)
  5. Quick Guide To Asset Reskinning in Scenario (vier Minuten)
  6. Generate Training Datasets (dreieinhalb Minuten)
  7. Modify Facial Expressions in Scenario (drei Minuten)
  8. Merging Style Models on Scenario (»Multi-LoRA«) (dreieinhalb Minuten)

Parallel dazu gibt es im Scenario Knowledge Center noch eine große Sammlung weiterer Tutorials.

Meine eigenen Experimente haben bisher ergeben, daß Flux.1 gegenüber Stable Diffusion (SDXL) tatsächlich ein gewaltiger Schritt nach vorne ist. Zwar ist das Problem konsistenter Charaktere auch hier nicht vollständig gelöst (kann es auch prinzipiell nicht, da die KI kein Gedächtnis besitzt und auch nicht wirkich versteht, was sie da zeichnet), aber da zum einen die Interpretation der Prompts von Flux.1 oft näher an dem dran ist, was der Nutzer eigentlich gemeint hat, und zum zweiten die Nachbearbeitungs-Werkzeuge von Scenario (mask im Canvas) es unterstützen, daß nur Teile der Bilder neu gezeichnet werden, ist eine weitestgehende Konsistenz schon erreichbar.

Außerdem interpretiert Flux.1 die Prompts mit zwei miteinander interagierenden Charakteren bedeutend besser. Das Bild im Banner oben zum Beispiel, in dem Alice sich mit Humpty Dumpty unterhält, wäre mit SDXL nur per Zufall mal gezeichnet worden, während meine fünfzehn Versuche mit Flux.1 alle eine Alice zeigten, die mit Humpty Dumpty spicht.

Allein deshalb halte ich Flux.1 tatsächlich für so etwas wie einen Game Changer. Was das Teil sonst noch so alles kann, werde ich noch mit weiteren Experimenten erkunden. Still digging!


Bild: Humtpy Dumpty und Alice, erstellt mit Scenario. Prompt: »Egg shaped Humpty Dumpty, wearing blue jacket, rust-red vest and red bow tie, sits on the top of a huge wall in a little village with strange looking buildings. Little Alice stands in front of this wall and looks at Humpty Dumpty with her big blue eyes and serious face, she has long blonde hair with pigtails, and wears a blue dress and a white apron«. Modell: Flux LoRA, Style: Expressive Comic Characters.