Milch macht müde Männer munter? Flux.1 bei Scenario

Bilder
Künstliche Intelligenz
Interactive Fiction
Spieleprogrammierung
Scenario
Flux.1
Autor:in

Jörg Kantel

Veröffentlichungsdatum

25. September 2024

Flux.1 ist ja so etwas wie ein neuer Stern am Himmel der bildgenerierenden gekünstelten Intelligenzia. Die Software soll nicht nur mit den Boliden MidJourney, Googles Imagegen oder DALL-E 3 mithalten können, sondern sie ist in der Grundversion Flux.1[schnell] auch noch Open Source (Apache 2.0 Lizenz). (Die Version Flux.1[pro] ist kommerziell und die Lizenz der Version Flux.1[dev] erlaubt nur eine nichtkommerzielle Nutzung.)

Bisher war es etwas umständlich, Flux.1 online zu nutzen und eine lokale Installation läßt mein schwachbrüstiger Mac-Mini nicht zu, trotzdem hatte ich schon Versuche mit dem Flux AI Image Generator und Tensor.art unternommen. Dem Rumoren im Netz war aber zu entnehmen, daß Scenario, die derzeitige bildgenerierende Künstliche Intelligenz meines Vertrauens, neben Stable Diffusion auch Flux.1 anbieten wolle, daher hatte ich mich mit Tests bisher zurückgehalten.

Diese Woche war es aber so weit, auf der Webseite von Scenario wurden still und ohne Ankündigung alle drei Modelle von Flux.1 angeboten: [pro], [dev] und [schnell]. Eines der herausragenden Merkmale von Flux.1 soll ja der fast fehlerfreie Umgang mit Text sein, also habe ich die KI gebeten, einen Milchwagen neben einem Schild mit der Aufschrift »Milch macht müde Männer munter« zu generieren. Das funktionierte leider nur ansatzweise:

  

»A milk delivery truck in front of a house in a small suburban area early in the morning. There is a sign “Milch macht müde Männer munter” beside the truck. The sun has just risen. Colored french comic style.« – Ein Klick auf die Vorschaubilder führt zu einer Seite mit einer Vergrößerung.

Von meinen Experimenten mit Tensor.art wußte ich allerdings schon, daß Flux.1 sich mit deutschen Texten schwertut. Also habe ich in weiteren Versuchen den deutschen Satz »Milch macht müde Männer munter« durch das englische »Milk makes tired men cheerful« (das hatte mir Google Translate als Übersetzung vorgeschlagen) ersetzt. Die neuen Ergebnisse waren immer noch nicht perfekt, aber schon um Klassen besser:

  

Okay, ein paar Tippfehler sind immer noch in den Bildern und an manchen Stellen fängt die KI auch an zu halluzinieren. Aber gerade das ist es ja, was die Beschäftigung mit bildgenerierenden Programmen für mich so spannend macht: Gute, kreative Ergebnisse entstehen nur aus der Interaktion eines Menschen mit dem Programm.

Es gibt übrigens auch seltsame Artefakte, wenn man die gekünstelte Intelligenzia um eine Vergrößerung bittet: Die Enhance-Funktion von Scenario schraubt trotz der Einstellung Precise manches Mal noch ein wenig an den Texten herum, das könnt Ihr zum Beispiel hier (Original) und hier (vierfache Vergrößerung) erkennen.

Ich habe auch schon weitere Experimente mit Flux.1 durchgeführt. Das Teil ist auf jeden Fall vielversprechend und spannend, aber ihm fehlen momentan für meine Anwendungen (Bilder für interaktive Geschichten und Visual Novels) auf Scenario noch die Stile (LoRAs), mit denen man das Aussehen der Bilder stärker beeinflussen und mehr Konsistenz erzeugen kann. Aber ich weiß, daß sie daran bei Scenario mit Hochdruck arbeiten. Zumindest habe ich herausgefunden, daß Flux.1 nicht zensiert – weder auf Scenario noch auf Tensor.art (für »explizite« Bilder braucht man natürlich wieder entsprechende LoRAs). Damit ist sie zumindest der Konkurrenz MidJourney überlegen. Ich bin gespannt, was die Zukunft uns noch bringen wird. Still digging!


Bild: Milch-Lieferwagen, erstellt mit Scenario. Prompt: »A milk delivery truck in front of a house in a small suburban area early in the morning. There is a sign “Milk makes tired men cheerful” beside the truck. The sun has just risen. Colored french comic style«. Modell: Flux.1[pro], Style: None.