Jo Hippo kauft ein: KI-Modelle im Vergleich

Künstliche Intelligenz
Bilder
Generative Art
OpenArt.ai
Flux.1
Nano Banana
Autor:in

Jörg Kantel

Veröffentlichungsdatum

21. Januar 2026

Irgendwie überkam mich, nachdem ich für diesen Beitrag das Maskottchen »Jo Hippo« habe generieren lassen, das Bedürfnis, meine Testreihe mit KI-Bildgeneratoren (Teil 1 und Teil 2) noch einmal aufzunehmen. Denn da einige Dienstleister, wie zum Beispiel OpenArt.ai, viele Modelle bereitstellen, wollte ich testen, was diese Modelle leisten oder nicht leisten und worin sie sich unterscheiden.

Beispielhaft habe ich OpenArt.ai ausgewählt, da ich zum einen dort schon einen Account habe und da sie tatsächlich ein schier undurchschaubare Menge an Modellen anbieten. Für diese Testreihe habe ich Modelle ausgesucht, von denen ich annehme, daß sie generisch sind, also noch nicht mit LoRAs verschlimmert verbessert wurden.

Als erstes habe ich wieder einmal einen Prompt zusammengeschraubt, der, um bessere Vergleichsmöglichkeiten zu haben, auf alle generierten Bilder angewandt wurde: (Wie immer führt ein Klick auf die daumennagelgroßen Bilder auf eine Flickr-Seite mit größeren Bildern und mehr Informationen.)

An anthropogenic hippopotamus wearing glasses, a blue jacket, a white shirt, and a red tie sits at a desk in front of a computer with two monitors, typing with its right hand. In its left hand, it holds a steaming mug of hot coffee. On the desk lies a stack of papers and files labeled with terms such as “Ideen,” “Projekte,” “Notizen,” “Politik,” “Python,” “Programmierung,” “Games,” and “Verschiedenes.” Next to the keyboard is a mug containing writing utensils and an open notebook. Behind the desk, along the walls, are tall shelves filled with files, books, and knick-knacks. Everything appears chaotic. Sunlight streams into the room through a window on the side. Colored classic comic style. Language: German. No speech bubbles. No text boxes.

Mir ist klar, daß ich mit diesem Prompt einige ältere Modelle überfordere, aber er zeigt eben auch, was heute möglich ist.

OpenArt SDXL

  

Das Modell in diese Testreihe mit einzubeziehen ist eigentlich unfair, aber vor wenigen Monaten noch war Stable Diffusion XL (SDXL) state of the art. Heute, ein knappes Jahr später, ist es völlig veraltet und kann den Prompt nicht wirklich verarbeiten. Es fehlen die Regale an den Wänden, oft die Becher und Texte können nicht dargestellt werden. Auch den Comic-Stil hätte SDXL vermutlich nur zeigen können, wenn er am Anfang des Prompts gestanden hätte.

HiDream-I1

  

  

HiDream-I1 ist ein kostenloser Bildgenerator, mit dem Ihr auf dieser Seite Bilder in unbegrenzter Anzahl für umme generieren könnt (es gibt jedoch auch kostenpflichtige Accounts, die auf Wassermarken und Anzeigen verzichten). Auch wenn der Generator gerne die Regale wegläßt und dafür auf Post-Its an den Wänden setzt, und die Textdarstellung verbesserungswürdig ist, die Ergebnisse sind eigentlich nicht schlecht. Allerdings ist der Stil nicht immer einheitlich, er schwankt in diesem Beispiel zwischen flachem Comic und Photorealismus.

Aber wer nach einem akzeptablen und in der Grundversion kostenlosen Bildgenerator sucht, der sollte einen Blick auf HiDream-I1 werfen.

Hunyuan Image 3

  

  

Hunyuan Image 3 ist ein Open-Source-Bildgenerator der chinesischen Firma Tencent, den Ihr unter anderem kostenlos auf EaseMate AI ausprobieren könnt. Was die Bildqualität und die Prompttreue angeht, schließt das Modell tatsächlich zu Nano Banana und Flux.2 auf. Auch die Stilsicherheit und Charakterkonsistenz ist hervorragend. Lediglich bei der (deutschen?!) Textdarstellung besteht noch Aufholbedarf, was aber bei einem chinesischen Produkt verständlich ist.

Wer jedoch Bilder ohne Texte generieren will, für den ist Hunyuan Image 3 sicher eine gute und freie Alternative. Und auch wenn sich manchmal eine dritte Hand in das Bild schleicht, mir gefallen die generierten Bilder ausnehmend gut.

OpenArt Photorealistic

  

Das hauseigene Modell OpenArt Photorealistic ist sicher kein geeignetes Modell für mein Testbeispiel. Ich habe die Bilder auch nur generiert, um der Vollständigkeit zu genügen. Die Prompttreue ist zweifelsfrei vorhanden, aber mit dem Comic-Stil hat das auf Photorealismus getrimmte Modell verständlicherweise seine Probleme.

Qwen Image

  

Qwen Image ist ein weiterer chinesischer Bildgenerator, der wohl in der Hauptsache dafür entwickelt wurde, Avatare für das hauseigene Chatprodukt zu entwickeln. Daher passt das Modell für diesen Anwendungsfall recht gut, auch die Charakterkonsistenz ist annehmbar. Daß das chinesische Modell Schwierigkeiten mit deutschen Texten hat, sollte niemanden wundern. Aber sonst ist die Prompttreue hervorragend.

Reve AI

  

  

Reve AI ist ein von einem in Palo Alto beheimateten Startup entwickelter Bildgenerator, den Ihr kostenlos zum Beispiel auf dieser Seite nutzen könnt. Laut Eigenwerbung ist er als Midjourney-Killer angetreten, das halte ich jedoch für reichlich übertrieben. Trotzdem, die generierten Bilder sind nicht schlecht, auch die Prompttreue ist erkennbar. Selbst die Behandlung der (deutschen!) Texte ist zwar nicht immer völlig korrekt, aber die Abweichungen sind hinnehmbar.

Kling O1 Image

  

Kling O1 Image ist ein KI-Bildgenerator der durch seinen kostenlos nutzbaren Videogenerator bekannten, chinesischen Firma Kling.AI. Das Modell kann unter anderem auch auf den Seiten von EaseMate AI ebenfalls kostenlos genutzt werden. Die Ergebnisse ähneln sehr stark den Bildern von Reve AI, allerdings ist – wie bei allen chinesischen Produkten – die Behandlung deutscher Texte nicht gerade überzeugend.

GPT Image 1.5

  

  

Eine Überraschung war der ChatGPT-eigene Bildgenerator GPT Image 1.5, der OpenAIs Antwort auf Nano Banana sein soll. Und das ist nicht zu viel versprochen: Die Prompttreue ist hervorragend, Texte (auch deutsche) werden fehlerfrei dargestellt und das Teil hat auch so etwas wie seinen eigenen Stil.

Seedream 4.5

  

  

Ein weiterer Nano-Banana-Konkurrent ist Seedream 4.5 der chinesischen Firma ByteDance. Seedream ist Open Source (Medium.com-Link hinter einer Bezahlschranke) und kann unter anderem hier kostenlos genutzt werden. Wenn man einmal von den chinatypischen (im Falle von Seedream nur leichten und nur gelegentlichen) Fehlern bei der Behandlung von europäischen Texten absieht, ist das Modell prompttreu, sehr konsistent und hat ebenfalls einen eigenen Stil, den es konsequent durchhält.

Flux.2 Pro und Flux 2 Flex

  

  

  

Flux.2 Pro 👆

  

  

  

  

Flux.2 Flex 👆

Die neuesten Modelle Flux.2 Pro und Flux.2 Flex der Freiburger Firma Black Forest Labs unterscheiden sich nur in Details voneinander. Flux.2 Flex soll noch eine leicht bessere Textbehandlung besitzen, hat aber dafür einen etwas geringeren Detailgrad. Entscheidet selber, ich habe von beiden Modellen eine Reihe von Bildern generieren lassen. Die Detailfülle ist unübertroffen. Sie sind beide das non plus ultra der KI-Bildgeneratoren und dem häufig als Referenz herangezogenen Nano Banana fast ebenbürtig.

Nano Banana Pro

  

  

Googles Nano Banana Pro ist momentan noch die unangefochtene Referenz der KI-Bildgeneratoren. Da die Generierung immer auf Googles Servern läuft, unterscheiden sich die Bilder nicht, egal ob sie von Scenario, OpenArt.ai oder einen anderen KI-Dienstleister angefordert werden. Aber der Abstand zur nachrückenden Konkurrenz wird deutlich enger. Damit Ihr vergleichen könnt (und weil es Spaß macht), habe ich hier noch ein paar Bilder reingestellt, die via OpenArt.ai von Nano Banana Pro erzeugt wurden.

Fazit

Im Bereich der KI-Bildgeneratoren hat sich gerade in den letzten Monaten viel getan. Wenn man die Ergebnisse mit denen vergleicht, die noch vor einem Jahr das Publikum in Staunen versetzten, so ist der Fortschritt offensichtlich. Die heute vorgestellten Modelle erfüllen mehr oder weniger alle ihren Zweck und vieles ist Geschmackssache, aber auch eine Frage des Geldbeutels. Bei Nano Banana Pro zum Beispiel kann – je nach Dienstleister – die Generierung eines Bildes leicht das hundertfache (1 Punkt/Credit vs 100 Punkte/Credits) gegenüber einen billigen, chinesischen Anbieter kosten. Im oberen Mittelfeld liegt Flux.2, das meiner Meinung nach in punkto Qualität und Preis das beste Verhältnis liefert. Aber auch GPT Image und Hunyuan Image (für mich der Überraschungshit) liefern durchaus beachtliche Ergebnisse.

Aber das alles ist nur eine Momentaufnahme. Bei dem Fortschritt, den die KI-Bildgeneratoren beinahe täglich hinlegen, kann morgen schon alles anders sein. Still digging!


Bild: Hippo-Pärchen im Supermarkt, erstellt mit OpenArt.ai. Prompt: »An anthropomorphic hippopotamus couple, he wearing glasses, a blue jacket, a white shirt, and a red tie, she in a red, blue, and white polka-dotted dress, stroll through a supermarket. He pushes a shopping cart, she carries a bag. Colored classic comic style.« Modell: Flux.2 Pro.