Google Bard mit Imagen: New KI on the Blog

Chatbot
Bilder
Imagen
Künstliche Intelligenz
Autor:in

Jörg Kantel

Veröffentlichungsdatum

5. Februar 2024

Es rauscht im Blätterwald (eigentlich eine blöde Metapher – heutzutage rauscht es schon lange nicht mehr in Blättern, sondern spült in Webseiten und Feedreader), Googles als ChatGPT-Konkurrent gestarteter, aber bisher eher verborgen gebliebener Chatbot Bard hat vor wenigen Tagen als Update die KI-Engine Gemini verpaßt bekommen und soll damit endlich aus dem Dornröschenschlaf geweckt werden.

Doch das ist nicht alles: Bard kann mit diesem Update endlich das, was ChatGPT schon lange kann – nämlich Bilder generieren. Google nutzt dafür Imagen, die bisher eigentlich nur als Forschungspapier existierende Antwort auf DALL-E. Erste Reaktionen (Medium.com-Link) sind sehr positiv.

Google will einiges besser (oder besser: anders) machen als die Konkurrenz: Erstens soll der Dienst – im Gegensatz zu ChatGPT – auch weiterhin kostenlos bleiben. Zweitens will Google gegen Deep Fakes vorgehen und bestimmte Prompts (zum Beispiel Photos von Personen) zurückweisen – Zeichnungen im Comic-Stil sollen aber akzeptiert werden. Wem das nach Zensur stinkt, der hat natürlich recht. Aber für bedenklicher halte ich, daß die Bilder ein unsichtbares Wasserzeichen verpaßt bekommen, das auf den Urheber zurückverfolgbar sein soll. Was autoritäre Regime damit anstellen könnten, will ich mir gar nicht erst ausmalen.

Wie auch immer, momentan ist das Tool in Deutschland noch nicht verfügbar1. Aber wenn es da ist (eine Einführung ist angekündigt), werde ich das Teil auf jeden Fall testen.

War sonst noch was? Ach ja, auf dem Weltwirtschaftsforum in Davos letzten Monat machte die französische Softwarefirma Mistral AI von sich reden. Deren KI-Modelle Mistral 7B und Mixtral 8x7B sollen nicht nur sehr leistungsfähig sein, sondern sind auch als Open Source für jeden frei nutzbar. Neben der aus London stammenden, ebenfalls freien KI-Software Stable Diffusion ist das ein weiterer europäischer Player mit freier Software gegen die meist US-amerikanischen, kommerziellen und großen Softwareriesen.


Bild: Schlange am Schreibtisch, erstellt mit Scenario. Prompt: »A python with ((glasses)) and a pointer in front of a chart with diagrams in an office. Shelves with books on the walls. It’s a sunny morning«, Modell: Stable Diffusion XL, Style: Stylized Fantasy + Whimsical Storybook.

Fußnoten

  1. Bevor hier wieder blöde Kommentare reinschneien: Ich weiß, wie man einen Proxy-Server hochzieht, aber ich habe keine Lust darauf.↩︎