PromptToImage: Stable Diffusion für (Silicon-) Macs

Künstliche Intelligenz

Autor:in

Jörg Kantel

Veröffentlichungsdatum

2. Januar 2023

Stable Diffusion ist ein Deep-Learning-Text-zu-Bild Generator. Es wird hauptsächlich zur Generierung detaillierter Bilder auf der Grundlage von Textbeschreibungen verwendet, kann aber auch für andere Aufgaben wie Inpainting, Outpainting und die Generierung von Bild-zu-Bild-Übersetzungen auf der Grundlage einer Textaufforderung eingesetzt werden. Im Gegensatz zu proprietären Projekten wie DALL-E oder Midjourney steht Stable Fusion unter einer freien, erweiterten GPL-Lizenz, die lediglich bestimmte, sozial schädliche Anwendungsfälle verbietet, wie zum Beispiel Verbrechen, Verleumdung oder die »Ausbeutung von Minderjährigen«. Ansonsten bleibt der Nutzer Eigentümer der Rechte an den von ihm erzeugten Bildern und kann diese auch kommerziell nutzen.

Stable Diffusion muß nicht in der Cloud, sondern kann auf den meisten, relativ modernen Consumer-Rechnern laufen. Während es für Windwows und Linux mit Stable Diffusion UI (Downlaod und Quellcode auf GitHub) schon seit längerem eine nette Desktop-Version gab, die Jim Clyde Monge hier besprochen hatte (leider ein Medium.com-Link hinter einer Bezahlschranke), war bisher eine Mac-Version nur versprochen.

Das hat sich nun geändert: Mit PromptToImage steht derzeit über Testflight auch eine Version für macOS zum Download bereit. PromptToImage setzt auf Swift und AppKit, ist also eine native Stable-Diffusion-App für den Mac. Dabei wird nicht nur Text-zu-Bild, sondern auch Bild-zu-Bild unterstützt. Also kommen nun auch endlich Mac-User in den Genuß des faszinierenden Spielzeugs. Doch Cashys Blog warnt: »… das Thema ist ein echtes »Rabbit Hole«, in dem man sich verlieren kann.«

Außerdem braucht das Teil einen Apple Silicon Mac mit macOS 13.1 Ventura. Intel Macs werden nicht unterstützt. Ich muß also noch etwas warten, bevor auch ich mit Stable Diffusion meine Zeit vergeuden kann.