Dall-E, Midjourney, Stable Diffusion und Adobe Firefly haben eine Gemeinsamkeit: Sie liefern nur anhand eines kurzen Textes vollautomatisch generierte Bilder. So einfach das auch klingt, so wenig zufriedenstellend sind manchmal die Ergebnisse. Helfen kann ausgerechnet ein weiteres KI-Tool.
Seit 2022 haben Bildgeneratoren große Fortschritte gemacht. Tools wie Dall-E, Midjourney oder Stable Diffusion erstellen mit Künstlicher Intelligenz ganz einfach Bilder – nur einen Text muss man dafür eingeben. Manchmal ist es aber genau diese Aufgabe, an der Nutzer noch verzweifeln: Damit die KI-Tools richtig gut funktionieren, brauchen sie im Text möglichst viele Informationen. Für den Menschen klingt so ein Prompt daher manchmal schon fast übertrieben blumig. Kein Wunder also, dass sich viele Menschen mit dem perfekten Prompt für KI-Bildgeneratoren noch schwer tun.
Abhilfe schafft dabei ausgerechnet ein anderes KI-Tool: Mit ChatGPT kann man zwar nur Texte und keine Bilder erstellen – allerdings kann man ChatGPT auch dafür nutzen, einen perfekten Prompt schreiben zu lassen, um diesen anschließend in Midjourney oder anderen Tools für KI-Kunst zu verwenden. In vielen Fällen klappt das erstaunlich gut, wie ein kurzer Test zeigt.
Prompt vom Menschen
Für einen Artikel brauchte ich ein fotorealistisches Bild eines Mannes, der durch eine Lupe direkt in die Kamera blickt. Ein einfacher Prompt hätte also gelautet: „A photo of a man with a giant magnifier glass looking into the camera.“ Das Ergebnis bei Dall-E ist zwar vollkommen zutreffend, sieht qualitativ aber nicht überzeugend aus.
Prompt von ChatGPT
Nun sollte ChatGPT den Prompt besser machen. Ich schrieb dafür an ChatGPT: „I need a prompt for an image generator AI. The image should be a photo of a man with a giant magnifier glass looking into the camera. Please write the prompt.“
ChatGPT lieferte daraufhin folgenden Vorschlag: „Prompt: „Generate an image of a captivating moment: a curious man holding a colossal magnifying glass, engrossed in examining something intriguing. His eyes meet the camera lens, inviting the viewer to share in his sense of wonder. Capture the essence of curiosity and discovery in this unique and visually striking composition.““ Schon hier ist zu erkennen, wie viel blumiger der Text von ChatGPT ist – und das Ergebnis war durchaus deutlich besser:
Optimierter Prompt von ChatGPT
Richtig gut wurde es dann mit Nachbesserungen. So schrieb ich ChatGPT, dass er so durch die Lupe blicken sollte, dass sein Auge vergrößert dargestellt würde. Außerdem war der Prompt zwischenzeitlich zu lang, sodass ich ChatGPT darauf hinwies, ihn auf maximal 400 Zeichen zu kürzen. Das Ergebnis ist damit nochmals deutlich besser geworden, sodass eines der Bilder nun tatsächlich für den Artikel genutzt werden konnte.
Es zeigt sich also: Auch beim Arbeiten mit KI-Tools kann man andere Künstliche Intelligenzen einsetzen, um die Ergebnisse nochmals zu optimieren. Insbesondere ChatGPT kann einem helfen, wichtige Informationen zu ergänzen und bessere Prompts für StyleGAN-Tools wie Dall-E zu schreiben.
Schreibe einen Kommentar