1. tibor.net >
  2. Digital >
  3. Künstliche Intelligenz >
  4. KI-Fotos: Konkrete Posen und Räume festlegen – so gehts

Wie man einer Künstlichen Intelligenz konkrete Posen und Raumgestaltungen beibringt

Eine OpenPose und mehrere Beispiele für KI-Bilder mit der entsprechenden Pose

KI-Fotos sind in der Art Direction inzwischen sehr beliebt, lassen sich aber nur begrenzt gestalten. Wir zeigen die Technik, mit der man konkrete Posen und Szenenbilder für Fotos von einer Künstlichen Intelligenz festlegen kann.

KI-Bilder sind günstig, einfach zu erstellen und qualitativ oft erstaunlich hochwertig. Dennoch haben sie im Vergleich zu echten Fotos einen Nachteil: Man kann Raumgestaltungen und Posen nicht so konkret festlegen, wie man es von der Arbeit mit Models gewohnt ist. Eine Spezialtechnik hilft in diesem Fall weiter.

ControlNet gibt der KI Informationen über Körperhaltung und Objekte

Um der KI konkrete Posen oder die Gestaltung von Räumen zu zeigen, nutzen wir ControlNet. ControlNet beschreibt sich selbst als Neurales Netzwerk, das KI-Modelle mit zusätzlichen Bedingungen kontrollieren kann – genau das, was wir brauchen, denn die Körperhaltung oder die Gestaltung von Szenen ist eine dieser zusätzlichen Bedingungen, die wir über einen Prompt nicht bis ins Detail umsetzen können.

Für ControlNet gibt es verschiedene Optionen, von denen wir zwei hier konkret vorstellen.

Für Körperhaltungen: OpenPose

Um der KI konkrete Posen oder Körperhaltungen vorzugeben, kann man OpenPose verwenden. OpenPose sieht auf den ersten Blick wie ein einfaches Strichmännchen aus, hat aber einige Tricks eingebaut, um bspw. die Körperhälften oder die Blickrichtung kontrollieren zu können.

Ein Beispiel zeigt, was mit ControlNet und OpenPose möglich ist. Alleine durch die Angabe der Pose steht der Mann im KI-Bild immer an der gleichen Stelle, hat die Beine übereinander geschlagen und die Arme verschränkt. Ein sehr konsistentes und verlässliches Ergebnis.

Eine Kollage zeigt ein OpenPose-Bild und mehrere damit erstellte Bilder mit konsistenten Posen
Konsistente Posen in KI-Fotos: Links die OpenPose-Skizze, rechts mehrere Ergebnisse aus Stable Diffusion

Die OpenPose-Posen für ControlNet kann man entweder selbst erstellen oder auf Datenbanken wie unter OpenPoses.com zurückgreifen.

Für Räume und Objekte: M-LSD-Linien

Wenn man mit Räumen, Objekten oder Inneneinrichtungen experimentieren möchte, bietet sich dafür M-LSD an. M-LSD steht für „Multiscale Line Segment Detector“ und sieht aus wie eine einfache Strichzeichnung von einer Szene.

Diese Strichzeichnungen lassen sich entweder manuell anfertigen oder auch aus bestehenden Fotos generieren lassen. Anschließend kann man sie beim nächsten KI-Foto einsetzen, um eine konkrete Szene darzustellen.

Eine Collage zeigt mehrere Beispiele für den gleichen Raum in KI-generierten Fotos
Der gleiche Raum in unterschiedlichen Stilen: ControlNet und M-LSD machen es möglich

Wie wendet man das ControlNet an?

ControlNet wird aktuell nicht von Midjourney oder Dall-E unterstützt, allerdings vom Open-Source-Konkurrenten Stable Diffusion. Man kann ControlNet in allen gängigen Apps für Stable Diffusion verwenden, so unter anderem in Diffusion Bee oder Automatic1111.

Ein Screenshot von Diffusion Bee zeigt, wie man in der App ControlNet anwenden kann
Ein Screenshot zeigt, wie man ControlNet in Diffusion Bee anwenden kann

Die Apps für Stable Diffusion haben unterschiedlich steile Lernkurven, am benutzerfreundlichsten ist aus meiner Sicht die App Diffusion Bee. Diffusion Bee liegt in der Benutzerfreundlichkeit zwischen Dall-E und Midjourney – wer mit Discord gut zurechtkommt, sollte das mit Diffusion Bee also auch schaffen.

In Diffusion Bee gibt es im Bereich „Text to image“ ein Modul für ControlNet, wo man die einzelnen Modelle anwählen kann. Hier kann man einfach per Drag&Drop anschließend noch das Kontroll-Bild mit OpenPose oder M-LSD hinzufügen und dann wie gewohnt per Prompt Bilder erstellen.

Quellen:

#ControlNet #Diffusion Bee #KI / Künstliche Intelligenz #Stable Diffusion #Tipp

Über den Autor:

Ich habe als Journalist und Social-Media-Experte für t-online.de, die dpa und stern.de / Gruner + Jahr / RTL gearbeitet. Hier schreibe ich unter anderem über Facebook, Twitter, Instagram, LinkedIn, TikTok und andere Themen rund ums Online-Marketing.

Artikel und News zu Künstliche Intelligenz

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert