Zurück zur Übersicht
ComfyUI Artikel 06 von 08

ControlNet und gezielte Steuerung

Bilder nicht nur beschreiben, sondern steuern. Pose, Tiefe und Konturen als Vorlage für die Generierung nutzen.

Hier nutzt du ControlNet in ComfyUI, um Pose, Tiefe, Kanten und Komposition gezielt zu steuern. ControlNet ist eine der mächtigsten Erweiterungen für Stable Diffusion. Es erlaubt die Generierung anhand einer Vorlage zu steuern: eine Körperhaltung, eine Raumtiefe, die Konturen eines Objekts. Das Ergebnis folgt der Vorlage, der Stil kommt vom Modell und Prompt. Das ist etwas fundamental anderes als reine Texteingabe.

Was ControlNet macht

Ohne ControlNet entscheidet das Modell auf Basis des Prompts selbst wie es das Motiv anordnet. Mit ControlNet gibt man eine Struktur vor. Das Modell füllt diese Struktur mit dem gewünschten Stil aus.

Ein Beispiel: Man hat ein Foto einer Person in einer bestimmten Pose. ControlNet extrahiert das Skelett dieser Pose. Dann generiert man ein neues Bild mit einem anderen Prompt, etwa eine mittelalterliche Kriegerin. Die generierte Person übernimmt exakt die Pose aus dem Originalfoto.

Die wichtigsten ControlNet-Typen

OpenPose Erkennt Körperposen aus einem Referenzbild und überträgt sie. Ideal für konsistente Charakterposen in einer Serie.
Depth Extrahiert die Tiefenstruktur einer Szene. Gut um Raumkomposition und Vorder/Hintergrund-Verhältnisse zu übernehmen.
Canny Erkennt Kanten und Umrisse. Hilfreich um die grobe Form eines Objekts beizubehalten während Stil und Details neu generiert werden.
Lineart Ähnlich wie Canny, aber weicher. Gut für Illustrationen oder wenn man eine Skizze als Vorlage verwenden will.
Tile Teilt das Bild in Kacheln und verarbeitet jede separat. Nützlich beim Upscaling um Details in großen Bildern zu verbessern ohne die Gesamtkomposition zu verändern.

ControlNet installieren

ControlNet benötigt zwei Dinge: den ComfyUI-Manager-Node für ControlNet und das passende Modell für den gewünschten Typ.

1
Node installieren
Im ComfyUI Manager nach "ControlNet" suchen und den Node "ComfyUI's ControlNet Auxiliary Preprocessors" installieren. Er enthält alle Preprocessoren um Vorlagen aus Bildern zu extrahieren.
2
ControlNet-Modell herunterladen
Für SDXL gibt es auf Hugging Face passende ControlNet-Modelle, zum Beispiel unter "xinsir/controlnet-openpose-sdxl-1.0". Die Modelldatei kommt in den Ordner ComfyUI/models/controlnet/.
3
Workflow aufbauen
Im Workflow kommt ein "Load ControlNet Model" Node dazu, dazu ein Preprocessor-Node (z.B. "DWPose Estimator" für Posen) und ein "Apply ControlNet" Node der zwischen CLIP-Encoder und KSampler sitzt.

Stärke und Balance

Der "Apply ControlNet" Node hat einen Stärke-Parameter. Bei 1.0 folgt das Bild der Vorlage sehr genau, der Prompt hat weniger Einfluss. Bei 0.5 ist es eine Balance. Bei 0.3 bis 0.4 nimmt das Modell die Vorlage als Orientierung, weicht aber stärker ab.

Für den Einstieg empfehle ich mit einem Wert um 0.7 zu beginnen und dann je nach Ergebnis anzupassen. Zu hohe Werte machen das Bild oft steif und unnatürlich.

Wann ControlNet sich lohnt

ControlNet lohnt sich sobald man konsistente Ergebnisse braucht, die rein per Prompt nicht zuverlässig erreichbar sind: Produktbilder in immer gleicher Perspektive, Charaktere in bestimmten Posen, Szenen mit definierter Komposition. Für freie, experimentelle Generierung ist der Standard-Workflow ohne ControlNet schneller und flexibler.

Der nächste sinnvolle Schritt

Wenn du diesen Teil verstanden hast, passen diese Seiten als Nächstes:

Häufige Fragen

Was macht ControlNet?

ControlNet gibt dem Modell zusätzliche Struktur, etwa Pose, Kanten, Tiefe oder Skizzen, damit das Bild kontrollierter entsteht.

Wann lohnt ControlNet?

Wenn Komposition, Körperhaltung, Perspektive oder Vorlage wichtiger sind als reine Prompt-Freiheit.

Warum ist die Stärke wichtig?

Zu wenig Stärke bringt kaum Kontrolle, zu viel Stärke macht Ergebnisse steif oder blockiert kreative Varianten.