Ollama Artikel 07 von 08

Ollama in n8n einbinden

Lokale Modelle in Automatisierungs-Workflows nutzen: Ollama-Credential, Chat Model, AI Agent und HTTP-Request.

Hier bindest du Ollama in n8n ein und nutzt lokale Modelle in Automationen und AI-Agent-Workflows. Nach der API kommt die praktische Automation. n8n ist mein zentrales Automatisierungs-Werkzeug. Und Ollama ist das KI-Backend das in vielen meiner Workflows steckt. Die Kombination ist mächtig: Workflows laufen rund um die Uhr, jede Anfrage an ein Modell kostet nichts und keine Daten verlassen den eigenen Server.

n8n bringt einen eigenen Ollama-Node mit, der die API-Details versteckt. Die Verbindung ist in wenigen Minuten eingerichtet.

Verbindung einrichten

Ollama Credential anlegen

In n8n unter "Credentials" eine neue Verbindung vom Typ "Ollama" anlegen. Als URL trägst du http://localhost:11434 ein, wenn n8n und Ollama auf demselben Rechner laufen. Bei Docker-Setups: http://host.docker.internal:11434.

Ollama-Node in Workflow einfügen

Im Workflow-Editor nach "Ollama" suchen. Der Node heißt "Ollama Chat Model" und wird als Language Model in AI-Nodes eingesetzt.

Modell auswählen

Im Node-Panel das gewünschte Modell eintragen, zum Beispiel qwen3.5:9b. n8n fragt die verfügbaren Modelle direkt von Ollama ab und zeigt sie im Dropdown an.

Mit AI Agent verbinden

Den Ollama-Node als "Chat Model" an einen "AI Agent" Node anschließen. Der Agent übernimmt die Gesprächslogik und du kannst ihm Werkzeuge wie Web-Suche oder eigene Funktionen geben.

Was ich damit automatisiere

E-Mails Eingehende E-Mails werden automatisch zusammengefasst und kategorisiert. Das Modell entscheidet ob sie dringend sind und legt sie entsprechend ab.

Content-Erstellung Aus kurzen Stichpunkten werden vollständige Social-Media-Posts oder Newsletter-Abschnitte. Der Workflow holt die Stichpunkte, schickt sie ans Modell und speichert den fertigen Text.

Dokument-Analyse PDFs und Textdokumente werden eingelesen, das Modell extrahiert die relevanten Informationen und schreibt sie in eine strukturierte Form.

Klassifizierung Eingehende Nachrichten oder Formulareingaben werden automatisch einem Thema oder einer Kategorie zugeordnet. Ohne Modell müsste das manuell passieren.

Direkter HTTP-Request als Alternative

Wenn du mehr Kontrolle über die Anfrage brauchst oder einen Parameter nutzen willst den der Ollama-Node nicht direkt bietet, kannst du stattdessen einen HTTP-Request-Node verwenden:

URL:    http://localhost:11434/api/chat
Method: POST
Body:
{
  "model": "qwen3.5:9b",
  "messages": [
    { "role": "system", "content": "{{ $json.systemPrompt }}" },
    { "role": "user",   "content": "{{ $json.userMessage }}" }
  ],
  "stream": false
}

Die doppelten geschweifte Klammern sind n8n-Ausdrücke die auf Daten aus vorherigen Nodes zugreifen. So baust du dynamische Prompts aus dem aktuellen Workflow-Kontext.

Modell nach Aufgabe wählen

In n8n kann jeder Workflow ein anderes Modell nutzen. Ich trenne das bewusst nach Aufgabentyp:

Texte schreiben:    qwen3.5:9b
Code-Aufgaben:      qwen2.5-coder:7b
Komplexe Analyse:   gemma4:26b
Schnelle Checks:    gemma4:e4b

Kleinere Modelle sind schneller und belasten den Server weniger. Für einfache Klassifizierungs-Aufgaben brauche ich kein 26B-Modell.

Mein Setup

n8n und Ollama laufen beide als Docker-Container auf meinem Linux-Server. n8n kommuniziert mit Ollama über das interne Docker-Netzwerk. Kein Aufruf verlässt den Server, alle Daten bleiben lokal. Die Workflows laufen 24 Stunden ohne dass ich etwas tun muss und ohne laufende API-Kosten.

Der nächste sinnvolle Schritt

Wenn du diesen Teil verstanden hast, passen diese Seiten als Nächstes:

Häufige Fragen

Warum Ollama in n8n nutzen?

Du kannst Texte lokal zusammenfassen, klassifizieren, umformulieren oder Entscheidungen vorbereiten, ohne jede Anfrage an eine Cloud zu senden.

Was ist stabiler: Chat Model oder HTTP Request?

Der passende n8n-Node ist bequemer. HTTP Request bleibt hilfreich, wenn du Endpunkte oder Parameter genauer kontrollieren willst.

Welches Modell nehme ich für n8n?

Für kurze Strukturaufgaben reicht oft ein kleines schnelles Modell. Für komplexe Agenten lohnt ein stärkeres Modell mit mehr Kontext.

Zurück: Ollama-API nutzen Weiter: Hardware und Leistung