Ollama in n8n einbinden
Lokale Modelle in Automatisierungs-Workflows nutzen: Ollama-Credential, Chat Model, AI Agent und HTTP-Request.
Hier bindest du Ollama in n8n ein und nutzt lokale Modelle in Automationen und AI-Agent-Workflows. Nach der API kommt die praktische Automation. n8n ist mein zentrales Automatisierungs-Werkzeug. Und Ollama ist das KI-Backend das in vielen meiner Workflows steckt. Die Kombination ist mächtig: Workflows laufen rund um die Uhr, jede Anfrage an ein Modell kostet nichts und keine Daten verlassen den eigenen Server.
n8n bringt einen eigenen Ollama-Node mit, der die API-Details versteckt. Die Verbindung ist in wenigen Minuten eingerichtet.
Verbindung einrichten
http://localhost:11434 ein, wenn n8n und Ollama auf demselben Rechner laufen. Bei Docker-Setups: http://host.docker.internal:11434.qwen3.5:9b. n8n fragt die verfügbaren Modelle direkt von Ollama ab und zeigt sie im Dropdown an.Was ich damit automatisiere
Direkter HTTP-Request als Alternative
Wenn du mehr Kontrolle über die Anfrage brauchst oder einen Parameter nutzen willst den der Ollama-Node nicht direkt bietet, kannst du stattdessen einen HTTP-Request-Node verwenden:
Die doppelten geschweifte Klammern sind n8n-Ausdrücke die auf Daten aus vorherigen Nodes zugreifen. So baust du dynamische Prompts aus dem aktuellen Workflow-Kontext.
Modell nach Aufgabe wählen
In n8n kann jeder Workflow ein anderes Modell nutzen. Ich trenne das bewusst nach Aufgabentyp:
Kleinere Modelle sind schneller und belasten den Server weniger. Für einfache Klassifizierungs-Aufgaben brauche ich kein 26B-Modell.
n8n und Ollama laufen beide als Docker-Container auf meinem Linux-Server. n8n kommuniziert mit Ollama über das interne Docker-Netzwerk. Kein Aufruf verlässt den Server, alle Daten bleiben lokal. Die Workflows laufen 24 Stunden ohne dass ich etwas tun muss und ohne laufende API-Kosten.
Häufige Fragen
Warum Ollama in n8n nutzen?
Du kannst Texte lokal zusammenfassen, klassifizieren, umformulieren oder Entscheidungen vorbereiten, ohne jede Anfrage an eine Cloud zu senden.
Was ist stabiler: Chat Model oder HTTP Request?
Der passende n8n-Node ist bequemer. HTTP Request bleibt hilfreich, wenn du Endpunkte oder Parameter genauer kontrollieren willst.
Welches Modell nehme ich für n8n?
Für kurze Strukturaufgaben reicht oft ein kleines schnelles Modell. Für komplexe Agenten lohnt ein stärkeres Modell mit mehr Kontext.