Ollama Artikel 01 von 08

Was ist Ollama?

Der Start der Ollama-Lernreise: wann lokale KI sinnvoll ist, was Ollama übernimmt und welche Hardware du realistisch brauchst.

Hier verstehst du, was Ollama übernimmt und wann lokale KI gegenüber Cloud-KI sinnvoll ist. Die meisten KI-Tools funktionieren über die Cloud. Du schreibst etwas, es geht an einen Server irgendwo, eine Antwort kommt zurück. Das funktioniert gut, kostet aber Geld, braucht Internet und du hast keine Kontrolle darüber was mit deinen Eingaben passiert.

Ollama ist ein anderer Ansatz. Es läuft auf deinem eigenen Rechner, ist kostenlos und kein Wort verlässt dein Gerät. Damit ist es der Einstieg, wenn du lokale Modelle erst ausprobieren und später in Open WebUI, n8n oder eigene Skripte einbinden willst.

Was Ollama macht

Ollama ist ein Werkzeug das große Sprachmodelle lokal ausführt. Es lädt ein Modell auf deinen Rechner und betreibt es dort. Du kannst dann im Terminal mit dem Modell chatten, es über eine API ansprechen oder es mit einer Oberfläche wie Open WebUI verbinden.

Das klingt technisch, ist in der Praxis aber erstaunlich einfach. Ein Befehl im Terminal und das Modell läuft. Kein Account, keine API-Keys, keine monatliche Rechnung.

Was Ollama nicht ist

Ollama ist kein Modell selbst. Es ist die Infrastruktur, die Modelle ausführt. Die Modelle (Llama, Gemma, Mistral usw.) kommen von anderen Anbietern und werden über Ollama heruntergeladen und betrieben. Ollama ist das Werkzeug, die Modelle sind der Inhalt.

Warum lokale KI sinnvoll ist

Lokal mit Ollama

Keine Cloud, keine Kosten pro Anfrage, kein Datenschutzproblem. Funktioniert ohne Internet. Volle Kontrolle über das Modell und seine Einstellungen. Geschwindigkeit hängt von der eigenen Hardware ab.

Cloud-KI (ChatGPT, Claude)

Immer aktuellste Modelle, keine Hardware-Anforderungen, einfache Nutzung. Monatliche Kosten, Daten gehen an externe Server, braucht stabile Internetverbindung.

Für mich persönlich ist lokale KI interessant für alles was ich nicht in die Cloud schicken will: interne Dokumente, Kundendaten, persönliche Texte. Und für Automatisierungen die rund um die Uhr laufen sollen ohne dass jede Anfrage Geld kostet.

Was du brauchst

Ollama läuft auf fast jeder modernen Hardware, aber die Geschwindigkeit hängt stark vom Rechner ab.

RAM Mindestens 8 GB für kleine Modelle (7B Parameter). 16 GB für komfortables Arbeiten mit 13B-Modellen. 32 GB oder mehr für große Modelle wie Llama 3.1 70B.

GPU Nicht zwingend nötig, aber stark empfohlen. Mit NVIDIA-GPU läuft das Modell im VRAM und ist deutlich schneller. Ohne GPU läuft alles auf der CPU, was bei großen Modellen sehr langsam wird.

Speicher Modelle sind groß. Ein 7B-Modell belegt je nach Quantisierung zwischen 4 und 8 GB. Plane mindestens 20 bis 30 GB freien Speicher ein wenn du mehrere Modelle ausprobieren willst.

OS Linux, Mac und Windows werden offiziell unterstützt. Apple Silicon (M1 bis M4) nutzt den gemeinsamen Arbeitsspeicher als GPU-Speicher und ist überraschend gut geeignet.

Was Ollama von anderen Lösungen unterscheidet

Es gibt andere Wege KI lokal zu betreiben: LM Studio, Jan, llama.cpp direkt. Ollama hat sich als Standard etabliert weil es sehr einfach zu bedienen ist und eine saubere API mitbringt.

Besonders der API-Zugriff ist wertvoll. Mit einer einzigen Zeile Code lässt sich ein lokales Modell in eigene Skripte, Automatisierungen oder Anwendungen einbinden. Artikel 06 dieser Serie zeigt wie das geht.

Meine Einschätzung

Ollama ist das Tool das mir lokale KI erst wirklich zugänglich gemacht hat. Vorher war der Aufwand zu hoch. Heute starte ich ein Modell mit einem Befehl und nutze es in meinen n8n-Workflows ohne einen Cent zu zahlen. In den nächsten Artikeln installierst du Ollama, lädst dein erstes Modell, vergleichst Modelle, verbindest Open WebUI und nutzt die API in n8n.

Der nächste sinnvolle Schritt

Wenn du diesen Teil verstanden hast, passen diese Seiten als Nächstes:

Häufige Fragen

Ist Ollama ein eigenes KI-Modell?

Nein. Ollama ist das Werkzeug, das lokale Modelle lädt, startet und per Terminal oder API nutzbar macht.

Bleiben meine Eingaben bei Ollama lokal?

Ja, solange du ein lokales Modell nutzt und keine externe API einbindest, verlassen Prompts und Antworten deinen Rechner nicht.

Brauche ich eine starke GPU?

Für kleine Modelle reicht oft CPU oder Apple Silicon. Eine GPU macht Antworten aber deutlich schneller und größere Modelle realistischer.

Alle Ollama-Artikel Weiter: Ollama installieren