Modelle vergleichen
Llama, Gemma, Mistral, Phi, Qwen und Code-Modelle: welches Modell zu welcher Aufgabe passt.
Hier vergleichst du Ollama-Modelle nach Aufgabe, Geschwindigkeit, Qualität und Hardwarebedarf. Ollama unterstützt viele verschiedene Modelle. Die Auswahl wächst ständig. Wer neu einsteigt, verliert da leicht den Überblick. In diesem Artikel schaue ich mir die wichtigsten Modelle an und erkläre wofür ich sie einsetze.
Alle Modelle kannst du auf ollama.com/library durchsuchen. Dort findest du auch die genauen Größen und verfügbaren Varianten.
Die wichtigsten Modelle
gemma4:e4b ist ein effizientes Multimodal-Modell das für seine Größe sehr stark ist, besonders bei deutschsprachigen Texten. gemma4:26b ist deutlich leistungsfähiger und mein erstes Modell wenn es etwas schwieriger wird. Braucht 32+ GB RAM.Was für welche Aufgabe
Meine Empfehlungen nach Anwendungsfall:
qwen3.5:9b oder gemma4:e4b. Guter Allrounder für tägliche Fragen, Texte und Ideen.
gemma4:e4b oder qwen3.5:9b für Deutsch. Beide produzieren flüssige, natürliche Texte in guter Qualität.
qwen2.5-coder:7b. Spezialisierte Modelle sind hier klar besser als Allrounder gleicher Größe.
qwen3.5:9b. Zuverlässiges Instruktions-Following und vorhersehbare Ausgaben für n8n-Workflows.
gemma4:e4b. Für seine Größe überraschend stark und startet schnell.
gemma4:26b wenn genug RAM vorhanden ist. Deutlich stärker als die kleineren Varianten, mein erstes Modell für anspruchsvolle Aufgaben.
Modelle nebeneinander testen
Du kannst mehrere Modelle herunterladen und direkt vergleichen. Starte einfach zwei Terminal-Sessions und stelle beiden die gleiche Frage:
So bekommst du schnell ein Gefühl dafür welches Modell für deine Aufgaben besser passt. Für spätere Vergleiche ohne Chat-Session kannst du ollama run auch mit einem direkten Prompt aufrufen:
Ich habe aktuell vier Modelle dauerhaft installiert: qwen3.5:9b als Allrounder für Texte und Analyse, qwen2.5-coder:7b für Code-Aufgaben, gemma4:e4b für schnelle Aufgaben und deutschsprachige Texte sowie gemma4:26b wenn ich mehr Qualität brauche. Das reicht für 95% meiner täglichen Arbeit.
Häufige Fragen
Gibt es das beste Ollama Modell?
Nein. Für kurze Alltagsfragen zählt Geschwindigkeit, für Coding oder Analyse eher Modellqualität und Kontextgröße.
Warum antworten kleinere Modelle schlechter?
Kleinere Modelle brauchen weniger Speicher, haben aber oft weniger Wissen, weniger Präzision und schwächere Schlussfolgerungen.
Soll ich mehrere Modelle installieren?
Ja, ein schnelles kleines und ein stärkeres größeres Modell sind für viele lokale Setups eine gute Kombination.