Dokumente hochladen und Wissen nutzen
Eigene Dateien als Wissensquelle nutzen: RAG verstehen, Sammlungen anlegen und Antwortgrenzen einschätzen.
Hier nutzt du Dokumente und RAG in Open WebUI, damit lokale Chats auf eigenen Dateien arbeiten. Nach Prompts und Personas kommt eigenes Wissen ins Spiel. Eines der nützlichsten Features von Open WebUI ist die Möglichkeit, eigene Dokumente hochzuladen und das Modell direkt dazu zu befragen. Du lädst eine PDF hoch, stellst eine Frage, und das Modell antwortet auf Basis dessen was in der Datei steht. Das nennt sich RAG: Retrieval-Augmented Generation.
Was ist RAG?
Ein Sprachmodell hat ein festes Wissensdatum. Es kennt nichts was nach seinem Training passiert ist, und es kennt natürlich keine deiner privaten Dokumente. RAG löst das: bevor das Modell antwortet, wird das hochgeladene Dokument nach relevanten Textstellen durchsucht. Diese Stellen werden zusammen mit deiner Frage an das Modell übergeben. Das Modell antwortet dann auf Basis dieser Stellen, nicht nur aus seinem allgemeinen Wissen.
Stell dir vor du fragst: "Was steht in meinem Mietvertrag über Nebenkosten?" Ohne RAG würde das Modell eine allgemeine Antwort geben. Mit RAG liest es deinen Mietvertrag und antwortet konkret auf Basis deines Dokuments.
Das Modell liest nicht das gesamte Dokument auf einmal. Es sucht nach den relevantesten Abschnitten und arbeitet mit diesen. Bei sehr langen Dokumenten kann es passieren, dass wichtige Stellen nicht gefunden werden. Dazu mehr im Abschnitt über Grenzen.
Dokument direkt im Chat hochladen
Der einfachste Weg: Datei direkt in einen Chat ziehen oder über das Büroklammer-Symbol im Chat-Eingabefeld hochladen. Das Dokument ist dann nur für diese eine Unterhaltung verfügbar.
Wissensdatenbank anlegen
Wer Dokumente dauerhaft verfügbar haben will, ohne sie jedes Mal neu hochzuladen, nutzt die Wissensdatenbank. Im Workspace unter "Wissen" lassen sich Sammlungen anlegen die in jedem Chat abrufbar sind.
#-Symbol tippen und den Namen der Sammlung auswählen. Das Modell hat nun Zugriff auf alle Dokumente in dieser Sammlung.Unterstützte Dateiformate
Open WebUI versteht die gängigen Formate. Das sind die wichtigsten:
Bilder und gescannte PDFs ohne Texterkennung funktionieren nicht. Das Modell braucht lesbaren Text, keine Bilddaten.
Wo die Grenzen liegen
RAG ist nützlich, aber kein Allheilmittel. Ein paar Dinge die ich selbst gelernt habe:
Ich nutze RAG am liebsten für klar strukturierte Dokumente: Handbücher, Verträge, Protokolle. Dort liefert es zuverlässig gute Ergebnisse. Für komplexe Analysen oder wenn ich wirklich sicher sein muss, lese ich lieber selbst nach.
Häufige Fragen
Was bedeutet RAG in Open WebUI?
RAG ergänzt die Modellantwort mit passenden Textstellen aus deinen Dokumenten, statt das Modell neu zu trainieren.
Welche Dokumente eignen sich?
Klare PDFs, Textdateien, Markdown und gut strukturierte Inhalte funktionieren besser als Scans oder schlecht formatierte Dateien.
Warum beantwortet das Modell trotz Dokument falsch?
Dokumentqualität, Chunking, Suche und Modellgrenzen spielen zusammen. RAG reduziert Fehler, beseitigt sie aber nicht vollständig.