Open WebUI Artikel 06 von 08

Dokumente hochladen und Wissen nutzen

Eigene Dateien als Wissensquelle nutzen: RAG verstehen, Sammlungen anlegen und Antwortgrenzen einschätzen.

Hier nutzt du Dokumente und RAG in Open WebUI, damit lokale Chats auf eigenen Dateien arbeiten. Nach Prompts und Personas kommt eigenes Wissen ins Spiel. Eines der nützlichsten Features von Open WebUI ist die Möglichkeit, eigene Dokumente hochzuladen und das Modell direkt dazu zu befragen. Du lädst eine PDF hoch, stellst eine Frage, und das Modell antwortet auf Basis dessen was in der Datei steht. Das nennt sich RAG: Retrieval-Augmented Generation.

Was ist RAG?

Ein Sprachmodell hat ein festes Wissensdatum. Es kennt nichts was nach seinem Training passiert ist, und es kennt natürlich keine deiner privaten Dokumente. RAG löst das: bevor das Modell antwortet, wird das hochgeladene Dokument nach relevanten Textstellen durchsucht. Diese Stellen werden zusammen mit deiner Frage an das Modell übergeben. Das Modell antwortet dann auf Basis dieser Stellen, nicht nur aus seinem allgemeinen Wissen.

Stell dir vor du fragst: "Was steht in meinem Mietvertrag über Nebenkosten?" Ohne RAG würde das Modell eine allgemeine Antwort geben. Mit RAG liest es deinen Mietvertrag und antwortet konkret auf Basis deines Dokuments.

Wichtig zu verstehen

Das Modell liest nicht das gesamte Dokument auf einmal. Es sucht nach den relevantesten Abschnitten und arbeitet mit diesen. Bei sehr langen Dokumenten kann es passieren, dass wichtige Stellen nicht gefunden werden. Dazu mehr im Abschnitt über Grenzen.

Dokument direkt im Chat hochladen

Der einfachste Weg: Datei direkt in einen Chat ziehen oder über das Büroklammer-Symbol im Chat-Eingabefeld hochladen. Das Dokument ist dann nur für diese eine Unterhaltung verfügbar.

Datei hochladen

Im Chat das Büroklammer-Symbol anklicken oder die Datei per Drag-and-drop in das Chat-Fenster ziehen. Open WebUI verarbeitet die Datei und zeigt sie oberhalb des Eingabefelds an.

Frage stellen

Einfach eine Frage zum Inhalt eingeben. Das Modell durchsucht automatisch das Dokument und antwortet auf Basis der relevantesten Stellen.

Quellen prüfen

Open WebUI zeigt oft an aus welchem Abschnitt des Dokuments die Antwort stammt. Lohnt sich zu prüfen, besonders bei wichtigen Dokumenten.

Wissensdatenbank anlegen

Wer Dokumente dauerhaft verfügbar haben will, ohne sie jedes Mal neu hochzuladen, nutzt die Wissensdatenbank. Im Workspace unter "Wissen" lassen sich Sammlungen anlegen die in jedem Chat abrufbar sind.

Workspace öffnen

Links in der Seitenleiste auf "Workspace" klicken, dann "Wissen" auswählen. Dort auf "Neue Sammlung" klicken.

Dokumente hinzufügen

Der Sammlung einen Namen geben und Dokumente hochladen. Mehrere Dateien auf einmal möglich. Open WebUI verarbeitet sie im Hintergrund.

Im Chat einbinden

Im Chat das #-Symbol tippen und den Namen der Sammlung auswählen. Das Modell hat nun Zugriff auf alle Dokumente in dieser Sammlung.

Unterstützte Dateiformate

Open WebUI versteht die gängigen Formate. Das sind die wichtigsten:

.pdf

PDFs aller Art, auch mehrseitige

.txt

Einfache Textdateien

.md

Markdown-Dokumente

.docx

Word-Dokumente

.csv

Tabellen und Datenlisten

.html

Webseiten als Datei

Bilder und gescannte PDFs ohne Texterkennung funktionieren nicht. Das Modell braucht lesbaren Text, keine Bilddaten.

Wo die Grenzen liegen

RAG ist nützlich, aber kein Allheilmittel. Ein paar Dinge die ich selbst gelernt habe:

Sehr lange Dokumente. Bei einem 200-seitigen Handbuch findet RAG nicht immer die richtige Stelle. Je kürzer und fokussierter das Dokument, desto besser die Ergebnisse.

Tabellen und Zahlen. Strukturierte Daten wie Tabellen aus PDFs werden oft unzuverlässig extrahiert. Für Zahlenauswertungen lieber CSV oder eine einfache Textauflistung verwenden.

Das Modell kann halluzinieren. RAG reduziert das Problem, löst es aber nicht vollständig. Das Modell kann trotzdem Dinge ergänzen die nicht im Dokument stehen. Quellen immer prüfen.

Lokale Modelle und Dokumentqualität. Kleine lokale Modelle tun sich schwerer mit komplexen Dokumenten als große Cloud-Modelle. Bei anspruchsvollen Analysen lohnt sich der Wechsel zu einem größeren Modell.

Meine Erfahrung

Ich nutze RAG am liebsten für klar strukturierte Dokumente: Handbücher, Verträge, Protokolle. Dort liefert es zuverlässig gute Ergebnisse. Für komplexe Analysen oder wenn ich wirklich sicher sein muss, lese ich lieber selbst nach.

Der nächste sinnvolle Schritt

Wenn du diesen Teil verstanden hast, passen diese Seiten als Nächstes:

Häufige Fragen

Was bedeutet RAG in Open WebUI?

RAG ergänzt die Modellantwort mit passenden Textstellen aus deinen Dokumenten, statt das Modell neu zu trainieren.

Welche Dokumente eignen sich?

Klare PDFs, Textdateien, Markdown und gut strukturierte Inhalte funktionieren besser als Scans oder schlecht formatierte Dateien.

Warum beantwortet das Modell trotz Dokument falsch?

Dokumentqualität, Chunking, Suche und Modellgrenzen spielen zusammen. RAG reduziert Fehler, beseitigt sie aber nicht vollständig.

Zurück: System-Prompts und Personas Weiter: Benutzer, Netzwerk und Zugriff