Mikrofon, Umgebung, Pegel und Sprechweise: die einfachen Stellschrauben für zuverlässigere Transkripte.
Hier verbesserst du Whisper-Transkripte über Mikrofon, Umgebung, Pegel und klare Sprechweise. Nach der Modellwahl kommt die zweite große Stellschraube: die Aufnahme selbst. Whisper ist gut. Aber wie gut es wird, hängt zu einem großen Teil nicht vom Modell ab, sondern von dem was das Modell zu hören bekommt. Schlechte Aufnahme ergibt schlechten Text. Gute Aufnahme ergibt sehr guten Text.
Das Mikrofon
Das ist der wichtigste Faktor. Ein schlechtes Mikrofon, weit weg vom Mund oder mit viel Rauschen, ist die häufigste Ursache für fehlerhafte Transkriptionen. Ich habe das selbst erlebt: nach dem Wechsel auf ein einfaches USB-Headset wurde das Ergebnis deutlich besser.
Abstand zum Mikrofon
20-30 cm sind ideal. Zu weit weg klingt dumpf und undeutlich. Zu nah entstehen Atemgeräusche und Zischlaute. Bei einem Headset sitzt das Mikrofon automatisch im richtigen Abstand.
Mikrofon-Empfehlung
Ein einfaches USB-Headset für 20-40 Euro ist schon ein enormer Schritt vorwärts gegenüber dem eingebauten Notebook-Mikrofon. Kein Audiophilen-Equipment nötig. Ich nutze ein günstiges Headset und es reicht vollkommen.
Gain-Einstellung prüfen
Wenn das Mikrofon zu leise oder übersteuert aufnimmt, wird Whisper Fehler machen. In den Systemeinstellungen den Aufnahme-Pegel prüfen und anpassen. Ziel: Aussteuerung im grünen Bereich, nie in Rot.
Die Umgebung
Hintergrundgeräusche sind Whispers Feind. Nicht weil Whisper damit nicht umgehen kann, sondern weil es Rechenkapazität kostet und Fehler provoziert. Was konkret stört:
Lüfter und Ventilatoren
Dauerhaftes gleichmäßiges Rauschen wird von Whisper oft als Sprachgeräusche interpretiert. Besonders bei leisen Passagen. Wenn möglich während der Aufnahme abschalten oder den Rechner in den Energiesparmodus setzen.
Musik und TV im Hintergrund
Das verwirrt Whisper massiv. Sprache im Hintergrund wird mittranskribiert, oft durcheinander mit deiner eigenen Stimme. Immer in Stille oder mit Kopfhörern diktieren.
Tastaturgeklapper
Klingt harmlos, landet aber in der Aufnahme. Bei direktem Diktat am Rechner empfehle ich kurze Pausen zwischen Tippen und Sprechen, oder ein Headset mit Rauschunterdrückung.
Wie du sprichst
Whisper kennt keinen Kontext. Es weiß nicht worum es in deinem Text geht. Deshalb hilft es Whisper wenn du klar und vollständig formulierst.
Vollständige Sätze sprechen
Halbe Sätze, Abbrüche, gedachte Ergänzungen. Das alles landet im Text so wie du es sagst. Oder wird weggelassen. Besser: vollständige Sätze von Anfang bis Ende sprechen.
Fachbegriffe langsam und deutlich
Namen, Produktbezeichnungen, technische Begriffe. Diese Wörter kennt Whisper möglicherweise nicht. Langsam und deutlich gesprochen erhöht die Trefferquote. Bei wichtigen Eigennamen kann es trotzdem Sinn machen, diese manuell zu korrigieren.
Absätze manuell setzen
Satzzeichen setzt Whisper automatisch und sehr zuverlässig. Absätze dagegen nicht, auch wenn du "neuer Absatz" sagst. Die setze ich immer manuell nach der Transkription. Das ist der einzige Handgriff der immer bleibt.
Meine Erfahrung
Die größte Qualitätssteigerung war für mich ein besseres Mikrofon kombiniert mit ruhiger Umgebung. Whisper kümmert sich selbst um Rechtschreibung und Satzzeichen. Was bleibt: Eigennamen gelegentlich korrigieren und Absätze manuell setzen.
Der nächste sinnvolle Schritt
Wenn du diesen Teil verstanden hast, passen diese Seiten als Nächstes: