Skip to Content

FAQ: Probleme mit der OCR-Suche in Paperless (Word "Zertifikat")

October 7, 2025 by
Mário Santiago

Warum findet die Suche in Paperless das Wort "Zertifikat" nicht, obwohl es im Dokument steht?


Das liegt höchstwahrscheinlich an einem Fehler in der Optischen Zeichenerkennung (OCR), die Paperless (oder die zugrundeliegende Software) verwendet, um Text aus Bildern oder Scans zu extrahieren.

  • Fehlerhafte Zeichenerkennung: Die OCR-Software interpretiert das Wort "Zertifikat" möglicherweise falsch, z.B. als "Zerti kat" (wie im ersten Bildausschnitt zu sehen ist) oder mit anderen Tippfehlern ("Zerifikat", "Zertfikat").

  • Design-Elemente: Ungewöhnliche Schriftarten, Farben oder überlagernde Grafiken (wie das Medaillon) können die Erkennung der Zeichen, insbesondere der Umlaute (ä, ö, ü) oder Sonderzeichen (ß), stören.

Was kann ich tun, wenn die Suche nach dem vollständigen Wort fehlschlägt?

Versuchen Sie, nach Teilen des Wortes zu suchen, bei denen die Fehlerwahrscheinlichkeit geringer ist.

  • Suchen Sie nach Präfixen: Geben Sie nur "Zerti" oder "Zert" ein. Da die Software meist den Anfang eines Wortes korrekt erkennt (siehe das Beispiel im ersten Bild: "Zerti kat"), erhöht dies die Trefferquote erheblich.
  • Suchen Sie nach dem Substantiv: Suchen Sie alternativ nach dem englischen Titel "Cyber Security Awareness", da dieser Text oft klar und ohne Unterbrechungen gedruckt ist und daher von der OCR gut erkannt wird.
  • Verwenden Sie einen Platzhalter (falls unterstützt): Manche Suchfunktionen unterstützen Platzhalter wie * oder ?. Wenn Paperless dies erlaubt, könnten Sie nach Zertif*kat oder Zerti?ikat suchen.

Wie kann ich dieses Problem in Zukunft vermeiden?

Um die Zuverlässigkeit der OCR zu verbessern, können Sie Folgendes tun, bevor Sie ein Dokument in Paperless hochladen:

  • Verbessern Sie die Bildqualität: Achten Sie darauf, dass Scans oder Fotos von Dokumenten scharf, gut beleuchtet und gerade sind. Eine höhere Auflösung kann ebenfalls helfen.
  • Kontrast optimieren: Stellen Sie sicher, dass der Text einen hohen Kontrast zum Hintergrund hat (z.B. dunkle Schrift auf hellem Papier).
  • Manuelle Korrektur (falls nötig): Bei wichtigen Dokumenten können Sie nach dem Upload in Paperless den extrahierten Text (falls Paperless diese Funktion bietet) manuell korrigieren, um das Wort "Zertifikat" einzufügen.
Suchen in Paperless
Cheat-Sheet