Paperless-ngx – das papierlose Büro

Paperless-ngx ist eine selbst gehostete Dokumentenverwaltung. Das Prinzip ist einfach: Dokument einscannen oder als PDF hochladen, Paperless erledigt den Rest.

Was „der Rest" bedeutet: Paperless führt OCR über alle Dokumente aus – das heißt, der Text wird erkannt und indexiert. Jedes Dokument ist danach volltext-durchsuchbar. Brief von der Krankenkasse von 2019? Einfach nach einem Begriff suchen, der darin vorkam.

Mein Setup

Ich betreibe Paperless als Container auf einem gehosteten Server. Der läuft einfach, braucht keine Aufmerksamkeit und ist von überall erreichbar.

Der Eingang läuft komplett über E-Mail. Paperless liest automatisch ein definiertes Postfach aus – alles was dort landet, wird direkt importiert und verarbeitet. Das hat einen schönen Nebeneffekt: Mein Scanner ist darüber genauso angebunden. Scan-to-Mail, das Dokument landet im Postfach, und von dort übernimmt Paperless. Kein Kabel, kein manuelles Hochladen, keine Extra-App.

Ministral als KI-Helfer

Der interessante Teil ist die Klassifizierung. Ich nutze Ministral – ein kleines, schnelles KI-Modell – das nach dem Import nochmal über jedes Dokument läuft. Es setzt automatisch den Korrespondenten, vergibt Tags und ordnet den Dokumenttyp zu. Das klingt nach mehr als es ist: In der Praxis funktioniert es wie geschnitten Brot und komplett schmerzfrei. Man lädt hoch, und ein paar Sekunden später ist alles sauber einsortiert.

Das Ergebnis ist ein volltext-durchsuchbares, strukturiertes Archiv – ohne manuelle Arbeit, ohne Cloud-Anbindung bei Dritten, ohne dass Dokumente irgendwo hingeschickt werden.

Workflow: Dokument kommt per Post → Scanner → Scan-to-Mail → Postfach → Paperless liest ein → OCR → Ministral klassifiziert → fertig einsortiert. PDFs per Mail landen direkt im selben Postfach und laufen den gleichen Weg.

Klingt nach Aufwand beim Einrichten – ist es auch, einmalig. Danach passiert alles automatisch, und der Papierstapel auf dem Schreibtisch ist Geschichte.