Dokumente automatisch trennen in Paperless-NGX – Stapelscans sauber verarbeiten


Wer regelmäßig mit Paperless-NGX arbeitet, kennt das Problem:
Mehrere Dokumente liegen auf dem Tisch, der Scanner läuft – und am Ende hat man eine einzige große PDF-Datei, obwohl es eigentlich viele einzelne Dokumente sind.

Natürlich kann man diese Datei später manuell aufteilen.
Aber genau an dieser Stelle verliert ein papierloser Workflow unnötig Zeit.

Paperless-NGX bringt dafür eine saubere Lösung mit: automatische Dokumententrennung beim Import.
In diesem Artikel zeige ich, wie dieses Prinzip funktioniert, wie es im Alltag eingesetzt wird und greife dabei ein konkretes Praxisbeispiel aus einem Video auf.


Was bedeutet Dokumententrennung in Paperless?

Dokumententrennung bedeutet in diesem Zusammenhang:

Paperless erkennt beim Import, wo ein neues Dokument beginnt, und teilt einen Stapelscan automatisch in mehrere einzelne Dokumente auf.

Das passiert während des Imports, nicht danach.
Das Ergebnis sind sauber getrennte Dokumente im System – ohne manuelles Nachbearbeiten der PDF-Datei.

Wichtig ist dabei die Einordnung:
Dokumententrennung ist kein Archivkonzept, sondern ein reines Werkzeug für den Scan- und Importprozess.


Der klassische Anwendungsfall: Stapelscans

Ein typisches Szenario sieht so aus:

  • mehrere Briefe, Rechnungen oder Bescheide liegen bereit
  • alles wird in einem Durchgang gescannt
  • der Scanner erzeugt eine PDF-Datei

Ohne Dokumententrennung entsteht:

  • eine große PDF
  • mehrere Dokumente in einer Datei
  • zusätzlicher manueller Aufwand

Mit aktivierter Trennung erkennt Paperless:

  • hier endet ein Dokument
  • hier beginnt das nächste

und erledigt das automatisch.


Praxisbeispiel aus dem Video

Ein sehr anschauliches Beispiel zeigt dieses Video:

YouTube thumbnailYouTube icon

In dem Video wird demonstriert, wie Paperless-NGX einen Stapelscan verarbeitet und anhand von Trennmarkern automatisch neue Dokumente erkennt.

Der gezeigte Ablauf:

  1. Mehrere Dokumente werden als Stapel gescannt
  2. Zwischen den Dokumenten liegt jeweils ein Trennmarker
  3. Paperless importiert die PDF-Datei
  4. Der Consumer erkennt die Marker
  5. Der Stapelscan wird automatisch in einzelne Dokumente zerlegt

Das Ergebnis:
Jedes Dokument landet einzeln in Paperless, ohne dass PDFs manuell geschnitten werden müssen.


Trennblätter als Marker für neue Dokumente

Im Video werden sogenannte Trennblätter verwendet. Dabei handelt es sich um spezielle Seiten, die beim Scan ein eindeutiges Signal setzen:

Hier beginnt ein neues Dokument.

Ein verbreitetes Beispiel ist der Patch Code T, ein standardisiertes Trennblatt, das von vielen Scannern und Dokumentenmanagementsystemen unterstützt wird.

Das im Video verwendete Trennblatt kann hier heruntergeladen werden:

https://www.alliancegroup.co.uk/downloads/patch-code-t.pdf

Dieses Trennblatt:

  • wird zwischen zwei Dokumente gelegt
  • gehört nicht zum eigentlichen Dokument
  • wird nach dem Scan nicht archiviert
  • dient ausschließlich der automatischen Trennung

Wie Paperless diese Trennung technisch umsetzt

Die Dokumententrennung erfolgt – wie alle Importfunktionen – im Consumer von Paperless-NGX.

Beim Import passiert Folgendes:

  • jede Seite wird analysiert
  • es wird nach definierten Markern gesucht
  • wird ein Trennmarker erkannt:
    • endet das aktuelle Dokument
    • ein neues Dokument beginnt

Die Trennung erfolgt vor der Klassifizierung, dem Tagging oder der Zuordnung von Metadaten.


Abgrenzung zu QR-Codes und ASN

Wichtig ist die klare Trennung der Konzepte:

Trennblätter / Patch Codes

  • temporär
  • dienen ausschließlich der Trennung
  • werden nicht archiviert
  • ideal für große Stapelscans

QR-Codes / ASN

  • dauerhaft
  • Teil des Dokuments
  • dienen der Identifikation und Wiederfindbarkeit
  • gehören zum Archivkonzept

Beide Ansätze können in Paperless eingesetzt werden, lösen aber unterschiedliche Probleme.


Wann sich Trennblätter lohnen

Trennblätter sind besonders sinnvoll, wenn:

  • regelmäßig viele Dokumente hintereinander gescannt werden
  • der Scanner als Stapelscanner genutzt wird
  • PDFs ohne Nacharbeit importiert werden sollen
  • Geschwindigkeit im Vordergrund steht

Für einzelne Dokumente oder sehr kleine Scanmengen sind sie meist überdimensioniert.
Bei Stapelscans sparen sie jedoch erheblich Zeit.


Typische Stolpersteine aus der Praxis

Auch bei Trennblättern gilt:

  • Druckqualität ist entscheidend
  • ausreichender Kontrast ist notwendig
  • Scanner-Auflösung sollte passen

Wenn Trennungen nicht funktionieren, lohnt sich immer ein Blick in die Logs des Consumer-Containers, um zu sehen, ob der Marker erkannt wurde.


Einordnung in meinen Workflow

In meinem Alltag nutze ich Trennblätter gezielt dann, wenn:

  • viele Dokumente in einem Durchgang verarbeitet werden
  • der Scan-Prozess möglichst schnell laufen soll
  • ich später keine PDFs manuell anfassen möchte

Sie sind für mich ein Werkzeug für den Scan, nicht für die Ablage oder Strukturierung.


Fazit

Die automatische Dokumententrennung in Paperless-NGX ist eine sehr hilfreiche Funktion, wenn regelmäßig mit Stapelscans gearbeitet wird.

Trennblätter wie der Patch Code T:

  • beschleunigen den Import
  • vermeiden manuelle Nacharbeit
  • halten den Scan-Workflow sauber

Wer Paperless nicht nur als Archiv, sondern als echtes Dokumentenmanagement nutzt, sollte sich diese Funktion unbedingt ansehen.

Weitere interessante Artikel

ASN & QR-Codes in Paperless-NGX – mein einfacher Workflow mit einem Aktenordner

QR-Code- und ASN-Erkennung in Paperless-NGX – Technik, Konfiguration und Praxis

Schreibe einen Kommentar

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre, wie deine Kommentardaten verarbeitet werden.