Use-Cases · Vom Posteingang zur Buchhaltung

Vom Posteingang zur Buchhaltung

Smarte Rechnungsextraktion für KMU: E-Mail-Postfach anbinden, Anhänge erfassen, Inhalte verlässlich auslesen, prüfen und strukturiert an DMS/ERP/Excel/Buchhaltung übergeben – on‑premise, und mit klaren Verantwortlichkeiten.

Kurzfassung in 30 Sekunden

Einleitung

Rechnungen trudeln per Post oder per E‑Mail ein, PDF‑Anhänge sammeln sich im Sammelpostfach. Zuständigkeiten sind unklar, Skonti verfallen und Mahnungen entstehen – Alltag in vielen KMU. Mit der 1 %‑Methode bringen wir Struktur hinein: kleine, nachhaltige Schritte statt teurer Großprojekte.

Lösung: Schritt für Schritt

1

Dokumentenarchiv mit Paperless‑NGX

Zentrale, lokale Ablage (z. B. NAS/Docker) mit integrierter OCR (Tesseract, OCRmyPDF), Tags/Feldern und direktem E‑Mail‑Import. Ergebnis: Rechnungen sind auffindbar, revisionsnah dokumentiert und sauber klassifiziert. Paperless NGX

2

Automatisierte Vorverarbeitung per App/Workflow

Das Postfach wird überwacht, Anhänge geladen, zentrale Felder (Lieferant, Datum, Betrag, UID/MwSt, Fälligkeit) extrahiert und z. B. in Excel/Airtable/CSV zur Übersicht abgelegt. So behalten Sie offene Rechnungen und Fristen im Blick. Paperless kann direkt IMAP-Postfächer überwachen und Anhänge laden. Für ein Daten-Parsing können Sie eine Python App oder einen Workflow (n8n) verwenden.

3

KI‑gestützte Varianten bei Dokumentenvielfalt

Für gemischte Formate (digitale PDFs, Scans, Handschrift) kommen robuste OCR‑ und LLM‑Modelle zum Einsatz (Mistral OCR, Mistral LLM). Sie reduzieren Vorlagenpflege, normalisieren Felder und liefern strukturierte Daten auch bei schwankender Qualität.

Umsetzung im Detail

  1. Eingang: IMAP‑Postfach überwachen und Dubletten anhand Message‑ID/Hash abfangen.
  2. Texterkennung: Direkter PDF‑Text (PyMuPDF) mit OCR‑Fallback (Tesseract) für Scans oder Mistral OCR.
  3. Parsing: Lieferant, Rechnungs‑/Belegdatum, Rechnungsnummer, Positionen, Summen, IBAN/BIC, Zahlungsziel. Dieser Schritt wird durch z.B. eine Python App von mir oder einen Workflow erledigt (n8n).
  4. Validierung: Plausibilitäten (Summe Positionen = Gesamt, IBAN‑Prüfziffer, MwSt, Duplikate, Pflichtfelder). Damit man schon eine gute Ausgangslage für eine weitere Verarbeitung hat.
  5. Übergabe:
    • DMS (z. B. Paperless‑NGX) inkl. Metadaten (Tags, Lieferant, Datum, Total) und Dateiablage.
    • Oder vorher extrahierte Daten an Excel/Airtable/CSV übergeben. Je nach Zielformat. Für die Buchhaltung können Sie die Daten per API/CSV‑Import an die Buchhaltung übergeben.
  6. Benachrichtigungen & Aufgaben: Ausnahmen als Ticket/Task an definierte Rollen (Eingang, Prüfung, Freigabe).
  7. Invoicetomails

Validierungsregeln (Auszug)

  • IBAN-Check (Prüfziffer), optional Abgleich mit dem Lieferantenstamm.
  • Summen-Konsistenz: Netto + MwSt = Brutto; Summe Positionen = Brutto.
  • Duplikate: Kombination aus Rechnungsnummer + Lieferant + Gesamtbetrag + Datum.
  • Pflichtfelder: Lieferant, Rechnungsnummer, Belegdatum, Zahlbetrag, Fälligkeitsdatum.
  • RechnungsdatumFälligkeitsdatum – Zahlungsziel plausibel.

Datenschutz & Betrieb

  • On‑Premise: Verarbeitung in Ihrer Infrastruktur (Docker, Synology, Linux/Windows‑Server) – volle Datenkontrolle.
  • Protokolle: Nachvollziehbarkeit pro Beleg (Status, Regeln, Verantwortliche, Zeitstempel).
  • Rollen: klare Trennung für Eingang, Prüfung, Freigabe. Wir definieren die Rollen und die Prozesse gemeinsam.

Tech‑Stack (Beispiel)

  • Automatisierung: Python, n8n, Node.js, Paperless, LLMs
  • Extraktion: Python (PyMuPDF), OCR‑Fallback (Tesseract), optional LLM‑gestützt (Mistral OCR, Mistral LLM)
  • DMS: Paperless‑NGX (oder andere DMS)
  • Frontend: Next.js (Dashboard/Monitoring optional), falls z.b. der Datenfluss über ein Dashboard visualisiert werden soll.
  • Deployment: Docker‑Container, on‑prem, oft reicht ein ausgemusterter Rechner
  • Tech Stack

Vergleich der Ansätze

Paperless‑NGX (Archiv, Extraktion)

Vorteile: Kostenlos, lokal, volle Datenkontrolle, einfache Installation

Grenzen: Keine automatische Datenextraktion zwecks Validierung und Übergabe. Aber Paperless hat eine API, somit kann man die Daten auch per API nachträglich an die Buchhaltung übergeben.

Typisch: Dokumentenarchiv & Suche. Für alle Dokumente geeignet

Eigene App / Workflow (Extraktion, Validierung, Datenaufbereitung)

Vorteile: Automatisierte Felder, flexible Integrationen (Excel, Airtable, CSV, Buchhaltung) vor der Ablage an z.B. Paperless

Aufwand: Einrichtung, Lieferanten‑Vorlagen. Lieferanten‑Vorlagen können auch mit LLMs erstellt werden.

Typisch: KMU mit wiederkehrenden Lieferanten

KI‑gestützte Lösung

Vorteile: Funktioniert auch bei handschriftlichen Scans, weniger Vorlagenpflege, skalierbar (Mistral OCR, Mistral LLM)

Hinweis: Höhere technische Ansprüche, variable Kosten (Mistral OCR 1$ pro 1000 Seiten). Sehr gut geeignet für alle Formate und Dokumentenvielfalt.

Typisch: Viele Formate & Dokumentenvielfalt

Aufwand & Nutzen (Richtwerte)

  • Einrichtung & Pilot (1–2 Lieferanten): wenige Tage
  • Erweiterung: iterativ je nach Formatqualität
  • Typische Effekte: 50–80 % weniger manueller Datei‑/Feldaufwand, geringere Fehlerquote, bessere Suchbarkeit

FAQ

Funktioniert das ohne ERP / Buchhaltung?
Ja. Start mit DMS‑Ablage + strukturierter CSV/JSON‑Export möglich. Ein späterer ERP‑API‑Anschluss ist optional. Die extrahierten Daten können für Sie in unterschiedliche Formate in unterschiedlichen Systemen verarbeitet werden.
Wie gehen wir mit Ausnahmen um?
Regeln markieren Ausnahmen (z. B. fehlende IBAN). Automatisch wird ein Task erzeugt; Mitarbeitende korrigieren gezielt. Alle technischen Details werden von mir erledigt und auch dokumentiert. Sie werden zu jederzeit genau wissen wo was passiert.
Wie bleiben wir flexibel?
Lieferantenspezifische Extraktionsmuster können als Vorlagen gepflegt und erweitert werden – ohne Vendor‑Lock‑in.
Können wir über andere Dokumente reden?
Na klar, die Optionen mit Python, Paperless und Mistral OCR sind überall anwendbar wo Daten aus Dateien extrahiert und evaluiert werden müssen.

Fazit

Starten Sie pragmatisch: zuerst die zentrale Ablage, dann die automatische Extraktion – und dort, wo es Mehrwert stiftet, optional KI. So werden Rechnungen nicht nur archiviert, sondern vor allem nutzbar: für Controlling, Analysen und die Finanzbuchhaltung. Das Prinzip lässt sich auf weitere dokumentintensive Prozesse übertragen; nahezu jede Dokumentart kann so verarbeitet werden. Alles bleibt modular und flexibel: Sie können einzelne Schritte automatisieren und andere bewusst manuell belassen – Leitprinzip ist Pragmatik.

Gern berate und inspiriere ich Sie bei der passenden Ausbaustufe. Oft entstehen aus kleinen, gezielten Implementierungsschritten rasch neue Ideen für weitere Automatisierungen. Dank der jüngsten Fortschritte in der KI – insbesondere bei Agentensystemen – eröffnen sich heute Lösungen, die noch vor Kurzem aufwendig waren.

Ich kenne die Realität kleiner Unternehmen und finde gemeinsam mit Ihnen die beste, schlanke Lösung – praxisnah, budgetbewusst und erweiterbar.

zurück zu allen Use‑Cases