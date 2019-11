OCR in der Rechnungsverarbeitung

OCR, oder optische Zeichenerkennung, bezieht sich auf Software, die in der Lage ist, geschriebenen Text oder gedruckte Briefe in ein digitales Format zu konvertieren. Es ist eine der wichtigsten Technologien hinter vielen modernen, automatisierten Lösungen. Allerdings wissen nicht viele Unternehmen nicht wie es funktioniert und warum es in so vielen Fällen verwendet wird. Deshalb ist es an der Zeit, diese erstaunliche Form der digitalen Automatisierung näher zu betrachten.

Textbasierte Dokumente begegnen uns in fast allen Lebensbereichen – vom Versenden

von Arbeits-E-Mails bis zum Unterschreiben eines Arbeitsvertrages. Viele von ihnen

sind auf unseren Laptops, Telefonen oder in der Cloud gespeichert, aber andere sind

gedruckt, handschriftlich oder in einem physischen Raum. Dies stellt eine besondere

Herausforderung dar, da Informationen im analogen Text nicht einfach von einem

Computer gelesen und verwendet werden können. Um es deutlicher zu machen,

erzeugt das Fotografieren eines Dokuments mit einer Kamera oder einem Scanner nur

ein digitales Bild, das aus Bildelementen mit unterschiedlichen Eigenschaften besteht.

Ein Computer kann das Bild anzeigen, reproduzieren oder bearbeiten, es aber nicht

verstehen. Um dies zu erreichen, benötigt das Gerät die Fähigkeit, ein Bild zu

betrachten und die abstrakten Formen zu erkennen, die wir Buchstaben und Zahlen

nennen. Kurz gesagt, ein Computer braucht die Fähigkeit zu lesen. Im folgenden Artikel

erklären wir wie die OCR-Technologie, im Kontext der Rechnungs- und Belegerkennung

funktioniert, und wie Ihr Unternehmen von den Vorteilen der OCR profitieren kann.

Wie liest und versteht die OCR Rechnungen

Die Extraktion von Informationen aus Papierdokumenten erfolgt in Anlehnung an die

Vorgehensweise. Der erste Schritt ist die Umwandlung der Papier oder PDF-Rechnung

in ein digitales Dokument wie z.B. ein PDF oder JPG. Dies geschieht in der Regel mit

einem Scan-Gerät oder einem Mobiltelefon. Sobald das Dokument digital ist, haben

Sie ein Bild des Dokuments, aber es gibt keine Informationen, die der Computer lesen

kann. Für den Computer ist es nur ein Bild und kein Text.

Anhand des Beispiels einer Rechnung demonstrieren wir Schritt für Schritt wie die OCR

funktioniert.

Digitalisierung durch Optical Character Recognition Software

Sie können entweder eine eigene OCR-Maschine entwickeln oder die OCR als SaaS

von einem Software-Provider nutzen. Unabhängig von der ausgewählten Lösung scannen

Sie Ihr Dokument auf Ihrem Scan-Gerät oder Mobiltelefon, welches eine OCR-Funktion

besitzt. Nun haben Sie das Dokument digitalisiert. Gleichzeitig wird das Bild in eine

unstrukturierte Textdatei konvertiert. Nach der OCR-Konvertierung liegt ein

Textdokument vor, aber für einen Computer ist die Textdatei noch nicht verständlich ist.

Zu beachten: Die Qualität der Rechnung spielt eine entscheidende Rolle bei der

automatischen Texterkennung. Eine Rechnung mit höherer Auflösung und Lesbarkeit

wird von der Software schneller und leichter erfasst. Wie liest die OCR?

Die OCR kann anhand von Machine-Learning Algorithmen gemeinsame Objekte und

Schlüsselwörter in unstrukturierten Texten erkennen. In der Textklassifizierung sucht die

Maschine beispielsweise nach Zielwerten, Schlüsselwörtern und Kategorien. Durch

Machine-Learning Algorithmen kann die OCR bestimmen, ob es sich um eine

Rechnung, einen Beleg, Passport, ID oder einen Vertrag handelt. Natürlich gibt es noch

etwaige andere Informationen, nach dem die OCR die Dokumente klassifiziert. Vor

allem bei der Rechnungserfassung sind Land, Sprache und Währung wichtig. Einige

OCR’s basieren auf selbstlernenden Algorithmen. Diese Algorithmen werden durch die

Eingabe von großen Datensätzen darauf trainiert unbekannte Daten zukünftig

selbstständig zu erkennen. Beispiel Daten-Parsen einer Rechnung Der nächste Schritt ist die Verwendung eines intelligenten Parsing-Systems, das den Text lesen, wichtige Informationen identifizieren und die richtigen Informationen extrahieren kann, um diese in einer Datenbank zu speichern. Wie oben schon beschrieben klassifiziert die OCR die Art von Dokument, die vorliegt. Nachfolgend wird die Rechnung nach bestimmten Schlüsselwörtern durchsucht. Pflichtfelder auf deutschen Rechnungen sind u.a. Händler-Adresse, Umsatzsteuer-Nummer, Rechnungsnummer und Rechnungsdatum.

Im Folgenden sehen Sie relevante Standardfelder die von einer Rechnungs-OCR

Software extrahiert werden wird:

Quelle: klippa.com

Zu beachten: Nachdem die OCR die relevanten Rechnungsdaten extrahiert hat, haben

Sie die Möglichkeit manuelle Korrekturen durchzuführen. Somit stellen Sie eine 100%

Genauigkeit her. Zukünftig erkennt die OCR die nachkorrigierten Felder automatisch,

was zu einer höheren automatischen Erkennungsrate führt.

Warum die automatisierte Texterkennung in Ihrem Unternehmen berücksichtigt werden

sollte

Durch den Einsatz einer OCR-Maschine können in erster Linie Kosten und

Zeiteinsparungen im Unternehmen erzielt werden. Das manuelle Auslesen von

Stammdaten von Rechnungen und Belegen gehört zu den Routineaufgaben in vielen

Unternehmen, insbesondere in den Sektoren Banking, Logistik, Transport und

Bauwesen. Diese Unternehmen benötigen zahlreiche Informationen aus Rechnungen

und Belegen, z.B um Finanzinformationen, Lieferaufträge oder Bestellungen im

Computer oder mobil zu erfassen. Wird die Dokumentverarbeitung automatisiert,

bedeutet dies im Regelfall, dass Ihre Mitarbeiter von Routineaufgaben entlastet

werden. Der Entfall schafft Freiraum für abwechslungsreichere, intelligenzfördernde

Aufgaben. Zudem beschleunigt OCR den Workflow in Ihrem Unternehmen im Vergleich

zum manuellen Auslesen und Eingeben von Informationen. Ein letzter, aber

bedeutender Vorteil ist, dass die Fehlerrate bei der Datenübertragung drastisch

reduziert wird. Fallstudien zeigen, dass die automatisierte Rechnungsverarbeitung mit

OCR bis zu 60% Kostenersparnis und eine positives ROI für Ihr Unternehmen erzielt.

Wenn Ihr Unternehmen ein hohes Volumen an eingehenden Rechnungen und Belege

verarbeitet, kann der Einsatz von autorisierter Texterkennungssoftware (OCR) ein hohes

Optimierungspotential für Ihr Unternehmen erzielen. Die Kosten und der Zeitfaktor, der

mit dem menschlichen Aufwand, sowie der Fehlerrate von manueller Datenerfassung

und Übertragung, assoziiert ist, kann drastisch reduziert werden. Durch technische

Schnittstellen können Sie Ihre OCR auslagern, was bedeutet, dass Sie Ihre Prozesse

schlanker gestalten können, ohne den Entwicklungsaufwand einer eigenen OCR. Somit

fokussieren Sie sich gezielter auf Ihr Kerngeschäft und treiben Ihr Unternehmen voran.