So funktioniert ein OCR Scanner

FanomenaLeads_OCR-Scanner

OCR steht für Optical Character Recognition und wird im deutschen auch als Zeichenerkennung bezeichnet. Bei einem OCR Scanner macht der Scanner ein Bild und die OCR Technologie erkennt die Zeichen. Ohne diese Technologie würde der Scanner lediglich ein Foto aufnehmen, das Pixel abbildet, die sich in verschiedenen Spalten und Zeilen befinden. Erst durch die OCR Technologie kann vom Computer erkannt werden, dass es sich bei den nebeneinanderliegenden Pixeln um Buchstaben und Zahlen handelt.

Vorteile der OCR Technologie

Die analoge Alternative zu der OCR Technologie ist das Abtippen der Inhalte. Das nimmt zum einen viel Zeit in Anspruch und führt unter Anderem auch zu Tippfehlern. Durch eine digitale Erfassung, beispielsweise mit Hilfe eines Scanners und einer anschließenden Analyse durch die OCR Technologie, kann daher eine bessere Datenqualität garantiert werden. Außerdem werden die Geschäftsprozesse effizienter, da die Dateneingabe wegfällt, wodurch gleichzeitig Zeit und Personal eingespart werden kann. Zusätzlich wird die Archivierung von Dokumenten einfacher. Viele Unterlagen müssen aus rechtlichen Gründen einige Jahre aufbewahrt werden, was durch eine Digitalisierung einfacher und kostengünstiger erfolgen kann. Es ist kein Abheften mehr nötig und es muss kein physischer Lagerplatz für die Akten eingerichtet werden. Die Erfassung analoger Dokumente mit Hilfe der OCR Technologie bietet somit viele Vorteile, die nachfolgend nochmal zusammengefasst sind:

  • Besser Datenqualität
  • Effizientere Prozesse
  • Kosteneinsparung durch weniger Personal
  • Einfachere Archivierung

Einsatzmöglichkeiten von OCR Scannern

Bei der Überweisung schnell die Rechnung fotografieren und alle Daten werden übernommen? Keine Zauberei, auch hier wird OCR Technologie eingesetzt. Diese erkennt die IBAN und weitere wichtige Informationen und füllt den Überweisungsträger entsprechend aus. In der Buchhaltung kann die Technologie ebenfalls dementsprechend eingeführt werden, damit beispielsweise eingehende Rechnungen direkt von der Buchhaltungssoftware verarbeitet werden können.

Auch für Blinde kann die Technologie eingesetzt werden, indem die OCR Technologie eingescannte Dokumente erkennt und für einen Screenreader lesbar macht, der das Dokument anschließend akustisch wiedergibt. Hilfreich ist die Technologie auch bei anderen eingescannten Dokumenten, die so bearbeitbar und vom Computer lesbar gemacht werden können. Aber auch bei PDF Dokumenten oder bei einem Digitalfoto kann die OCR Technologie die Buchstaben und Zahlen erkennen.

Des weiteren können Visitenkarten durch einen OCR Scanner abgescannt werden, wodurch garantiert alle Kontaktdaten richtig erfasst werden. Aufgrund dessen hat auch Fanomena Leads die OCR Technologie in ihrer Lösung integriert, damit die Visitenkarten auf Messen zuverlässig erfasst werden und direkt ins CRM übertragen werden können.


Aber nicht nur Dokumente, die Computern geschrieben wurden können erkannt werden. Es ist durch die Weiterentwicklung der Technologie zudem möglich Handschriften zu erkennen. Hierfür wird die OCR Technologie beispielsweise bei der Post eingesetzt, die anhand der handschriftlichen Adresse die richtige Zuordnung durchführt.

Wie funktioniert ein OCR Scanner?

In den Anfängen der OCR Technologie wurden eigene Schriftarten entworfen, die die Erfassung durch die Technologie vereinfachen sollte. Diese Schriftart war so konzipiert, dass es eine Unterscheidung beispielsweise zwischen einer 8 oder einem B einfacher durchgeführt werden konnte. Weiterentwicklungen haben jedoch dazu geführt, dass alle Schriftarten und sogar handschriftlich geschriebene Texte erkannt werden können. Im folgenden wird erklärt, wie die OCR Technologie beim erfassen eines Dokuments vorgeht.

Die Funktionsweise der OCR Technologie kann wesentlich in fünf Schritte unterteilt werden:

1. Layoutanalyse: In einem ersten Schritt unterteilt die Technologie die gescannte Datei in relevante Teile (Schrift) und irrelevante Teile (Bilder, Weißflächen).

2. Zerlegung des Textes: Als nächstes werden die einzelnen Textblöcke zerlegt. D.h. Abschnitte werden in Sätze zerlegt, Sätze in Wörter und Wörter schließlich in Buchstaben.

3. Erkennung der Buchstaben und Zahlen: Da jetzt alle Abschnitte in einzelne Buchstaben und Zahlen zerlegt wurden, fängt der Algorithmus an diese mit vorhandenen Mustern aus der Datenbank zu vergleichen. Dadurch identifiziert er einzelne Buchstaben.

4. Zusammensetzung zu Wörtern und Sätzen: Als nächstes werden die Buchstaben wieder zu Wörtern zusammengefügt und anhand eines Wörterbuchs wird geprüft, ob die Wörter korrekt sind oder ob sich Fehler eingeschlichen haben. Dadurch kann ein „B“ beispielsweise von einer „8“ unterschieden werden, denn Wörter wie 8eispiel machen in der Regel keinen Sinn. Die Wörter werden dann auch schließlich wieder zu Sätzen zusammengeführt und an der richtigen Stelle im Dokument platziert. Die Sätze werden durch ein Grammatikprogramm geprüft, bis schließlich eine digitalisierte Version des eingescannten Dokuments existiert.

5. Text speichern: Der Text ist nun fertig und die Datei kann gespeichert werden. Anschließend kann sie in ein beliebiges Textformat umgewandelt werden. 

Das könnte Sie auch interessieren…

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert