Was ist ein OCR-Scanner?

February 27

Optical Character Recognition (OCR) ist eine Technik, die Dateneingabe, die eine bestimmte Schriftart verwendet und ein OCR-Scanner, das Zeichen zu lesen und an Ihren Computer senden. Das American National Standards Institute oder ANSI, definiert die Schriftart als einen Satz von Zeichen 0-9, A bis Z und ein paar Sonderzeichen jeweils eine definierte Größe und Form. OCR-Fonts sind reproduzierbar und Menschen und OCR-Scannern gelesen und sie unterscheiden können.

Kategorien

OCR-Scannern sind entweder Texteingabe oder Data Capture Scanner. Text-Input-Scanner lesen Sie das gesamte Dokument oder zumindest große Teile davon. Dateneingabe kann sein Hand gefüttert oder des Scanners kann automatische Fütterung, lesen, Sortieren und Stapeln-Funktionen. Wenn einen Texteingabe-Scanner verwenden, erfolgt die Bearbeitung entweder während oder nach dem Scannen. Daten Capture Scanner erfassen und Formatieren von Daten während der Scan-Prozess und keine menschliche Bearbeitung der Daten erfolgt. Aus diesem Grund müssen die Datenerfassung Scanner genauer sein.

Typen

Stationäre oder handgeführte möglich Scanner-Typen. Stationäre Scanner, wie Flachbett, Bogen- und Trommel-Scanner verwenden hauptsächlich Texteingabe zu lesen, Prozess und Daten-Images auf Ihrem Computer ablegen, wo Sie dann bearbeiten oder anderweitig erfassten Text formatieren. Handscanner, wie z. B. digitale Stifte oder Barcode-Scanner, mit Texteingabe oder Data Capture zu lesen und Daten Daten verarbeiten und speichern Sie es dann für spätere Bearbeitung oder "Sperren" Daten bearbeiten zu verhindern.

Methoden

Kurz, ein OCR-Scanner nimmt ein Bild des Dokuments und dann die OCR-Scanner-Software untersucht die OCR Schriften, die das Bild enthält, und dann liest und konvertiert es in Text mit einer Matrix Matching oder Feature Extraction-Methode. Matrix-Matching ist eine Form des Mustervergleichs wo der Scanner sieht ein Zeichen und vergleicht ihn mit ein in seine Bibliothek von Zeichen oder Zeichen-Vorlagen. Feature-Extraktion ist nicht auf eine vordefinierte Bibliothek, sondern auf allgemeine Funktionen wie Freiflächen, geschlossene Formen und sich überschneidenden Linien angewiesen, wenn Zeichen zu entziffern. Feature Extraction geht auch unter dem Namen Intelligent Character Recognition oder ICR.

Vorteile

Der bedeutendste Vorteil der Verwendung eines OCR-Scanners ist die Abschaffung der menschliche Fehler bei der Dateneingabe. OCR-Scannern gelesen Daten in Geschwindigkeiten, die mehr als 200 Zeichen erreichen können pro Sekunde. Die Treffsicherheit eines OCR-Scanner ist 99.9975 Prozent oder ein Zeichen falsch in 40.000, im Vergleich zu einer menschlichen misread Rate von einer in 300 Zeichen. Automatische Überprüfung Ziffer Validierung kann die OCR-Genauigkeit-Rate für weniger als 3.000.000 bringen.

Überlegungen zur

Schlechte Qualität originale führt zu weniger präzise OCR-Dokumente. Handschriftliche Dokumente, Dokumente mit Stil, Text, ältere Dokumente, Fotokopien und am meisten gefaxte Dokumente funktionieren nicht gut mit OCR-Scannern. Empfehlungen für akzeptable Dokumente gedruckten Text in einen Schriftgrad von weniger als 72 Punkt, Laser- und Ink-Jet Drucker Text einschließen, fax-Dokumente mit 200 Punkten pro Zoll (dpi) oder höhere Auflösung und professionell gedruckte Materialien wie Bücher, Broschüren und Zeitschriften.