Was ist die optische Zeichenerkennung Software?

December 5

Die Möglichkeit, ein Dokument in maschinenlesbarer Form zu scannen ist eine unvergleichliche Zeitersparnis. Statt erneut einzugeben, das Dokument, und möglicherweise Störungen der eigenen einfügen können es zu scannen und das gescannte Bild durch eine Software-Reader übergeben eine bearbeitbare Dokument mit einem hohen Maß an Genauigkeit im Vergleich zum Original führen. Dieser Software-Prozess heißt optische Zeichenerkennung.

Optische Zeichenerkennung

Optische Zeichenerkennung (OCR) ist ein Prozess, in dem gedruckten oder handschriftlichen Text ist mechanisch oder elektronisch lesen und konvertiert in eine Form, die von einem Computer erkannt. Der anspruchsvolle Prozess betrachtet die Formen der Buchstaben und vergleicht sie mit einer Bibliothek von ähnlichen Formen. Wenn eine Übereinstimmung vorliegt, wird ein Muster darstellen Zeichen auf dem Bildschirm angezeigt oder in eine Computerdatei eingeben. OCR macht es möglich für ein Dokument gescannt und von einem Computer gelesen werden, erstellen eine Datei, die bearbeitet oder gehandelt werden kann, auf andere Weise.

OCR-Software

Computer-Software ist für moderne OCR-Implementierung verwendet. Die Software hat von seinen frühesten Tagen vorgerückt in dem die Programme hatte für jede eindeutige Schriftart kalibriert werden, wie es erwartet wurde, zu erkennen. Es steht in eigenständiger Form als ein Programm speziell für die Aufgabe erstellt, und als Komponente in der Scan-Software. Das Aufkommen des Internet und Cloud computing-zur Entwicklung von Web-basierte OCR-Programmen, wodurch die Notwendigkeit für individuelle Desktop- oder Server-Installationen geführt hat.

Der Erkennungsvorgang

OCR-Software-Funktionen durch die erste Anerkennung der Unterscheidung zwischen hellen und dunklen Bereichen des gescannten Bildes. Als es eine hell-dunkel-Unterscheidung entdeckt, sucht die Software nach erkennbaren Muster, wie z. B. vertikale und horizontale Linien sowie angeschlossenen oder partielle Kurven. Wenn sie eine Muster als einen Brief oder ein anderes Zeichen erkennen kann, sucht es seiner Datenbank für das entsprechende Zeichen in der Computer-Sprache-auf. Anschließend übergibt Sie dieses Zeichen auf das Dokument oder die Anzeige, die es Montage ist. Die Software nicht in der Lage, ein Zeichen zu erkennen ist, kann seine beste Vermutung zu machen oder ein alternatives Zeichen zu ersetzen, um den Prozess gehen zu halten.

Potenzielle Probleme mit OCR-Software

Da die OCR-Software auf Mustererkennung angewiesen ist, ist jedes Artefakt auf der Seite, die möglicherweise diesen Prozess beeinflussen können eine Quelle von Problemen. OCR funktioniert am besten wenn es eine klare Unterscheidung zwischen Zeichen und Hintergrund des Dokuments, im Idealfall schwarz auf weiß gibt. Farbige oder beschäftigt Hintergründe, die das Muster weniger ausgeprägtes machen können zu Problemen führen. Flecken, Falten und andere Schäden an das Dokument führt zu falschen Zeichenerkennung.