ABBYY FineReader
Die Software Abbyy FineReader basiert auf der OCR-Technologie und erzeugt aus bestimmten Vorlagen Texte, die vollständig bearbeitbar und durchsuchbar sind. Bei den Vorlagen kann es sich um gescannte Papierdokumente, PDF-Datein oder Digitalbilder handeln. Die Daten können aus Dokumenten und Bildern extrahiert und in leicht zugängliche Formate umgewandelt werden. Die in eine Textdatei konvertierten Daten können in den Formaten DOC, PDF, XML, CDY oder HTML gespeichert werden. Für die bequeme Bedienung kann der Abbyy FineReader vollständig in die gängigen Office-Anwendungen integriert werden.
Die eingelesenen Dokumente werden vom Abbyy FineReader in einer Zwei-Fenster-Ansicht dargestellt, in der sowohl der originale, als auch der umgewandelte Text betrachtet werden kann. Eine Rechtschreibkorrektur ist integriert. Dennoch können kleine Fehler entstehen, die aber in der Regel sofort erkannt werden. Zudem kann die Software beispielsweise auch das Layout von Zeitungsausschnitten oder Buchtexten übernehmen. Durch die umfangreiche Sprachunterstützung erkennt die Software die Sprache eines Textes selbstständig. Mit Hilfe der bedienerfreundlichen Benutzeroberfläche können sich auch Anfänger relativ schnell in dem Programm zurecht finden.
Betriebssystem: Windows XP oder höher | FineReader 10 | FineReader 9.0 Pro | FineReader 8.0 Pro
Readiris 12
Das OCR-Programm Readiris wurde von der Firma I.R.I.S. entwickelt. Schon 1987 spezialisierte sich I.R.I.S. auf Optical Character Recognition. Mit Readiris wandelt man print- und auch handgeschriebene Vorlagen in ein Textdokument auf dem Computer um. So lassen diese sich problemlos weiter verarbeiten, ohne es beispielsweise abtippen zu müssen. Das Besondere an Readiris 12 ist, dass die OCR-Software 120 verschiedene Sprachen und deren Zeichen erkennt. Dazu gehören auch Sprachen nicht lateinischen Ursprungs, wie Chinesisch und Russisch.
Man kann das Textmaterial über den am PC angeschlossenen Scanner einlesen. Auch Bildmaterial lässt sich mit Readiris 12 umwandeln. Dieses sollte in den Formaten BMP, JPEG, PNG oder TIFF vorliegen. Die eingelesenen Dateien werden als DOC, RTF, PDF oder auch HTML ausgegeben. Für die Umwandlung einer Handschrifterkennung gibt es ein Trainingsformular, dass im mitgelieferten Handbuch beschrieben wird. Auch Layouts und Tabellen werden durch Readiris erkannt. Readiris 12 ist damit eine Texterkennungssoftware, die viele Bereiche der Texterkennung abdeckt. Die neue Version 12 zeichnet sich durch eine noch schnellere Bearbeitung aus.
Betriebssystem: Windows, Mac. | Readiris Home 12 | Readiris Pro 12 | Readiris Corporate 12
Corel OCR-Trace
Corel OCR-Trace entwickelte die kanadischen Firma Corel. Diese Firma ist nicht nur für ihre Texterkennungssoftware bekannt, sondern vor allem für Bildbearbeitungs- und Grafikprogramme. CorelDRAW gehört zu den bekanntesten Vektorgrafikprogrammen. Das Programm Corel OCR-Trace ist in dem Set von CorelDRAW enthalten.
Für CorelDRAW benötigt man vor allem dann ein OCR-Programm, wenn Bilddateien in Vektorgrafiken umgewandelt werden sollen. Dies übernimmt die Software Corel OCR-Trace. Es kann Bilder für die Vektorgrafikbearbeitung in CorelDRAW umwandeln. Es konvertiert also ein Bild direkt in CorelDRAW, um es dort weiter zu bearbeiten. Dafür muss man den OCR-Trace starten, das Bild einlesen und dieses als Vektorgrafik speichern. OCR-Trace ermöglicht weitere Einstellungen, wie die Knotenanzahl oder Farbeinstellungen. Der Kompromiss zwischen Qualität und Dateigröße hängt jeweils vom Bild ab. Für die Vektorgrafikbearbeitung ist Corel OCR-Trace also unersetzlich.
Außerdem kann man mit OCR-Trace auch gescannte Textdokumente erkennen und in eine Datei umwandeln. OCR Trace erkennt gescannte Seiten ab einer Auflösung von 300 dpi. Es hat ein Rechtschreibprogramm integriert, dass kleinere Fehler korrigiert.
Betriebssystem: Windows | CorelDraw Vollversion | CorelDraw Student
Adobe Acrobat
Die OCR-Software Adobe Acrobat wurde von Adobe Systems entwickelt. 1993 brachte Adobe Systems den ersten Adobe Reader heraus, der anfangs noch kostenpflichtig war. PDF-Dokumente im Browser anzuzeigen, war erstmals 1996 möglich. Im Laufe der Zeit sind regelmäßig neue Versionen veröffentlicht worden. Als aktuelle Version des Adobe Acrobat ist die Version 9 auf dem Markt.
Mit der Adobe Acrobat-Software können PDF-Dateien gelesen, erstellt und verwaltet werden. Das kostenpflichtige Programmpaket bietet zudem eine weitgehende Unterstützung von digitalen Unterschriften und von Verschlüsselungstechnologien. Durch die automatische Zeichen- und Schrifterkennung kann die Software gescannte Vorlagen in einen durchsuchbaren Text umwandeln. Dabei bietet Adobe Acrobat die Möglichkeit, Scannen, Texterkennung und Umwandlung in einem Arbeitsschritt zu erledigen – es müssen nur die richtigen Einstellungen ausgewählt werden. Der Text wird anschließend mit Hilfe von OCR erkannt und im PDF-Format gespeichert. Allerdings wird eine Scannerauflösung von mindestens 72 dpi benötigt, um OCR auf ein PDF-Dokument anwenden zu können.
Betriebssystem: Windows, Mac | Adobe Acrobat 9 Standard | Adobe Acrobat 9 Pro Windows | Adobe Acrobat 9 Pro MAC
BIT-Alpha
Eine nicht ganz so gängige Zeichenerkennungs-Software ist BIT-Alpha. Das Programm verwandelt Papierdokumente, PDF-Dateien und Digitalbilder in digitale Texte um, die weiterverarbeitet, editiert und korrigiert werden können. BIT-Alpha segmentiert automatisch das Dokument in Bild- und Textbereiche, wodurch die Erkennung vereinfacht wird. Zudem kann die Software jegliche Schriftarten, Symbole und Logs neu erlernen und wiederverwenden. Laut Hersteller erreicht die adaptive OCR-Software eine sehr hohe Genauigkeit bei der Erkennung von Zeichen. Jedes einzeln erkannte Zeichen wird daher mit einer Erkennungsgenauigkeit angezeigt.
BIT-Alpha ist besonders geeignet für die Archivierung und Verarbeitung von historischen Dokumenten. Für eine komfortable Übersicht können die Daten in numerischen Bibliotheken sortiert und gespeichert werden. Durch die automatische Anpassung der Text- und Bildformate wird eine schnelle Präsentation der historischen Dokumente im Internet ermöglicht. Draüber hinaus gehört BIT-Alpha zu den wenigen OCR-Programmen, die Frakturdokumente mit altdeutscher Schrifttype oder Gotisch lesen können und zeitgemäße Schrift umwandelt. Auch handschriftliche Zeichen und Unterschriften können von der Software erkannt und identifiziert werden.
Betriebssystem: k.A.
Scansoft OmniPage
Die Software OmniPage wandelt eingescannte Dokumente, PDF-Dateien und Bilder in Textdateien um. Dies ist besonders hilfreich, wenn die Vorlage nur in Papierform oder als abfotografiertes Bild zur Verfügung steht. Auf Basis der OCR-Technologie erstellt OmniPage ein digitales Dokument, das anschließend mit einem Textverarbeitungsprogramm weiterbearbeitet werden kann. Die Erkennungsgenauigkeit liegt laut Herstellerangabe bei über 99 Prozent. Das Zeichenleseprogramm kann Dateien mit den Formaten TIFF, PCX, DCX, BMP, JPG, GIF, PNG und MAX in eine reine Textdatei transformieren. Auch PDF-Dokumente werden im Handumdrehen in bearbeitbare Dateiformate verwandelt. Durch die Beibehaltung der Formatierung sehen die erzeugten Dokumente genauso aus wie die Originalvorlagen.
Die Benutzeroberfläche ist sehr einfach zu bedienen. Dennoch ist die Software sehr vielfältig. So können beispielsweise einzelne Bereiche einer Vorlage ausgewählt und nicht gewünschte Teile ausgeschlossen werden. Die Bereichseinstellungen können vom Programm gespeichert werden, um die Mustererkennung bei Vorlagen mit identischem Layout wieder anwenden und dadurch Zeit sparen zu können. OmniPage kann 56 Sprachen automatisch erkennen und besitzt für 19 Sprachen ein eigenes Wörterbuch. Um nicht den Überblick bei einer Vielzahl von Dokumenten zu verlieren, bietet die Software eine eigene Verwaltungsfunktion.
Betriebssystem: Windows XP oder höher | OmniPage 17 Standard | OmniPage 17 Pro









Mit einer entsprechenden OCR-Software-







