claraocr.org

  • Full Screen
  • Wide Screen
  • Narrow Screen
  • increase font size
  • Default font size
  • decrease font size

Was ist OCR?

OCR wird als Texterkennung oder als auch Optische Zeichenerkennung (Abkürzung OCR von englisch Optical Character Recognition, selten auch: OZE) bezeichnet und beschreibt die automatische Texterkennung in Bildern.

Anwendungen von OCR!

Mit einer entsprechenden OCR-Software-Anwendung können Textinformationen aus Bilddateien gewonnen werden. Die erhaltenen Daten lassen sich anschliessend mit Hilfe einer Textverarbeitungssoftware editieren oder elektronisch durchsuchen.

OCR Software

Für OCR-Software gibt es ein breites Angebot an  kommerziellen und Open Source-Lösungen, die sich auf den unterschiedlichsten Plattformen (Linux, MAC, Windows) nutzen lassen.

Donnerstag, den 02. Dezember 2010 um 12:57 Uhr

Google Docs nun auch mit OCR ausgestattet

Rate this item
(0 votes)

Es ist zwar nicht mehr brandaktuell, aber dennoch sollte es Erwähnung finden, da dieses Feature einigen entgegenkommen dürfte. Die OCR-Software ist seit Sommer verfügbar u sorgt dafür, dass Google Docs nun auch „lesen“ kann. Über ein Jahr hat es gedauert.

 

Aber nun scheint sich die lange Entwicklung gelohnt zu haben. Doch hält die OCR auch das, was sie verspricht? Dass Google Docs im Allgemeinen eine vorteilhafte Sache sein kann, mag der eine oder andere gerade in Bezug auf Dokumentenaustausch schon gemerkt haben. Docs reinstellen. Leute einladen und alle Eingeladenen können nun auf die Docs zugreifen oder aber auch eigene Dateien online teilen. Allerdings kann man nicht einfach jedes beliebige Format bearbeiten. Es müssen einige Sachen berücksichtigt werden. Es können nur Textbausteine aus PDFs, JPGs, GIFs und PNGs verarbeitet werden. Außerdem sollte keine exotische Sprache verwendet werden. Erkennbar sind neben Deutsch auch Englisch, Französisch, Spanisch und Italienisch.

Die Datei kann auch nur beim Hochladen editiert werden. Wenn man das vergisst, hat man nachträglich keine Chance mehr und muss die Datei erneut hochladen. Beim Hochladen muss einfach nur ein Häkchen gesetzt werden. Die Datei sollte auch nicht größer als 25 MB sein. So, nachdem wir die Einzelheiten geklärt haben, widmen wir uns den Ergebnissen. Die sind anscheinend je nach Stimmungslage des Programms gut bis bescheiden. Es ist eine eher einfache Software und hat mit relativ simplen Texten wenig Mühe und kann diese gut aufarbeiten. Gerade bei PDF-Dateien wird dies offensichtlich. Wenn die Texte aufwendiger werden, also sehr kleine Schrift, viele Versetzungen im Text, stößt das Programm an die eigenen Grenzen.

Die OCR von Google Docs ist wirklich eine reine Texterkennung, denn Bilder werden selten übertragen. Auch wird der Text zwar erkannt, aber die Formatierung muss nachbearbeitet werden. Bei den anderen drei Formaten ist es etwas schlechter. Hier wird teilweise der Text einfach aufgenommen, aber dann nicht mehr rausgegeben. Das ist mehr ein Glücksspiel. Man kann also resümieren, dass OCR für Google Docs im Generellen eine sinnvolle Erweiterung ist, jedoch sollte an den Feinheiten noch gearbeitet werden. Die Wiedergabe der Umwandlung ist doch nicht ganz so, wie sich das ein User wünscht.

Last modified on Montag, den 06. Dezember 2010 um 06:32 Uhr

Add comment


You are here: News News Google Docs nun auch mit OCR ausgestattet