Aber nun scheint sich die lange Entwicklung gelohnt zu haben. Doch hält die OCR auch das, was sie verspricht? Dass Google Docs im Allgemeinen eine vorteilhafte Sache sein kann, mag der eine oder andere gerade in Bezug auf Dokumentenaustausch schon gemerkt haben. Docs reinstellen. Leute einladen und alle Eingeladenen können nun auf die Docs zugreifen oder aber auch eigene Dateien online teilen. Allerdings kann man nicht einfach jedes beliebige Format bearbeiten. Es müssen einige Sachen berücksichtigt werden. Es können nur Textbausteine aus PDFs, JPGs, GIFs und PNGs verarbeitet werden. Außerdem sollte keine exotische Sprache verwendet werden. Erkennbar sind neben Deutsch auch Englisch, Französisch, Spanisch und Italienisch.
Die Datei kann auch nur beim Hochladen editiert werden. Wenn man das vergisst, hat man nachträglich keine Chance mehr und muss die Datei erneut hochladen. Beim Hochladen muss einfach nur ein Häkchen gesetzt werden. Die Datei sollte auch nicht größer als 25 MB sein. So, nachdem wir die Einzelheiten geklärt haben, widmen wir uns den Ergebnissen. Die sind anscheinend je nach Stimmungslage des Programms gut bis bescheiden. Es ist eine eher einfache Software und hat mit relativ simplen Texten wenig Mühe und kann diese gut aufarbeiten. Gerade bei PDF-Dateien wird dies offensichtlich. Wenn die Texte aufwendiger werden, also sehr kleine Schrift, viele Versetzungen im Text, stößt das Programm an die eigenen Grenzen.
Die OCR von Google Docs ist wirklich eine reine Texterkennung, denn Bilder werden selten übertragen. Auch wird der Text zwar erkannt, aber die Formatierung muss nachbearbeitet werden. Bei den anderen drei Formaten ist es etwas schlechter. Hier wird teilweise der Text einfach aufgenommen, aber dann nicht mehr rausgegeben. Das ist mehr ein Glücksspiel. Man kann also resümieren, dass OCR für Google Docs im Generellen eine sinnvolle Erweiterung ist, jedoch sollte an den Feinheiten noch gearbeitet werden. Die Wiedergabe der Umwandlung ist doch nicht ganz so, wie sich das ein User wünscht.









Mit einer entsprechenden OCR-Software-