Text- und Objekterkennung

Bei der Texterkennung werden Inhalte von einer Kamera oder einem Scanner erfasst und über optische Zeichenerkennung in digitalen Text bzw. Gegenstandsbeschreibungen verwandelt.

Was ist das?

Texterkennungsprogramme (oft auch OCR-Programme genannt, von Optical Character Recognition) verwandeln eingescannten oder fotografierten Text in digitalen Text, der dann von einer Sprachausgabe vorgelesen werden oder auch als Datei weiter bearbeitet werden kann.

Bei der Objekterkennung werden dagegen Fotos oder Codes (z.B. fotografierte Barcodes) mit einer Datenbank verglichen, die dort hinterlegten Beschreibungen werden ausgegeben. In manchen Systemen werden fotografierte oder gefilmte Gegenstände auch von Menschen beschrieben.

OCR-Programme wie OmniPage von Nuance verarbeiten Text, der mit dem Flachbett-Scanner eingescannt wird. Auch Bilddateien, die Text zeigen, können verarbeitet werden.

Es gibt eine Reihe von mobilen Apps, die es erlauben, Text mit dem Smartphone zu fotografieren und in Fließtext zu verwandeln. Manche Apps, wie der KNFB Reader, haben auch eine Ausrichtungshilfe, die vor allem blinden Nutzern hilft, Dokumente vollständig zu erfassen.

Marktübersicht

OCR-Programme

Zu den Marktführern bei Desktop OCR-Programmen zählen OmniPage, Adobe Acrobat, ABBYY FineReader und ReadIris.

OCR-Apps

Es gibt eine ganze Reihe von OCR-Apps für die Texterfassung, die alle die eingebaute Smartphone-Kamera nutzen. Manche sind kostenlos, andere recht teuer - so der KNFB Reader, der über eine auch für blinde Menschen brauchbare Ausrichtungshilfe verfügt. Einen Martküberblick bietet unser Test von OCR-Apps für Smartphones.

Objekterkennungs-Apps

  • TapTapSee (verfügbar für iOS und Android). Nutzer können Objekte fotografieren, menschliche Betrachter schicken in Sekunden eine Beschreibung des Bildes. Achtung: Die Beschreibung wird zum Teil ungenau oder kurios durch die automatische Übersetzung der (wohl meist englischen) Beschreibung.
  • BeMyEyes. Eine App, mit der blinde oder sehbehinderte Nutzer Objekte über die Videokamera des Smartphones erfassen und von einem Netzwerk sehender Helfer über einen Live-Video-Chat Hilfestellung bei der Identifizierung oder auch der Durchführung von Aufgaben bekommen.

Barcode-Scanner-Apps

Barcode-Apps wie Barcoo erlauben das Abfotografieren von Barcodes oder QR-Codes und suchen dann die für den Code hinterlegte Information aus Produktdatenbanken.

Spezielle Objekterkennungssysteme

Das Orcam MyEye-System funktioniert über eine seitlich an der Brille montierte Einheit und wird in der Erkennung über Fingerzeige geleitet. Nutzer können auf Text in Dokumenten oder Zeitungen oder auch Schilder im öffentlichen Raum zeigen und diese sich akustisch ausgeben lassen. In Verbindung mit einer Datenbank können auch Objekte oder Gesichter gespeichert und dann erkannt werden.

Externe Links