Der KNFB Reader für iOS - ist der Hype gerechtfertigt?

21. November 2014

Mehrere Jahre haben viele blinde und sehbehinderte Menschen zwei Telefone mit sich herumgeschleppt: ihr neues Apple- oder Android-Smartphone und ihr altes Nokia, das sie nur aus einem Grund behalten haben: um die KNFB Reader Software zu nutzen. Nun endlich gibt es den KNFB Reader auch auf dem iPhone.

Autor: Bill Holton

Dieser Artikel wurde ursprünglich unter dem Titel KNFB Reader for iOS: Does This App Live up to All the Hype? in der AccessWorld veröffentlicht.

Der KNFB Reader ermöglicht es Nutzern, Dokumente, Flyer, Speisekarten und andere Drucksachen unterwegs mit meist überraschender Genauigkeit einzuscannen. Bislang war diese Software nur für Nokias Symbian-Betriebssystem verfügbar.

Im September hat KNFB Reading Technologies Inc. zeitgleich mit der Veröffentlichung von iOS 8 und den neuen iPhones 6 und 6 plus die langerwartete iOS-Version des KNFB Readers herausgebracht. Im iPhone App Store ist die App für € 89.99 erhältlich und läuft auf iPhones ab Modell 4s, ebenso auf dem iPod Touch 5. Zurzeit ist sie auf iPads nicht verfügbar, aber die Firma plant, iPads mit Kamera und Blitz in einem zukünftigen Update zu unterstützen. Auch eine Android-Version ist in Planung, aber dazu gibt es bisher keine Details.

Seit den ersten Tagen von zugänglichen iPhones haben Nutzer die Firma mit Anfragen nach einer iOS-Version bombardiert. Aber erst Ende 2013 wurde der Plan einer iOS-Version bekanntgegeben, denn bis zum iPhone 5 und 5s waren die Kameras der iPhones nicht so gut wie die Nokia-Kameras, besonders, was geringes Licht und Blitz anging. Außerdem war bis iOS-Version 7 der Zugriff auf bestimmte Kamera-Kontrollfunktionen nicht möglich, der für eine hochwertige Texterkennung erforderlich ist.

Ich habe die letzten Wochen den KNFB Reader sowohl auf dem iPhone 6 als auch auf dem iPhone 5 genutzt und ausgewertet.

Das KNFB Reader Interface

Das KNFB-Reader-Interface ist auf elegante Weise einfach. Es gibt zwei Bedienleisten, eine oben, eine unten. Der Rest des Bildschirms ist vertikal zweigeteilt. Die rechte Seite enthält die Field-of-View-Taste (Gesichtsfeld), welche wir gleich besprechen. Die linke Seite enthält die Take-Picture-Taste (Bild aufnehmen). Ein Doppel-Tippen irgendwo in diesem Bildschirmbereich führt dazu, dass der Reader ein Bild aufnimmt und automatisch den OCR-Prozess (also die Texterkennung) startet. Schon nach ein oder zwei Sekunden setzt die Sprachausgabe des erkannten Textes ein. Es gibt eine Menge, was in diesem kurzen Zeitraum hinter den Kulissen passiert.

Der KNFB ist sehr tolerant, was die Bildqualität angeht. Er bearbeitet den Text, um dessen Lesbarkeit zu erhöhen (eingesetzt wird hierfür die ABBI Mobile OCR Engine). Er korrigiert geneigten oder geknickten Text und kommt selbst mit knitteriger und gebogener Schrift zurecht (z.B. die Beschriftung einer Konservendose). Natürlich kann der KNFB Reader nichts ausgeben, was er nicht gesehen hat. So funktioniert das bei Konserven nur eingeschränkt, obwohl ich meist erkenne, um welche Konserve es sich handelt, und dann selbst Informationen zu Inhaltsstoffen, Nährwert oder Rezepten erfassen kann.

Der Reader kann meist mit einem einzigen schnellen Schnappschuss gedruckten in gesprochenen Text verwandeln. Einfach doppeltippen oder - wenn Sie beim Tippen zum Verwackeln neigen - zwei Finger auf den Bild-aufnehmen-Bereich legen, dann einen Finger abheben.

Der Gesichtsfeld-Report (Field of View Report)

Wir erwähnten schon die Field-of-View-Report-Taste rechts von der Take-Picture-Taste auf dem Haupt-Screen der App. Dieses Bedienelement hilft sicherzustellen, dass die gesamte Seite von der Kamera aufgenommen wird. Positionieren Sie Ihr Smartphone so, dass Sie die gesamte Seite im Aufnahmebereich zu haben meinen. Dann tippen Sie auf diese Taste. Die App macht eine schnelle Probeaufnahme mit niedriger Auflösung und beschreibt dann im Report die Kamera-Position. So könnte die App zum Beispiel ausgeben: „Rechter Rand ist sichtbar, um 10 Grad gegen den Uhrzeigersinn gedreht.“

Ich fand dieses Feature besonders am Anfang meiner Nutzung praktisch. Das Fast-Echtzeit-Feedback zeigte mir, wie und in welcher Entfernung ich die Kamera halten musste, um zu einer guten Aufnahme zu kommen. Mit mehr Erfahrung machte ich immer weniger Field-of-View-Reports, zum Teil, weil meine Aufnahmetechnik sich verbessert hatte, aber hauptsächlich, weil KNFB Reader auch recht gut mit meinen weniger perfekten Aufnahmen zurechtkam.

Neigungs-Führung (Tilt Guidance)

Dieses Bedienelement ist ein An-/Aus-Schalter direkt oberhalb des Field-of-View-Report-Bereiches. Er vermittelt Nutzern, ob sie ihr Gerät geradehalten, sowohl in der Ausrichtung von vorn nach hinten als auch seitlich. Je mehr das Gerät in Schieflage ist, desto stärker wird es vibrieren und brummen. Wenn man den Punkt erreicht hat, wo die Vibration aufhört, ist man bereit für Aufnahme senkrecht nach unten.

Ich fand die Neigungs-Führung noch hilfreicher als den Field of View Report. Ich hatte schnell heraus, dass ich dazu neige, mein Telefon nach vorne und etwas nach links gekippt zu halten. Aber Übung macht den Meister, und auch wenn ich nicht behaupten kann, mein iPhone aus dem Stand heraus perfekt richtig zu halten, kostet die Korrektur immer weniger Zeit.

Die Neigungsführung korrigiert nur Aufnahmen aus der Aufsicht. Ich wünschte, es hätte eine ähnliche unterstützende Funktion für Aufnahmen gerade nach vorn. Diese Funktion fehlt deutlich in den VoiceOver-Kamerazugangs-Funktionen. Zu wissen, dass ich zwei Gesichter im Bildausschnitt habe, ist hilfreich – aber noch hilfreicher wäre es, zu erfahren, dass ich die Kamera gerade und in der Bildachse horizontal halte.

Das Sichern und Exportieren von Dateien

Nachdem ein ein- oder mehrseitiges Dokument erkannt wurde, kann man die Datei entweder unter einem aussagekräftigen Namen oder unter dem Datums- und Zeitstempel sichern. Diese Aktion sichert sowohl das Bild als auch den erkannten Text auf dem iPhone. Über den File-Explorer-Reiter kann man den Text wieder lesen, das Bild noch einmal anzeigen oder eine Neuerkennung mit neuen Einstellungen für Spalte oder Sprache starten.

Der File Explorer hat mehrere Reiter zum Aufrufen gescannter Dateien, PDF-Dateien und Bilddateien (über letztere gleich mehr). Man kann in der Liste gescannter Dateien zu einem der Dateinamen herunterwischen und diese über die Edit-Taste umbenennen oder löschen. Man kann sie auch als reine Text-Datei exportieren, als formatierte HTML-Datei oder als KNFB-Datei: eine Archivdatei, die sowohl Bild als auch Text enthält. Dies ist besonders nützlich zum Speichern von Verträgen und anderen unterzeichneten Dokumenten, deren Originale man mit einer vom Screenreader lesbaren Textkopie elektronisch abspeichern möchte. Eine Verbesserung, die ich mir wünschen würde, wäre der Einschluss der Option „Umbenennen und Exportieren“ auf dem Aktionsmenü des Rotors. Das würde den Zugriff auf diese Funktionen deutlich beschleunigen.

Wenn man eine Datei exportieren will, hat man all die üblichen Möglichkeiten wie E-Mail, Dropbox oder andere iPhone-Apps, die das Dateiformat verstehen.

PDFs und Bild-Dateien lesen

Wir kennen alle die Frustration, wenn wir eine PDF-Datei im Acrobat Reader öffnen und nur die schreckliche Nachricht “Achtung! Leeres Dokument!“ zu hören kriegen. JAWS-Nutzer können das Quick-Scan-Feature nutzen und jedweden Text Bildschirm-für Bildschirm erkennen. Die angekündigte JAWS-Version 16 soll die volle PDF-Erkennung unterstützen. Wer K1000 oder OpenBook nutzt, kann auch einen Send-to-OCR-Engine-Druckauftrag ausführen, aber mit KNFB Reader gibt es nun eine neue Option.

Schicken Sie sich das PDF selbst als E-Mail oder wählen Sie es in Dropbox, OneDrive oder in einer anderen Datenabgleichs-App aus. Nutzen Sie die Doppeltippen-und-Halten-Geste, um die Teilen-Funktion aufzurufen, dann die Öffnen-in-Option zum Öffnen im KNFB Reader. Nun ist die Nachricht "Imports available" neben der File-Explorer-Taste aufgetaucht. Importieren Sie die Datei, öffnen Sie sie durch Doppeltippen und wählen Sie dann Recognise imported PDF (importiertes PDF erkennen) aus.

Ich lud kürzlich ein Gerätehandbuch herunter, das sich als unlesbares PDF erwies. Selbst JAWS Quick OCR-Option konnte keinen Text finden. Die Kundenbetreuung der Firma hatte mir daraufhin die ungeschützte Version des Handbuchs geschickt, ich hatte also einen Vergleich. Als ich mir das unzugängliche PDF per E-Mail schickte und KNFB Reader die 10 Seiten erkennen ließ, ging das schneller als "Seite 1 fertig, Seite 2 fertig..." usw. zu sprechen. Als ich die ersten paar Seiten las und mit dem Original verglich, konnte ich absolut keine Texterkennungsfehler entdecken.

Dasselbe kann man mit Bilddateien machen, aber dieser Prozess ist zurzeit nur eingeschränkt brauchbar und eher komplex. Ich konnte ein Bild auf der Camera Roll des iPhone nicht erkennen, ebenso wenig ein JPG, das ich über E-Mail empfangen hatte. In beiden Fällen tauchte KNFB Reader nicht in der Teilen- bzw. Öffnen-in..-Liste auf. Ich musste das JPG erst zum Favoriten machen und danach erst das Share-Icon, dann Open in… doppeltippen. Erst jetzt bekam ich die gleiche Import-Nachricht im File Explorer-Menü des KNFB Reader, über das ich das Bild unter dem Bilder-Reiter hinzufügen und schließlich erkennen konnte.

Gelegentlich bekomme ich JPG-Dateien anstelle von Faxen zugeschickt. Hoffentlich wird durch das Lockern von Apples Restriktionen auf Benachrichtigungs-Widgets und der Teilen-Funktionalität das Verwandeln solcher Dokumente in Text mittels KNFB Reader in zukünftigen Releases einfacher werden. Nutzer sollten in der Lage sein, JPGs oder andere Bilddateien direkt aus einer E-Mail heraus zu öffnen, so wie sie es bereits mit PDF-Dateien machen können.

Weitere Features

Hier noch ein Blick auf viele andere nützliche Einstellungen und Features des KNFB Reader.

  • Stapelverarbeitung (batch mode processing). Wenn man mehrere Seiten zu scannen hat, erlaubt einem dieser Modus, mehrere Bilder aufzunehmen und diese alle in einem Dokument zu erkennen. Ich vermied diesen Modus, bis ich meine Bildaufnahme-Fertigkeiten verbessert hatte, aber jetzt finde ich es für das Erfassen mehrseitiger Dokumente sehr nützlich.
  • OCR-Sprache. Die ABBI Mobile OCR Engine der App unterstützt zurzeit 11 Sprachen, darunter die meisten europäischen Sprachen. Ich habe mir sagen lassen, dass eine zukünftige Version auch die Übersetzung eines erkannten Dokuments in eine andere Sprache anbieten wird.
  • Dokument-Typ. KNFB Reader erkennt einen Scan als ein- oder mehrspaltige Seite. Die Einstellung Single-Column wird die Seite "ent-spalten" und die erkannten Textinhalte von oben nach unten anordnen, Spalte für Spalte. Multi-Column wird jede Zeile über Spalten hinweg lesen, wie man etwa die meisten Rechnungen lesen wollen wird, in denen Beschreibungen vom Rechnungs-Gegenstand und zugehörigem Preis zusammengehören. Das gleich gilt für Tabellen, in denen Informationen Zeile für Zeile gelesen werden sollten. Leider kann der KNFB Reader in beiden Fällen nicht den Text als formatiertes Dokument exportieren, also mit Tabellen, die man später auf dem PC mittels Screenreader-Shortcuts für Tabellen oder Überschriften erfassen könnte.
  • Profile. Diese Bild-Erfassungsoption bietet die Auswahl zwischen manueller und automatischer Aufnahme. Automatisch soll immer dann eine Aufnahme auslösen, wenn der KNFB Reader prozessierbaren Text sieht. Zurzeit ist diese Option aber eher ein Platzhalter als eine brauchbare Alternative, was heißen soll, dass sie für mich bislang nicht von Nutzen war. Ich gehe davon aus, dass diese Option sehr viel genauer wird, wenn die App für iOS 8 und die neuen iPhones 6 und 6 plus optimiert worden ist.

Meine Erfahrungen bislang

Über die letzten Jahre habe ich eine Reihe von Texterkennungs-Apps ausprobiert, unter anderem Textgrabber und Prizmo. Ich weiß, dass andere Nutzer mit diesen Apps erfolgreich gearbeitet haben, aber mich haben sie überhaupt nicht befriedigt. Was den KNFB Reader angeht, habe ich viel Zeit mit der App zugebracht, vom ersten Release bis zur letzten Version 1.2 – und um meine Erfahrungen in einem Wort zusammenzufassen, findet sich kein besseres als „phänomenal“.

Heutzutage gehören die Sendungen in der täglichen Post zu den wenigen Drucksachen ohne irgendeine E-Alternative. Nach der Installation von KNFB Reader ging ich schnurstracks zum Briefkasten und arbeitete mich geschwind durch den Berg von Rechnungen, Werbesendungen, Rundschreiben und Zeitungen. Ich fütterte den Papierkorb und las Rechnungen und ganzseitige Briefe, selbst die stark zerknitterten. Der Reader kam sogar hervorragend mit dem Text unter den Adressfenstern der Briefumschläge zurecht, und ich konnte die Herkunft eines plastikverschweißten Katalogs bestimmen. Auf einigen der schwierigsten Sendungen war die Erkennung nicht perfekt, aber die Ergebnisse waren fast immer mindestens so vollständig wie bei der Nutzung von K1000 (eine Systemverwaltungs-Appliance) und einem Flachbettscanner.

Der Reader liest nur gedruckten Text, nicht handschriftlichen. Auch Geldscheine kann er nicht erkennen, selbst nicht deren Text und Seriennummern. Auch als ich eine Kreditkarte aufnahm, kam ich nicht an die Kartennummer, denn sie hatte die gleiche Farbe wie der Kartenhintergrund.

In meiner Speisekammer hatte ich dagegen guten Erfolg mit Schachteln und Konservendosen. Der Reader las sogar einen Gutteil des Textes auf einer Tüte Eiernudeln. Wenn der Produktname sehr groß oder in einer ungewöhnlichen Drucktype war, kam der Reader nicht damit klar, aber fast immer hatte ich genug Informationen, um die gewünschte Dose Bohnen zu finden und nicht stattdessen aus Versehen eine Dose Chili aufzumachen. Nichtsdestotrotz werde ich fürs Erste die Apps TapTapSee, oMoby und CamFind auf meinem iPhone lassen.

Seiten aus meinem Laserdrucker wurden fast ohne Ausnahme zu 100 % fehlerfrei erkannt. CD-Hüllen und DVD-Hüllen wurden auch gut gelesen, die Discs selbst dagegen überhaupt nicht. Als ich den Text "The quick brown fox jumped over the lazy dog" in 72 Punkt Größe ausdruckte und an die Wand heftete, konnte ihn der KNFB Reader mit hundertprozentigem Erfolg noch aus 3 Metern Entfernung erkennen, aber nur, wenn ich die Seite etwa in die Mitte des Bildbereichs bekam und die Kamera gerade hielt, ohne sie zu sehr in irgendeine Richtung zu neigen. Dieser Punkt zeigt noch einmal, warum eine vertikale Neigungs-Führung von großem Nutzen wäre.

KNFB Reader kam ausgezeichnet mit der Erkennung des Menüs in meinem Lieblings-Grillrestaurant zurecht, aber Menüerkennung ist längst nicht mehr im gleichen Maße ein Muss wie vor vier oder fünf Jahren. Heutzutage hat fast jedes Restaurant, das ich frequentiere, sein Menü auch online.

Das Gleiche lässt sich zu Büchern sagen. Egal ob Bookshare, Google Books oder Amazon Kindle: Es kommt selten vor, dass ein Buch, das ich lesen möchte, nicht auch in zugänglicher Form verfügbar ist. Nichtsdestotrotz habe ich auch einige Bücher gescannt. Taschenbücher waren problematisch, da der Bundsteg besonders das Scannen der ersten und letzten Seiten schwierig machte. Ich fand es einfacher, Kamera und Buch seitlich zu halten und so Seite für Seite aufzunehmen. Mit größeren kartonierten Büchern ging es besser, aber die Resultate waren nicht so akkurat wie mit dem Flachbett-Scanner.

Ich versuchte, auch kartonierte und gebundene Bücher mittels KNFB Reader und einem StandScan Pro zu erfassen – das ist ein portabler Ständer, der einem hilft, Dokument und Smartphone für optimale Resultate zu positionieren. Dieser Arbeitsablauf war sehr viel schneller, da mein iPhone in der richtigen Position oberhalb der StandScan-Öffnung für die Linse positioniert blieb und ich so beide Hände für die Ausrichtung des Buches verwenden konnte – bis auf den Moment, wo ich das Buch mit einer Hand halten musste, um die Take-Picture-Taste doppelt zu tippen. Bundstege waren jedoch nach wie vor ein Problem. Viele gebundene Bücher passten nicht doppelseitig in den StandScan und mussten Seite für Seite erfasst werden. Der StandScan war unglaublich nützlich beim Scannen meiner Briefpost und lieferte mir hier ausgezeichnete Resultate fast ebenso schnell, wie ich immer neue Umschläge einschieben konnte.

Fazit

89 Euro sind heutzutage eine Menge Geld für eine App und viele wird dieser Preis abschrecken. Aber Preise sind relativ. Wenn morgen OpenBook oder K1000 nur an einem Tag für 100 Dollar verfügbar wäre, würden Leute sich beeilen, sich einzuloggen und dieses Schnäppchen zu kaufen. Dennoch wäre es wünschenswert, wenn es eine Demo-Version der App gäbe. Ich glaube, das würde den Umsatz kräftig ankurbeln, denn sobald man diese App einmal ausprobiert hat, versteht man nicht mehr, wie man vorher je ohne sie zurechtgekommen ist.

Der Original-Artikel erschien im AFB AccessWorld Magazine, November 2014 Issue, Volume 15 Number 11, unter dem Titel KNFB Reader for iOS: Does This App Live up to All the Hype? Die (leicht gekürzte) Übersetzung von Detlev Fischer erscheint mit freundlicher Genehmigung der AFB und des Autors.