Stadtplan in der Hosentasche: Gedanken zu taktilen interaktiven grafischen Displays

Welchen Nutzen haben sie und sind sie wirklich die Lösung vieler Probleme?

Vier Felder stellen dasselbe Objekt dar; Es handelt sich um einen Bleistift, der seine Spitze in der linken unteren Ecke hat; An der rechten oberen Ecke ist er abgeschnitten und ragt so in das Bild hinein; Das erste Feld stellt den Gegenstand so dar, wie er auf einem hochwertigen Farbdisplay aussehen könnte und ist so leicht als Bleistift zu erkennen; Im zweiten Feld sind die Farben auf vier Graustufen reduziert, die Auflösung ist unverändert; Im Dritten Feld ist die Bildauflösung um den Faktor 20 reduziert, die Farben sind wie in Feld 1 vorhanden; Im vierten Feld sind Bildauflösung und Farben reduziert, der Bleistift ist dadurch nicht mehr ohne weiteres als solcher zu erkennen;
Alexander Vogler @Chiliphunk

Längst kann jeder Mensch eine komplette Weltkarte in der Hosentasche haben. Aber gilt das wirklich für „jeden Menschen“? Nein, leider nicht. Blinde Menschen sind auch hier ausgenommen, dabei wäre das gerade für uns noch wichtiger als für Sehfische.

Allein schon, dass sich meine persönliche Landkarte von Wien dann nicht mehr an einer Donau, die strikt in West-Ost-Richtung verläuft, ausrichten würde, die es so nicht gibt, wäre ein echter Erfolg.

Ich könnte zur Blindenbücherei des Bundesblindeninstituts (BBI) gehen; mir dort einen Stadtplan für Wien ansehen, ausleihen oder kaufen. Der würde mir zwar Erkenntnisse zur Lage des Gürtels, der Tangente und der Donau verschaffen, ein Rendering zu einer anstehenden Umgestaltung eines Platzes in der Umgebung könnte er aber freilich nicht enthalten. Von den Informationen, die meine Freund_innen heutzutage bei Wanderungen aus ihren Handys so rausquetschen, wollen wir da noch gar nicht reden.

Einen persönlichen Bedarf für ein solches taktiles interaktives grafisches Display (TIGD) verspüre ich also durchaus und bin damit sicher auch nicht alleine.

Historischer Abriss

Seit ich in den 80er Jahren begonnen habe, mit einem Braille-Display am Computer zu arbeiten, hatten wir immer mal wieder diesbezügliche Träume. Damals ging es noch nicht um die Wiedergabe von Grafiken im eigentlichen Sinne, sondern eher um die Möglichkeit, Buchstaben, Worte, usw. in ihrer Ausrichtung und Lage am Bildschirm wahrzunehmen.

Für die, die das so nicht mehr kennen: Bildschirme hatten 25 Zeilen, in jeder Zeile konnten 80 Buchstaben dargestellt werden und, wenn Mensch Glück / Geld hatte, wurden diese Buchstaben in unterschiedlichen Helligkeiten / Graustufen angezeigt. Hätte Mensch seinerzeit also 25 der vorhandenen Braille-Displays mit jeweils 80 Zellen für Buchstaben hintereinander gestellt, so wäre Mensch dem schon recht nahe gekommen. So ähnlich sahen erste Versuche diesbezüglich auch aus.

ABER! Eine solche 80er-Zeile ist bereits breiter als eine normale PC-Tastatur und 25 davon übereinander – selbst wenn Mensch die überstehenden Geräteteile abzieht – füllen einen durchschnittlichen Schreibtisch schon recht gut aus. Von Platz für Tastatur, Caffee-Häferl oder Telefon reden wir jetzt mal nicht; von den Kosten lieber auch nicht.

Im neuen Jahrtausend erlebte die Idee immer wieder mal ein Revival. Diesmal nicht auf mechanischer Basis, sondern in Form von Kunststoffen, die elektrostatisch verformbar waren. Mit solchen Ansätzen könnten durchaus drei Anforderungen kombiniert werden:

  • Haptische Darstellung
  • Positionsbezogenes Feedback / Interaktivität
  • Optische Darstellung.

So etwas könnte also in einem Handy oder Tablet verbaut werden und dahin gingen die letzten mir bekannten Entwürfe auch.

Ein paar Zahlen und Einordnungen

Die im Folgenden genannten Zahlen sind als Größenordnungen zu verstehen, weil einerseits zu viele Nachkommastellen die Vorstellungskraft dämpfen; zum Anderen aber auch, weil ich mir überhaupt nicht sicher bin, ob diese oder jene Zahl bereits solide wissenschaftlich erhoben wurde oder überhaupt erhoben werden könnte.

Nehmen wir als Beispiel das Auflösungsvermögen eines tastenden Fingers. Da liegen zwischen dem gesunden Finger einer gesunden Hand eines Kindes in der Volksschule und der verhornten und schwieligen Hand eines_r pensionierten Maurer_in sicher Welten. Zu weiteren Einschränkungen durch Behinderung, Diabetes oder Durchblutungsstörung müssen wir da gar nicht greifen.

Größe und Anwendbarkeit

Vom Traum, dass mit TIGD jede Anwendung von Grafik für blinde Menschen zugänglich wäre, verabschieden wir uns ganz rasch!

Haptische Auflösung / Pixeldichte

Viele praktische Anwendungsmöglichkeiten sind nicht ortsgebunden, so dass wir mal von der Größe eines Tablets oder Handys ausgehen und dies der Faulheit halber mit 10*10cm annehmen; Am Schreibtisch lässt das auch noch Platz für den Caffee. Das mögliche haptische Auflösungsvermögen setzen wir mit 0,5mm an, so dass wir von einer Darstellbarkeit von 200*200 Pixeln ausgehen.

Das sind 20 Pixel pro cm oder, 50,8 DPI. Schaut jetzt mal auf die entsprechenden Angaben eures Druckers, eures Scanners oder Bildschirms. Da findet ihr ganz schnell Werte mit 3 oder 4 Stellen. Da könnten wir also 1000 DPI ansetzen und kämen so auf ein Verhältnis der möglichen Auflösungen von 1 zu 20.

Graustufen oder so

Jetzt hat ein Pixel nicht nur eine Größe, sondern auch noch eine Farbe, die mit den Fingern nicht wahrgenommen werden kann. Wir sollten die Grafik also besser mit Graustufen denken. Diese Graustufen müssen ganz unabhängig von der mechanischen Umsetzbarkeit als Höhenunterschied wahrgenommen werden können.

Mehr als 4 Höhen/Graustufen sind mit den Fingern nicht klar unterscheidbar, wenn der Gesamthub „hosentaschenfähig“ bleiben soll; Dabei ist die Basisfläche / Hintergrundfarbe mit einzurechnen. Vergleicht Mensch dies mit dem Farbraum von gut 16.000.000 bei RGB-Darstellung, so ist eine deutliche Reduktion auch hier sichtbar.

Natürlich ist das menschliche Auge nicht in der Lage, all diese 16.000.000 Farben klar und eineindeutig zu unterscheiden, so dass wir die mal lieber willkürlich auf 4.000 reduzieren, damit wir dann auf einen Faktor von 1 zu 1.000 in der Farbdarstellung kommen.

Informationsdichte der taktilen Darstellung

Wenn wir also jetzt die Auflösung und die Farbtiefe der visuellen Darstellung der möglichen taktilen Darstellung gegenüberstellen, so kommen wir mit dem Verhältnis der Auflösung von 1 zu 20 und dem Verhältnis der Höhen / Farben von 1 zu 1.000 auf ein Verhältnis der Informationsdichte von 1 zu 20.000.

Wie eingangs erwähnt, handelt es sich um Abschätzungen. Aber, ob wir nun bei diesen 20.000 eine 0 dazu geben oder eine wegnehmen, der Unterschied in der Informationsdichte ist enorm. Dazu müssen wir noch überhaupt nicht in Betracht ziehen, dass der Sehsinn die Information mehr oder minder auf einmal aufnehmen und verarbeiten kann, wohingegen Finger nur relativ kleine Ausschnitte nacheinander ertasten und das Bild nach und nach im Kopf entsteht.

Mögliche praktische Verwendung

Zuvorderst fallen mir zwei Bereiche ein, die sich zur tastbaren, flächigen Darstellung anbieten. Die Verdeutlichung von grafischen Oberflächen im Web oder bei Apps und die irgendwie dazugehörende, gleichwohl aber getrennt zu betrachtende Darstellung von räumlichen Informationen wie Landkarten oder auch Lageplänen.

Grafische Oberflächen

Schon wegen der Informationsdichte verbietet sich eine 1-zu-1-Übernahme der visuellen Information zur tastbaren Darstellung. Das führt direkt zur Frage, welche Informationen hier denn (nicht) dargestellt werden sollten. Diese wiederum lässt sich auch so formulieren: Welche Informationen werden denn von aktuellen Screenreadern / Sprachausgaben / Braille-Displays (nicht) dargestellt?

Mit dem Wissen, dass die genannten Medien im Wesentlichen eindimensional sind, sich also z.B. eine Web-Site mit all ihren Bildern, Tabellen, Listen, Überschriften, Eingabefeldern, Links und – was weiß ich noch – wie eine lange Wurscht darstellt, ist die letzte Frage schon recht gut zu beantworten: Wir könnten diese Links, Tabellenzellen, Überschriften, Sidebars, … wieder mit ihren Positionsangaben verknüpfen; Diese sind ja ohnehin da. Das wiederum unterscheidet sie davon, dass die Zusatzinformationen, die eigentlich auch immer da sein sollten, oft eben genau nicht da sind.

Name oder was?

Ganz oft sind wir beim Online-Shoppen damit konfrontiert, dass wir Name und Anschrift für den Versand eingeben sollen. Manchmal sind dabei Vor- und Nachname in einem Feld einzugeben, manchmal in zwei. Deshalb gibt es Labels/Beschriftungen, die uns helfen, die richtigen Daten in die richtigen Felder zu schreiben.

Jetzt gibt es aber ganz oft den Fall, dass dieses Label – entgegen aller W3C, WCAG, Webzugänglichkeitsgesetze usw. – nicht technisch mit dem zugehörigen Eingabefeld verknüpft ist. Somit weiß der Screenreader also nicht, ob ich mich jetzt im Feld für den Vornamen, den Nachnamen oder für beides befinde.

Steht doch da

Visuell besteht die Verknüpfung aber durchaus. Oft stehen die Labels links, manchmal aber auch oberhalb des betreffenden Feldes; jedenfalls so, dass es für den geneigten Sehfisch klar ist.

Aber bitte nur die Position

Es ist wichtig, dass nicht das Wort „Vorname“ fühlbar gemacht wird; weder in Braille, noch in Print  / Normalschrift, das würde viel zu viel wertvollen Platz verbrauchen. Es braucht eine Repräsentation der Fläche, die vom entsprechenden Text oder Bild eingenommen wird, so wird eine positionsgerechte Darstellung ermöglicht. Der tatsächliche Inhalt, also der Text oder die Bildbeschreibung, muss getrennt davon über einen zweiten Kanal, also z.B. die Sprachausgabe oder eine parallel angeschlossene klassische Braille-Zeile, wiedergegeben werden.

Dabei taucht die Frage auf, wann dies geschehen soll. Denkbar wäre, wenn der Druck auf diese Stelle erhöht wird oder der Finger eine Zeit auf dieser Stelle verweilt. Ich bin da für Variante 1, das müsste sicher aber noch genauer untersucht werden. Jedenfalls wird daraus klar, dass es sich bei einem TIGD auf jeden Fall um ein interaktives Gerät handeln muss und dass eine einfache pixelhafte Umsetzung nicht genügt!

Landkarten und Lagepläne

Stellt euch einen beliebigen Ausschnitt aus einer Landkarte vor oder holt sie euch in ein zweites Fenster. Egal, ob das nun ein Nah-Erholungsgebiet, eine Straßenkarte oder die aktuelle Corona-Lage ist, sehr schnell stellt ihr fest, dass es viele Farben gibt. Dieselbe Karte in ein Graustufenbild mit nur vier Farben inklusive Grundfarbe (Schwarz, Dunkelgrau, Hellgrau und Weiß) zu übertragen, wäre nicht einfach.

Dieselben Einschränkungen wie oben, dass schriftliche Inhalte nicht wiedergegeben werden können/dürfen, gilt auch hier. Somit auch, dass eine einfache Umsetzung auf Pixel-Ebene nicht möglich ist.

Was mach ich dann damit?

Natürlich ist die Versuchung groß, mit solch einer Darstellung am Handy während der Wanderung in Konkurrenz mit Sehfischen zu treten, um z.B. schneller als sie herauszufinden, ob diese seltsame Brücke am Horizont nun ein Bahnviadukt ist oder doch eher die Wiener Hochquellwasserleitung. Nettes Spiel, aber dafür würde weder ich noch ein allfälliger Kostenträger für Hilfsmittel tief in die Tasche greifen.

Wenn ich aber mal wieder feststelle, dass ich an einem Straßenrand ohne Gehweg entlang gehe, dann wäre es schon interessant, ob es vielleicht auf der anderen Straßenseite einen Gehweg gibt und wo ich allenfalls gut queren kann, um nicht auf halben Wege das Schotterbett der Straßenbahn überklettern zu müssen. Da wäre es also schon ein echtes Hilfsmittel für, das Zusatzkosten wirklich gerechtfertigt wären.

Von gern gemachten Fehlern und ihrer Vermeidung

Wer den Text bis hier aufmerksam gelesen hat, mag hier eine Zusammenfassung wiederfinden oder den Abschnitt überspringen. Wer meine Methode, erst alles durch Erklärungen zu verkomplizieren, um es dann wieder zu vereinfachen nicht mag, hat vieles bis hier her einfach quergelesen. Deshalb jetzt nochmal die Knackpunkte:

  1. Das bloße Vorhandensein einer Hardware-Lösung eines taktilen interaktiven grafischen Displays (TIGD) ist höchstens die halbe Miete.
  2. Die zu erwartende Informationsdichte eines TIGD liegt etwa um den Faktor 1 zu 20.000 unter einem aktuellen visuellen Display.
  3. Die gewinnbringendste Einschränkung der Informationsfülle ist, die enthaltenen Texte nicht taktil wiederzugeben.
  4. Ohne Interaktivität ist ein TIGD wertlos.

Fazit

Technisch machbar

Technisch ist ein TIGD seit über 20 Jahren machbar. Mit aktuellen Technologien wäre es vermutlich im Massenmarkt auch zu vertretbaren Preisen herstellbar.

Warten auf die Killer-App

Der massenhafte Bedarf / die Erweckung desselben ist nicht in Sicht. Das sehen wohl auch die Big Player der Hardware-Industrie so, denn wäre das nächste Super-Phone – egal von welchem_r Hersteller_in, egal mit welchem Betriebssystem – mit einem solchen Display angekündigt, das wüsste ich aber und auf die Anfrage, ob Mensch das nicht auch für uns Blindfische alleine machen könnte, hat MacGyver schon genervt abgewinkt.

Was hätte ich davon?

Welche Killer-App das nun auch immer sein könnte, es wäre mit sehr hoher Wahrscheinlichkeit keine, von der auch Blindfische etwas hätten. Aber die Hardware und die nötigen Schnittstellen im Betriebssystem wären dann vorhanden.

Apps und Websites

Screenreader – und damit wir Blindfische – stoßen immer dort an ihre Grenzen, wo notwendige Meta-Informationen nicht – oder fast noch schlimmer nicht korrekt – hinterlegt sind. Zumindest im Open-Source-Bereich würde es daher wohl nur wenige Wochen dauern, bis solch ein TIGD unterstützt würde und damit diese Grenzen massiv ausgedehnt würden.

Freilich, die bei Sehfischen so beliebten Icons wären damit immer noch nicht zugänglich, wie die Grafik mit dem Bleistift gut veranschaulicht. Mit einem TIGD könnten wir Positionen erfassen und so mit Angaben wie „Klicken Sie rechts oben auf das Zahnrad“ etwas anfangen. Aktuell ist es durch die sequenzielle Darstellung so, dass wir schlicht nicht wissen, wo rechts oben eigentlich ist.

OpenStreetMap (OSM)

Schon vor vielen Jahren gab es Projekte aus dem OSM-Umfeld, deren Ziel es war, Landkarten usw. mittels geeigneter Software auf handelsüblicher Hardware zu produzieren. Das Knowhow, aus geographischen Datenbanken Informationen taktil aufzubereiten, ist also vorhanden und müsste lediglich aktualisiert und in zeitgemäße Software gegossen werden.

Hier beginnt der Werbebereich Hier endet der Werbebereich
Hier beginnt der Werbebereich Hier endet der Werbebereich