Page 1

Henning Brau, Andreas Lehmann, Kostanija Petrovic, Matthias C. Schroeder

Usability Professionals 2011

Wir arbeiten daran. Arbeiten Sie mit.


Sponsoren

Konferenzsponsoren

German UPA Fรถrderkreis

2


Inhaltsverzeichnis

Tutorials 10

Aus die Maus – Design für natürliche Interaktion

Claudia Nass; Steffen Hess

16 User Experience mit Biss Dr. Jan Seifert; Lisa Reimer; Patrick Schick 24 UX meets RE Anne Gross; Steffen Hess 30 Gefühlvoll gestalten – Praxismethoden für emotionales Design interaktiver Produkte Christina Sturm; Daniela Vey 36 Fehlertexte und Beschreibungen aus der Sicht des Nutzers erstellen. Claus Wagner 40 Personas als Werkzeug in modernen Softwareprojekten Eva-Maria Holt; Dominique Winter; Jörg Thomaschewski

Workshops 46 Content Strategy & User Experience Design Nikki Tiedtke 52 Branchenreport Usability 2011 Daniel Ullrich; Sarah Diefenbach 58 Mehrwert für alle Christian Becker; Fabian Lang 60 Design the Future Mariya Pavlenko; Martine Clémot 62 Rapid Cognitive Modeling, Prototyping und Evaluation mit CogTool Tobias Ehni

3


Arbeitskreise German UPA 66 Eingeschränkt Sehen. Eingeschränkt Hören. Interagieren. Petra Kowallik; Martin Schrepp; Markus Erle 72 Der Qualitätsstandard für Usability Engineering der German UPA Holger Fischer; Christian Bogner; Thomas Geis; Knut Polkehn; Dirk Zimmermann 76 Arbeitskreis Nachwuchsförderung Anja Wipfler; Astrid Beck; Kostanija Petrovic

Nachhaltigkeit 78 Starke Bedienkonzepte bringen frischen Wind in Windenergieanlagen Stefanie C. Zürn; Rebecca Rothfuß 82 Benutzerzentriertes User Interface Design für einen Solarthermie-Regler Tim Schneidermeier; Patricia Böhm; Christian Wolff 88 Outdoor-Nutzertest eines Leitsystems im öffentlichen Raum Paul Müller; Oliver Siegmund

Natural User Interfaces (NUI) 94 Räumliche Gestenerkennung und Natural User Interfaces mit Microsoft Kinect Björn Oltmanns; Denis Kruschinski; Dieter Wallach 100 Positive User Experience durch natürliche Interaktion Kerstin Klöckner ; Claudia Nass; Rudolf Klein; Hartmut Schmitt 106 (Multi-)Touch me! Christina König; Marko Seidel; Andreas Röbig; Ralph Bruder

4


Usability Professionals 2011 Inhalt

Einflussfaktoren 112 Erwartungshaltung versus Usability: Der Effekt von negativer Erwartungshaltung auf die Akzeptanz von Software-Systemen. Roman Szymanski; Daniel Ullrich 120 Warum „gutes Aussehen“ nicht immer von Vorteil ist Andrea Struckmeier 128 „Da ham se mich aber reingelegt, dat muss man sich ja zuerst ganz durchlesen (...)“ Claudia M. Nick; Alexander Mertens; Stefan Krüger

Webseiten Best Practices 134 Themenbühnen im Internet aus Usability-Sicht – Ergebnisse einer Usability-Studie Torsten Bartel; Gesine Quint; Steffen Weichert 142 Iterative Überarbeitung der Homepage und des Headers von ImmobilienScout24 Jekaterina Cechini 148 WELT ONLINE – Joy of Use für Nachrichten in digitalen Medien Klaus Cloppenburg; Roland Schweighöfer

Geschäftssoftware 154 Barrierefreiheit von Web Anwendungen mit dem ARIA Standard sicherstellen Annett Hardt; Martin Schrepp 158 Benutzererlebnis bei Unternehmenssoftware Maria Rauschenberger; Andreas Hinderks; Jörg Thomaschewski 164 „Tipp‘ die Opportunity“ – sollte Geschäftssoftware Spaß machen? Svenja Schiffler; Theo Held; Martin Schrepp

5


Methoden 172 „Don’t make me think aloud!“ – Lautes Denken mit Eye Tracking auf dem Prüfstand

Yong-Min Markus Jo; Anke Stautmeister

178 Ich sehe, was Du fühlst Kathrin Kim; Simon Eisele; Kristin Kolbe 186 Weiter – Weiter – Fertig Roman Reindler 192 Evangelisieren, Testen, Optimieren – Erfolgsmodell Usability Clinic Kilian Hughes; Karsten Skuppin 196 Wie klicken frustrierte Nutzer? Maria Händler 202 360° User Experience Juergen Kiefer; Carina Lehne; Michael Schiessl 208 Remote Usability Testing für einen multinational agierenden Großkonzern Marian Möhren 212 Adaptierbares Onsite-Befragungstool für Websites Franziska Leithold; Özlem Can, Ben Heuwing, Ieva Karalyte,; Thomas Mandl, Christa Womser-Hacker 216 Usability Testing für und mit Senioren Marc Turnwald, Alexandra Frerichs, Michael Prilla

Werkzeuge 222 228 230

6

Das Usability Engineering File in der Medizintechnik – Ein Stapel Papier als Business Case Tobias Walke; Henning Brau

HTML5 – ein „NochnichtStandard“ erorbert die mobile Welt Sascha Meier

Effizientes Prototyping mit der Software ANTETYPE Tim Klauck


Usability Professionals 2011 Inhalt

Wirtschaft und Wissenschaft 236 Von der Wissenschaft in die Wirtschaft Wissenstransfer in Sachen Usability Daniela Kessner; Frank Dittrich; Nina Bär 242 Hedonische Qualität in der digitalen Fabrikplanung Karl-Josef Wack; Franz Peschel 250 Was Firmen wollen: eine Umfrage zu Usability- Dienstleistungen für klein- und mittelständische Unternehmen Diana Reich; Nina Bär

User Experience 254 Die Wechselbeziehung zwischen Marke und User Experience Olde Lorenzen-Schmidt

260 Erfassung visueller Ästhetik mit dem VisAWI Meinald T. Thielsch; Morten Moshagen 266 Resilienz – “Joy on Error” Usability als Chance und Ressource Kerstin Palatini ; Volkmar Richter

Referenten 272 Referenten

Impressum 296 Impressum

7


8


Tutorials

9


120

Aus die Maus – Design für natürliche Interaktion Claudia Nass Fraunhofer-Institut für Experimentelles Software Engineering IESE Fraunhofer-Platz 1, 67663 Kaiserslautern claudia.nass@iese.fraunhofer.de

Steffen Hess Fraunhofer-Institut für Experimentelles Software Engineering IESE Fraunhofer-Platz 1, 67663 Kaiserslautern steffen.hess@iese.fraunhofer.de

Abstract Viele der Interaktionsgeräte, die in jüngster Zeit auf den Markt gekommen sind, sind gesten- und touchbasiert. Diese auf neuen Technologien basierenden Interaktionsformen werden häufig auch als natürliche Interaktion bezeichnet. Maus und Tastatur haben als Eingabegeräte Konkurrenz bekommen. Als prominente Vorreiter sind hier die aktuellen Smartphones sowie Microsoft Surface zu nennen. Damit hat sich auch der Gestaltungsraum für Interaktionsdesigner erweitert. Die Konzeption von Steuerungsgesten kommt als neue Dimension hinzu. Den damit verbundenen Herausforderungen widmet sich unser Tutorial. Wir zeigen die Bandbreite neuer Interaktionsmöglichkeiten auf und probieren gemeinsam mit den Teilnehmern eine Methode zur Gestaltung von gesten- und touchbasierter Interaktion aus.

1. Einführung Wie ein Bildhauer, der mit seinen Werkzeugen und Techniken an einem Stück Ton arbeitet, brauchen Interaktionsdesigner Mittel, um die Interaktion adäquat zu beschreiben und sie durch die Nutzung von geeigneten Techniken und Richtlinien in Form zu bringen. In unserem Tutorial zeigen wir die Bandbreite neuer Interaktionsmöglichkeiten auf und experimentieren gemeinsam mit den Teilnehmern mit einer Methode zur Gestaltung von gesten- und touchbasierter Interaktion. Unser Ziel ist es, den Teilnehmern ein besseres Verständnis für das Konzept der natürlichen Interaktion und für die Herausforderungen zu vermitteln, die sich mit diesem neuen Bereich für die Designer stellen. Außerdem möchten wir den Teilnehmern einen Überblick über mögliche Methoden

Abb. 1. iPad – Tablet-PC von Apple1

10

geben und sie dabei unterstützen, eine dieser Methoden (DESIGNi, siehe Kapitel 3.3) selbst auszuprobieren. Dadurch können Interaktionsdesigner, Mediendesigner, Grafikdesigner, Informatiker, UX- bzw. Usability-Experten und Studenten von dem Tutorial profitieren. Um dieses Ziel zu erreichen, gibt es zunächst eine Einführung in das Thema, damit sich die Teilnehmer ihr eigenes Bild von natürlicher Interaktion bilden können. Danach werden die Herausforderungen dieses Bereichs erläutert und anschließend wird die Methode DESIGNi vorgestellt. Auf diese Inhaltsbereiche wird im vorliegenden Paper detailliert eingegangen. 2. Was ist natürliche Interaktion? Im Zusammenhang mit den neuartigen Interaktionsgeräten, die uns täglich neue

Abb. 2. Kinect Xbox 3602

Keywords: /// Natürliche Interaktion /// Designmethode /// Interaktionsdesign

Formen von Interaktion erleben lassen, wird oft über natürliche Interaktion gesprochen. Valli (2008) definiert natürliche Interaktion als Interaktion mit der Technologie analog zur Interaktion mit der realen Welt, wobei die Menschen durch Gesten, Bewegungen oder Gesichtsausdrücke kommunizieren können [9]. Für Valli spielt es bei der natürlichen Interaktion eine wichtige Rolle, dass man seine Umgebung bzw. die Welt durch die Manipulation physikalischer Objekte entdecken und erleben kann. In diesem Sinne geht es nicht nur um die Verwendung existierender Interaktionskonzepte aus der physikalischen Welt, sondern auch um die Erschaffung neuer Konzepte, die mit speziellen elektronischen interaktiven Geräten funktionieren. Ein durchgängiges Beispiel dafür sind die neuen Smartphones und Tablet-PCs. Sie gehören zu den Produkten, die in erster Linie für die rasche Verbreitung des


Usability Professionals 2011 Tutorials

Abb. 3. Links: SixthSense, Rechts: Skinput3

Phänomens der natürlichen Interaktion verantwortlich sind. Zurzeit besitzen 50 % aller Personen, die ein mobiles Telefon haben, ein Smartphone [4], häufig ausgestattet mit einem Touch-Display. Mit einfachen Gesten kann man Bilder vergrößern, seine Kontaktliste durchsuchen oder Aktionen rückgängig machen. [Abb. 1] Andere innovative Technologien, wie die neue Kinect Steuerung der Xbox 360, erlauben den Benutzern, ohne zusätzlichen Joystick oder andere Steuergeräte zu spielen [3]. Nur durch die Verwendung von Gesten in der Luft können die Benutzer z. B. bei einem Autorennspiel ein Auto fahren oder sogar beim Boxenstopp Räder wechseln. Durch die Bereitstellung solcher Technologie auf dem Massenmarkt wird deren zukünftige Anwendung in anderen Bereichen ebenfalls gefördert. Wie durch Magie kann man Objekte aus der Ferne berührungslos steuern und damit interagieren. [Abb. 2] In der Forschung werden Prototypen, wie die von Mistry und Maes (2009) und Harrison et al. (2010) [7, 5], entwickelt, die den menschlichen Körper als Eingabegerät für die Steuerung von verschiedenen Systemen verwenden (Harrison et al. (2010) benutzen die physische Eigenschaft der Reflexion, um die Interaktionsgeräte zu steuern [5]. Beim Tippen auf verschiedenen Bereichen des eigenen Arms oder der

Abb. 4. Microsoft Office Labs Vision 20194

eigenen Hand werden unterschiedliche Frequenzen gesendet, die unterschiedliche Funktionen steuern. Diese Technologie heißt Skinput und wird vor allem empfohlen, wenn der Sehsinn mit anderen Aktivitäten beschäftigt ist; so kann z. B. ein Benutzer beim Joggen zum nächsten Musiktitel springen, indem er Zeigefinger und Daumen gegeneinander tippt.3). In ihrer gestenbasierten Schnittstelle „SixthSense“ unterstützen Mistry und Maes (2009) die Benutzer bei der Durchführung von Aufgaben wie fotografieren, Zeitung lesen, malen oder die Zeit auf einer virtuellen Uhr sehen. Das System bedient sich der Augmented Reality, bei der sich reale Objekte und projizierte Bilder während einer Interaktion vermischen [7]. [Abb. 3] Harrison et al. (2010) benutzen die physische Eigenschaft der Reflexion, um die Interaktionsgeräte zu steuern [5]. Beim Tippen auf verschiedenen Bereichen des eigenen Arms oder der eigenen Hand werden unterschiedliche Frequenzen gesendet, die unterschiedliche Funktionen steuern. Diese Technologie heißt Skinput und wird vor allem empfohlen, wenn der Sehsinn mit anderen Aktivitäten beschäftigt ist; so kann z. B. ein Benutzer beim Joggen zum nächsten Musiktitel springen, indem er Zeigefinger und Daumen gegeneinander tippt. Als Zukunftsvisionen präsentiert Microsoft Office Labs eine Reihe von

Interaktionsgeräten, die sich in verschiedene Bereichen des Alltagslebens einbinden lassen [1]. In dieser Videoreihe präsentiert Microsoft alltägliche Objekte, die die analoge und digitale Welt verschmelzen. So werden z. B. Schlüsselanhänger, Tassen und Papierzeitung zu interaktiven Geräten, die durch einfache Gestenmanipulation gesteuert werden. [Abb. 4] Die genannten Beispiele stehen im Einklang mit der Definition von Valli: Die Nutzung von Gesten und die direkte Manipulation von elektronischen Objekten werden in die Manipulation der physikalischen Welt integriert, sodass der Benutzer keinen Bruch zwischen der einen und der anderen Art von Objekten mehr spürt. Auf der anderen Seite werden neue Konzepte erarbeitet, die bei der Nutzung von elektronischen Geräten angewandt werden können, wie z. B. das Strecken eines Bildes mit zwei Fingern. 2.1. Herausforderung beim Design von natürlicher Interaktion Die Gestaltung solcher Arten von Interaktionsformen bringt verschiedene Herausforderungen mit sich. Diese Herausforderungen verteilen sich auf verschiedene Abstraktionsebenen, von sehr abstrakten Fragestellungen bis hin zu detaillierten Fragestellungen, die sich mit der Spezifikation des Designs einer Interaktion

11


dieser Technologie? So lauten die Fragen, die die zweite Herausforderung umfassen. Als letzte im Tutorial behandelte Herausforderung steht die Erweiterung des Gestaltungsraums, die mehr Kompetenz von den Designern verlangt. Die Freiräume für das Design werden größer und sind nicht mehr so übersichtlich. Die Aktion des Benutzers ist Teil des Designziels und muss mitbetrachtet werden. Die Entscheidung, welche Gesten bzw. Interaktionsformen eine Aktion repräsentieren können und wie darauf basierend das System reagieren soll, sind jetzt relevante Aspekte für das Design von natürlicher Interaktion. Welche Elemente werden auf der graphischen Benutzeroberfläche gezeigt; was genau kann der Benutzer manipulieren; und wie findet diese Manipulation statt? Dies sind Fragestellungen, die die letzte Herausforderung in sich birgt.

Abb. 5. Gestenbibliothek von Gesturecons5

3. Designansätze für natürliche Interaktion beschäftigen. Im Folgenden sind einige dieser Herausforderungen aufgelistet: 1. Wie hängen natürliche Interaktion und User Experience zusammen? 2. Welche Dimensionen sollen beim Design der natürlichen Interaktion beachtet werden? 3. Was ist der Designraum für natürliche Interaktion? Hassenzahl (2010) präsentiert ein Modell für User Experience, in dem er die Interaktion mit einem Produkt als eine zielgerichtete Aktion beschreibt, die durch ein interaktives Produkt vermittelt wird [7, S. 11]. Relevant für die Interaktion mit einem technologischen Produkt sind die zwei unteren Ebenen seines Modells, die Do-Goals Ebene und die Motor-Goals Ebene (unterste Ebene). Do-goals sind eher von einem Produkt unabhängige Ziele, wie z. B. „jemanden anrufen“ oder „ein Video anschauen“. Man braucht ein Interaktionsgerät, um diese Ziele zu erreichen, mehrere in Frage kommende Geräte können aber sehr unterschiedlich sein. Motor-Goals sind dagegen stark an ein Gerät gebunden, da sie eine

12

Dekomposition des Aufgabenablaufs beschreiben, z. B. beinhaltet ein Anruf mit einem alten Wählscheibentelefon Aktionen wie „Hörer abheben“, „Finger in die Wählscheibe stecken“, „Nummer bis zur maximalen Position drehen“, usw. Es ist diese unterste Ebene der User Experience, auf der die Gestaltung der natürlichen Interaktion beeinflusst werden kann. Aber wie kann man das Design auf dieser Ebene der Experience beeinflussen, welche Faktoren sind dafür relevant, wie können diese Faktoren in den Designprozess integriert werden? Dies alles sind Fragen, die beantwortet werden müssen. Die zweite Fragestellung bezieht sich auf den Bruch zwischen digitaler und analoger Welt. Bei einer natürlichen Interaktion sollte der Benutzer nicht mehr so stark wahrnehmen, was Teil seiner digitalen Welt ist und was Teil seiner analogen Welt. Welche technischen Entwicklungen können solche Verbindungen zwischen den beiden Welten ermöglichen; wie sollen diese Technologien integriert werden; was sind die Gestaltungsmöglichkeiten für Designer bezüglich

Dieses Kapitel beschreibt drei Ansätze, die im Rahmen des Tutorials präsentiert werden. Einer davon, DESIGNi (vgl. Kapitel 3.2), wird auch mit den Teilnehmern ausprobiert und unterstützt die Gruppenarbeit. 3.1. Patterns und Richtlinien Zurzeit existieren über 100 Patterns und Richtlinien, die die Gestaltung solcher Systeme mit natürlicher Interaktion unterstützen. Die meisten davon stammen aus Erfahrungen bei der Entwicklung von Systemen für die neuen Smartphones und Tablet-PCs, vor allem bezüglich der Nutzung von Touch-Gesten. Touch-Gesten können als Single-Touch oder Multi-Touch (mehrere-Finger einer Hand), Multi-Finger/-Hände (mehrere Hände, mehrere Finger) klassifiziert werden. Weiterhin gehören dazu TangibleGesten und Free-Form-Gesten, die nicht notwendigerweise eine grafische Benutzeroberfläche verlangen. Im Bereich der multimodalen Steuerung von Systemen


Usability Professionals 2011 Tutorials

findet man auch Pattern und Richtlinien für multimodale Systeme und speziell für sprachbasierte Systeme. Diese Design Patterns unterstützen Designer bei der Entscheidung, geeignete Interaktionsformen für ein wiederkehrendes Designproblem zu identifizieren. Viele davon werden sogar anhand bestimmter Aktionen beschrieben und geben Designern mehr Sicherheit während der Entwicklung. Die existierenden Patterns, die allesamt bereits häufig eingesetzt wurden, werden vom Benutzer gut akzeptiert, sind einfach zu erlernen und durchzuführen [4].5 zeigt das Bild einer online verfügbaren Gestenbibliothek, die Designer bei der Entwicklung eines Systems unterstützt. [Abb. 5] Diese Design Patterns unterstützen Designer bei der Entscheidung, geeignete Interaktionsformen für ein wiederkehrendes Designproblem zu identifizieren. Viele davon werden sogar anhand bestimmter Aktionen beschrieben und geben Designern mehr Sicherheit während der Entwicklung. Die existierenden Patterns, die allesamt bereits häufig eingesetzt wurden, werden vom Benutzer gut akzeptiert, sind einfach zu erlernen und durchzuführen [4]. 3.2. Storyboard Das Storyboard ist eine Technik, die aus dem Kino- und Comic-Bereich übernommen wurde [4]. Es handelt sich um eine Folge von Bildern, die oft von textueller Beschreibung begleitet werden und eine Nutzungssituation eines Produkts darstellen. Das Storyboard erlaubt es, Gesten Schritt für Schritt zu konzipieren und zu zeigen, vor allem wenn Teile des erlebten Kontexts relevant sind. Die Anfertigung eines Storyboards wird oft für zeitaufwändig gehalten. Daher gibt es eine alternative Variante mit Fotos statt Zeichnungen. Diese Technik unterstützt die Gruppenarbeit von Designern bei der Konzeption neuer Interaktionsformen sowie des Ablaufs dieser Interaktionen. Das Storyboard wird vor allem empfohlen, um detaillierte Gesten und Gestensequenzen sowie den Kontext zu zeigen. Es regt zu mehr Ideen an und fördert den

Abb. 6. Storyboard [3]

Gruppenkonsens.6 zeigt ein Beispiel eines Storyboards von Safer (2008) [4]. [Abb. 6] Die Anfertigung eines Storyboards wird oft für zeitaufwändig gehalten. Daher gibt es eine alternative Variante mit Fotos statt Zeichnungen. Diese Technik unterstützt die Gruppenarbeit von Designern bei der Konzeption neuer Interaktionsformen sowie des Ablaufs dieser Interaktionen. Das Storyboard wird vor allem empfohlen, um detaillierte Gesten und Gestensequenzen sowie den Kontext zu zeigen. Es regt zu mehr Ideen an und fördert den Gruppenkonsens. 3.3. DESIGNi DESIGNi (Designing Interaction) ist eine Workbench, die die systematische Konzeption und Spezifikation von Interaktionen und ihrem Verhalten unterstützt [8]. Es erlaubt Designern, die Formen und die Eigenschaften einer Interaktion (d.h. das Zusammenspiel zwischen Mensch und System) intensiv und bewusst zu explorieren. Das Design der Interaktionen einer natürlichen Interaktion fördert auch die genaue

Beschreibung der Aktionen seitens des Menschen und die dementsprechende (Re) aktion seitens des Systems. Diese (Re)aktionen können durch die eigentliche Aktion, die Art und Weise und die spezifischen Attribute beschrieben werden (siehe Dieses Tutorial wurde in einer ähnlichen, aber verkürzten Form am WUD (World Usability Day) 2010 in Mannheim durchgeführt. Beim Tutorial erhalten die Teilnehmer eine Einführung in die Methode DESIGNi sowie Hilfsmaterial (in Form von annotierten Formblättern), um die Methode praktisch anzuwenden. Mit der im Tutorial angewendeten Methode erleben die Teilnehmer, wie sie die Interaktionsformen des Gestaltungsraumes gezielt explorieren können. Dies fördert die Kreativität und steigert gleichzeitig die Qualität der entwickelten Interaktion.7). DESIGNi wird für die detaillierte Gestaltung und Spezifikation von Interaktionen empfohlen. [Abb. 7] 4. Ausblick Dieses Tutorial wurde in einer ähnlichen, aber verkürzten Form am WUD (World Usability Day) 2010 in Mannheim durchgeführt. Beim Tutorial erhalten die Teilnehmer eine

13


1

Quelle: Screenshot von http://www.youtube. com/watch?v=twzRX982DNQ

2

Quelle: Screenshot von http://www.youtube. com/watch?v=p2qlHoxPioM

3

Abb. 7. Komponenten für die Beschreibung einer Interaktion mit DESIGNi [8]

Quelle: Screenshot von http://www.youtube. com/watch?v=mUdDhWfpqxg und von http:// www.youtube.com/watch?v=g3XPUdW9Ryg

4

Quelle: Screenshot von http://www.officelabs. com/Pages/Envisioning.aspx

5

Einführung in die Methode DESIGNi sowie Hilfsmaterial (in Form von annotierten Formblättern), um die Methode praktisch anzuwenden. Mit der im Tutorial angewendeten Methode erleben die Teilnehmer, wie sie die Interaktionsformen des Gestaltungsraumes gezielt explorieren können. Dies fördert die Kreativität und steigert gleichzeitig die Qualität der entwickelten Interaktion.

4. Entner, R. (2010). Smartphones to Overtake Feature Phones in U.S. by 2011 (URL). Gelesen am 18.05.2011von http://blog. nielsen.com/nielsenwire/consumer/ smartphones-to-overtake-feature-phones-inu-s-by-2011/ 5. Harrison, C., Tan, D., Morris, D. (2010). Skinput: appropriating the body as an input surface. In Proceedings of the 28th international conference on Human factors in computing systems (CHI ‘10).

Das Tutorial wird mit zahlreichen Beispielen angereichert und fördert an unterschiedlichen Stellen im Verlauf die aktive Beteiligung der Teilnehmer. Für die praktische Anwendung der Methode erhalten die Teilnehmer ein konkretes Szenario, das eine Gestaltungsaufgabe und ihren Kontext definiert. Diese Gestaltungsaufgabe wird dann in Gruppenarbeit gelöst. Die Gruppen stellen die verschiedenen Lösungen vor. Die Anwendung und die Erfahrungen der Teilnehmer mit der Methode werden anschließend diskutiert.

ACM, New York, NY, USA, 453-462. DOI=10.1145/1753326.1753394 http://doi. acm.org/10.1145/1753326.1753394 6. Hassenzahl, M. (2010). Experience Design: Technology for all the Right Reasons. Morgan and Claypool Publishers. 7. Mistry, P., Maes, P. (2009). SixthSense: a wearable gestural interface. In ACM SIGGRAPH ASIA 2009 Sketches (SIGGRAPH ASIA ‘09). ACM, New York, NY, USA, Article 11, 1 pages. DOI=10.1145/1667146.1667160 http://doi.acm.org/10.1145/1667146.1667160 Microsoft Office Labs – Vision 2019 8. Nass, C., Kloeckner, K., Diefenbach,

Literatur

S., Hassenzahl, M. (2010). DESIGNi: a

1. Anonymus. (2009). Future Vision Montage

workbench for supporting interaction

(URL). Gelesen am 19.05.2011 von

design. In Proceedings of the 6th Nordic

http://www.officelabs.com/projects/

Conference on Human-Computer

futurevisionmontage/Pages/default.aspx

Interaction: Extending Boundaries (NordiCHI

2. Anonymus. (2009). Kinect (URL). Gelesen am 19.05.2011 von http://www.xbox.com/de-DE/ kinect 3. Saffer, D. (2008). Designing Gestural

‚10). ACM, New York, NY, USA, 747-750. DOI=10.1145/1868914.1869020 http://doi. acm.org/10.1145/1868914.1869020 9. Valli, A. (2008). The design of natural

Interfaces: Touchscreens and Interactive

interaction. Multimedia Tools Appl. 38, 3

Devices. O‘Reilly Media, Inc.

(July 2008), 295-305. DOI=10.1007/s11042007-0190-z http://dx.doi.org/10.1007/ s11042-007-0190-z

14

Quelle: http://gesturecons.com/


Usability Professionals 2011 Tutorials

15


139

User Experience mit Biss Ansätze zur Bewusstseinsbildung und zum Wissenstransfer in Unternehmen bei der Einführung von User Centred Design Dr. Jan Seifert User Interface Design GmbH Martin-Luther-Straße 57-59 71636 Ludwigsburg jan.seifert@uid.com

Lisa Reimer User Interface Design GmbH Martin-Luther-Straße 57-59 71636 Ludwigsburg lisa.reimer@uid.com

Patrick Schick ETAS GmbH Borsigstraße 14 70469 Stuttgart patrick.schick@etas.com

Abstract

Keywords: /// User Experience /// Veränderungsmanagement /// Change Management /// Partizipation /// Kommunikation im Unternehmen

Hersteller interaktiver Produkte schenken dem Thema User Experience (UX) zunehmend Aufmerksamkeit bei der Entwicklung interaktiver Produkte. Viele Unternehmen wollen sich weiter entwickeln, mehr verwirklichen als die reine Erfüllung von technischen Anforderungen und mit geschärftem Bewusstsein auf die Nutzer und deren Bedürfnisse zugehen. Nach den ersten Experimenten mit diesem Ansatz im Unternehmen wird jedoch mitunter schnell klar: User-Centered Design einzuführen erfordert nicht nur die Vermittlung von Fachkompetenzen und das Etablieren von Prozessen und Strukturen, auch die „weichen“ Aspekte wie Einstellungen und Motivation von Mitarbeitern müssen für dieses Ziel geschärft werden. Nicht nur das Produktmanagement und das Entwicklungsteam müssen nutzerzentriertes Denken verinnerlichen – das gesamte Unternehmen sollte dahinter stehen. Außerdem müssen erworbene Kompetenzen in den Alltag übernommen werden, gehen dort aber im Alltagstrott meist schnell wieder verloren. Hier kommt der Ansatz „UX mit Biss“ ins Spiel, der von den Autoren gemeinsam entwickelt wurde. In einem zwanglosen Rahmen bekommen Mitarbeiter die Gelegenheit, sich über UX zu informieren und mit Experten zu diskutieren. Das Konzept kann beispielsweise als Frühstück mit Kaffee und Brezeln realisiert werden. Losgelöst von Projektarbeit, Zeitplänen oder Budget bietet es eine Möglichkeit, die Hemmschwelle zu senken und sich dem Thema anzunähern. Dadurch ergibt sich Raum, der die Offenheit bei den Teilnehmern erhöht. Sie können dort das Thema UX Engineering unvoreingenommener entdecken.

1. Ausgangssituation Wer dem Nutzer seiner Produkte eine bessere User Experience (UX) ermöglichen möchte, steht vor allem vor einer Herausforderung: neue Vorgehensweisen in die Produktentwicklung zu integrieren. Ein Weg, um diese Herausforderung anzugehen, ist das Veränderungsmanagement (auch Change Management). Veränderungsmanagement ist ein geplanter Prozess, der das Unternehmen darin unterstützt, zu lernen und sich zu entwickeln. Am Ende des Veränderungsmanagements steht ein Zielzustand, der sich meist grundlegend von der Ausganssituation des Unternehmens unterscheidet. Es ist schon fast banal darauf hinzuweisen, dass

16

Unternehmen letztlich aus den Mitarbeitern bestehen, die sich dort engagieren. „Der Erfolg von Veränderungen hängt maßgeblich von der Fähigkeit eines Unternehmens ab, seine Mitarbeiter in den paradigmatischen Veränderungsprozess zu integrieren“ (Kostka & Mönch, 2009, S. 9). Der Ansatz „UX mit Biss“ will diesem Umstand Rechnung tragen. Er will Neugierde beim Mitarbeiter wecken und konkretes Wissen vermitteln. Dieser Artikel identifiziert zuerst die Ziele für „UX mit Biss“, arbeitet anschließend die Wege zu den Zielen heraus und schlägt konkrete Lösungsschritte vor. Er erörtert die Voraussetzungen, die für „UX mit Biss“ gegeben sein müssen und zeigt eine konkrete Umsetzung anhand eines Beispiels.

2. Ziele „UX mit Biss“ hat Nutzer- und Prozessorientierte Ziele. Die Nutzer-orientierten Ziele dienen dazu, Veränderungen bei den betroffenen Mitarbeitern anzustoßen. Das Hauptziel ist, Widerstände durch Mitarbeiter abzubauen. Dazu bedarf es dem Aufbau von Wissen und Kompetenzen (z. B. Brehm, 1972; Doppler & Lauterburg, 1994). Für komplexere Fragestellungen, die nur mit viel Hintergrundwissen und Erfahrung gelöst werden können, sollten qualifizierte Ansprechpartner etabliert werden. Diese sollen sowohl bekannt als auch ansprechbar sein. Der betroffene Mitarbeiter beginnt als natürliche Reaktion (z. B. Brehm, 1972) die geplante


Usability Professionals 2011 Tutorials

Veränderung zu prüfen und stellt sie dabei ins Verhältnis mit seinen Kompetenzen und seinen Bedürfnissen: –– Welche Herausforderungen kommen auf mich zu? –– Kann ich sie bewältigen und wenn ja wie? –– Will ich das in Zukunft überhaupt machen? –– Könnte mir das Spaß machen?

und und die Arbeit konstruktiv verändern. Sie nehmen ihre Kollegen ernst und greifen deren Rückmeldungen auf.

Solche Fragen mögen auf den ersten Blick betriebswirtschaftlich wenig relevant erscheinen, sind aber für eine erfolgreiche Veränderung der Unternehmensprozesse von Bedeutung (z. B. Eilam & Shamir, 2005; Rüdel, 2007). Veränderungen in der Ausrichtung von Unternehmensprozessen betreffen darüber hinaus grundsätzlich nicht nur die fachliche Arbeit der Mitarbeiter, sondern auch ihre persönliche Lebenssituation und ihre Emotionen (z. B. Kostka & Mönch, 2009; Rüdel, 2007). Die Gestaltung von Veränderung im Unternehmen ist somit keine rein sachliche und fachliche Angelegenheit (Kostka & Mönch, 2009; Streich, 1997). Mitarbeiter werden vor neue, unbekannte Herausforderungen gestellt. Diese sind teilweise nicht vom Mitarbeiter gewollt und er weiß nicht, ob er diesen gewachsen ist. Jede Veränderung ruft Emotionen hervor (Frijda, 1988). Damit diese nicht negativ ausfallen, müssen Betroffene in Ihrem Selbstvertrauen gestärkt werden, diese Änderung bewältigen zu können (Kostka & Mönch, 2009).

„UX mit Biss“ ist durch zwei Strömungen beeinflusst. Zum Einen ist es eine Methode, die im Rahmen eines Veränderungsprozesses eingesetzt wird. Es lässt sich daher dem Change Management zuordnen. Zum Anderen orientiert sich der Ansatz an dem Thema, für das er sich selbst stark macht: User Experience. „UX mit Biss“ setzt ein Zeichen, indem die Unternehmensführung nicht nur von UX redet, sondern selbst von diesem Vorgehen überzeugt ist und partizipative Methoden einsetzt. Diese gehen mit Beispielen voran und demonstrieren, dass sie es ernst meinen und zeigen, dass und wie die Methoden funktionieren.

Die zweite Gruppe von Zielen betrifft den Veränderungsprozess selbst. Er sollte regelmäßig so optimiert werden, dass er zur jeweils aktuellen Unternehmensausrichtung passt. Dazu müssen geplante Maßnahmen der Veränderung hinterfragt und nötigenfalls auch an die realen Verhältnisse und Bedürfnisse angepasst werden. Zentral ist dabei, Rückmeldungen von Betroffenen zu solchen Veränderungen einzuholen und mögliche Missverständnisse seitens der Betroffenen zu diskutieren und auszuräumen. Dadurch zeigen Entscheider oder Veränderungsmanager, die Entscheidungen in die Tat umsetzen, dass Sie Veränderung nicht gegen den Willen ihre Kollegen durchsetzen, sondern diese mitnehmen

3. Einordnung in den Veränderungsprozess 3.1. Was haben Veränderungsmanagement und UX gemeinsam?

Die zentralen Aspekte von UX sind vor allem die Nutzerperspektiven. Diese drücken sich aus in der Nutzerbeteiligung und durch ein iteratives Vorgehen und interdisziplinäres Arbeiten. Der iterative Ansatz lässt sich direkt auf „UX mit Biss“ übertragen. Bei der Realisierung einer groß angelegten Veränderung muss der Vorgang dauernd beobachtet werden. Er muss kontinuierlich evaluiert und angepasst werden. Die Veränderung eines Unternehmensprozesses kann ohne Rückmeldungen der Mitarbeiter genauso wenig gelingen, wie eine Produktentwicklung ohne Nutzerfeedback. Aus Sicht der Veränderungsmanager fehlt es an Wissen, was eine Veränderung im Detail für die Nutzer und ihre Arbeitsabläufe bedeutet. Hier bestehen Parallelen zur Gestaltung eines User Interfaces: Man kann sich ein tolles Konzept ausdenken, aber ob Nutzer es tatsächlich beherrschen, muss erst durch Nutzerstudien herausgefunden werden. Je früher man sich solche Rückmeldungen einholt, desto besser kann man die Veränderung steuern und Frust bei Mitarbeitern vermeiden. „UX mit Biss“

ist für den Veränderungsprozess das, was der Usability Test für das Produkt ist. Deswegen ist „UX mit Biss“ ein Ansatz mit Nutzerbeteiligung. Veränderungen werden nicht von oben herab angeordnet. Die Mitarbeiter werden in den Prozess mit einbezogen, um Widerstände frühzeitig abzufangen und die Qualität des Endergebnisses zu steigern. Außerdem erhalten UX-Experten Rückmeldung, wie ihre Ideen von den Mitarbeitern verstanden werden. An geplanten Maßnahmen können Korrekturen vorgenommen werden, damit das gewünschte Potential der Veränderung voll zum Tragen kommt. Für die UX-Experten entfaltet sich so ein doppelter Nutzen: Sie lernen aus der Praxis, können besser und sicherer planen und ihre Vorstellungen direkter und besser vermitteln. 3.2. Change Management mit Biss „UX mit Biss“ entspricht dem Ansatz des benutzerzentrierten Gestaltungsprozesses (UCD) und erhält dadurch eine klare Ausrichtung. Dennoch geht der Ansatz weiter. Die Entwicklung von Unternehmen lässt sich teilweise mit der Entwicklung von Produkten vergleichen. Unternehmen bringen darüber hinaus Anforderungen mit sich, die sich aus der Produktentwicklung nicht ableiten lassen. Deshalb stellt dieser Abschnitt eine kurze Einordnung in den Veränderungsprozess dar. [Abb. 1] stellt typische Phasen eines Veränderungsprozesses dar. Der Verlauf zeigt die Haltung der Mitarbeiter zu den anstehenden Veränderungen. Auf einen ersten Schock folgt im Regelfall häufig eine Phase der deutlichen Ablehnung. Die Mitarbeiter betonen die vorhandenen Stärken, als ob diese ausreichen würden, um in Zukunft zu bestehen (Brehm, 1972). Mit einer fortschreitenden rationalen Einsicht setzt sich nach und nach die Erkenntnis durch, dass die Veränderung unweigerlich kommen wird. Doch rationale Einsicht ohne emotionale Akzeptanz kann den Aufschwung noch nicht einleiten. Erst wenn Mitarbeiter die Veränderung auch emotional akzeptieren kann dies geschehen.

17


Krise Selbstwirksamkeit der Mitarbeiter

Teufel im Detail

Erste Euphorie

Phase nach Streich (1997)

1 Schock, Verwirrung

2 Verneinung

Zeit 3 Einsicht

4 Emotionale Akzeptanz

5 Experimentieren

6 Erkenntnis 7 Integration

Abb. 1. Phasen eines Veränderungsprozesses

In diesen letzten Phasen arbeiten Mitarbeiter nach dem neuen Vorgehen. Sie erwerben neue Kompetenzen und übernehmen die Veränderung mehr und mehr in ihr eigenes Verhalten und in ihr Selbstverständnis (Schilling, Werr, Gand & Sardas, 2011; Eilam & Shamir, 2005). In dieses Verlaufsmodell kann „UX mit Biss“ in die mittleren Phasen (3-5) eingeordnet werden. Ist der erste „Change-Schock“ abgeklungen, dann ist dies der früheste Zeitpunkt, an dem eine solche Veranstaltung sinnvoll durchgeführt werden kann. Da die Teilnahme freiwillig ist, müssen die Mitarbeiter ihr eigenes Motiv haben, mitzumachen. Das kann durchaus darin bestehen, Widerstand gegen die Veränderung zu demonstrieren. Auch für eine solche Situation sollten Vorbereitungen getroffen werden. Andere Mitarbeiter wollen sich lediglich informieren, um ein genaueres Bild zu bekommen. Nur wenige kommen in dieser Phase bereits aus Sympathie und zur Unterstützung der Veränderung. Ab Phase drei setzt sich allmählich eine rationale Überzeugung durch. „UX mit Biss“ kann hier aktiv fördern, indem die UX-Experten gezielt auf Fragen und Kritik eingehen. Die Mitarbeiter können die Anforderungen des praktischen Alltags

18

direkt mit den geplanten Veränderungen in Beziehung setzen. Indem Missverständnisse ausgeräumt werden, lassen sich viele Widerstände direkt beseitigen. Darüber hinaus können Mitarbeiter auch mitteilen, worauf bei der Einführung der Veränderung ihrer Meinung nach geachtet werden muss. Mitarbeiter einzubinden und von ihnen Rückmeldung anzunehmen, ist in mehrerer Hinsicht bedeutsam. Die Zuversicht der Mitarbeiter und das Vertrauen ins Management werden dahingehend gestärkt, dass die Veränderung positiv für das ganze Unternehmen und jeden Einzelnen ist. Dies wird in den Studien des Beratungsunternehmens Capgemini (2010) als einer der Schlüsselfaktoren bei Veränderungen angesehen. Insgesamt wird das Commitment der Mitarbeiter gestärkt, was ebenso als zentral angesehen wird (Doppler & Lauterburg, 1994; Capgemini, 2010). Die Beteiligung der Mitarbeiter erhöht die Motivation und steigert die Identifikation mit dem Unternehmen (Doppler & Lauterburg, 1994). Zuletzt sollte „UX mit Biss“ auch so gestaltet werden, dass nicht nur die rationale Einsicht der Mitarbeiter angesprochen, sondern auch der Spaß an User Experience vermittelt wird. Auch über die letzte Phase hinaus lässt sich die Veranstaltung „UX mit Biss“ nutzen:

Sie schafft einen Raum, in dem Mitarbeiter User-Experience-Methoden ohne Zeit- und Ergebnisdruck spielerisch testen können. Das ist von großer Bedeutung, weil es in den meisten Schulungen oft schwer ist, neue Vorgehensweisen auf den Alltag zu adaptieren. 4. Lösungsansatz 4.1. Wege „UX mit Biss“ fördert den direkten Dialog zwischen den Betroffenen und den Veränderungsmanagern. Die aufgezeigten Wege können prinzipiell auf verschiedene Art erreicht werden: –– Bestehendes würdigen –– Missverständnisse ausräumen –– Regelmäßig Hilfe zu UX-Themen anbieten –– Zum Mitmachen motivieren –– Kommunikationsbarrieren abbauen 4.1.1. Bestehendes würdigen Ein kommunikatives Grundprinzip jeder Einführung von Veränderungen in ein Unternehmen sollte sein: „Das Alte ist nicht schlecht, nur weil jetzt etwas Neues


Usability Professionals 2011 Tutorials

kommt.“ In der gesamten Kommunikation sollte darauf geachtet werden, dass der Status quo entsprechend gewürdigt wird, denn Unternehmen haben mit den bewährten Methoden über lange Zeit erfolgreich Produkte auf dem Markt etabliert. Eine Abwertung von Bestehendem würde also im Gegensatz zu bereits Erreichtem stehen und tendenziell Widerstand hervorrufen. Doch der wirtschaftliche und/oder technische Rahmen verschiebt sich: Kunden verändern ihre Ansprüche, neue Technologien (MultiTouch, Gestensteuerung von Wii und Kinect) bieten ganz andere „Experiences“ als bisher. Darauf müssen Unternehmen und Mitarbeiter reagieren. 4.1.2. Missverständnisse ausräumen Nach der Analysephase und der Entscheidung über Veränderungen im Unternehmen gehört es zu den wichtigsten Maßnahmen, diese den Mitarbeitern mitzuteilen. Es bleibt jedoch eine gewisse Informationsunschärfe, da nicht alle Details der Entscheidungsfindung kommuniziert werden. Viele Aspekte bleiben unausgesprochen: zum Beispiel welche Motive die Geschäftsleitung mit der Veränderung verfolgt oder welche neuen Anforderungen dies an den Mitarbeiter stellt. Auch die Arbeit von Kotter (2006) zeigt: Das Thema Kommunikation wird häufig unterschätzt. Die Aussagen in den meisten Informationsmaterialien lassen oft Punkte unberührt, die für den Betroffenen von Bedeutung sind. Ohne direkte Kontakte kann es passieren, dass Umfang und Ziele der Veränderung zu einer Art „Black Box“ werden. Mitarbeiter tendieren dazu, die nicht vorhandenen Informationen durch konstruierte Zusammenhänge zu füllen. Solche Spekulationen sind nicht förderlich, denn die Unsicherheit verleitet die Mitarbeiter zu eher negativen Annahmen. Neben der Informationsunschärfe birgt jede Kommunikation die Gefahr von Missverständnissen im Bezug auf die explizit kommunizierten Informationen. Inwiefern Kommunikation tatsächlich den gewünschten Effekt hat, findet man nur

durch persönliche Kontakte heraus. Dazu muss das Feedback der Rezipienten systematisch erhoben werden. Erst dadurch identifiziert man Missverständnisse. Darüber hinaus hat keine Informationsbroschüre so viel Überzeugungskraft wie ein persönliches Gespräch. 4.1.3. Regelmäßig Hilfe zu UX-Themen anbieten

probieren können, eine freundliche Atmosphäre herrschen. Die drei Aspekte „Ansprechen“, „Informieren“ und „Ausprobieren“ stehen in einer gewissen zeitlichen Reihenfolge. 4.1.4. Zum Mitmachen motivieren

Die Institutionalisierung eines UX-Experten oder UX-Teams sorgt zwar formal für ständig verfügbare Ansprechpartner; die Hürde, diese zu kontaktieren kann jedoch hoch sein. Ein informelles Treffen, das in fest vorgegebenen Intervallen durchgeführt wird, soll diese Hürden abbauen. Jeder Teilnehmer hat bei Veranstaltungen wie „UX mit Biss“ die Möglichkeit, seine Probleme, Fragen und/oder Wünsche mitzuteilen und sich Hilfe zum aktuellen Projekt zu holen. Es entwickelt sich eine persönliche Beziehung zu den UX-Experten und Barrieren werden abgebaut.

Mitarbeiter sollten gezielt zur Teilnahme motiviert werden. Jeder soll aber für sich beurteilen können, wie viel er in der aktuellen Phase zur Verbesserung der Produkte und Dienstleistungen beitragen kann. Die Veranstaltung sollte nicht zum „gewöhnlichen Meeting“ werden, sondern in Kombination mit ungezwungenen Aktivitäten, wie z. B. dem Guten-MorgenKaffee oder einem Snack zwischendurch, angeboten werden. So kann statt einem Gefühl von verlorener Zeit eine kollegiale, entspannte und ungezwungene Atmosphäre entstehen, die sich positiv auf die „User Experience“ des Events auswirkt und somit die Akzeptanz des neuen Vorgehens unterstützt.

Der zweite Aspekt in Sachen Hilfe ist das Informieren. Die UX-Experten greifen einzelne Themen auf und präsentieren Hintergrundinformationen dazu. Dabei erläuterten sie, warum man eine neue Methode anwendet und wie.

Ein Mehrwert entsteht für Mitarbeiter dann, wenn sie in der Diskussion ihre aktuellen Entwurfsprobleme lösen können. Zur Lösung solcher Probleme kann jeder Teilnehmer der Gruppe sein Wissen und seine Erfahrung beitragen.

„UX mit Biss“ gibt Raum für eigenes Ausprobieren von UX-Methoden. Ohne den regulären Zeit- und Budgetdruck der Arbeit können dabei Erfahrungen und bestehendes Wissen ausgetauscht werden. Die Teilnehmer erhalten neue Informationen über Materialien und Hilfestellungen und können diese erkunden. Sie stehen nicht unter Leistungsdruck und können so positive Erfahrungen mit neuen Vorgehensweisen sammeln. Wenn es nicht klappt, entstehen daraus keine negativen Konsequenzen für ein Projekt. Wenn es klappt, können sie den Erfolg positiv verbuchen.

Damit die Teilnehmer nach der Veranstaltung das Gelernte verinnerlichen und damit arbeiten können, sollte Ihnen die Möglichkeit geboten werden, das kennengelernte oder erarbeitete Material wiederholt abrufen zu können, z. B. über ein firmeninternes Wissensportal.

Das Ausprobieren setzt voraus, dass gewisse UX-Grundkenntnisse bei den Teilnehmern von „UX mit Biss“ vorhanden sind. Dazu sollte in den Veranstaltungen, bei der die Teilnehmer unter Beobachtung

4.1.5. Kommunikationsbarrieren abbauen Genauso wichtig ist es, bestehende Kommunikationsbarrieren abzubauen und keine neuen entstehen zu lassen. Die Teilnehmer sollten keinen Zwang verspüren und nicht das Gefühl bekommen „abgefragt“ zu werden. In der Veranstaltung kann jeder Vorschläge und Themen einbringen – direkt oder anonym über den Moderator. Keine Idee wird als nichtig

19


abgetan und es wird gezeigt, dass über alles aus diesem Themengebiet gesprochen werden kann. Unterstützt wird dies durch die beschriebene informelle Atmosphäre, in der möglichst keine Hierarchien spürbar sein sollten. Der Team-Gedanke sollte stets im Fokus stehen und jedem Teilnehmer sollte bewusst werden, wie er selbst zu einem besseren Produkt beitragen kann. Dabei ist es ebenso wichtig, die Sprache des Teams zu sprechen und so wenige unbekannte Fachausdrücke wie nötig zu verwenden. Dies könnte Mitarbeiter abzuschrecken. Unumgängliche Fachausdrücke sollten so aufbereitet sein, das sich jeder nach Bedarf informieren kann. 4.2. Konkrete Schritte Ziel ist eine offene Kommunikationssituation: Die Teilnehmer können sich einbringen, müssen aber nicht. Man kann diskutieren, man kann sich aber auch nur informieren: Jeder ist willkommen. Eine geführte Veranstaltung ist hier also eher nicht das Mittel der Wahl. Um den persönlichen Austausch zu fördern, gestalten wir einen offenen Raum. Im Raum soll Bewegung möglich sein, damit die Teilnehmer sich zu immer neuen Gruppen zusammen finden und diskutieren können.

Hörsaal-Bestuhlung gewählt werden. Der Raum sollte in unterschiedliche Bereiche eingeteilt werden: –– Stehtische –– Sitzgruppen –– Arbeitsplätze, um etwas zu erstellen oder am Computer auszuprobieren –– Stellwände für Feedback, Poster, etc. –– Projektionsflächen zur Präsentation –– Snacks und Getränke Die genaue Gestaltung des Raums ist stark abhängig vom aktuellen Thema und der erwarteten Teilnehmerzahl. Wichtige Grundsätze, die immer beachtet werden sollen sind: –– Eine offene Raumgestaltung, damit Neuankömmlinge sich eingeladen fühlen –– Genügend Platz für alle –– Rückzugmöglichkeiten, um einzelnen Gruppen den Raum zum Gespräch zu geben.

Der folgende Teil konkretisiert diese Schritte. Dazu müssen bestimmte Rahmenbedingungen als gesetzt gelten. Er stellt außerdem verschiedene didaktische Mittel vor, die in der Veranstaltung Einsatz finden können.

Stationen. Innerhalb des Raumes sind verschiedene Stationen aufgebaut, durch die das Thema dem Teilnehmerkreis näher gebracht wird. Diese Stationen verwenden jeweils ein didaktisches Mittel (siehe unten). Folgende Stationen sollten nach Möglichkeit immer angeboten werden: –– Feedback-Ecke: Teilnehmer können Rückmeldung zur Veranstaltung oder allgemein zu UX geben. –– Ideen/Fragen-Pool: Teilnehmer können ihre Anregungen und Fragen für weitere Veranstaltung hinterlassen (auch anonym). –– Glossar: Wichtige UX-Begriffe sollten immer wieder erklärt werden.

4.2.1. Rahmenbedingungen

4.2.2. Ablauf

Thema. Jede Veranstaltung behandelt ein definiertes Thema, welches auf die Bedürfnisse des Teilnehmerkreises abgestimmt ist. Alle Inhalte sollten zunächst auf dieses Thema ausgerichtet sein, wobei auch generelle oder wiederkehrende Inhalte präsentiert werden können.

Die Vorbereitung von „UX mit Biss“ umfasst die Organisation der Veranstaltung selbst und die Einladung der Teilnehmer. Die Veranstaltung ist insgesamt offen angelegt, zu Beginn empfiehlt sich dennoch eine allgemeine Begrüßungsund Einführungsrunde als Warm-Up.

Raumgestaltung. Es sollte ein ausreichend großer Raum ohne Konferenz- oder

Einladung zur Veranstaltung. Es erfolgt eine Einladung der Zielgruppe via

20

persönlicher E-Mail und unterstützend durch direkte Ansprache. Darin wird kurz über Rahmen und Thema informiert. Wichtig ist, dass hier die freiwillige Basis deutlich wird. Zusätzlich sollten Poster in Gemeinschaftsräumen/Fluren/Schwarzen Brettern das Event ankündigen. Dabei sollte auf ein neugierig machendes, sich vom Standard abhebendes Design geachtet werden. Dadurch kann eine Streuung über die Kernzielgruppe hinaus erfolgen und der Wunsch der Geschäftsführungsebene zur Teilnahme ausgedrückt werden. Durchführung der Veranstaltung. Nach einer kurzen Einfindungsphase (ca. 10-15 Minuten) eröffnet der Organisator den Kreis offiziell und gibt eine kurze Einweisung: –– Veranstaltungsregeln –– Freiwillig, keine Verpflichtungen –– Man kann jederzeit kommen und gehen, wie es die aktuelle Arbeitssituation erlaubt. –– Einzelne Stationen kurz erläutern –– Ansprechpartner benennen und gegebenenfalls vorstellen Die Veranstaltung selbst verläuft sehr offen. Währenddessen stehen mehrere Betreuer zur Verfügung, die sich in Diskussionen einbringen und die Perspektive der Veränderungsmanager vertreten. 4.2.3. Didaktische Mittel Zur Vorstellung des jeweiligen Themas können unterschiedliche Mittel eingesetzt werden. Dabei unterscheidet man drei Ebenen, die unterschiedliche Zwecke verfolgen: –– Darstellende Präsentationsformen –– Aktive Handlungsstationen –– Diskussionsplattformen / Gespräche Darstellende Präsentationsformen können z. B. Poster, Filme oder Präsentationen sein. Themen sollten nicht nur über einen Sinneskanal (z. B. Sehen) zugänglich gemacht werden. Informationen können auch teilweise redundant wiedergegeben werden. So


Usability Professionals 2011 Tutorials

Film „Grundlagen der Orientierung“

UX Literatur

Tisch

Abb. 2. UCD-Würfel

Brezeln

kann ein Thema zunächst in einem kleinen Film dargestellt werden, um den Teilnehmer neugierig zu machen. Ein Poster, an einer anderen Station, vertieft das Thema. Auf dieser Ebene erlernen und vertiefen die Teilnehmer neue Inhalte. In weiteren Stationen können diese Informationen dann aktiv angewandt oder diskutiert werden. Zu den aktiven Handlungsstationen gehören beispielsweise Übungen, „Basteleien“ oder Material zum Ausprobieren (z. B. Rechner mit einer Software zum Testen). Durch diese eigenen Erfahrungen verinnerlichen die Teilnehmer die Inhalte ungezwungen und ohne Projektdruck. Vor allem der Projektdruck stellt im Arbeitsalltag oft ein Hindernis dar, neue Vorgehensweisen auszuprobieren. Die Veranstaltung gibt den Raum, Fehler machen zu können oder umständliche Wege zu testen. Nur dadurch bekommen Teilnehmer ein Gefühl dafür, wie eine neue Methode im Projektalltag eingesetzt aussehen kann. An manchen dieser Stationen kann der Nutzer außerdem etwas „erschaffen“, das er als Gedankenstütze mitnehmen kann und das ihn permanent an das Erlernte erinnert. Ein Beispiel hierfür ist ein Würfel, dessen Seiten die Teilnehmer mit Notizen zu den vier Phasen des benutzerzentrierten Gestaltungsprozesses füllen können. Die [Abb. 2] zeigt einen unausgefüllten, gebastelten Würfel. Zusätzlich zur Vertiefung entstehen im aktiven Handeln neue Fragen und es

Poster 1.Metaphern 2. Vertiefung Orientierung

Poster Wireframes (Wiederholung des letzten Termins) Säule im Raum

Feedback-Ecke

Pinnwand

Karten & Stifte

Tür

Abb. 3. Beispiel zum Thema Orientierung – Raumaufteilung

äußern sich Bedürfnisse, die dann in einer Diskussion geklärt bzw. weitergegeben werden können.

Veranstaltern zum anderen die Möglichkeit, mehr über die konkreten Anforderungen im Arbeitsalltag zu erfahren.

Die Diskussionsplattform als solche wird durch Ansprechpartner und durch den notwendigen Raum ermöglicht. Ziel ist es zum einen, dass die Teilnehmer das Gesehene und Erlebte reflektieren und mit einem fachkundigen Kollegen diskutieren können. Die Diskussion bietet den

4.3. Konkretes Beispiel Ein konkretes Beispiel erläutert die Wege und didaktischen Mittel. Das „UX Breakfast“ wird bei der ETAS GmbH in einem 6 – 8-wöchigen Turnus seit Anfang 2011

21


durchgeführt. ETAS befasst sich seit mehreren Jahren mit der Neuausrichtung zu UX-orientierter Entwicklung. Die Ausgangssituation und Ziel der Veranstaltung entspricht im Großen und Ganzen der oben beschriebenen.

Als Hersteller von Automotive Engineering Software sind es oft Weiterentwicklungen oder Verbesserungen von bestehenden Produkten, mit dem die Entwicklung beschäftigt ist. Kommt jedoch in einem Release eine größere Veränderung, z. B. im visuellen Design oder neue Funktionalitäten, ist es wichtig, alle Nutzer mitzunehmen. So müssen sich nicht nur Nutzer zurecht finden, für die neben der Software auch die Logik dahinter neu ist. Ebenso erfahrene Nutzer müssen effizient in die neuen Wege eingeführt werden.

–– Wireframes (Wiederholung des letzten UX Breakfasts) –– UX Literatur –– Feedback-Ecke 5. Fazit „UX mit Biss“ ist ein flexibler und partizipativer Ansatz, der eine bessere Verankerung der UX-Ausrichtung in Unternehmen stützt und fördert. Er passt sich flexibel an den jeweiligen Bedarf der Phasen im Veränderungsprozess an und eignet sich als langfristige Begleitmaßnahme. Die besonderen Stärken, verglichen mit anderen Ansätzen sind: –– Die grundsätzliche Freiwilligkeit, –– die Möglichkeit, zwanglose Rückmeldungen Betroffener einzuholen, –– und der offene Raum für Diskussion, in dem Teilnehmer ihre eigenen Fragen stellen dürfen.

Dazu sollte die Veranstaltung „Orientierung“ den am Entwicklungsprozess beteiligten Mitarbeitern verschiedene Aspekte näher bringen: Wie orientiert sich ein Nutzer in seiner Umwelt? Wie ist dieses Verhalten auf ein UI übertragbar? Wie kann auf unterschiedlichen Wegen Hilfestellungen gegeben werden? Besonderer Anspruch war es, von der Devise „Ach, die technische Dokumentation schreibt da schon was dazu“ wegzukommen. Vielmehr sollte gezeigt werden, wie in Zusammenarbeit zwischen Entwicklern und Technischer Redaktion bereits frühzeitig Ideen für die Integration von offensichtlichen oder indirekten Hilfen in die Oberflächen entstehen können. Folgende Stationen entstanden dazu – Aufteilung [Abb. 3]: –– Film: Grundlagen der Orientierung –– Poster: –– Metaphern –– Vertiefung „Orientierung“

22

Abb. 4. Feedback eines Teilnehmer. Den Teilnehmern standen für ihr Feedback leere Zettel oder Bildkarten zum Assoziieren zur Verfügung.

Im Gegensatz zu vielen anderen Ansätzen gibt es keine feste Agenda, sondern einen Rahmen, der von den Teilnehmern mitgestaltet werden kann. Jeder kann sich einbringen, fühlt sich ernst genommen und respektiert. Die ersten Veranstaltungen bei ETAS zeigen durch die positiven Rückmeldungen der Teilnehmer, wie sie für die Veränderung des Unternehmens gewonnen werden konnten. [Abb. 4] Literatur 1. Brehm, J. W. (1972). Responses to Loss of Freedom. A Theory of Psychological Reactance. Morristwon: General Learning Press. 2. Capgemini (2010). Change ManagementStudie 2010. München: Capgemini Consulting. 3. Doppler, K. & Lauterburg, C. (1994). Change Management - Den Unternehmenswandel gestalten. Frankfurt/Main; New York: Campus Verlag, 4. Auflage.


Usability Professionals 2011 Tutorials

4. Eilam, G. & Shamir, B. (2005). Organizational Change and Self-Concept Threats - a Theoretical Perspective and a Case Study. Journal of Applied Behavioral Science, 41, 399-421. 5. Frijda, N. H. (1988) The laws of emotion. American Psychologist, 43, 349-358. 6. Kostka, C. & Mönch, A. (2009). Change Management. München: Hanser. 4. Auflage. 7. Kotter, J. (2007). Leading Change - Why Transformation Efforts Fail. Harvard Business Review, 73, 59-67. 8. Ruedel, I. (2007). Der direkte Weg ins Herz Ihrer Mitarbeiter - Emotionales Change Management. Bonn: Verlag interna. 9. Schilling, A., Werr, A., Gand, S. und Sardas, J.-C. (2011). Understanding professionals‘ reactions to strategic change: the role of threatened professional identities‘. The Service Industries Journal, 1–17. 10. Stolzenberg, K. & Heberle, K. (2009). Change Management. Heidelberg: Springer. 2. Auflage. 11. Streich, R.K. (1997): Veränderungsmanagement. In: Reiss, M., Rosenstiel, L., Lanz, A. (Hrsg.): Change Management: Programme, Projekte und Prozesse. Stuttgart: Schäffer Pöschl, S. 237-254. 12. Vahs, D. & Weiand, A. (2010) Workbook Change Management. Stuttgart: SchäfferPoeschel Verlag.

23


151

UX meets RE Hohe User Experience durch bedarfsgerechte Anforderungsspezifikation Anne Gross Fraunhofer Institut für Experimentelles Software Engineering (IESE) Fraunhofer Platz 1 67663 Kaiserslautern Anne.Gross@iese.fraunhofer.de

Steffen Hess Fraunhofer Institut für Experimentelles Software Engineering (IESE) Fraunhofer Platz 1 67663 Kaiserslautern Steffen.Hess@iese.fraunhofer.de

Abstract Die Erreichbarkeit einer hohen User Experience in Softwareprodukten setzt ein detailliertes Verständnis über Benutzer und deren Aufgaben voraus. Daher bilden Anforderungsdokumente für die Aktivitäten von Usability Professionals eine wichtige Arbeitsgrundlage. Aber auch für andere Rollen wie beispielsweise Architekten oder Tester bilden Anforderungsdokumente eine wichtige Informationsquelle. Dies bringt jedoch die Herausforderung mit sich, dass unterschiedliche Informationsbedarfe in diesen Dokumenten in Abhängigkeit der jeweiligen Rollen und Aufgaben abgedeckt sein müssen. Dabei ist zu beobachten, dass diese unterschiedlichen Informationsbedarfe häufig nicht adäquat adressiert werden, wodurch die Nutzbarkeit und auch Akzeptanz von Anforderungsdokumenten negativ beeinflusst wird. In diesem Tutorial erarbeiten und diskutieren die Teilnehmer konkrete Informationsbedarfe und Erwartungen, die in Anforderungsdokumenten aus der Sicht von Usability Professionals adressiert sein sollten, um eine effektive und effiziente Nutzbarkeit der Dokumente zu erreichen. Basierend auf einem Framework zur systematischen Erhebung und Verfeinerung von Anforderungen werden resultierende Artefakte hinsichtlich ihrer Relevanz bewertet und geeignete Repräsentationen diskutiert.

1. Motivation Die Entwicklung von Software mit einer hohen User Experience (UX) geht nicht ohne eine detaillierte Erfassung und Analyse von Benutzeranforderungen einher. Daher bilden Dokumente, die diese Anforderungen dokumentieren, eine wichtige Grundlage für die Aktivitäten eines Usability Professionals: etwa zur benutzerund aufgabenorientierten Gestaltung von Bedienoberflächen oder von Interaktionen. Aber nicht nur für Usability Professionals gelten Anforderungsdokumente als eine wichtige Informationsquelle. Auch andere Rollen, welche in Softwareentwicklungsprojekte involviert sind, wie Architekten, Tester und Programmierer, basieren ihre Arbeiten und Aktivitäten auf Informationen und Artefakten, die in Anforderungsdokumenten spezifiziert sind.

24

Dies führt zu der Herausforderung, dass Anforderungsdokumente unterschiedliche Informationsbedürfnisse und Erwartungen adressieren müssen, die abhängig sind von der jeweiligen Rolle und Aufgabe, die die Leser der Anforderungsspezifikationen (sog. „Dokument-Stakeholder“) haben. Abbildung 1 illustriert verschiedene Dokument-Stakeholder und veranschaulicht exemplarische Informationsbedarfe für Tester, UI Designer und Architekt. Ein Architekt benötigt z. B. detailliertes Wissen über Qualitätsanforderungen, Daten und technische Rahmenbedingungen, wohingegen die Arbeiten eines Usability Professionals auf detaillierten Beschreibungen der Benutzer, Use Cases, sowie zu unterstützenden Aufgaben und Workflows basieren. Für den Tester stellen ebenfalls detaillierte Use Case Beschreibungen eine wichtige Informationsgrundlage dar, etwa zur Ableitung von Testfällen.

Keywords: /// User Experience /// Usability Engineering /// Requirements Engineering /// Anforderungsdokumente /// Perspektiven-orientierte Anforderungsspezifikation

Aber nicht nur bezüglich der Relevanz verschiedener „Anforderungstypen“ (Artefakten) wie z. B. Benutzerbeschreibungen oder Workflow-Beschreibungen gibt es unterschiedliche Bedarfe zwischen den Dokument-Stakeholdern. Ebenso gibt es Unterschiede hinsichtlich der geeigneten Repräsentation der verschiedenen Artefakte (z. B. Notation, Detailtiefe) was eine initiale Studie gezeigt hat (siehe Abschnitt 2.2). [Abb. 1] Heutzutage gibt es bereits eine Vielzahl etablierter Methoden, Standards, und Guidelines, die Anforderungsingenieure dabei unterstützen, Anforderungen systematisch zu erheben und zu spezifizieren [1, 2, 3, 4]. Allerdings adressiert keine dieser Methoden gezielt und explizit die „individuellen“, d.h. rollen-spezifischen Informationsbedarfe der unterschiedlichen Dokument-Stakeholder. Vielmehr resultieren daraus Anforderungsdokumente, die weit mehr Informationen enthalten, als der


Usability Professionals 2011 Tutorials

Abb. 1. Dokument-Stakeholder und ihre Informationsbedarfe

Dokument-Stakeholder für die Durchführung seiner Aktivitäten eigentlich benötigt, was das Auffinden relevanter Informationen im Dokument erschwert. Oder aber es fehlen wichtige Informationen, oder die Informationen sind unzureichend repräsentiert etc. [5]. Alle diese Faktoren beeinflussen auf negative Weise eine effiziente und effektive Nutzung der Anforderungsdokumente, was zur Folge hat, dass die Akzeptanz für solche Anforderungsdokumente negativ beeinflusst wird. Im schlimmsten Fall führt diese geringe Akzeptanz dazu, dass Anforderungsdokumente von den Dokument-Stakeholdern vernachlässigt

werden und es letztendlich zur Umsetzung von Softwareprodukten kommt, die die Benutzeranforderungen nicht adressieren.

2. Perspektiven-orientierte Anforderungsspezifikationen

Mit zunehmender Komplexität von Softwaresystemen und Trends hinsichtlich agiler Entwicklung wird dieses Problem der unzureichenden Nutzbarkeit und Akzeptanz von Anforderungsdokumenten in Zukunft ein immer größer werdendes Problem darstellen. Im Folgenden werden zunächst die Lösungsidee von perspektiven-orientierten Anforderungsspezifikationen sowie bisherige Aktivitäten vorgestellt. Anschließend wird noch ein kurzer Ausblick auf aktuelle und künftige Aktivitäten gegeben.

Um dem oben beschriebenen Problem der unzureichenden Nutzbarkeit von Anforderungsdokumenten entgegenzuwirken, erforschen die Autoren derzeit „Perspektiven-orientierte Anforderungsspezifikationen“ mit dem Ziel, den Dokument-Stakeholdern bedarfsgerechte Anforderungsdokumente zur Verfügung zu stellen, die effektiv und effizient genutzt werden können (vgl. [Abb. 2]).

25


Abb. 2. Forschungsvorhaben zur perspektiven-orientierten Anforderungsspezifikation

In einem ersten Schritt arbeiten die Autoren derzeit daran, empirisch validiertes Wissen darüber zu erhalten, welche Informationsbedarfe aus der Perspektive der verschiedenen Dokument-Stakeholder in Abhängigkeit ihrer jeweiligen Rolle und Aufgaben im Rahmen eines Softwareentwicklungsprojektes existieren. Im Folgenden wird dabei besonders auf die Rolle des Usability Professionals eingegangen und somit folgende Forschungsfragen adressiert: –– Welche Aufgaben eines Usability Professionals werden mit Hilfe von Anforderungsdokumenten unterstützt? –– Welche Artefakte sind für die Durchführung dieser Aufgaben relevant? –– Wie sollen diese Artefakte repräsentiert sein? –– Welche Notation wäre optimal für die Darstellung? –– Welche Details / Informationen sollen dokumentiert werden? In einem zweiten Schritt soll das Wissen über die jeweiligen Informationsbedarfe

Abb. 3. Entscheidungspunkte des TORE Frameworks

26

in ein Wissensmodell einfließen, welches es schließlich durch geeigneten Toolsupport ermöglicht, perspektiven-orientierte Anforderungsspezifikationen zu generieren, beispielsweise durch Bildung von perspektiven-orientierten „Sichten“ auf ein Anforderungsdokument. Dies ermöglicht es, dass den Dokument-Stakeholdern alle (und nur) relevante Artefakte und Informationen im Anforderungsdokument zur Verfügung gestellt werden, die diese benötigen, um ihre Aufgaben optimal zu erfüllen. Eine solche Lösung bildet somit auch aus Sicht von Usability Professionals einen wesentlichen Vorteil, da für die Entwicklung und Gestaltung von Software mit einer hohen UX eine detaillierte Analyse der Anforderungen seitens des Usability Professionals eine unabdingbare Voraussetzung ist. Eine bedarfsgerechte und perspektiven-orientierte Anforderungsspezifikation kann hier eine wesentliche Unterstützung bieten, Softwareprodukte mit einer höheren UX effektiver und effizienter entwickeln können.

3. Bisherige Arbeiten 3.1. TORE Framework Die derzeitigen Forschungsarbeiten zur Erarbeitung der verschiedenen Informationsbedarfe basieren auf dem am Fraunhofer IESE entwickelten TORE Framework [6]. Dieses Framework (dargestellt in Abbildung 3) umfasst verschiedene Entscheidungspunkte, die einen Anforderungsingenieur darin unterstützen, Anforderungen systematisch zu erheben und über verschiedene Abstraktionsebenen hinweg zu verfeinern. Ausgehend von der Entscheidung, welche Benutzer vom Softwareprodukt unterstützt werden sollen, spezifiziert man deren Ziele und Aufgaben und verfeinert diese Aufgaben systematisch weiter über eine Analyse von Workflows bis hin zu konkreten Systemfunktionalitäten und Interaktionsbeschreibungen, die von verschiedenen Stakeholdern weiterverarbeitet werden. [Abb. 3]


Usability Professionals 2011 Tutorials

Abb. 4. Persona (Beispiel)

Abb. 5 Beispiel für eine tabellarische Use Case Beschreibung auf Basis eines Templates

Wendet man dieses Framework nun in einem konkreten Softwareprojekt an, so entstehen verschiedene Artefakte (wie z. B. Benutzerbeschreibungen, Zielbeschreibungen, Workflow-Beschreibungen, Interaktionsbeschreibungen), die die getroffenen Entscheidungen in Form von konkreten Anforderungen dokumentieren. Zur Dokumentation dieser Artefakte stehen verschiedene Notationen zur Verfügung. Abbildung 4 illustriert beispielsweise eine Benutzerbeschreibung in Form einer Persona [7], Abbildung 5 eine Interaktionsbeschreibung in Form einer tabellarischen Use Case Beschreibung [8]. [Abb. 4] [Abb. 5]

3.2. Eye-Tracker Studie 3.2.1. Ablauf In einer initialen Eye-Tracker Studie mit einem mobilen Eye-Tracker (vgl. Abbildung 6 und Abbildung 7) wurden 2 Software Architekten und 2 Usability Professionals mit einer Anforderungsspezifikation bestehend aus einer Spezifikation der Systemanforderungen und einer Spezifikation von Domänenanforderungen konfrontiert. Die Dokumente wurden basierend auf dem TORE Framework erstellt und enthielten insgesamt 35 Artefakte, die aus Sicht des Anforderungsingenieurs für die Erstellung des Systems relevant sind. Das Verhalten der Probanden wurde durch Eye-Tracking, eine externe Kamera und 1-3 Beobachter, die jeweils Protokoll führten analysiert.

Außerdem war ein Versuchsleiter anwesend und die Probanden waren angewiesen laut zu denken. Ziel der Studie war es, grundsätzliche Informationsbedarfe der beiden Rollen zu erheben und darüber hinaus auch Unterschiede in der Arbeitsweise mit dem Dokument festzustellen. Die Abbildungen der Prozesse waren auf Grund der Größe teilweise im Raum aufgehängt, weswegen ein mobiler Eye-Tracker die optimale technische Unterstützung zur Analyse war. Basierend auf der Auswertung der Studie wurden Schlussfolgerungen über Schwachstellen im Dokument und Relevanz der Artefakte gezogen.

27


keine Relevanz hat und dadurch die Arbeit mit dem Dokument unnötig erschwert. [Tab. 1]

Abb. 6. Eye-Tracker Studie - Bearbeitung des Anforderungsdokumentes

Darüber hinaus wird schnell deutlich, dass ein Anforderungsdokument einen Kompromiss darstellt, mit dem Architekten und Usability Professionals zwar arbeiten können, aber für keine der beiden Rollen ist das Dokument wirklich optimal. Im Folgenden werden diese unterschiedlichen Informationsbedarfe anhand von konkreten Beobachtungen während der Studie für ausgewählte Artefakte erläutert. Allgemeines

Abb. 7. Eye-Tracker Studie Workflowabbildungen

3.2.2. Ergebnisse Im Rahmen der Eye-Tracker Studie wurden die Teilnehmer zusätzlich in Form eines Fragebogens zu Problemen, Relevanz und Verwendungszweck aller Artefakte befragt. Dabei wurde vor allem festgestellt, dass nicht alle benötigten Artefakte in den Anforderungsdokumenten enthalten waren (z. B. technische Rahmenbedingungen fehlten). Es wurde ebenso deutlich, dass nicht alle Artefakte für die Rollen Architekt und Usability Professional gleichermaßen relevant sind und dass es starke Unterschiede in der Präferenz zwischen den einzelnen Rollen gibt. Tabelle 1 zeigt die Auswertung der Artefakt-Relevanz in Bezug zur jeweiligen Rolle und zeigt auf den ersten Blick, dass für den Usability Professional eine erhebliche Menge an Artefakten

Aus Sicht der Usability Professionals beinhaltet ein Anforderungsdokument zu viele Informationen. Es werden nur diese Informationen gelesen, die als tatsächlich relevant erachtet werden. Problem dabei ist es, diese Informationen im Dokument zu finden, wenn es nicht angemessen strukturiert ist. Klassische Vorgehensweise ist, dass zunächst auf Personas, Use Cases und Informationen zum Nutzungskontext zugegriffen wird. Für Architekten beinhaltet das Anforderungsdokument zu viel textuelle Beschreibung, eine Darstellung primär in Form von Diagrammen wäre sinnvoll. Wichtig ist eine gute Strukturierung und Formatierung des Dokumentes, da der Architekt zunächst versucht, sich einen Überblick über das zu erstellende System zu verschaffen, in dem er vor allem auf Überschriften, Grafiken und Diagramme zugreift – wichtige Dinge markiert und diese später im Detail anschaut. Stakeholder Beschreibungen

Usability Professionals sind sehr stark an die strukturierte Persona gebunden. Diese hilft ihnen deutlich mehr als eine rein textuelle Beschreibung der Benutzer.

Relevanz der Artefakte

Use Cases

Eine gute Verfolgbarkeit zwischen Use Case Diagrammen und Use Case Beschreibungen ist für Usability Professionals eine wichtige Eigenschaft, um mit dem Anforderungsdokument produktiv arbeiten zu können. Im Use Case ist vor allem die Beschreibung des Interaktionsflusses relevant. Nichtfunktionale Anforderungen (insbesondere solche, welche sich auf Usability beziehen) beschreiben in der Regel Sachverhalte, die man als guter Usability Professional sowieso berücksichtigen sollte und sind insofern nicht hilfreich, da sie nicht detailliert spezifiziert sind. In der durchgeführten Studie waren Architekten der Auffassung, dass Use Case Diagramme nicht so hilfreich wie Workflows sind. In einem Use Case sind außerdem zu viele detaillierte Informationen enthalten, die es schwierig machen einen Überblick zu gewinnen. Um als Architekt optimal damit arbeiten zu können, sollten Use Case Beschreibungen auf die wesentlichen Elemente (Interaktionsfluss, Nichtfunktionale Anforderungen und Daten) reduziert werden. Workflows

Bei der Darstellung der Workflows waren sich Usability Professionals und Architekten einig, dass eine grafische Darstellung der Workflows sehr hilfreich ist, dass diese aber unbedingt auch durch eine textuelle Beschreibung ergänzt werden sollte, um

Architekt

Usability Professional

Sehr wichtig

19/35

18/35

Eher wichtig

12/35

4/35

Eher unwichtig

4/35

4/35

Unwichtig

0/35

9/35

Tab. 1. Relevanz der Artefakte

28

Architekten hingegen interessieren sich überhaupt nicht für Personas, da Details der Stakeholder keine Relevanz besitzen. Wichtige Attribute der Stakeholder bezüglich der Systemanforderungen (z. B. Erwartungen ans System, Involvierung ins System) sollten vielmehr in Form von Tabellen oder Listen dargestellt werden, um einen schnellen Überblick zu gewinnen.


Usability Professionals 2011 Tutorials

ggf. Missverständnissen vorzubeugen und unklare Sachverhalte nachlesen zu können. Hierbei sollte dann auf unnötige Details, wie z. B. Probleme und Wünsche direkt im Workflowdiagramm verzichtet werden und dort eine möglichst übersichtliche Darstellung geboten werden. Nichtfunktionale Anforderungen (Qualitätsanforderungen)

Zur Erstellung des User Interface Designs sind nicht alle im Anforderungsdokument spezifizieren Qualitäten relevant. Positiv hervorgehoben wurde, dass die Anforderungen sehr strukturiert dargestellt sind und man so schnell die für UI Design relevanten Qualitäten findet. Für die Architekten hingegen sind alle dargestellten Qualitäten relevant. Vor allem die graphische Repräsentation und die Verfeinerung der Attribute bieten hier dem Leser einen Mehrwert. Die zusätzliche textuelle Beschreibung erweckt den Eindruck, dass hier redundante Informationen gezeigt werden. Wichtige Informationen sollten auf jeden Fall im Text hervorgehoben sein. Darüber hinaus wurden in der Studie weitere allgemeine Erkenntnisse gewonnen: –– Die Relevanz der Artefakte ist von der Projektsituation abhängig, d.h. eine flexible Lösung wird benötigt –– Die Vorgehensweise bei der Analyse der Dokumente hängt sehr stark von der individuellen Person ab –– Systemanforderungen sind generell relevanter als Domänenanforderungen –– Verbesserung bezüglich der Notationen sollte in Betracht gezogen werden

4. Future Work

6. Adam S., Doerr J., Eisenbarth M., and Gross A. (2009). Using Task-oriented Requirements Engineering in Different Domains -

Künftige Arbeiten haben in erster Linie das Ziel, die Ergebnisse der initialen Studie zu validieren und somit eine größere Datengrundlage für die Entwicklung der perspektiven-orientierten Anforderungsspezifikation zu erhalten. Hierzu wird als nächste Aktivität ein Tutorial auf der UPA 2011 durchgeführt. Weiterhin soll die Erstellung von perspektivenorientierten Anforderungsspezifikationen durch ein Tool unterstützt werden, um somit gleichermaßen dem Anforderungsingenieur als auch den weiteren beteiligten Rollen (wie Architekt und Usability Professional) eine wertvolle Unterstützung bei der Entwicklung von Softwaresystemen zu bieten. Anforderungsingenieure würden so bei der Erhebung der Informationen und der Erstellung der Anforderungsdokumente unterstützt werden. Architekten und Usability Professionals würden eine Arbeitsgrundlage erhalten, die jeweils auf ihre Bedarfe zugeschnitten ist und in produktivem Einsatz optimal verwendet werden könnte.

Experiences with Application in Research and Industry. In Proceedings of the 2009 17th IEEE International Requirements Engineering Conference, RE (RE ‚09). IEEE Computer Society, Washington, DC, USA, 267-272, 2009 7. Cooper, Alan. The Inmates Are Running the Asylum : Why High-Tech Products Drive Us Crazy and How to Restore the Sanity. Indianapolis, USA, 1999. 8. Jacobson I. (2004).Use cases -- Yesterday, today, and tomorrow” in Software and systems modeling, pp 210-220, August 2004

Literatur 1. IEEE (1998). Recommended practice for Software Requirements Specifications. Standard IEEE Std. 830-1998, Institute of Electrical and Electronic Engineers, 1998 2. Volere Requirements Specification Template: Robertson S., Robertson, J (2006). Mastering the Requirements Process—Second Edition, Addison-Wesley, 2006. ISBN 0-321-41949-9 3. Simon, T., Streit, J., and Pizka, M. (2008). Practically Relevant Quality Criteria for Requirements Document, itestra GmbH, Germany, published at International Conference on Software Engineering Research and Practice 2008 4. Firesmith, D. (2003) “Modern Requirements Specification”, in Journal of Object Technology, Vol. 2, No. 1, March-April 2003, pp. 53-64 5. Gross, A. (2010). Perspective-based Specification of Efficiently and Effectively Usable Requirements Documents”, Doctoral Symposium, Requirements Engineering Conference (RE’10), Sydney, Australia

29


Gefühlvoll gestalten – Praxismethoden für emotionales Design interaktiver Produkte Christina Sturm Daimler AG Leibnizstraße 2 71032 Böblingen christina.sturm@daimler.com

Daniela Vey Infodesignerin.de Forststraße 172 70193 Stuttgart dv@infodesignerin.de

Abstract Warum fühlen sich Menschen zu bestimmten interaktiven Produkten hingezogen? Was macht Produkte attraktiv und wie können sie Emotionen beim Nutzer auslösen? Wie können Produkte „emotional“ konzipiert und gestaltet werden? Welche Rolle spielt dabei die User Experience? Welche Methoden gibt es dazu, die in der Praxis sinnvoll einsetzbar sind? Haben Sie sich diese oder ähnliche Fragen schon einmal gestellt? In diesem Tutorial werden Antwortmöglichkeiten für solche Fragestellungen basierend auf ausgewählten theoretischen Modellen und Methoden aus der User Experience-Forschung erörtert. Die Teilnehmer erhalten Einblicke in Vorgehensweisen, die sich in der Praxis eignen, um interaktive Produkte bedürfnis- und erlebniszentriert zu gestalten. Schwerpunkt des Tutorials ist eine Praxisübung, in der die Teilnehmer einen Papierprototypen für ein neuartiges interaktives HiFi-Produkt unter Berücksichtigung der vorgestellten Methoden entwerfen und anschließend im Hinblick auf die potenzielle User Experience diskutieren.

1. Einleitung Emotional Design, User Experience, Joy of Use, Flow, Product Pleasure, Emotional Experience, Funology, Affective Computing, Hedonic Quality, Product Enchantment, Joyperience… Derartige Begriffe gewinnen im Feld der Human-Computer Interaction zunehmend an Bedeutung. Klassische UsabilityAspekte wie Effektivität, Effizienz und Zufriedenstellung dürfen zwar nicht vernachlässigt werden, stellen jedoch keine wesentlichen Faktoren im Hinblick auf emotionale und freudvolle Erlebnisse in der Interaktion mit Produkten oder Services dar (Hassenzahl, 2010; Norman, 2004; Jordan, 1998, 2000, 2002). Bei der Konzeption und Gestaltung interaktiver Produkten drängen sich demzufolge Fragen danach auf, was diese wirklich attraktiv macht und ihnen eine Bedeutung verleiht. Wie können durch die Interaktion mit einem Produkt Emotionen vermittelt werden, um dem Nutzer einen persönlichen Mehrwert zu bieten?

30

Erfolgreiche Produkte wie Apples’ iPhone oder iPad zeigen, dass interaktive Geräte einen hohen Stellenwert im täglichen Leben ihrer Nutzer einnehmen können und gleichzeitig eine starke emotionale Bindung zwischen Mensch und technischen Geräten entstehen kann. Um zu verstehen, welche Faktoren dabei relevant sind und wie es möglich ist, diese Aspekte in den Konzeptions- und Entwicklungsprozess zu integrieren, werden in diesem Beitrag relevante Modelle und Methoden aus der Emotions- und User Experience-Forschung herangezogen: Das Emotional DesignModell von Norman (2004), der Product Attachment-Ansatz von Mugge (2008) sowie das User Experience-Modell von Hassenzahl (2008, 2010) liefern interessante Erkenntnisse darüber, welche Rolle Emotionen bei der Wahrnehmung und Nutzung von Produkten spielen, über ihren Einfluss auf die Bindung zwischen Nutzer und Produkt und wie Emotionen durch die Adressierung von psychologischen Bedürfnissen ausgelöst werden können. Für den praktischen Einsatz – genauer gesagt für den Konzeptionsprozess –

Keywords: /// Emotional Design /// User Experience /// Experience Design /// Produktbindung /// Praxismethoden

eignet sich besonders die Vorgehensweise nach dem „Experience Design“-Ansatz von Hassenzahl (2010), die auf dem zuvor erwähnten UX-Modell aufbaut und das „Erlebnis“ mit dem Produkt, im Gegensatz zur „Nutzung“, in den Fokus stellt. Ergänzend dazu bietet sich die Interviewtechnik des „Laddering“ (Reynolds & Gutman, 1988; Burmester et al., 2010) in Kombination mit der Methode des „Scenario-Based Design (SBD)“ nach Rosson & Carroll (2002) an. Im Rahmen des Tutorials wird dargestellt, wie diese Ansätze und Methoden in der Praxis sinnvoll miteinander zu verknüpfen sind und eine Empfehlung für eine entsprechende Vorgehensweise wird näher erläutert. Diese kann anschließend von den Teilnehmern direkt selbst angewandt werden, so dass sie einen intensiven Einblick erhalten und in der Lage sind, die Vorgehensweise auf ihre eigene praktische Situation bzw. ihre Projekte anzupassen. Eine Diskussion über die Konzeptergebnisse und über die Methodik soll den Austausch in der Thematik fördern und Perspektiven für die Zukunft aufzeigen.

155


Usability Professionals 2011 Tutorials

2. Theoretische Modelle für emotionales Design und User Experience Das Emotional Design-Modell nach Norman (2004) basiert auf der Annahme, dass Emotionen einen entscheidenden Einfluss auf die menschliche Fähigkeit haben, die Welt wahrzunehmen, zu verstehen und neue Dinge zu lernen. Norman unterscheidet zwischen drei kognitiven Ebenen, die für die Entwicklung und Verarbeitung von Gefühlen und emotionalen Reaktionen im Hinblick auf Produkte grundlegend sind: –– Das „Visceral Level“ (viszerale Ebene) ist zuständig für schnelle Beurteilungen über „gut“ und „schlecht“, sendet Signale an das motorische System und ruft Emotionen wie z. B. Freude oder Angst hervor. –– Das „Behavioural Level“ (Verhaltensebene) verarbeitet automatisierte Alltagsprozesse, die eher unbewusst oder beiläufig stattfinden wie z. B. Autofahren oder das Zehn-Finger-Tippen. –– Das „Reflective Level“ (Reflektionsebene) ist die höchste kognitive Dimension, da hier Meinungen und persönliche Einstellungen gebildet werden. Die drei Ebenen interagieren über BottomUp- und Top-Down-Prozesse miteinander und beeinflussen sich gegenseitig. Laut Norman werden Objekte und Produkte stets in allen drei Dimensionen wahrgenommen, weshalb gutes Design alle Ebenen adressieren soll. Bei der Interaktion mit Produkten spielen Emotionen also immer eine Rolle, eine rein rationale analytische Betrachtung ist demzufolge nicht möglich. Mugge fokussiert in ihrem Product Attachment-Ansatz (2008) den Einfluss von positiven Emotionen auf eine (langfristige) Produktbindung. Sie definiert Produktbindung als “the strength of emotional bond a consumer experiences with a specific product“ (S.10). Produktbindung ist laut dieser Definition mit emotionaler Bindung gleichzusetzen. Nach Mugges Forschungsergebnissen unterstützen die folgenden vier Designstrategien die Entwicklung

einer tieferen Beziehung zwischen Nutzer und Produkt: –– Das Produkt verspricht „Pleasure“ (Freude), z. B. durch außergewöhnliche Funktionalität oder modernes Design. –– Das Produkt unterstützt die „Selfexpression“ (Selbstdarstellung) des Nutzers z. B. durch Personalisierung. –– Das Produkt fördert „Group affiliation“ (Gruppenzugehörigkeit) z. B. durch Unterstützung sozialer Kommunikation. –– Das Produkt weckt „Memories“ (Erinnerungen) und erinnert an die persönliche Vergangenheit z. B. mit Hilfe von Personen, Events oder Orten. Diese Strategien sprechen im Prinzip die menschlichen Grundbedürfnisse nach „Freude“, „Selbstdarstellung“, „Gruppenzugehörigkeit“ und „Erinnerungen bewahren“ an. Sie weisen eine Ähnlichkeit zu Hassenzahls Modell für User Experience (2008, 2010) auf, das eine differenzierte Betrachtung der Ebene der universellen menschlichen Bedürfnisse aufzeigt. Hassenzahl liefert eine Definition für User Experience (UX), die den Menschen mit seinen Bedürfnissen und Emotionen in den Mittelpunkt stellt: „UX is a momentary primarily evaluative feeling (good-bad) while interacting with a product or service … Good UX is the consequence of fulfilling the human needs …“ (2008, S.2). UX ist demzufolge ein subjektiver Gefühlszustand, welcher durch die Erfüllung von persönlichen psychologischen Bedürfnissen wie z. B. Autonomie, Kompetenz, Verbundenheit oder Popularität ausgelöst wird. Diese menschlichen Grundbedürfnisse bezeichnet Hassenzahl als „Be-Goals“, welche bei Befriedigung durch die Interaktion mit einem Produkt positive Emotionen wie Freude hervorrufen. Im Gegensatz dazu stehen die sog. „Do-Goals“, die sich auf pragmatische Produkteigenschaften wie Usability beziehen. Produkte mit einem positiven emotionalen Wert fokussieren also „das Selbst“ des Menschen, indem sie seine zentralen psychologischen Bedürfnisse erfüllen. In seinem Modell der „Three Level Hierarchy of Goals“ (s. Abb. 1) beschreibt Hassenzahl drei Ebenen von Zielen: Die

unterste Ebene ist die „How“-Ebene, welche die motorischen Ziele adressiert (z. B. eine Telefonverbindung aufbauen durch das Eingeben von Ziffern ins Telefon). Auf der mittleren „What“-Ebene befinden sich die Do-Goals (z. B. die Kalenderfunktion des Telefons nutzen und einen Eintrag vornehmen). Die Howund What-Ebene fokussieren primär Usability-Merkmale. Die höchste der drei Ebenen stellt die „Why“-Ebene dar. Hier werden die Be-Goals angesprochen (z. B. „being close to others“ (anderen nah sein) oder „being competent“ (kompetent sein)). Somit wird den Aktionen auf der How- und What-Ebene eine Bedeutung zugesprochen, indem z. B. ein Telefonanruf getätigt wird oder eine Verabredung mit einer Person in den Kalender eingetragen wird, mit der man sich verbunden fühlen möchte. Dieses Modell ist deshalb besonders interessant, da es differenziert aufzeigt, wie und auf welcher Ebene Emotionen im Zusammenhang mit ProduktInteraktionen angesprochen und wie diese ausgelöst werden. [Abb. 1] Die Vorstellung dieser drei ausgewählten Modelle bietet den Teilnehmern die Möglichkeit, ein tieferes Verständnis für kognitive Prozesse in Bezug auf Produktwahrnehmung und Emotionen zu entwickeln und zu erkennen, welche Ebenen dabei angesprochen werden, die für die Konzeption und Gestaltung von Produkten relevant sind. 3. Praxismethoden für emotionales Produktdesign Der erlebniszentrierte Ansatz des „Experience Design“ nach Hassenzahl (2010) basiert auf dem zuvor beschriebenen UX-Modell. Ziel ist es, „Erlebnisse mit Produkten“ und nicht nur die Produkte oder Technologien selbst zu gestalten. Dazu bildet die Konzentration auf die Erfüllung von menschlichen Grundbedürfnissen das Fundament für den Designprozess: „I suggest universal psychological needs, such as competence, stimulation, relatedness, autonomy, popularity, meaning, security

31


Konzeptionsprozesses zu alternativen und innovativen Lösungen führt, welche ein hohes Potenzial besitzen, während der Interaktion Emotionen beim Nutzer auszulösen. Zur näheren Erforschung von Tiefenbedürfnissen eignet sich die Interviewtechnik des „Laddering“ (Reynolds & Gutman, 1988; Burmester et al., 2010). Durch Laddering werden Erlebnisse von Interviewteilnehmern stufenweise bis hin zur Bedürfnisebene reflektiert. Dabei wird immer wieder nach dem „Warum“ gefragt, bis die Ebene der Grundbedürfnisse erreicht worden ist. Beispiel: „Ich höre nach der Arbeit immer Musik.“ „Warum?“ „Weil ich mich dabei entspannen kann.“ „Warum?“ „Um von der Arbeit abzuschalten.“ „Warum?“ „Na ja, ich denke dann an meinen Freund.“ „Warum?“ „Wenn wir uns nicht sehen können, dann höre ich immer unsere gemeinsamen Lieder.“ „Warum?“ „Weil ich mich ihm dann nah fühle…“ Das Bedürfnis ist in diesem Fall also Verbundenheit; d.h. das Konzept kann nun gezielt auf dieses Bedürfnis ausgerichtet werden.

Abb. 1. „Three level hierarchy of goals” nach Hassenzahl (2010, S. 12)

and physical striving as important constituents of experience. It is the fulfillment of those needs which creates emotion and meaning in interacting with a product.” (Hassenzahl, 2010, S.57). Daraus ergibt sich die Herausforderung, das Gap zwischen dem abstrakten Bedürfnis und dem Entwurf für ein konkretes Produkt zu überwinden. Wie kann also auf Grundlage eines universellen Bedürfnisses ein interaktives Produkt gestaltet werden? In seinem Buch „Experience Design – Technology for All the Right Reasons“ (2010) beschreibt Hassenzahl anhand des „Touch Trace-Mirror“ Konzepts der Designer Baffi & Schmeer eine mögliche Vorgehensweise. Der Touch Trace-Mirror ermöglicht das Vermitteln von (Liebes-) Botschaften auf einem beschlagenen Badezimmer-Spiegel, in dem ein Lichtpunkt auf dem Spiegel zum Nachzeichnen einer zuvor vom Partner gesendeten Botschaft mit dem Finger auf dem Spiegel auffordert. Ziel war es, ein Erlebnis zu gestalten, das das Bedürfnis nach „Verbundenheit“ erfüllt. Hierzu wurde zunächst das Bedürfnis an sich näher betrachtet und

32

eine dazu passende Aktivität identifiziert (das Hinterlassen von Nachrichten unter Liebenden). Folglich wurde ein Kommunikationsgerät gewählt (der beschlagene Spiegel) und eine Geschichte entworfen, die eine tiefgründige Bedeutung trägt (das Hinterlassen und Erhalten von Nachrichten auf dem Badezimmerspiegel und zugleich das „Nachschreiben“ der Nachricht, das den Empfänger in das Erstellen der Nachricht einbindet und somit zusätzliche Nähe zu ihrem Verfasser vermittelt, z. B. durch das Nachfahren der Handschrift des Partners). Zuletzt wurde an der Ästhetik der Interaktion gearbeitet, um ein konkretes Produktdesign zu erhalten (dem Folgen des Lichtpunktes mit dem Finger, um die Nachricht zu zeichnen). Weitere Merkmale wie zum Beispiel die Eigenschaft der Vergänglichkeit der Spiegel-Nachricht tragen dazu bei, dass durch das Erlebnis eine besondere Spannung erzeugt wird. Solche Merkmale ergeben sich ebenfalls aus einer intensiven Reflektion des zu Grunde liegenden Bedürfnisses. Diese Vorgehensweise verdeutlicht, dass der Fokus auf Bedürfnisse während des

Außerdem kann durch sog. „Reverse Laddering“ auch nach Ideen für Features gefragt werden. Beispiel: „Wie könnte das System sie optimal darin unterstützen, sich ihrem Freund nahe zu fühle?“ „Es wäre zum Beispiel toll, wenn ich ihm, während ich unsere Lieder höre, meine Gedanken in diesem Moment mitteilen könnte.“ „Wie könnte so etwas funktionieren?“ „Zum Beispiel würde ich gerne Kommentare direkt in die Songs einbauen. Er könnte das auch machen und dann hätten wir unsere ganz persönlichen Lieder, die wir anhören können, wenn wir uns nicht sehen.“ Auf diese Weise können innovative Ideen für neue Funktionen oder sogar für neue Produkte entstehen. Die Laddering-Methode ist in der Praxis vor allem in frühen Phasen der Produktentwicklung gut einsetzbar und erfordert neben einem geübten Interviewer keine weiteren aufwändigen Ressourcen (Sproll, Peissner & Sturm, 2010). Die im User-Centered Design etablierte Methode des „Scenario-Based Design (SBD)“ (Carroll, 2000; Rosson & Carroll, 2002) basiert auf Beschreibungen von


Usability Professionals 2011 Tutorials

Abb. 1. Inhalte und Ablauf des Tutorials

Nutzern, die eine bestimmte Technologie nutzen. SBD lässt sich sehr gut mit den beiden zuvor beschriebenen Methoden kombinieren und erleichtert das Entwerfen von Interaktionskonzepten auf Basis von Personas und Szenarien. Es gibt vier Typen bzw. Stufen von Szenarien – nämlich Problemszenarien, Aktivitätsszenarien, Informationsszenarien und Interaktionsszenarien. Problemszenarien sind eher allgemein und ohne Beschreibung von genauen Interaktionsabläufen formuliert, während Interaktionsszenarien ganz konkrete Bedienabläufe beinhalten. Auf Basis von Szenarien können Gestaltungsentwürfe sehr anschaulich vorgenommen werden. Vor allem für Personen, die bisher mit der

Konzeption von Interfaces eher unerfahren sind, bietet die SBD-Methode einen guten praktischen Einstieg. 4. Inhalte und Ablauf des Tutorials In diesem Tutorial erhalten die Teilnehmer durch eine Kombination aus theoretischem Input und einer darauf abgestimmten Praxisübung die Möglichkeit, ein grundlegendes Verständnis für emotionale Produktgestaltung zu entwickeln, das sie in zukünftigen Projekten einsetzen können. Die Session ist in die folgenden 8 Module eingeteilt: Einführung, Praxisbeispiele,

Theoretische Modelle, Methoden, Aufgabenstellung / Erklärung der Datenbasis, Brainstorming, Konzeptionsphase sowie Diskussion und Schluss. [Abb. 2] Nach einer kurzen Vorstellungsrunde werden die Teilnehmer zum Einstieg in die Thematik dazu aufgefordert, spontan ein interaktives Produkt aus ihrem Alltag zu nennen, das für sie persönlich Emotionen hervorruft. Anschließend werden Begrifflichkeiten geklärt, um ein gemeinsames Verständnis zu schaffen. Es folgt eine Präsentation von vielseitigen Beispielen aus den Bereichen interaktive Technologien, Produktdesign und Webdesign. Etwa das Konzept der „ComSlipper“ (Chen et

33


al., 2006), zwei miteinander verbundene Hausschuhe, die mit Sensoren ausgestattet sind und warm werden, wenn der Partner die Schuhe ebenfalls trägt. Mittels Gesten des Fußes können Emotionen kommuniziert werden, welche dem Partner durch Licht und Vibration übertragen werden. Dabei wird das Bedürfnis nach Verbundenheit – beispielsweise zwischen Paaren, die sich häufig nicht sehen können – erfüllt und emotionale Produkterlebnisse werden ermöglicht. In den folgenden beiden Modulen werden ausgewählte theoretische Modelle aus der Emotions- und User Experience Forschung sowie geeignete Methoden für den praktischen Einsatz näher vorgestellt (vgl. 2. und 3.). Diese werden anschließend von den Teilnehmern selbst auszugsweise angewandt, denn den Schwerpunkt der Veranstaltung bildet eine praktische Übung. Hier erstellen die Teilnehmer unter Berücksichtigung der zuvor vorgestellten Theorien und Methoden einen papierprototypischen Entwurf für ein bedürfniszentriertes interaktives HiFi-Produkt. Die Bearbeitung der Aufgabenstellung erfolgt auf Grundlage einer aufbereiteten Datenbasis, welche Ergebnisse von Laddering Interviews und Szenarien enthält. Ziel ist es, auf Grundlage von Nutzerbedürfnissen Konzepte für „Produkterlebnisse“ mit einem hohen Emotionspotenzial zu gestalten und diese papierprototypisch in einer Form aufzubereiten, so dass sie für die anderen Teilnehmer verständlich sind. Am Ende der Übung werden alle Entwürfe präsentiert und in der Gruppe im Hinblick auf die potenzielle User Experience diskutiert.

Kernfunktionalität des iPhones, nämlich das Telefonieren, ist mit dem aktuellen Produktdesign alles andere als ergonomisch. Weder die Form noch das Gewicht unterstützen eine angenehme mobile Kommunikation; vor allem für die Damenwelt liegt das iPhone äußerst ungünstig in der Hand… Dennoch gehört es unumstritten zu den Produkten, die eine hohe User Experience aufweisen und Freude bei der Nutzung bereiten.

34

and Applied Issues. New York: University of Rochester Press. 7. Dunne, A. (2011). Portfolio der Designer Dunne, A. & Raby, F. Online verfügbar unter: http://www.dunneandraby.co.uk/content/ projects. 8. Gaver, W., & Martin, H. (2000). Alternatives: Exploring Information Appliances through Conceptual Design Proposals. In York: ACM Press. 9. Gutman, J. (1982). A Means-End Chain Model based on Consumer Categorization Processes. Journal of Marketing, 46 (2), 60-72. 10. Harvey, P. (1994). Tongue-in-Cheek Chair. Online verfügbar unter: http://peter-harvey. com/en/67-tongueincheekchair.htm. 11. Hassenzahl, M. (2003). The Thing and I: Understanding the Relationship Between User and Product. In Blythe, M., Overbeeke, C. J., Monk, A.F., & Wright, P.C. (Hrsg.): Funology. From Usability to Enjoyment (S. 31-42). Dordrecht: Kluwer Academic

Quellen und weiterführende Literatur 1. Abeele, V.V. & Zaman, B. (2009). Laddering

Publishers. 12. Hassenzahl, M. (2007). Aesthetics in

the User Experience! Workshop Paper,

Interactive Products: Correlates and

UXEM09 at Interact2009. Online

Consequences of Beauty. In Schifferstein,

verfügbar unter: https://lirias.kuleuven.

H. N. J. & Hekkert, P. (Hrsg.): Product

be/bitstream/ 123456789/267307/4/ Laddering+the+User+Experience.pdf. 2. Buchberger, Stefan (2009). Flatshare.

Experience (S. 287-302). Amsterdam: Elsevier. 13. Hassenzahl, M. (2008). User Experience (UX): Towards an Experiential Perspective on

Wettbewerb: Konzepte für den Haushalt von

Product Quality. In Proceedings of the 20th

Morgen, Designreport,1, Online verfügbar

French-Speaking Conference on Human-

unter: http://www.design-report.de/

Computer Interaction 2008 (S. 11-15). New

Fachartikelarchiv/31785893/Konzepte-fuerden-Haushalt-von-Morgen.html. 3. Burmester, M., Mast, M., Jäger, K. & Homans, H. (2010). Valence Method for Formative

York: ACM Press. 14. Hassenzahl, M (2010). Experience Design. Technology for all the Right Reasons. San Francisco: Morgan & Claypool. 15. Hekkert, P., & Leder, H. (2007). The Aesthetic

& M.G. Graves Petersen (Hrsg.): DIS2010

Experience. In Schifferstein, H. N. J., &

Proceedings (S. 364-367). New York: ACM.

Hekkert, P. (Hrsg.): Product Experience (S.

4. Carroll, J. M. (2000). Making Use. Scenario-

Produkte wie Apples’ iPhone zeigen, dass der hedonische Wert und die Erlebnisse mit einem Produkt zentrale Voraussetzungen für eine langfristige Produktbindung sind. Freude und Emotionen während der Interaktion mit dem Produkt werden von den Menschen gewünscht und geschätzt. Dabei darf sogar die pragmatische Qualität teilweise vernachlässigt werden. Denn zugegeben: Die eigentliche

on Self-Determination Research: Theoretical

Proceedings of CHI’00 (S. 209-216). New

Da die hier vorgestellte Thematik, nicht nur bedingt durch den „Apple Hype“ der letzten Jahre, zunehmend an Bedeutung gewinnt, ist die Integration in die Praxiswelt ein wichtiger Schritt, um dieses abstrakt anmutende Themenfeld der „Emotionalisierung“ von Produkten anschaulich zu machen. Dazu müssen Methoden zur sinnvollen praktischen Umsetzung kommuniziert und lebendig weiterentwickelt werden. Dieses Tutorial soll einen kleinen Beitrag dazu leisten.

Evaluation of User Experience. In K. Halskov

5. Fazit

6. Deci, E. L., & Ryan, R. M. (2002). Handbook

259-285). Amsterdam: Elsevier.

Based Design of Human-Computer

16. IFA (2010). Ausschnitt eines Videos

Interactions. Cambridge: MIT Press.

zum Thema “Innovation at Home –

5. Chen, C.-Y., Forlizzi, J., & Jennings, P. (2006):

Haushaltsgeräte der Zukunft“. Online

ComSlipper: An expressive design to support

verfügbar unter: http://www.youtube.

awareness and availability. In Proceedings of

com/watch?v=PZsi4QhGnh0&feature=pla

the CHI 06 Conference on Human Factors in Computing Systems. alt.chi. (pp. 369-374). New York: ACM.

yer_embedded#at=39. 17. Jordan, P. W. (1998). Human Factors for Pleasure in Product Use. Applied Ergonomics, 29(1), 25-33.


Usability Professionals 2011 Tutorials

18. Jordan, P.W. (2000). Designing Pleasurable Products. An introduction to the new human factors. London, New York: Taylor & Francis. 19. Jordan, P. W. (2002). Personalities of Products. In Green, W. S., & Jordan, P. W. (Hrsg.): Pleasure with Products: Beyond Usability (S. 19-48). London: Taylor & Francis. 20. Maslow, A. H. (1954). Motivation and Personality. New York: Harper. 21. Mugge, R. (2008). Emotional Bonding with Products. Investigating Product Attachment from a Design Perspective. Saarbrücken: VDM Verlag. 22. Norman, D. A. (2004). Emotional Design. Why We Love (or Hate) Everyday Things. New York: Basic Books. 23. Reiss, S. (2002). Who Am I? The 16 Basic Desires That Motivate Our Actions and Define Our Personalities. New York: Berkley. 24. Reynolds, T. J., & Gutman, J. (1988). Laddering Theory, Method, Analysis, and Interpretation. Journal of Advertising Research, 28, 11-31. 25. Rosson, M. B., & Carroll, J. M. (2002). Usability Engineering – Scenario-Based Development of Human-ComputerInteraction. San Diego: Academic Press. 26. Sheldon, K. M., Elliot, A. J., Kim, Y., & Kasser, T. (2001). What is Satisfying About Satisfying Events? Testing 10 Candidate Psychological Needs. Journal of Personality and Social Psychology, 80(2), 235-339. 27. Sproll, S., Peissner, M. & Sturm, C. (2010). From product concept to user experience: exploring UX potentials at early product stages. In Proceedings of the 6th Nordic Conference on Human-Computer Interaction: Extending Boundaries (NordiCHI ´10, Reykjavik Island, Oktober 2010). ACM Press: New York (S. 473-482). 28. Sproll, S., Peissner, M., Sturm, C. & Burmester, M. (2010). UX Concept Testing: Integration von User Experience in frühe Phasen der Produktentwicklung. In H. Brau, S. Diefenbach, K. Göring, M. Peissner & K. Petrovic (Hrsg.): Usability Professionals 2010. Stuttgart: Fraunhofer Verlag (S. 195-201). 29. Van Boven, L., & Gilovich, T. (2003). To Do or to Have: That is the Question. Journal of Personality and Social Psychology, 85, 1193-1202.

35


171

Fehlertexte und Beschreibungen aus der Sicht des Nutzers erstellen. Content Usability in der Sonderform „Fehlerprävention“ unter besonderer Berücksichtigung unterschiedlicher Zielgruppen. Claus Wagner CommWeCon consultancy Bernhäuser Straße 24 70771 Leinfelden-Echterdingen claus.wagner@commwecon.de

Abstract Fehlermeldungen stellen in der HCI eine besondere Herausforderung dar: Für den Nutzer wie für den Entwickler. Fehler stören die Zusammenarbeit zwischen Mensch und System. Es wird der Frage nachgegangen, ob Richtlinien (Guidelines) zur Gestaltung von Fehlermeldungen und –dialogen ausreichen, um dem Ziel benutzungsfreundlicher Fehlertexte und Beschreibungen näher zu kommen und in wie fern die Zielgruppe und deren Eigenschaften berücksichtigt werden sollen und welchen Einfluss diese auf die Gestaltung von Fehlermeldungen haben.

1. Unerwünschte Störenfriede Fehlermeldungen sind unerwünscht. Von Benutzern wie von Entwicklern. Dennoch lassen sich solche Meldungen nicht vermeiden. Genau genommen sind sie ein wichtiger Dialog zwischen Mensch und Computer. Offenbart eine Fehlermeldung doch, dass es in der Kommunikation zwischen Mensch und Computer zu einer Störung gekommen ist. Man könnte es fast vermenschlichen: Wo Probleme auftauchen, muss darüber gesprochen werden, um sie zu lösen. Bei genauerer Betrachtung werden Fehlermeldungen allerdings noch recht stiefmütterlich behandelt (P.J. Brown 1983, J. Tzeng 2004). Zu zitieren wäre hier der sicherlich allseits bekannte unerwartete Fehler gefolgt von einer nichtssagenden Ziffer oder die mystische Meldung „Programm wurde unerwartet beendet.“ Durch das World Wide Web und die damit einhergehende Menge an möglichen Fehlern bei der Bedienung durch eine immer größere und heterogener werdende Benutzermenge, wurde das Thema in den 90er Jahren immer wieder aufgenommen und beschrieben. Zahlreiche Guidelines geben Hinweise, wie Fehlermeldungen gestaltet werden sollen. Diese Guidelines tragen vor allem dem Design und Layout

36

Keywords: /// Fehlermeldungen /// Content Usability /// User Experience /// Meldungskonzept /// Lesbarkeit /// verständliche Texte /// Kommunikation

von Fehlermeldungen Rechnung (Apple Human Interface Guidelines, Microsoft Guidelines Style & Tone, J. Nielsen 2001).

meldet sich mit kurzen, grammatikalisch unvollständigen Sätzen, um den Sachverhalt zu schildern.

Beschäftigt man sich näher mit Dialogen und deren Auswirkungen auf die User Experience, so zeigt sich, dass gerade die Art und Weise, wie das System mit dem Benutzer spricht, eine bedeutende Rolle spielt (M. Wenger 1991, J. Tzeng 2004). Schon die Tatsache, dass darüber gestritten wird, ob sich ein System bei Benutzern entschuldigen darf oder nicht, zeugt von der Unsicherheit, im Umgang mit Fehlermeldungen (J. Tzeng, 2004). So tauchen vermehrt unterschiedliche Stile von Fehlerdialogen auf. Grob können diese in drei Textkategorien eingeteilt werden (nach S.E. Brennan, J.O Ohaeri).

Die offene Frage, ob sich ein System beim Nutzer entschuldigen darf oder nicht, wird umschifft, in dem bei den einen Fehlermeldungen um Verständnis gebeten wird, bei anderen einfach kalt der Fehler genannt wird.

Die anthromorphe Variante: „Ich verstehe Ihre Eingabe nicht, bitte wiederholen Sie Ihre Suchanfrage“. Das System spricht menschlich und simuliert somit einen menschlichen Gegenpart.

Unstrittig dagegen ist allgemein, dass Fehlermeldungen eine Störung in der Kommunikation von Mensch und Computer darstellen. Stören sie doch teils erheblich den Handlungsablauf. Und genau hier gilt es anzusetzen, um Fehlermeldungen benutzungsfreundlicher zu gestalten. 2. Was zunächst einfach erscheint, kann für den einzelnen die Welt bedeuten

Die Fließtextvariante: „Ihre Eingabe wurde leider nicht verstanden. Bitte überprüfen Sie die Eingabe und wiederholen Sie gegebenenfalls die Suchanfrage“. Das System reagiert in ausführlicher Textform.

Handlungen sind komplexe Prozesse, die je nach Anwendung unterschiedlich ablaufen. Einfluss auf diesen Ablauf hat nicht nur der programmierte, vom Entwickler als optimal angedachte Ablauf (Standardablauf, normal flow), sondern auch die Vorstellung dieser Handlung im Kopf des Anwenders (mentales Modell).

Die telegrafische Variante: „Eingabe unverständlich. Wiederholen!“ Das System

Fehler entstehen in einem Komplex aus System, Anwender und Situation. Sprich:


Usability Professionals 2011 Tutorials

Ein Anwender nutzt ein System in einer bestimmten Situation, um letztlich eine Aufgabe in dieser Situation zu lösen. Dieser Situation ist das Verhalten von allen Beteiligten unterworfen. Vergleicht man den Kauf einer Fahrkarte an einem Fahrkartenautomaten auf dem Bahnsteig mit dem Kauf der Karte am heimischen Computer, so zeigt sich deutlich die unterschiedliche Situation. Stressfaktoren wirken auf unterschiedliche Weise auf den Benutzer ein (Zeit, Lärm, …). Welche Rolle spielt in diesem Komplex die Handlung? Zur Verdeutlichung ist ein Handlungsmodell hilfreich: Test, Operate, Test, Exit – TOTE (G.A Miller, 1960). Ein einfaches Modell, um den menschlichen Handlungsprozess zu skizzieren. Letztlich auch um zu zeigen, wie die Faktoren der Situation auf diesen Handlungsprozess einwirken können. Die Handlung selbst wird umrahmt von einer Ist-Situation (Aufgabe) und einer Soll-Situation (Lösung). Der Benutzer möchte mit Hilfe des Systems die Wandlung der Ist- zu einer Soll-Situation vollziehen. Dabei überprüft er jede seinen Handlungen bevor er die nächste Handlung vornimmt. Feingranuliert bedeutet das, dass jeder Schritt an der Benutzungsoberfläche geprüft, getätigt, geprüft und abgehakt wird, bevor der nächste Schritt nach gleichem Muster in Angriff genommen wird. Dies kann in Bruchteilen von Sekunden geschehen und im Laufe der Wandlung von der Ist- zur Soll-Situation hundertfach von statten gehen. Jede einzelne Abfolge der TOTE ist für sich anfällig für eine Unterbrechung: Einen Fehler. Und diese Unterbrechung wird frustrierend wahrgenommen (J. Laza, A. Norcio 1999). In erster Linie genügt die Tatsache, dass ein Fehler passiert ist, in zweiter Linie stellt sich die Schuldfrage. Wer trägt an diesem Fehler die Schuld? Gerade Neulinge stellen sich diese Frage unterbewusst und beschuldigen sich selbst fast intuitiv. 3. User-centered vs. System-centered Werden Fehler aus Systemsicht (Systemcentered) erstellt, so liegt es in der Natur der Sache, dass das System den Benutzer

beschuldigt, den Fehler verursacht zu haben. Eine benutzerzentrierte Sicht (user centered) stellt den Benutzer in den Mittelpunkt und stellt nicht die Frage nach dem wer, sondern warum (J. Lazar, A. Norcio 1999).

Für benutzungsfreundliche Fehlermeldungen ist es ausschlaggebend, ausreichende Informationen über die Beteiligten zu haben: Vom System, vom Benutzer und vor allem aber auch von der Situation in der sich beide befinden.

Fragt man Guidelines, wie Fehlermeldungen auszusehen haben, empfehlen diese meist, den Fehler zu beschreiben und eine Lösung des Fehlers vorzuschlagen, so dass der Benutzer zum einen sieht, was geschah und zum anderen lernt, wie man den Fehler vermeiden kann. Letztlich kann hier die DIN ISO 9241 herangezogen werden. In vielen dieser Richtlinien wird empfohlen, keine Fachtermini zu verwenden und eine prägnante und verständliche Sprache zu wählen (J. Johnson 2000).

So bilden detaillierte Beschreibungen der Benutzer (Personas) sowie die Nutzungsszenarien (Use Cases) die Basis bei der Fehlertexterstellung. Diese Dokumente müssen Antworten auf folgende Fragen geben: –– Wer benutzt das System? –– Welche Aufgaben soll er mit Hilfe des Systems lösen? (Ist- und Soll-Situation) –– Wann soll er diese Aufgaben lösen? –– Wie sieht der Standardablauf der Aufgabenlösung aus? –– Wie sieht der alternative Ablauf aus? –– Wo befindet sich der kritische Pfad – der Misserfolg? –– Welches Vorwissen hat der Benutzer? –– Welche Kenntnis fehlt ihm? –– Welchen soziografischen Hintergrund besitzt er (Ausbildung, Umfeld, Tätigkeitsbereich)? –– Wie oft nutzt er das System? –– Was ist seine Motivation das System zu nutzen? –– Welche ähnlichen Systeme nutzt er? –– Welche Systeme bestimmen seinen Alltag? –– Welche Erfahrungen hat er bereits mit ähnlichen Systemen? –– Welche Vorkenntnisse (Fachwissen) besitzt er?

Dieser Ratschlag kann ungeachtet der Eigenschaften der dezidierten Benutzergruppe nicht ausreichen. Die Frage stellt sich doch, was angemessene Sprache ist? Die Gefahr besteht, dass wenn die Sprache zu einfach gewählt wird, dass der Benutzer das Gefühl bekommt, nicht ernst genommen zu werden. Oder andersherum, wenn die Sprache zu kompliziert gewählt wurde, dass er sich für dumm verkauft fühlt (P. Watzlawick, 1960/2003). 4. Personas und Anwendungsfälle Basis für Texterstellung Somit ist es klar, dass Fehlermeldungen, gleichwertig allen anderen Bestandteilen eines Systems, dem benutzerzentrierten Design unterliegen müssen. Inhalte, Design und Funktion sind auf den Benutzer auszurichten. Folgend ist das Gestalten von Fehlermeldungen Bestandteil der Inhaltserstellung (Content Creation) und muss im Wirkkreis des benutzerzentrierten Entwickelns im Rahmen der Content Usability Betrachtung evaluiert und geprüft werden. Wie oben beschrieben, treten die meisten Fehler nicht kontextlos auf, sondern eingebettet im Handlungsablauf. Folgerichtig dürfen Fehlermeldung nicht getrennt davon betrachtet werden. Dies gilt linguistisch wie grafisch (Fehlermeldungen bestehen aus Sprach- sowie Präsentationselement).

Antworten auf diese Fragen (die genannte Auflistung ist nicht abschließend und unterscheidet sich je nach Projekt) geben Aufschluss darüber, welches die adäquaten Mittel zu Erstellung der Fehlermeldungen sind. Die Fragestellung geht weit über die in den Richtlinien (Guidelines) berücksichtenden Elemente hinaus und gibt wertvolle Antworten, um so die Gestaltung auf die individuelle Zielgruppe auszurichten. Ist bekannt, aus welcher Ist-Situation der Benutzer kommt und welche Anforderungen und Erwartungen er an die avisierte Soll-Situation hat, können Frustrationsmomente eruiert und sichtbar gemacht werden. Letztlich geben die Antworten

37


Aufschluss darüber, wie die Sprach- und Präsentationselemente einer Fehlermeldung zu gestalten sind. Somit steht fest, dass der richtige Zeitpunkt sich der Meldungsgestaltung anzunehmen in den ersten Schritten eines Projektes befindet. In der Planphase sind die Fragen zunächst von den Dokumenten Personas und Anwendungsfälle zu beantworten und sind dann iterativ im User-centered Design Prozess regelmäßig abzufragen. Um sie zu bestätigen, zu aktualisieren oder zu revidieren. 5. Ausrichten der Kommunikation a) Um Gestaltungsmittel (linguistisch wie grafisch) bewerten zu können, kann der Kriterienkatalog einer Content Usability Überprüfung (C. Wagner, 2010) herangezogen werden. Nach diesen Kriterien sind Inhalte in ihrer Gestaltung kategorisiert nach Deutlichkeit, Angemessenheit, Stil und Sprachrichtigkeit. [Abb. 1] Alle diese Kriterien sind mittelbar mit dem Nutzer verbunden. Am Beispiel Stil lässt sich dies am einfachsten verdeutlichen. „Der Stil wird meist als sprachliches Mittel umschrieben. Es ist der Umgang mit der Sprache, seinen Gesetzmäßigkeiten, den gegebenen Möglichkeiten in Form von bildhafter Sprache (Metaphern), Ausdrucksstärke (Emphase) und Wortschatz in

Abb. 1. Inhalte in ihrer Gestaltung kategorisiert nach Deutlichkeit, Angemessenheit, Stil und Sprachrichtigkeit

38

enger Verwandtschaft mit der Angemessenheit (Tonalität).“ (Wagner, C., 2010) Bilder funktionieren bei Menschen unterschiedlich, letztlich unterscheidet sich je nach Zielgruppe der verwendete Wortschatz. Das bedeutet, dass eine gezielte Verwendung die Zielgruppe berücksichtigen muss. Der unerwartete Fehler mag für einen Entwickler eine Bedeutung haben, für manch einen Anwender jedoch, stellt sich die Frage, ob Fehler überhaupt erwartet werden können? 6. Auswuchten der Kommunikation Ein auftretender Fehler kann als Ungleichgewicht in der Kommunikation zwischen Mensch und System gewertet werden. Somit muss die Kommunikation zur Lösung dieses Problems neu bewertet und ausgerichtet werden. Zur Überprüfung dieses Gleichgewichts können, so die Ansicht des Autors, durchaus die 5 Axiome von P. Watzlawick zu Rate gezogen werden (P. Watzlawick, 1960). 1. Axiom: „Man kann nicht nicht kommunizieren“ kann in seiner Interpretation in Bezug auf Fehlertexte bedeuten, dass eine nicht ausreichende Darstellung und Erklärung einer Schuldzuweisung in Richtung Nutzer gleichkommt. Wer nichts sagt, macht dennoch eine Aussage. (Unbekannter Fehler – „Bin ich der erste der das macht? Hab ich es jetzt kaputt gemacht?“; „-201 aufgetreten“ – Das System verweigert das Gespräch mit dem Nutzer.) Die dahinterliegende Frage lautet: Was sage ich dem Nutzer bzw. was sage ich ihm damit nicht? 2. Axiom: „Jede Kommunikation hat einen Inhalts- und Beziehungsaspekt“. Die Beziehung zur Anwendung hat durchaus diese beiden Aspekte: Inhalt ist die lösende Aufgabe und deren dazu notwendigen Informationen. Die Beziehung zum Programm (User Experience) bietet aber die Tragfläche für diese Informationen. („Oooops, sorry, habe die Seite wohl verschlampt“ – als Fehlermeldung für einen 404 – file not found einer Witze-Seite im Internet durchaus vertretbar, als Meldung einer Datenbankanwendung unmöglich. Informations- und

Beziehungsaspekt unterscheiden sich bei den Beispielen grundlegend.) 3. Axiom: „Kommunikation ist immer Ursache und Wirkung“. Nutzer und System sind in einer Beziehung, die durch eine Kette von Reizen und Reaktionen definiert ist. Diese Reize und Reaktionen bestimmen das Verhalten miteinander. Wird ein Mensch bspw. in einer Diskussion ständig despektierlich behandelt, wird er sich weniger häufig äußern. (Tritt der Fehler „unzulässige Eingabe“ ohne weitere Erklärung auf, so wird der Nutzer mehr und mehr von seiner Motivation verlieren, das System zu nutzen. Letztlich weil ihm etwas zum Vorwurf gemacht wird – nämlich eine falsche Eingabe gemacht zu haben – wird er dem System vorwerfen, nicht zu sagen, wie die Eingabe korrekt zu erfolgen hat, der Fehler wird wieder auftreten, die Schuldzuweisungen führen zu Frust.) 4. Axiom: „Menschliche Kommunikation bedient sich analoger und digitaler Modalitäten“. Eine analoge Modalität kann zweideutig sein, auch wenn sie auf den ersten Blick eindeutig erscheint. Tränen, Zeichen der Trauer, können auch Freudetränen sein sowie Lächeln ein Zeichen von Freundlichkeit aber auch Überheblichkeit sein kann. 5. Axiom: „Kommunikation ist symmetrisch oder komplementär“. Ist die Kommunikation symmetrisch, so ist sie ausgeglichen und findet auf Augenhöhe statt. Ist sie dagegen komplementär, versuchen sich die Beteiligten auszustechen. Ein Ober- und Untergefühl stellt sich ein („Fehler wurde auf Nutzerseite erkannt“ – das System befindet sich maßregelnd über dem Nutzer.) 7. Erstellen der Fehlermeldungen Das Erstellen der Fehlermeldungen – und das zeigen die vorgehenden Kapitel eindeutig – ist kein einfaches Unterfangen. Es bedarf der professionellen und strategischen Herangehensweise und Umsetzung. Sprache und Design als tragende Komponenten müssen zielgenau ausgerichtet werden. Das heißt für den Ersteller der Meldungen: –– Wissen um die Zielgruppe


Usability Professionals 2011 Tutorials

–– Fähigkeit zur Perspektivenübernahme –– Sprachliche Kompetenz (linguistisch, grammatikalisch) –– Wissen um Semiotik und Semantik –– Wissen um didaktische und persuasive Mittel –– Professionelle Textfähigkeiten Die DIN ISO 9241, die Kriterien zu benutzungsfreundlichen Inhalten und die Grundgesetze der Kommunikation an den charakteristischen Eigenschaften der angesprochenen Zielgruppe umzusetzen verlangt für die Erstellung von Fehlertexten ein besonderes Fachwissen. Ein Fachwissen, dem im Projekt genügend Raum eingeräumt werden muss, um das gesetzte Ziel zu erreichen. Es ist ebenbürtig mit anderen Projektbestandteilen (Programmierung, Design) und gehört eng verbunden mit Informationsarchitektur, Benutzerführung und Inhaltserstellung. Das Ausgestalten von Fehlertexten ist nur im Gesamtkontext möglich und kann nur dann zielgerecht umgesetzt werden, wenn der Blick des Erstellers das Gesamtumfeld erfassen kann, in dem der Fehler auftauchen könnte (Situation, Aufgabe). Grundlegend notwendig sind daher: –– Anwendungsfall komplett inklusive normal flow, alternative flow –– Design, Layout (Typographie, Farben, …) –– Technische Beschreibung des Fehlers –– Auswirkungen des Fehlers –– Vermeidungsmöglichkeiten des Fehlers –– Behebung der Fehlersituation (notwendige Schritte/Maßnahmen) –– Schwere des Fehlers –– Umfeld des Fehlers (Bsp: Datenbankausgabe oder Eingabeformular) Als sehr hilfreich hat es sich erwiesen, in Klickdummies ebenfalls die Fehlermeldungen einzubinden, um so das Zusammenspiel der oben genannten Punkte zu simulieren. 6. Testen der Kommunikation

Probandentests in einem Aufgaben-ZielUmfeld bieten sich an. Im moderierten Ablauf der Testsituation ist es möglich alle Kanäle der Kommunikation zu überprüfen. So spielen Gestik, Mimik und Sprache (lautes Denken) eine außerordentlich wichtige Rolle in der Reaktion der Probanden auf die Dialoge.

Durch dieses vorgehen können Fehlermeldungen benutzungsfreundlicher gestaltet werden. Literatur Referenzierte und weiterführende Literatur 1. Brennan, S. & Ohaeri, J.. Effects of Message Style on Users‘ Attributions toward Agents. Departement of Psychology State University

Für die Vorbereitung dieser Test sind folgende Vorüberlegungen zu tätigen: 1) Zielgruppe: die Zielgruppe muss den in den Personas beschriebenen Charakteren entsprechen. Herausfordernd sind hier vor allem die Angaben zu Vorwissen, Wissenshintergrund, Motivation und handlungsbeeinflussende Faktoren. 2) Anwendungsfälle: Das Aufgaben-ZielUmfeld muss aus den Anwendungsfällen entnommen werden. Allerdings spielt hier weniger der normal flow als vielmehr der alternative flow die ausschlaggebende Rolle. Letztlich um den Fehler zu provozieren. 3) Eingangs- und Ausgangsfragebogen: Diese beiden Elemente haben zur Aufgabe Ergebnisse zu liefern, die direkt mit den Fehlermeldungen zu tun haben. So können diese auf die im Content Usability aufgeführten Kriterien Bezug nehmen. Eine der herausforderndsten Aufgaben der Fragebogen ist es, besonders Vorkenntnisse (Fachwissen) und Erfahrungen des Probanden mit dem System (oder ähnlichen) zu erfragen (C. Wagner, 2010).

New York. 2. Brown, P. J. (1983). Error Messages: The neglected area oft he man/machine interface? Communications of the ACM, April 1983, Volume 26, Nr. 4, 246-149 3. Johnson, J. (2000). GUI Bloopers. San Diego: Academic Press. 4. Lazar, K. & Norcio A. (1999). To Err Or Not To Err, That Is The Question: Novice User Perception of Errors While Surfing The Web. IRMA International Conferences, 1999, 321-325. 5. Miller, G. (1960). TOTE-Modell. Wikipedia http://de.wikipedia.org/wiki/TOTE-Modell abgerufen am 10.6.2011 6. Nielsen, J. (2001). Error Guidelines. Alertbox, 24. Juni 2001. http://www.useit. com/alertbox/20010624.html abgerufen am 10.6.2011. 7. Norman, D. (1988). The Design of Everyday Things. New York: Basic Books. 8. Tzeng, J. (2004). Toward a more civilized design: stuying the effects of computers that apologize. International Journal of HumanComputer Studies. 2004, 61, 319-345. 9. Wagner, C., Lotterbach, S. & Marek, M. (2010). Content Usability: Vorstellung

7. Fazit Fehlermeldungen sind ein wichtiger Bestandteil der Kommunikation zwischen Mensch und Maschine. Daher ist es wichtig, diese am Menschen auszurichten und ihr die gebotene Aufmerksamkeit zu schenken. Somit empfiehlt es sich: a) Den Menschen in den Mittelpunkt zu stellen (oder andersherum Fehlertexte in den UCD einbeziehen) b) Die Kommunikation von Fehlern zu professionalisieren c) Textprofis, Programmierer und Konzepter in Teams zu integrieren d) Textmeldungen in (Content) Usability Tests einbeziehen

eines Kriterienkatalogs zur Überprüfung der Gebrauchstauglichkeit von Inhalten. Berichtsband zur 8. Fachtagung der German UPA, 2010, S.123 ff 10. Watzlawick, P., Beavin, J. & Jackson, D. (1969). Menschliche Kommunikation. Bern: Hans Huber. 11. Wenger, M. (1991). On the Rhetorical Contract in Human-Computer Interaction. Computers in Human Behaviour, 1991, Volume 7, 245-262.

Diese Grundregeln und Interpretationen sind an der Zielgruppe iterativ zu prüfen.

39


178

Personas als Werkzeug in modernen Softwareprojekten Die Humanisierung des Anwenders Eva-Maria Holt 7P B2B Mobile & IT Services GmbH Balcke-Dürr-Allee 9 40882 Ratingen eva-maria.holt@7p-group.com

Dominique Winter GreenPocket GmbH Siegburger Str. 215 50679 Köln dominique.winter@greenpocket.de

Abstract In der agilen Softwareentwicklung haben User Stories einen hohen Stellenwert. Häufig beschreiben sie die Anforderungen aus Anwendersicht, ohne dabei den Anwender weiter zu konkretisieren. Dies führt dazu, dass der Anwender ein theoretisches Konstrukt bleibt und dem Entwickler hypothetisch erscheint. Zur Steigerung des Verständnisses des hypothetischen Anwenders bietet sich die Persona-Methode als Ergänzung zu User Stories an. Personas ermöglichen es, ein realistisches Bild des Anwenders zu vermitteln und können in allen Teilen des Entwicklungsprozesses vom Verständnis der Anwenderbedürfnisse über Usability-Tests bis hin zu Akzeptanztests herangezogen werden. Sie ermöglichen für alle Projektbeteiligten eine einheitliche Sichtweise auf den Anwender und schaffen insbesondere bei den Software-Entwicklern ein besseres Anwenderverständnis während der Implementierungsphase. Den Teilnehmern wird im zugehörigen Tutorial vermittelt, wie Personas auf eine Art erstellt und genutzt werden können, die durch einen hinreichenden Realismus die Entwicklung von Software in allen Teilen des Entwicklungsprozesses unterstützt.

1. Einleitung Moderne Softwareentwicklung richtet den Fokus in der Analyse- und KonzeptionsPhase zunehmend auf eine stark anwenderzentrierte Sicht. Dies spiegelt sich unter anderem im Konzept des Human-Centred Designs nieder (DIN EN ISO 9241210:2010) und benötigt ein ausgeprägtes Verständnis vom künftigen Anwender. An der Durchführung eines Softwareprojektes wirken verschiedene Beteiligte (z. B. Programmierer, Usability Professional, Kunde) mit, welche jeweils eine durch ihre Blickwinkel geprägte Vorstellung des Anwenders haben (Kowallik 2007). Während Produktverantwortliche den Anwender in der Rolle des potenziellen Kunden sehen, ist dieser für die Entwickler oft eine anonyme Persönlichkeit, die die Funktionalitäten einer Software nutzt. Neben diesen beiden Perspektiven betrachten weitere Projektbeteiligte den Anwender in

40

ihrem jeweiligen Projektkontext. Aufgrund der diversen Perspektiven entwickeln sich innerhalb des Projektes unterschiedliche Vorstellungen des Anwenders. Dabei kommt es unter Umständen zu verschiedenen Interpretationen des Anwenders, da jeder Projektbeteiligte sich seinen eigenen Bezugsanwender konstruiert. Um ein gemeinsames Verständnis für den Anwender zu schaffen, bietet sich die aus dem User-Centred Design (Arnold et al. 2005) bekannte und von Alan Cooper (Cooper 1999) definierte Methode „Personas“ an. Somit wird eine homogenere Sichtweise auf das abstrakte Konstrukt des Anwenders geschaffen. Bei Personas handelt es sich um eine Methode, die den anonymen Anwender eines Systems konkretisiert und dadurch für die Projektbeteiligten greifbarer macht. Dies geschieht mit dem Ziel, einen hinreichenden Einblick in ein wahrscheinliches Anwenderprofil zu geben. Diese Methode erhebt keinen Anspruch die Wirklichkeit

Jörg Thomaschewski Hochschule Emden/Leer Constantiaplatz 4 26723 Emden joerg.thomaschewski@hs-emden-leer.de

Keywords: /// Personas /// Usability /// User Experience /// Scrum /// User Stories

vollständig abzubilden. Eine Persona stellt ein Modell des Benutzers dar, welches auf Basis der Motive und Ziele realer Benutzer entwickelt wird (Cooper & Reimann 2003). Personas ermöglichen es auf diese Weise, Software „[…] für ‚Jemand‘ statt für ‚Jedermann‘ zu gestalten“ (Petrovic et al. 2010). 2. Entwicklung von Personas Eine Persona kann mit unterschiedlichem Detaillierungsgrad beschrieben werden. In der Regel wird ein Foto mit einer textuellen Beschreibung verwendet, um die emotionale Ansprache gegenüber den Projektbeteiligten zu verstärken. [Abb. 1] Der Einsatz eines Fotos weist im Vergleich zur Verwendung einer Illustration Vorteile auf und steigert die emotionale Bindung zur Persona. Dadurch erscheint die Persona realer. Im Gegensatz hierzu erhöht die Verwendung einer Illustration das Risiko, der Persona selbstbezogene Details anzufügen und


Usability Professionals 2011 Tutorials

Quail (Quail 2008) definiert fünf unterschiedliche Kategorien, um eine qualitative Differenzierung von Personas im Hinblick auf ihren validen Anteil vorzunehmen (Persona Sketch, Persona Hypothesis, Provisional Persona, Robust Personas, Complete Personas). Diese Kategorien unterscheiden dabei, wie groß der Aufwand zur Entwicklung einzelner Personas ist und berücksichtigen den Einsatz unterschiedlicher Methoden zur Erhebung der Daten. 2.3. Disabled Personas Abb. 1. Beispiel einer Persona

bestimmte Attribute der Persona selektiv auszublenden (Long 2009). Ansonsten besteht die Gefahr, die Bedürfnisse des Anwenders elastisch an die des jeweiligen Projektbeteiligten anzupassen. 2.1. Reale und realistische Personas Eine grundsätzliche Unterscheidung von Personas kann basierend auf der Methodik ihrer Entwicklung vorgenommen werden. Beck et al. (Beck et al. 2005) unterscheiden hierbei zwischen realen Personas und realistischen Personas. „Reale Personas basieren auf qualitativen und quantitativen Daten, die in Untersuchungen zur Zielgruppe gewonnen werden.“ (Beck et al. 2005) Im Gegensatz hierzu dienen Gespräche zwischen unterschiedlichen Projektteilnehmern, wie z. B. den Marketingverantwortlichen und der Kundenbetreuung, als Grundlage zur Entwicklung von realistischen Personas. Dabei gilt es jedoch darauf zu achten, dass in der Art generierte Personas nicht zu stereotypisch beschrieben werden, da dann der Nutzen der Personas im Entwicklungsprozess verringert werden würde (Beck et al. 2005). Oftmals bietet sich zu Beginn eines Entwicklungsprozesses die Entwicklung einer hypothetischen („realistischen“)

Persona an. Dies gilt insbesondere dann, wenn für ein neues System noch keine realen Anwender zur Verfügung stehen. Im weiteren Verlauf des Entwicklungsprozesses sollten diese hypothetischen („realistischen“) Personas iterativ weiterentwickelt werden, damit die zumeist fiktiven Daten der Persona anhand von Ergebnissen aus der Benutzerforschung belegt werden können (Quail 2008). Auf diese Weise können realistische Personas zu realen Personas weiterentwickelt werden. Die Verwendung von realen Personas innerhalb des Entwicklungsprozesses minimiert das Risiko an der eigentlichen Zielgruppe vorbei zu entwickeln, da subjektive Wahrnehmungen der Projektbeteiligten in den Hintergrund rücken. 2.2. Qualitative Differenzierung von Personas Die repräsentative Fähigkeit einer Persona lässt sich anhand der Art ihrer Erstellung qualitativ bewerten. Je höher der valide Anteil einer Persona ist, z. B. durch Einbeziehung der Ergebnisse aus der Benutzerforschung, und je geringer der fiktive Anteil einer Persona, desto größer ist ihre Fähigkeit, die tatsächliche Zielgruppe zu repräsentieren.

Die Methode der Personas lässt sich auch zur Entwicklung barrierefreier Systeme einsetzen. Hierfür werden einzelne Personas um die speziellen Anforderungen erweitert, die Benutzer mit Einschränkungen stellen (Kowallik & Weber 2010). Um eine Persona zu entwickeln, die auch Einschränkungen eines Anwenders real charakterisiert, sind Interviews und Beobachtungen eingeschränkter Personen unabdingbar. Dies ist notwendig, da beim Entwurf einer Disabled Persona darauf geachtet werden muss, eine detaillierte Beschreibung der Fähigkeiten vorzunehmen. Medizinische Diagnosen lassen sich dabei nicht als Grundlage für Rückschlüsse auf die vom Anwender eingesetzten, assistierenden Systeme nutzen. Beispielsweise kann keine Aussage über das Assistenzsystem bei einem Benutzer mit einer Spastik getroffen werden, da anhand der Diagnose keine Aussage über Schwere und konkrete Auswirkung der Spastik in der MenschMaschine-Interaktion getroffen werden kann (de Piotrowski & Tauber 2009). Daraus resultierend kann eine Empfehlung bezüglich der barrierearmen Konzeption eines interaktiven Systems für Anwender mit Einschränkungen nicht getroffen werden. Statt einer Beschreibung der Einschränkung der Persona sollte eine Schilderung der Fähigkeiten erfolgen. Dieses Prinzip lässt sich im gesamten Gestaltungsprozess von Personas nutzen. Geeignet sind beispielsweise Auflistungen, welche Geräte diese Persona mit welcher Ausprägung bedienen kann und welche nicht.

41


3. Kategorisierungsmöglichkeiten Zu Beginn eines Projektes werden typischerweise mehrere Personas erstellt. Jede Persona stellt idealerweise individuelle Anforderungen an das zu entwickelnde System. Damit eine objektive Bewertung der unterschiedlichen Anforderungen in Bezug auf ihre Priorität im Entwicklungsprozess möglich wird, können Personas auf unterschiedliche Weise kategorisiert werden. Zum einen besteht die Option, sie in Benutzerklassen aufzuteilen. Zum anderen besteht die Möglichkeit, sie im Hinblick auf ihr Interesse an dem System in Benutzergruppen zu gliedern. 3.1. Benutzerklassen Die Anwender digitaler Systeme lassen sich aufgrund ihrer Vorkenntnisse in Bezug auf die Nutzung eines bestimmten Systems in unterschiedliche Benutzerklassen gliedern. Beispielsweise ist eine Differenzierung zwischen Anfänger, Fortgeschrittene und Experten möglich (vgl. Cooper et al. 2007). Diese unterschiedlich ausgeprägten Kenntnisse können zur Differenzierung von Personas eingesetzt werden. Ein Anwender, der ein System zum ersten Mal benutzt, wird in die Klasse der Anfänger eingeordnet. Im Gegensatz hierzu ist eine Persona, die jahrelange Erfahrung mit ähnlichen Systemen besitzt, als fortgeschrittener Anwender oder Experte angesehen. Auf diese Weise können Anforderungen hinsichtlich der Komplexität des Systems und der bestehenden mentalen Modelle bei Erstellung entsprechender Personas berücksichtigt werden. 3.2. Benutzergruppen Die Zuordnung der Personas zu Benutzergruppen ermöglicht eine Priorisierung der möglichen Anwender. Cooper und Reimann (Cooper & Reimann 2003, Cooper et al. 2007) geben sechs mögliche Gruppen vor (Primary, Secondary, Supplemental, Customer, Served, Negative). Olsen (Olsen 2004) schlägt hingegen eine Einteilung in

42

fünf Gruppen vor (Focal, Secondary, Unimportant, Affected, Exclusionary). Diese Art der Gruppierung bietet den Vorteil, dass im Kommunikationsprozess unter den Projektbeteiligten eine Bewertung einzelner Bedürfnisse vorgenommen werden kann. Die Sichtweise und Erwartungen von Hauptnutzern (Primary bzw. Focal) können objektiv stärker berücksichtigt werden als solche von unwichtigen Nutzern. So wird eine Beurteilung in Bezug auf die Relevanz einzelner Systemfunktionalitäten möglich (Cooper & Reimann 2003). 4. Einsatz in Softwareprojekten Personas lassen sich an verschiedenen Stellen des Entwicklungsprozesses konstruktiv einsetzen. Hier werden die Einsatzzwecke im Usability Engineering, im UX Design und in User Stories als Bestandteile agiler Entwicklungsmethoden am Beispiel Scrum betrachtet. 4.1. Einsatz im Usability Engineering Innerhalb des Usability Engineerings können Personas an mehreren Stellen eingesetzt werden. Während der Analysephase können die Ergebnisse aus der Benutzerforschung zu Personas modelliert werden. Anschließend dienen diese Personas zur Kommunikation der Anforderungen innerhalb des Entwicklungsteams. Der Fokus wird auf die Bedürfnisse der Benutzer gelenkt und Systeme mit einer nachweislich höheren Gebrauchstauglichkeit können entwickelt werden (Long 2009). Ein weiterer Vorteil besteht darin, dass auf diese Weise ein teamübergreifendes Bild eines fiktiven Nutzers entsteht. Damit wird der „Anwender“ für Entwickler greifbarer und weckt Empathie (Buß 2009). Da Menschen dazu neigen, einen menschlichen Orientierungspunkt zu suchen (Cooper et al. 2007), reduziert der Einsatz von Personas die Gefahr, dass Entwickler sich selbst als Anwendervorlage betrachten und dementsprechend die Software entwickeln.

Einen weiteren Vorteil bietet die Verwendung der Methode während der Konzeptphase. Der Prozess der Entscheidungsfindung (Abgrenzung der Systemfunktionalitäten) kann beschleunigt werden, da die Projektteilnehmer auf Basis einer homogenen Sichtweise auf den Anwender festlegen können, wie seine Bedürfnisse am besten befriedigt werden können. Während der Entwicklungsphase können Personas als Werkzeug für die Durchführung diverser Evaluationsmethoden, wie z. B. eines Cognitive Walkthroughs, eingesetzt werden. Sie können dem UsabilityInspektor als Hilfsmittel zur Seite stehen, um sich besser in den zu erwartenden Anwender hineinzuversetzen. 4.2. Einsatz von Personas im UX Design Neben dem Einsatz im Usability Engineering Prozess können Personas ebenfalls im User Experience (UX) Design genutzt werden. Werden beim potenziellen Anwender durch Werbung, Informationsbroschüren oder sonstige Marketinginstrumente Erwartungen geweckt (Sarodnick & Brau 2011), die die Software schließlich zu erfüllen sucht, können diese Erwartungen in den Personas beschrieben und damit berücksichtigt werden. Mögliche emotionale Reaktionen der Anwender (z. B. Freude, Spannung) können ebenfalls mit einbezogen werden. Dabei müssen dieselben Personas eingesetzt werden, die bereits in der Softwareentwicklung eingesetzt wurden, um keine Diskrepanz zwischen der angesprochenen und der anvisierten Zielgruppe zu erreichen. 4.3. Einsatz von Personas in User Stories In der agilen Softwareentwicklung nach dem Vorgehensmodell Scrum werden Anforderungen in der Regel durch User Stories beschrieben. User Stories definieren in reduzierter Art die Anforderungen an die zu entwickelnde Software und nutzen dabei die Sprache des Anwenders (Wirdemann 2009). In der Regel beginnen User Stories mit dem User (bzw. seiner


Usability Professionals 2011 Tutorials

Facetten im Verhalten der Anwender zu verstehen. –– Personas können als Werkzeug zur Evaluation von Designlösungen eingesetzt werden. –– Probleme, die bei der Präsentation von umfangreichen Daten aus der Benutzerforschung entstehen, können vermieden werden. –– Personas können drei DesignProbleme lösen: Elastizität des Anwenders, selbstbezogenes Design, Konzentration auf Sonderfälle.

Dauerhaftes Löschen bestätigen Als Anwender möchte ich das permanente Löschen einer Datei bestätigen müssen, damit ich nicht aus Versehen eine Datei unwiderruflich lösche.

Dauerhaftes Löschen bestätigen Emma hofft, dass sie vor dem permanenten Löschen von Dateien noch einmal den Vorgang bestätigen muss, da sie in anderen Programmen schon manchmal eine Datei aus Versehen permanent gelöscht hat. Abb. 2. Beispiel einer Story Card

Rolle im jeweiligen Kontext) und seinen Anforderungen (z. B. „Als Anwender möchte ich...”) (Wirdemann 2009, Nazzaro & Suscheck 2010). Dieses Verfahren sollte beim konsequenten Einsatz von Personas in allen Projektschichten dahingehend geändert werden, dass auch an dieser Stelle die Personas eingesetzt werden (z. B. „Emma möchte…“). Durch diesen Einsatz der Persona erscheint der Anwender nicht mehr als Abstraktion (Beyer 2010). Da User Stories im Scrum-Team ausformuliert werden (Nazzaro & Suscheck 2010), kann die Methode „Personas“ helfen, die Anwender besser zu repräsentieren. Sie lässt sich im Regelfall auf sämtliche Anforderungen aus Sicht des Anwenders anwenden. Der Product Owner kann mit Personas die Produktanforderungen aus Sicht des Kunden auf emotionaler Ebene an das Team herantragen. [Abb. 2] Personas werden nur für anwenderbezogene und nicht für technische Anforderungen eingesetzt. Sind Anwender von den Auswirkungen technischer Anforderungen

(z. B. Performance) betroffen, können Personas mit einbezogen werden. 5. Vor- und Nachteile Die Verwendung von Personas bietet diverse Vor- und Nachteile. Diese zu kennen, hilft bei der korrekten Anwendung der Methode „Personas“. Im Folgenden werden Vor- und Nachteile aufgeführt (vgl. Cooper et al. 2007, Chapman & Milham 2006). Sie beziehen sich sowohl auf reale als auch auf realistische Personas. Vorteile: –– Ziele und Aufgaben der Personas liefern eine Basis für Entscheidungen über Funktionen und Verhalten eines Produktes. –– Personas richten den Fokus der Projektbeteiligten auf den Benutzer. –– Personas unterstützen die Kommunikation zwischen Stakeholdern, Entwicklern und Designern. –– Die narrative Darstellung einer Persona ermöglicht es, unterschiedliche

Nachteile: –– Unsicherheit über die exakte Beschreibung einer Gruppe von Anwendern in einer Persona. –– Mit zunehmender Genauigkeit einer Persona verkleinert sich der Anteil der Benutzer, den sie repräsentiert. –– Fiktive Personas stehen häufig im Konflikt zu anderen Datenquellen. Eigene persönliche Erfahrungen zeigen Abweichungen zu den präzisen Daten, die in Form einer Persona repräsentiert werden. –– Unsicherheit über die Erfassung aller relevanten Anwendergruppen in den Personas. 6. Hinweise zum Einsatz von Personas Aufgrund der Entwicklungsmethodik von realistischen Personas ist bei ihrem Einsatz besondere Vorsicht geboten. Auf der einen Seite besteht die Gefahr, dass der Fokus auf eine falsche Zielgruppe gerichtet werden könnte. Auf der anderen Seite besteht die Gefahr, dass der Fokus zwar auf die richtige Zielgruppe gerichtet wird, aber dennoch wichtiges Schlüsselverhalten der Benutzer nicht berücksichtigt wird (Cooper et al. 2007). Des Weiteren stellen Chapman und Milham (Chapman & Milham 2006) die Frage, in wessen Verantwortungsbereich die Kommunikation von Personas fällt. Eine Problematik sehen die Autoren in der Gewährleistung, dass die Informationen einer Persona von den Projektbeteiligten richtig verstanden werden und die

43


Methode innerhalb des Entwicklungsprozesses angemessen eingesetzt wird. Personas müssen kommuniziert werden und sollten nicht nur einem eingeschränkten Kreis zugänglich sein. Daher sollten sie unternehmensweit zur Verfügung stehen. Eine Möglichkeit besteht in der Bereitstellung einer „Persona Library“. Von dort aus können Personas abteilungsübergreifend genutzt werden (Petrovic et al. 2010), um auch außerhalb des Entwicklungsprozesses (z. B. im Marketing) eingesetzt und wahrgenommen werden zu können.

4. Buß, A. (2009): Personas als

Personas für Business Software. In Brau, H.,

Designs: Methode mit Tücken. i-com 2009

Diefenbach, S., Göring, K., Peissner, M. &

8:2, S. 58-60.

Petrovic, K. (Hrsg.): Usability Professionals

5. Chapman, C. & Milham, R. (2006): The Personas’ new Clothes: Methodological

Beyond Fake Personas. http://www.

Method. 50th Annual Meeting, 2006, S. 634

personacreation.com/persona_

–636. 6. Cooper, A. (1999): The Inmates Are Running the Asylum: Why High Tech Products Drive Us Crazy and How To Restore The Sanity. Boston: Pearson Professional Education. 7. Cooper, A. & Reimann, R. (2003): About face Indianapolis: Wiley. 8. Cooper, A., Reimann, R. & Cronin, D. (2007): About face 3. The Essentials of

Das Tutorial soll neben den Grundlagen der Persona-Methode und der Motivation für den Einsatz ebendieser im Entwicklungsprozess praktisches und anwendungsgerechtes Wissen vermitteln. Dazu werden die Teilnehmer wiederholt die Anwendung der Methode üben und fachgerechtes Feedback erhalten. Ebenfalls soll ihnen die Einsatzmöglichkeiten von Personas aufgezeigt werden. Thematische Schwerpunkte bilden dabei der Einsatz während der Usability-Evaluation und der Einsatz innerhalb agiler Softwareentwicklungen, insbesondere zur Entwicklung von User Stories. Abschließend werden den Teilnehmern Erfahrungen und Empfehlungen zu Vorgehensweise und themenbezogener Literatur mit auf den Weg gegeben.

Interaction Design. Indianapolis: Wiley. 9. Frydyada de Piotrowski, A. & Tauber, M. (2009): Benutzerprofile von Menschen mit Beeinträchtigungen/ Fähigkeiten. In Wandke, H., Kain, S. & Struve, D. (Hrsg.): Mensch & Computer 2009: Grenzenlos frei!? S. 33–42. München: Oldenbourg Verlag. 10. DIN EN ISO 9241-210:2010 (2010): Ergonomie der Mensch-System-Interaktion - Teil 210: Prozess zur Gestaltung gebrauchstauglicher interaktiver Systeme. Berlin: Beuth 11. Kowallik, P. (2007): E-Mail von Natalie – Wie Personas die Softwareentwicklung beeinflussen. In Röse, K., Brau, H. (Hrsg.): Usability Professionals 2007. Stuttgart: German Chapters der Usability Professionals Association 12. Kowallik, P. & Weber, H. (2010): Usability Professionals und Barrierefreiheit – Der AK

Literatur

Barrierefreiheit in der G-UPA. In Brau, H.,

1. Arnold, P., Gaiser, B. & Panke, S. (2005):

Diefenbach, S., Göring, K., Peissner, M. &

Personas im Designprozess einer E-Teaching Community. In Haake, J. (Hrsg.): DELFI 2005 S. 469–480. Bonn: Köllen. 2. Beck, A., Eichstädt, H., Gaiser, B., von

Petrovic, K. (Hrsg.): Usability Professionals 2010 S. 215–218. Stuttgart: Fraunhofer Verlag. 13. Long, F. (2009): Research Paper - Real or Imaginary: The effectiveness of using

Savigny, P., Schubert, U. & Schweibenz,

personas in product design. In O’Sullivan,

W. (2005): Personas in der Praxis. In

L.W. (Hrsg.): Proceedings of the Irish

Hassenzahl, M., Peissner, M. (Hrsg.): Usability

Ergonomics Society Annual Conference S.

Professionals 2005, Berichtband des 3.

1-10. Dublin: Irish Ergonomics Society.

GC-UPA Tracks S. 92-102. Linz: German

14. Nazzaro, W. & Suscheck, C. (2010): New to

Chapters der Usability professionals Association. 3. Beyer, H. (2010): User-centered agile methods. San Rafael: Morgan & Claypool.

User Stories?. http://www.scrumalliance.org/ articles/169-new-to-user-stories. 15. Olsen, G. (2004): Persona Creation and Usage Toolkit. http://www.interactionbydesign.com/ presentations/olsen_persona_toolkit.pdf.

44

2010 S. 59-64. Stuttgart: Fraunhofer Verlag. 17. Quail, A. (2008): Buyer Persona Creation:

and Practical Arguments against a Popular

2.0. The essentials of interaction design.

7. Tutorial

16. Petrovic, K., Göring, K. & Kowallik, P. (2010):

Standardwerkzeug des User Centered

creation/2008/04/beyond-fake-per.html. 18. Sarodnick, F. & Brau, H. (2011): Methoden der Usability Evaluation. Bern: Hans Huber 19. Wirdemann, R. (2009): Scrum mit User Stories. München: Carl Hanser.


Workshops

45


Content Strategy & User Experience Design Nutzerfreundliche Inhalte als Basis für nutzerfreundliche Produkte

Nikki Tiedtke USEEDS° GmbH Interaction Architect Chausseestr. 123, 10115 Berlin nikki.tiedtke@web.de

Abstract Dieser Beitrag zeigt die Relevanz der relativ neuen Disziplin Content Strategy im Bereich User Experience Engineering. Dabei wird gezeigt, dass im heutigen Informationszeitalter die Vernetzung von User Experience Engineering, Geschäfts- und Marketing-Strategie sowie redaktioneller Strategie für Web-Inhalte besonders wichtig ist. Content Strategy verbindet Methoden aus genau diesen Bereichen und definiert, wie Web-Inhalte aller Art auf Nutzerziele und deren Kontext sowie Geschäfts- und Marketingziele maßgeschneidert werden können. Der Beitrag definiert Content Strategy und führt die wichtigsten Prinzipien auf, um dann typische User Experience Engineering- und Content Strategy-Methoden gegenüberzustellen. Dabei wird deutlich, wie sinnvoll sich diese beiden Disziplinen ergänzen und wie einfach es im Grunde sein kann, inhaltliche Nutzungsanforderungen in jedem Schritt des User Experience Engineering zu berücksichtigen.

1. Warum Inhalte heute für User Experience wichtiger sind denn je

weitere Nutzergruppen erschlossen. Die Grenzen zwischen Online und Offline werden fließend.“4

„High-quality web content that’s useful, usable, and enjoyable is one of the greatest competitive advantages you can create for yourself online.”1

1.1. Bisher nicht im Fokus: Gebrauchstauglichkeit von Inhalten?

Wir leben im Informationszeitalter. Die zentralen Funktionen des Internet sind Kommunikation und Information.2 Laut ARD/ZDF-Onlinestudie betrachten Nutzer das Internet als virtuelles Informationszentrum, aber auch als Marktplatz: 2006 hatten insgesamt 63 Prozent aller Online-Nutzer bereits Einkäufe im Netzt getätigt und 50 Prozent mindestens einmal wöchentlich zielgerichtet nach Informationen gesucht.3 Und selbst Fernseh-, Rundfunk- und Printangebote wandern zunehmend ins Netz: „Zukünftig werden immer mehr Nutzer das Internet als „all-in-one-Medium“ verstehen. (...) Via Internet eröffnen sich den etablierten Rundfunkanbietern (...) neue Chancen: Inhalte werden auf mehreren Plattformen verbreitet und damit

46

Laut Claus Wagner richten Usability-Experten „viel zu oft (...) das Hauptaugenmerk auf das Design, den Container (...), der die Inhalte transportiert. Viel zu selten, gar stiefmütterlich, wird der eigentlich entscheidende Faktor in die Betrachtung einbezogen: Der Inhalt.“5 Man könnte sogar noch einen Schritt weiter gehen mit der Behauptung, dass die Vernetzung von strategischer User Experience-, Business-, Marken- und Marketingplanung sowie das Aufsetzen von stabilen, nachhaltigen, redaktionellen Prozessen für die heutige Informationsflut im Internet überlebenswichtig ist. „Content strategy is rising because organizations all over the world have begun to realize that they desperately need it

Keywords: /// User Experience-Professionals /// Informationsarchitekten /// Interaction Designer /// Marketing-Strategen /// Content-Manager und Content-Strategen

to handle their rapidly expanding online communications.“6 2. Was bedeutet Content Strategy? Content Strategy ist eine noch relativ junge Disziplin innerhalb der Web-Disziplinen, die sich mit dem „Content“ beschäftigt, also Web-Inhalten aller Art und wie diese analysiert, katalogisiert, entwickelt, erstellt, präsentiert, strukturiert, evaluiert und gepflegt werden. Dabei vereinigt Content Strategy Methoden aus User Experience, Engineering, Content-, Business- sowie Marketing-Management. Erste Artikel zum Thema erschienen 20057 bzw. 20078 und bescherten der neuen Disziplin zum ersten Mal größeres Interesse innerhalb der Web-Professionals. 2008 und 2009 erschienen bereits mehrere Artikel zum Thema, u.a. in Online-Magazinen wie „A List Apart“ oder „Boxes and Arrows“, die Content Strategy zunehmend etablierten.

117


Usability Professionals 2011 Workshops

Ab 2009 erschienen erste Fachbücher9, die Content Strategy als neue Disziplin definierten, weiter festigten und den Rahmen für bestimmte Methoden und Arbeitsergebnisse bildeten. 2.1. Definitionen Kristina Halvorson definiert Content Strategy als „(...) practise of planning for the creation, delivery, and governance of useful, usable content.“10 Richard Sheffield betont vor allem den nachhaltigen, redaktionellen Prozess, den eine fundierte Content Strategy ausmachen sollte: “Content strategy is a repeatable system that defines the entire editorial content development process for a website development project, from (…) analyzing and classifying readers to (…) planning for the ongoing content maintenance (…).”11

Dabei wird Content definiert als Text, Meta(-daten), Grafiken, Video und Audio – alle Inhalte, die ein Web-Produkt benutzbar und nutzerfreundlich machen sollten. Viele Praktiker der Szene rechnen dazu auch Intranets oder interne Wissensmanagement-Systeme. 2.2 Welche Fragen beantwortet Content Strategy? Richtig angewendet, kann Content Strategy … –– nutzerfreundliche und relevante Inhalte für bestimmte Zielgruppen/Personas entwickeln helfen. –– realistische, nachhaltige, langfristig plan- und messbare redaktionelle Prozesse und Projektpläne für WebTeams aufsetzen. –– Kosten reduzieren, indem irrelevante redaktionelle Tätigkeiten eingeschränkt und der Fokus auf die Effektivitäts- und Effizienzverbesserung bestehender Inhalte gerückt wird.

–– sicherstellen, dass Kommunikation über verschiedene Kanäle hinweg stets den Businesszielen entspricht – diese sollten selbstverständlich User Experience-Ziele beinhalten. –– in ihrer Funktion als übergreifende „Meta-Disziplin“ die Gräben zwischen verschiedenen Teams, z. B. Kundenservice, Web Development, Business, Marketing, User Experience, Visual Design, überbrücken helfen, da alle diese Teams wichtige Inputgeber für einen Content-Strategen sind. [Abb. 1] 2.3. Prinzipien von Content Strategy Inhalte müssen auf Nutzerziele und deren Kontext maßgeschneidert sein: Eine Content Strategy sollte nicht nur definieren, welche Inhalte ein Nutzer/Zielgruppe/eine Persona benötigt, sondern auch wann, in welchem Format, in welchem Kommunikationskanal, wie viel Inhalt, in welchem Stil.

Was sind die Businessziele? Für welche Zielgruppe / Persona? Was sind die Ergebnisse aus User Research? Wie messen wir Erfolg? Was kommt nach dem Launch?

Business

Wie finden Nutzer Inhalte? Wie benutzen sie diese (Kontext)? Wie sollten die Inhalte strukturiert sein? Wie sollen sie aussehen?

(UX) Design

Content Strategy

Content

Welche Informationen benötigen die Nutzer? Wieviel Informationen? In welchen Formaten und Kanälen? Was sollen wir sagen und wie? Wie erstellen, reviewen, publizieren und pflegen wir die Inhalte? Wann und wie oft?

Technologie

Mit welcher Technologie erstellen wir die Inhalte? Wer verwaltet die Technologie?

Abb. 1. Content Strategy beantwortet Fragen aus Business-, Marketing-, Branding-, User Experience- und technischer Sicht. Grafik in Anlehnung an Karen McGranes Grafik in ihrer vorzüglichen Präsentation „Why UX needs Content Strategy“. http://www.slideshare.net/KMcGrane/why-ux-design-needscontent-strategy

47


Der Content Stratege Daniel Eizans fordert sogar, dass Content Strategy – genau wie User Experience – die physischen, emotionalen und kognitiven Faktoren von Nutzern einbeziehen sollte: Idealerweise arbeiten User Experienceund Marketing-Experten sowie ContentStrategen zusammen, um eine Persona zu erstellen, die diese Nutzerbedürfnisse bündelt und auch die inhaltlichen Anforderungen aufführt. [Abb. 2] Daher hilft Content Strategy maßgeblich, die … –– Effektivität, –– Effizienz, –– Joy of use, –– Nutzungskontexte, –– Usability, –– Verständlichkeit, –– Terminologie und Taxonomie, –– Struktur, –– Relevanz und –– Substanz von Inhalten optimal aus Nutzer- und Business-Sicht zu definieren und umzusetzen sowie nachhaltig zu pflegen. Inhalte müssen auf Geschäftsziele maßgeschneidert sein: Eine Content Strategy hilft

einem Projektteam, inhaltliche Anforderungen zu definieren, die Geschäftsziele möglichst effektiv, effizient und nachhaltig unterstützen. Das bedeutet konkret, ... die Erstellung von Prozess- und Projektplänen sowie Workflows (z. B. wer erstellt wann welche Inhalte? Mit welchen Hilfsmitteln? Wer muss Input liefern bzw. die Inhalte prüfen bzw. editieren? Wer gibt die Inhalte frei?) –– sicherzustellen, dass jegliche Erstellung von Inhalten (Content) stets Geschäftsoder Nutzerziele erfüllt und die Prioritäten richtig gesetzt sind. –– die Definition von Content-Key Performance-Indikatoren, um den Erfolg zu messen. Idealerweise geschieht dies in enger Abstimmung mit anderen Teams, wie z. B. mit User Research sowie Marketing und dem Kundenservice. –– die Definition und Verwaltung des Content-Lebenszyklus. Letzterer stellt sicher, dass Inhalte je nach ihrem Lebenszyklus aktualisiert, wiederverwendet, archiviert oder gelöscht werden. –– die Erstellung und Pflege von redaktionellen Gestaltungsrichtlinien

(Styleguides) – maßgeschneidert auf Nutzerbedürfnisse und für alle Kommunikationsmittel und -kanäle. 3. Content Strategy & User Experience Design: Nutzerfreundliche Inhalte als Basis für nutzerfreundliche Produkte Wie die oben aufgeführten Definitionen und Prinzipien zeigen, sollte Content Strategy als Disziplin eng mit User Experience und User Research zusammenarbeiten. Anders als der typische User-ExperienceProzess definiert Content Strategy auch Prozesse und Methoden für die Pflege („Governance“) von Content – das kann von der Verwaltung des Content-Lebenszyklus über die Definition von Team-Strukturen und Rollen bis hin zum Aufsetzen von Qualitätsmanagement-Prozessen für Content reichen. In diesem Abschnitt soll aber vor allem gezeigt werden, wie Content Strategy und User Experience-Methoden Hand in Hand gehen – ja, sich geradezu perfekt ergänzen. 3.1. Content Strategy & User Experience: Das perfekte Team Schon Jesse James Garrett zeigte 2000 in seiner Infografik „The elements of User Experience“ die Spezifikation inhaltlicher Anforderungen gleichrangig neben der der funktionalen Anforderungen. 2003 verankerte er die Disziplin Content Strategy in seinen „The nine pillars of successful webteams“. [Abb. 3], [Abb. 4] Garrett trennte damals noch „Content Production“ von „Content Strategy“, die sich bei ihm vor allem auf die Website bezog. Heutige Experten würden auch die Definition der Inhalte sowie das Management der Content-Erstellung unter der Ägide von Content Strategy sehen. Trotzdem stellte sich Garrett bereits 2003 genau die richtigen Fragen in Bezug auf „useful, usable“ Content.

Abb. 2. Daniel Eizans: Context in Content Strategy: Personal Behavioral Context, Januar 2011. http://danieleizans.com/2011/01/contextin-content-strategy-personal-behavioral-context

48

Der Content Stratege Richard Ingram hat in einer Infografik zusammengefasst,


Usability Professionals 2011 Workshops

Abb. 3. Jesse James Garrett. The nine pillars of successful web teams. http://www.adaptivepath.com/ideas/ nine-pillars-of-successful-web-teams

Abb. 4. Jesse James Garrett. The elements of user experience, 2000. http://www.jjg.net/elements/pdf/elements.pdf

Abb. 5. Richard Ingram: Collaboration with Content Strategist, 2009: http://www.richardingram. co.uk/. Grafik für den Druck modifiziert.

wie Content Strategen mit typischen User Experience-Teams oder -Disziplinen zusammenarbeiten können, um nutzerzentrierte Inhalte zu erstellen. [Abb. 5] 3.2. Wie sich User Experience- und Content Strategy-Methoden ergänzen

In der folgenden Tabelle werden typische User Experience- und Content StrategyMethoden gegenübergestellt. Dabei wird deutlich, bei welchen User Experience Engineering-Methoden eine Content Strategy berücksichtigt bzw. angewendet werden kann und welche Fragen dabei beantwortet werden. [Tab. 1]

http://danieleizans.com/wp-content/ uploads/2011/01/Personal-BehavioralContext.png

Das verdeutlicht, wie sinnvoll sich diese beiden Disziplinen ergänzen und wie einfach es im Grunde sein kann, inhaltliche

Nutzungsanforderungen in jedem Schritt des User Experience Engineering zu berücksichtigen. Für detaillierte Informationen und Anleitungen zu den unten aufgeführten Content-Strategy-Methoden sind die Bücher von Halvorson und Kissane zu empfehlen (siehe Literaturliste).

49


User Experience Engineering UX-Strategie / UX-Briefing

Content Strategy Content-Briefing

–– Welche Inhalte unterstützen die UX-Strategie?

Analytics & Competitive Analysis

Content analytics / content competitive analysis –– Logfile-Analyse oder Web Analytics: Welche Inhalte werden aufgerufen und wie oft? Wie sind typische „KlickFlows“? Wo sind Abbrüche zu verzeichnen? –– Welche Inhalte bieten Konkurrenten an und was kann man daraus lernen?

Contextual Inquiry

Content contextual inquiry / analysis –– Welche Inhalte brauchen / erwarten Nutzer, um eine Aufgabe zu bewältigen? –– Was sind deren emotionalen, physischen und kognitiven Bedürfnisse und Fähigkeiten in Bezug auf Inhalte? –– Was ist ihr mentales Modell in Bezug auf Inhalte? –– Welche Textformen, -Formate und -Kanäle ergeben sich daraus? –– Welche Ausdrücke verwenden Nutzer?

Personas und Szenarien

Content Personas und Szenarien –– Sicherstellen, dass Personas und Szenarien auch inhaltliche Anforderungen definieren bzw. abbilden.

Use Cases /Task Flows / User Flows

Content Flows –– Wie finden Nutzer die Inhalte? Was sind Einstiegspunkte? Wie sollten Inhalte miteinander verlinkt sein? –– Wo an welcher Stelle des Flows sollten wir welche Inhalte anbieten?

Storyboards

Storyboard Content –– Sicherstellen, dass Storyboards inhaltliche Konzepte, sinnvolle und nutzerzentrierte Begriffe / Texte enthalten. –– Ggf. Input, welche Inhalte über Storyboards noch getestet werden können.

UX-Spezifikationen

Content-Spezifikationen –– Content Inventory: Was haben wir, wo, wann wurde es zuletzt aktualisiert, wer ist dafür verantwortlich, etc.? –– Content Audit / Evaluation: Erfüllen die Inhalte, die wir haben, unsere Business- und User Experience-Ziele? (Tipp: Es empfiehlt sich, bei dieser Analyse Usability-Heuristiken mit internen redaktionellen Gestaltungsrichtlinien zu mischen.) –– Content Gap Analysis: Was brauchen wir? –– Redaktionelle Gestaltungsrichtlinien (Styleguide) und Glossar –– SEO-Strategie

Informations­architektur

Content Architektur –– Definition der Hierarchie der Kernbotschaften und welche Botschaft an welcher Stelle kommuniziert werden soll. –– Seitenstruktur: Wie sollen die Inhalte strukturiert sein? –– Taxonomien / Benennung von IA-Elementen

UI Wireframing & Prototyping

User Interface Content / Content Mapping –– Sicher stellen, dass mit „echtem“ UI-Content gearbeitet und getestet wird. –– Ggf. Input, welche Inhalte getestet werden können.

Usability Guidelines & Styleguides

Content Styleguide –– Redaktionelle Gestaltungsrichtlinien inkl. Usability-Guidelines sowie Industriestandards für Online-Inhalte.

Usability Testing / User Research

Content Testing / Content Research –– Welche Inhalte testen wir? –– Wie können wir Inhalte testen und deren Erfolg messen (z. B. Readability Formulas, Usablity test, Cloze Test, Experten-Evaluation, cognitive Walkthrough)

–– Content Mapping: Welche Inhalte / Kernbotschaften erscheinen wo in den Wireframes?

Tab. 1.

50


Usability Professionals 2011 Workshops

Literatur

Projektgruppe ARD/ZDF-Multimedia (BR, hr,

4

1. Barr, C. (2010): The Yahoo! Style Guide: The

rbb, SWR, ZDF) (2007). 10 Jahre ARD / ZDF

Ultimate Sourcebook for Writing, Editing,

Onlinestudie. http://www.ard-zdf-onlinestudie.

and Creating Content for the Digital World.

de/fileadmin/Fachtagung/ARD_ZDF_

London: Macmillan. 2. Halvorson, K. (2010): Content Strategy for the

Onlinebrosch_re_040507.pdf, Seite 27. Wagner, C. (2011). Content Strategy: Inhalte

5

strategisch erstellen. http://www.art-of-web-

Web. Berkeley: New Riders.

usability.de/Wordpress/wordpress/?p=1164

3. Jones, C. (2010): Clout: The Art and Science of Influential Web Content. Berkeley: New

Kissane, E. (2011). The Elements of Content

6

Strategy, New York: A Book Apart, Seite 2.

Riders. 4. Kissane, E. (2011): The Elements of Content

Gahran, A. (2005). What is Content Strategy

7

and Why Should You Care? http://www.

Strategy. New York: A Book Apart.

contentious.com/2005/05/25/what-is-content-

5. McGovern, G. (2007): Killer Web Content:

strategy-and-why-should-you-care/

Make the Sale, Deliver the Service, Build the Brand. London: A & C Black.

Lovinger, R. (2007). Content Strategy:

8

The Philosophy of Data. http://

6. Redish, J. (2007): Letting Go of the Words:

www.boxesandarrows.com/view/

Writing Web Content That Works. San

content-strategy-the

Francisco: Morgan Kaufmann. 7. Sheffield, R. (2009): The Web Content Strategist’s Bible. Atlanta: CLUEfox

Siehe ausführliche Literaturliste.

9

Halvorson, K. (2010). Content Strategy for the

10

Web, Berkeley: New Riders, S. 32.

Publishing.

Sheffield, R. (2009). The Web Content

11

Magazine / Blogs:

Strategist’s Bible, Atlanta: CLUEfox Publishing.

1. A List apart: www.alistapart.com/

S. 35.

2. Bailie, R. A.: Intentional design. Content Strategys for business impact: http:// intentionaldesign.ca/ 3. Boxes and Arrows: http://www. boxesandarrows.com/ 4. Daniel E.: Digital Strategie / Content Strategy: http://danieleizans.com/ 5. Jones, C.: Winning content: http://www. leenjones.com/ 6. Nielsen, J.: Writing for the web. Alertbox columns. http://www.useit.com/papers/ webwriting/ 7. Scatter / Gather: Ideas and opinions from content strategists at Razorfish: http:// scattergather.razorfish.com/

1

Halvorson, K. (2010). Content Strategy for the

2

Projektgruppe ARD/ZDF-Multimedia (BR, hr,

Web, Berkeley: New Riders, Seite 28. rbb, SWR, ZDF) (2007). 10 Jahre ARD / ZDF Onlinestudie. http://www.ard-zdf-onlinestudie. de/fileadmin/Fachtagung/ARD_ZDF_ Onlinebrosch_re_040507.pdf, Seite 16. 3

Projektgruppe ARD/ZDF-Multimedia (BR, hr, rbb, SWR, ZDF) (2007). 10 Jahre ARD / ZDF Onlinestudie. http://www.ard-zdf-onlinestudie. de/fileadmin/Fachtagung/ARD_ZDF_ Onlinebrosch_re_040507.pdf, Seite 17.

51


103

Branchenreport Usability 2011 Ergebnisse einer Befragung unter Usability Professionals in Deutschland Sarah Diefenbach Folkwang Universität der Künste Universitätsstraße 12 45141 Essen sarah.diefenbach@folkwang-uni.de

Daniel Ullrich Technische Universität Darmstadt Alexanderstraße 10 64283 Darmstadt ullrich@psychologie.tu-darmstadt.de

Abstract Mit dem jährlichen Branchenreport Usability dokumentiert die German UPA (Berufsverband der deutschen Usability und User Experience Professionals, www.germanupa.de) die Situation von Usability und User Experience Professionals in Deutschland. Rund 300 Personen haben sich in diesem Jahr an der Befragung zum Branchenreport beteiligt. Ihre Angaben liefern Informationen zu Ausbildungswegen und Weiterbildungsmöglichkeiten, spezifischen Merkmalen der Arbeitssituation sowie Herausforderungen und Verdienstmöglichkeiten unter angestellten und selbstständig tätigen Usability Professionals. Zudem wird ein Überblick über die bekanntesten Unternehmen der Branche geboten.

1. Einleitung Mit dem Branchenreport Usability 2011 liefert der Berufsverband der deutschen Usability und User Experience Professionals (www.germanupa.de) bereits zum sechsten Mal ein umfassendes Bild der Arbeitssituation in der Usability und User Experience Branche in Deutschland. Grundlage hierfür bilden die Ergebnisse einer landesweiten Befragung, an der sich von Jahr zu Jahr mehr Personen beteiligen. Diese kontinuierliche Steigerung der Teilnehmerzahl spiegelt das Wachsen der Branche wider und spricht für Usability/User Experience als ein spannendes Berufsfeld mit Zukunft. 2. Aufbau der Befragung Neben Angaben zu Ausbildungswegen, Weiterbildungsmöglichkeiten, momentaner Position, Herausforderungen und Verdienstmöglichkeiten unter angestellten und selbstständig tätigen Usability Professionals werden auch die bekanntesten Unternehmen der Branche erfragt. So erhalten Personen, die sich für eine Tätigkeit im Usability-Bereich interessieren, eine Übersicht über mögliche Ausbildungswege, eine realistische Einschätzung

52

des Berufsfelds und gleichzeitig bereits eine Übersicht über potentielle spätere Arbeitgeber. Ebenso können sich bereits in der Branche Tätige mit ihren Kollegen vergleichen und so ihre momentane Arbeitssituation besser einordnen. Durch die kontinuierliche Dokumentation von zentralen Merkmalen und Kennwerten der Arbeitssituation lassen sich außerdem Trends und Veränderungen über die Zeit analysieren, wie beispielsweise das Wachstum der Usability/User Experience Branche in verschiedenen Regionen Deutschlands oder die Entwicklung von unter Usability/ User Experience Professionals üblichen Gehältern bzw. Stunden- und Tagessätzen. Schließlich werden von Jahr zu Jahr auch neue Aspekte mit in die Befragung aufgenommen und spezifische Schwerpunkte gesetzt, häufig inspiriert von den Fragen und Anmerkungen der Besucher des Vortrags zum Branchenreport auf der Usability Professionals Konferenz im Vorjahr. So kam in diesem Jahr beispielsweise die Abfrage einer Reihe von näheren Informationen zur Beschreibung der beruflichen Tätigkeit hinzu, wie die durchschnittliche Projektdauer, Aufgabenschwerpunkte sowie die Berufsgruppen, mit denen die Befragten typischerweise zusammenarbeiten.

Keywords: /// Usability und User Experience Professionals /// Ausbildung /// Weiterbildung /// Arbeitssituation /// Gehaltsspiegel /// Branche

Die Befragung umfasste insgesamt vier thematische Bereiche: –– Demografie. Erfragt wurden hier Alter, Geschlecht, Berufserfahrung sowie die Region des Arbeitsplatzes. –– Aus- und Weiterbildung. Hier wurden Studienfach und Universität, Berufsund Zusatzausbildungen sowie Aktivitäten zur Weiterbildung und deren jeweilige Relevanz erhoben. –– Momentane Position. Zunächst wurden hier allgemeine Angaben zur Beschreibung der beruflichen Tätigkeit erhoben, wie der Arbeitsbereich, Aufgabenschwerpunkte sowie die Berufsgruppen, mit denen die Befragten typischerweise zusammenarbeiten. Auch wurde erfragt, ob es sich um eine Tätigkeit in einem Angestelltenverhältnis oder um eine selbstständige Tätigkeit handelt und nachfolgend spezifische Fragen an Angestellte und Selbstständige gerichtet. –– Situation der Angestellten. Unter den Angestellten wurden hier beispielsweise der Jobtitel, Stellenumfang, die Dauer der Unternehmenszugehörigkeit, die Größe des Unternehmens sowie die wichtigsten Faktoren für Zufriedenheit und


Usability Professionals 2011 Workshops

Unzufriedenheit beim aktuellen Arbeitgeber erhoben. Auch das Bruttojahresgehalt wurde erhoben. –– Situation der Selbstständigen. Auch unter den Selbstständigen wurden hier zunächst Angaben zu (ihrem) Unternehmen wie der Zeitpunkt der Unternehmensgründung und die Zahl der Beschäftigten erfragt, weiterhin wurden spezifische Herausforderungen und Schwierigkeiten bei der Unternehmensgründung im Bereich Usability erhoben. Auch hier wurden Angaben zum Verdienst erhoben, wobei Selbstständige meist ihren üblichen Stunden- oder Tagessatz angaben. –– Branche. Um einen Überblick über die bekanntesten Unternehmen der Branche zu erlangen, wurden die Befragten schließlich um die Nennung der ihrer Meinung nach drei bekanntesten Unternehmen der Branche gebeten. Im Folgenden werden die wichtigsten Ergebnisse der Befragung zum Branchenreport Usability 2011 vorgestellt. Unterschiede werden als signifikant bezeichnet, wenn eine Irrtumswahrscheinlichkeit von < 5% vorliegt (p < .05). 3. Demografie Die Datenerhebung zum Branchenreport Usability erfolgte wie auch in den Vorjahren mittels Online-Befragung im Zeitraum von Februar bis Mai. Neben der Verbreitung über den German UPA Newsletter wurde auch in Usability/ User Experience-Gruppen in sozialen Netzwerken wie Xing oder Facebook zur Beteiligung eingeladen. Von den insgesamt 360 Personen, die sich an der Befragung beteiligt haben, machten 305 Personen Angaben zu einem Großteil der Fragen, welche die Grundlage für die vorliegenden Analysen bilden. Die Frage nach der Beteiligung am Branchenreport 2010 ergab, dass 164 Personen 2011 erstmalig an der Befragung zum Branchenreport Usability teilnahmen, 141 hatten bereits im Vorjahr teilgenommen.

Mit den somit vorliegenden 305 vollständigen Datensätzen konnte die Datenbasis gegenüber den Vorjahren nochmals gesteigert werden. [Abb. 1]

Abb. 1. Entwicklung der Teilnehmerzahlen in den Jahren 2007 – 2011

Das Durchschnittsalter der Befragten liegt bei 35 Jahren (sd=7, min=21, max=61). 60% der Teilnehmer sind männlich, 40% weiblich, wobei das Durchschnittsalter unter den Männer signifikant höher liegt (m=37) als unter den Frauen (m=33). Die durchschnittliche Berufserfahrung im Bereich Usability liegt bei 6,6 Jahren (sd=5, min=0, max=34). Eine genauere Analyse zeigt, dass es sich um eine linkssteile Verteilung handelt, 60% der Teilnehmer sind erst seit 6 Jahren oder kürzer in der Usability-Branche tätig. Die Region des Arbeitsplatzes wurde mittels Angabe des Bundeslands abgefragt. Das Bundesland mit der größten Zahl von Usability Professionals ist Bayern,

hier arbeiten 19% der Befragten, gefolgt von Berlin/Brandenburg (17%), NordrheinWestfalen (15%) und Baden-Württemberg (14%). Die stärkste „Zuwanderung“ von Usability Professionals in den letzten Jahren lässt sich für die Arbeitsregion Berlin/ Brandenburg feststellen, 2008 waren erst 5% der Befragten dort tätig. Abbildung 2 visualisiert die Verteilung der Befragten auf die unterschiedlichen Regionen Deutschlands. [Abb. 2] 4. Aus- und Weiterbildung 4.1. Ausbildung Die große Mehrheit der Befragten (281 Personen, 91%) hat ein Studium absolviert, 24 Personen (8,0%) haben außerdem promoviert. Die meist studierten Fächer sind wie auch im Vorjahr Psychologie (39 Personen) und Informatik (31 Personen), auch die Studiengänge Medieninformatik (25 Personen), BWL (10 Personen) und Informationsdesign (10 Personen) sind unter den Befragten relativ häufig vertreten. Wie auch im letzten Jahr ist die unter den Branchenreport-Teilnehmern meist besuchte Hochschule die Hochschule der Medien Stuttgart (13 Personen), ebenfalls gut vertreten sind dieses Jahr die TU Berlin sowie die FH Kaiserslautern mit jeweils 10 Personen. 81 Personen haben anstelle oder zusätzlich zum Studium eine Berufsausbildung absolviert. Die am häufigsten erlernten Ausbildungsberufe sind hier Mediengestalter/in (13 Nennungen) und Fachinformatiker/in (7 Nennungen). Von den 69 Personen, die eine (meist Usability-spezifische) Zusatzausbildung absolviert haben ist dies bei 26 Personen (38%) die Ausbildung zum Usability Consultant am artop Institut der HU Berlin. 4.2. Aktivitäten zur Weiterbildung

Abb. 2. Arbeitsregionen

Die Einschätzung der Relevanz verschiedener Möglichkeiten und Informationsquellen zum Erwerb von Usability-Wissen

53


wurde auch in diesem Jahr wieder anhand einer fünfstufigen Skala (1=sehr unwichtig, 5=sehr wichtig) abgefragt, die Rangfolge der verschiedenen Aktivitäten ist gegenüber den Vorjahren weitgehend unverändert: Die wichtigste Aktivität sind weiterhin “Training on the job” (m=4,73) und der Austausch mit Kollegen (m=4,50), spezifische Weiterbildungsangebote spielen hingegen eine geringere Rolle (m=3,14). Verändert hat sich allerdings die relative Bedeutung der zur Weiterbildung in Eigenregie genutzten Medien: Während 2008 Bücher und Zeitschriften noch die meist genutzten Medien waren, wird mittlerweile dem Internet (m=4,13) eine größere Bedeutung beigemessen als Büchern/ Zeitschriften (m=3,88). Das mittlere Urteil für die Relevanz des Studiums für den Erwerb von Usability-Wissen liegt bei 3,31. Eine Analyse getrennt nach den meist studierten Fächern zeigt, dass BWLer die Relevanz des Studiums im Vergleich zu den Befragten anderer Fachrichtungen als eher gering (n=10, m=2,90) einschätzen. Am höchsten schätzen Informationsdesigner die Relevanz des Studiums ein (n=10, m=4,20). Unter Medieninformatikern (n=25, m=3,76), Psychologen (n=40, m=3,68) und Informatikern (n=32, m=3,41) liegen die Werte etwas geringer, aber immer noch über dem Durchschnitt. 5. Momentane Position 5.1. Arbeitsbereiche Der Arbeitsbereich wurde durch Vorgabe der Bereiche „Web“, „Mobile“, „Industrie“, „Büro“ und „Unterhaltung“ abgefragt, Mehrfachantworten waren möglich. Fast drei Viertel der Befragten (73%) beschäftigen sich mit Usability im Web-Bereich, ebenfalls eine wichtige Rolle spielt mit 51% der Bereich „Mobile“. Abbildung 3 zeigt die relative Häufigkeiten für die vorgegebenen Bereiche. Darüber hinaus konnten die Befragten in einer offenen Frage weitere Arbeitsbereiche angeben, genannt wurden hier beispielsweise die Bereiche „Automotive“, „Medical/ Pharma“ oder „Haushaltsgeräte“. [Abb. 3]

54

5.3. Zusammenarbeit mit anderen Berufsgruppen

Abb. 3. Arbeitsbereiche

5.2. Aufgabenschwerpunkte Die in diesem Jahr erstmalig gestellte Frage nach dem Aufgabenschwerpunkt lieferte für keine der vorgegebenen Kategorien eine deutlich höhere Häufigkeit als für die anderen Bereiche – lediglich „UX Design“ wird mit 60% etwas häufiger als Aufgabenschwerpunkt genannt (siehe Abbildung 4). Die vorgegebenen Kategorien stellen somit allesamt für einen beträchtlichen Teil der Befragten einen wichtigen Schwerpunkt ihrer Arbeit dar. Die entsprechende offene Frage lieferte Beispiele für weitere Kategorien wie „Interaktionsdesign“, „Prototyping“ und „Lehre“, diese nennen allerdings jeweils nur für 1-3% als einen Schwerpunkt ihrer Tätigkeit (wobei sich in zukünftigen Befragungen herausstellen wird, ob sich der Anteil noch erhöht, wenn diese Beispiele ebenfalls in die Liste der vorgegebenen Kategorien aufgenommen werden). [Abb. 4]

Abb. 4. Aufgabenschwerpunkte

Auf die offene Frage „Mit welchen Berufsgruppen arbeiten Sie am häufigsten zusammen?“ nannten die meisten der Befragten gleich mehrere Berufsgruppen, wobei sich die Kategorisierung durch Überschneidungen sowie den unterschiedlichen Abstraktionsgrad der Nennungen als schwierig erwies. Eine Analyse auf Basis der genannten Begriffe ergab als meist genannte Berufsgruppe (Software-)Entwickler (35%), gefolgt von Designern (29%), Produktmanagern (20%), Informatikern (15%) und Marketing Experten (13%). 5.4. Unterschiede der Arbeitssituation für Angestellte und Selbstständige 233 der Teilnehmer (76%) arbeiten als Angestellte, die restlichen 72 der Befragten sind Inhaber eines Unternehmens oder freiberuflich tätig. Für einige der erhobenen Maße ergaben sich signifikante Unterschiede zwischen den beiden Personengruppen: Während sich unter den Angestellten etwa die Hälfte (53%) unternehmensintern mit der Usability der “eigenen” Produkte beschäftigt, und die andere Hälfte (47%) sich um die Usability “fremder” Produkte von Auftraggebern kümmert, trifft bei dem Großteil der Selbstständigen (80%) letzterer Fall zu, sie bieten Usability als Dienstleistung an. Ein weiterer signifikanter Unterschied zwischen Angestellten und Selbstständigen betrifft den Anteil der Arbeitszeit, der für Tätigkeiten im Bereich Usability aufgewendet wird. Unter Angestellten liegt dieser bei 65%, bei Freiberufler und Inhabern sind es lediglich 50%. Auch die durchschnittliche Dauer der Projekte unterscheidet sich signifikant zwischen Angestellten und Selbstständigen: Während Angestellte im Mittel 8 Monate (sd=8,2 min=1, max=36) an einem Projekt arbeiten, sind es unter Selbstständigen nur knapp 6 Monate (sd=5,6, min=0,5, max=24).


Usability Professionals 2011 Workshops

Keinerlei Unterschiede zwischen Angestellten und Selbstständigen gibt es allerdings bezüglich ihrer Einschätzung des Anteils der von ihnen gemachten Vorschläge, die tatsächlich umgesetzt werden. Beide Personengruppen schätzen, dass etwas mehr als die Hälfte (56%) ihrer Vorschläge umgesetzt werden, wobei die pessimistischsten Schätzungen jeweils bei 10% liegen, die optimistischsten bei 100% (Angestellte) bzw. 90% (Selbstständige). Neben den bisher aufgeführten Angaben zur momentanen Situation wurden zudem spezifische Fragen an Angestellte und Selbstständige gerichtet, im Folgenden sind die entsprechenden Analysen aufgeführt. 6. Situation der Angestellten 6.1. Stellenbeschreibung Der unter den Angestellten am häufigsten vertretene Jobtitel ist mit 36 Nennungen “Usability Engineer”, wie auch schon in den Vorjahren. Tabelle 1 gibt einen Überblick über die häufigsten Bezeichnungen für Usability Professionals; aufgeführt sind Jobtitel die von mindestens fünf Personen genannt wurden. [Tab. 1]

Rang

Jobtitel

Die große Mehrheit der Angestellten (92%) hat eine Vollzeitstelle, 4,5% haben eine halbe Stelle. Es bestehen keine signifikanten Unterschiede bezüglich des Stellenumfangs zwischen Frauen (M=97%) und Männern (M=96%). Bei ihrem aktuellen Arbeitgeber sind die befragten Usability Professionals im Schnitt seit knapp 4 Jahren tätig (sd=4, min=0, max=28), bei 80% sind es fünf Jahre oder weniger. Mit steigender Unternehmenszugehörigkeit erhöht sich auch der Anteil der Angestellten mit Personalverantwortung (r=.16*), insgesamt ist der Anteil von Angestellten mit Personalverantwortung mit 29% aber eher gering. 6.2. Unternehmen Die Angaben zur Frage nach dem Anteil der Kollegen im Unternehmen, die sich mit Usability beschäftigen, liegen zwischen 1% und 100%, der Durchschnittswert liegt bei eher niedrigen 20%. Selbstverständlich hängt dieser Anteil auch davon ab, ob es sich um eine Stelle zur Beschäftigung mit der Usability der Produkte von Auftraggebern handelt, hier liegt der Anteil von “Usability-Kollegen” bei durchschnittlich 35%, oder um eine Anstellung in einem Unternehmen zur Erhöhung der Usability der “eigenen” Produkte, hier liegt der Zahl der Nennungen

1

Usability Engineer

36

2

User Experience Consultant

22

3

User Interface Designer

16

4

Usability Consultant

10

5

Product Manager

9

6

User Experience Engineer

8

7/8/9

User Experience Designer

7

7/8/9

Konzepter

7

7/8/9

Wiss. Mitarbeiter

7

10/11

Information Architect

6

10/11

Projektmanager

6

Interaction Designer

5

12 Tab. 1. Jobtitel

Anteil von “Usability-Kollegen” bei gerade 5%. Genauso variiert auch die Zahl der Beschäftigten des Unternehmens mit der Frage nach der Usability eigener oder fremder Produkte. Teilnehmer, die an der Usability fremder Produkten arbeiten, sind meist (67%) bei einem Unternehmen mit maximal 100 Beschäftigten angestellt. Usability Professionals die an Produkten des “eigenen” Unternehmens arbeiten, sind hingegen eher bei größeren Unternehmen beschäftigt. 80% arbeiten in einem Unternehmen mit mehr als 100 Beschäftigten, bei 60% sind es über 300 Beschäftigte, und bei immerhin 20% über 1000. Über beide Gruppen hinweg liegt die durchschnittliche Unternehmensgröße bei 13.650 Beschäftigten (sd=53.025, min=2, max=400.000), Abbildung 5 zeigt die relativen Häufigkeiten verschiedener Unternehmensgrößen im Vergleich zu den Vorjahren. Es zeigt sich eine relative Verschiebung der Häufigkeit der Anstellung von Usability Professionals in Unternehmen mit 101 – 1000 Beschäftigten. [Abb. 5]

Abb. 5. Unternehmensgrößen

6.3. (Un-)Zufriedenheit beim aktuellen Arbeitgeber Ein Großteil der Nennungen zu Gründen für Zufriedenheit beim momentanen Arbeitgeber bezieht sich auf den kollegialen und kooperativen Umgang, den tollen Teamgeist oder auch allgemein die “tolle Stimmung” am Arbeitsplatz, oft wird hier auch die Unternehmenskultur als unterstützender Faktor genannt (29%). 26% der Befragten sehen vor allem Freiräume und

55


Möglichkeiten zum eigenverantwortlichen Arbeiten als wichtigen Zufriedenheitsfaktor. 19% beziehen sich auf inhaltliche Aspekte ihrer Arbeitsaufgaben und freuen sich über deren Vielfalt und die Übereinstimmung mit eigenen Interessen. 9% sind vor allem mit den Arbeitskonditionen zufrieden und schätzen beispielsweise die flexiblen Arbeitszeiten, gute Möglichkeiten zur Vereinbarkeit von Familie und Beruf, die Sicherheit des Arbeitsplatzes, das Gehalt, den Arbeitsplatzstandort oder auch die Möglichkeiten zur Weiterbildung. 8% freuen sich, bei ihrem aktuellen Arbeitgeber Anerkennung für das Thema Usability/ UX zu finden, und fühlen sich in ihrer Arbeit durch das Management gut unterstützt. Für Unzufriedenheit sorgen zumeist schwierige Bedingungen für die Bearbeitung des Themas Usability/User Experience, wobei die Befragten hierfür unterschiedliche Gründe verantwortlich machen bzw. besonders hervorheben. Ein Teil der Befragten (22%) bemängelt, dass das Thema Usability/User Experience seitens des Arbeitgebers oder anderer Abteilungen nicht genug Anerkennung findet, was mit schlechten Bedingungen für die Ausführung der eigenen Arbeit und einer geringen Wertschätzung der eigenen Arbeit einhergeht. Andere (14%) beklagen in diesem Zusammenhang vor allem ungünstige Entwicklungsprozesse, die das Thema Usability nicht ausreichend berücksichtigen oder in ungünstiger Weise integrieren (14%). Auch die Unternehmensstruktur machen einige der Befragten verantwortlich dafür, dass das Thema Usability nicht ausreichend Anerkennung findet (14%). Weiterhin gibt es Personen, die unabhängig vom Thema Usability Faktoren für Unzufriedenheit beklagen, beispielsweise klagen 13% über eine enorme Arbeitsbelastung durch hohen Zeitdruck, und insgesamt 12% sind unzufrieden mit den Arbeitskonditionen wie dem Gehalt, der Bürosituation oder unflexiblen Arbeitszeiten. Schließlich beklagen 9% mangelhafte Aufstiegsmöglichkeiten und fehlenden Weiterbildungsangebote. Unzufriedenheit auf Grund des Inhalts der Arbeitsaufgaben beschreiben hingegen nur 3%.

56

Trotz aller genannten Schwierigkeiten sind die Befragten im Mittel beim momentanen Arbeitgeber dennoch “eher zufrieden”, das durchschnittliche Urteil liegt bei 4,0 (fünfstufige Skala von 1= sehr unzufrieden bis 5= sehr zufrieden). Eine Analyse der Zufriedenheitsurteile in Abhängigkeit von den zuvor aufgeführten verschiedenen genannten Faktoren für (Un-)Zufriedenheit zeigt, dass unter den Zufriedenheitsfaktoren die Personen die höchsten Zufriedenheitsurteile abgeben, die sich über den hohen Grad an Anerkennung für das Thema Usability/UX freuen (M=4,33). Gewichtigster Unzufriedenheitsfaktor scheinen fehlende Weiterbildungs- und Aufstiegsmöglichkeiten zu sein, das mittlere Zufriedenheitsurteil liegt in dieser Gruppe bei 3,0. Korrelationsanalysen zu anderen erhobenen Variablen ergeben nur für wenige Variablen signifikante Zusammenhänge und diese sind auch eher gering. So sind Männer tendenziell zufriedener als Frauen (r=. 155*), und die Zufriedenheit ist insgesamt umso höher, je größer der Zeitanteil ist, der für Tätigkeiten im Bereich Usability genutzt werden kann (r=.142*).

Abb. 6 Gehälter unter männlichen und weiblichen Usability Professionals in Abhängigkeit der Berufserfahrung im Bereich Usability

Dementsprechend gibt es auch insgesamt signifikante geschlechtsspezifische Gehaltsunterschiede: Frauen verdienen im Mittel 45.592€ und damit im Schnitt 15.000 €weniger als ihre männlichen Kollegen, die einen Durchschnittsverdienst von 60.321€ verzeichnen können. Dieser Unterschied entspricht in etwa auch dem Bild der vergangenen Jahre. [Abb. 7]

6.3.1. Gehaltsspiegel Für die hier aufgeführten Gehaltsanalysen wurden die Angaben von Angestellten mit ganzer Stelle berücksichtigt. Das durchschnittliche Bruttojahresgehalt der Angestellten liegt 2011 bei 54.112 Euro (sd=20.000, min=20.000, max=130.000). Im Vergleich zu Vorjahren, in denen dieser Wert immer um die 52.000€ lag, ist das Durchschnittsgehalt somit leicht gestiegen (2007: 52.260€; 2008: 52.179€; 2009: 52.418€; 2010: 52.368€). Wichtigster Prädiktor für das Gehalt ist die Berufserfahrung, die Korrelation liegt hier bei r=.68**. Allerdings ist der Zusammenhang zwischen Gehalt und Berufserfahrung unter Männern deutlich höher (r=.73**) als unter Frauen (r=.41**). Zurückzuführen ist dies vor allem das Ansteigen der Gehälter unter Männern mit zehn Jahren Berufserfahrung und mehr. [Abb. 6]

Abb. 7 Gehälter unter männlichen und weiblichen Usability Professionals von 2007 – 2011

7. Situation der Selbstständigen 7.1. Unternehmen Unter den insgesamt 72 Unternehmensinhaber oder freiberuflich tätigen Usability Professionals ist der Anteil der Frauen mit 27% deutlich geringer als in der Gruppe der Angestellten (44%). Die Unternehmensgründung liegt im Schnitt 5 Jahre zurück (sd=4,3, min=0, max=20).


Usability Professionals 2011 Workshops

21% der Selbstständigen arbeiten alleine und haben keine Angestellten. Bei den Selbstständigen mit Angestellten sind es bei der Mehrheit (78%) maximal fünf Angestellte, bei 54% ist es sogar nur einer. Inhaber größerer Unternehmen mit 60 Angestellten sind unter den Befragten die Ausnahme. Bis eine offene Stelle besetzt werden kann dauert es durchschnittlich 3,55 Monate (sd=3,0; min=0, max=12).

Zeit die Anforderungen verstehen und passend beraten und umsetzen können” oder die “Mediatorrolle zwischen Entwicklern, Marketing und Entscheidern”. 7.3. Verdienst

41% der Selbstständigen bezeichnen ihr Unternehmen als “Beratung”, beispielsweise als “Beratung für Online-Konzeption und Informationsarchitektur”, 22% betreiben eine “Agentur”, beispielsweise eine “Agentur für digitale Kommunikation”. Beispiele für die Unternehmensbezeichnungen unter den restlichen 37% der Selbstständigen sind “User Centered Design Services”, “Büro für Marketingforschung” oder “Designstudio für User Experience”.

Der Stundensatz der Selbstständigen liegt 2011 bei durchschnittlich 84€ (min=25, max=250, sd=48). Ein Vergleich mit den Vorjahreswerten zeigt nach dem Abfall des Stundensatzes im Zusammenhang mit der Finanzkrise 2008 wieder einen kontinuierlichen Anstieg (siehe Abbildung 8). Der Tagessatz selbstständig tätiger Usability Professionals bewegt sich zwischen 250€ und 1.200€, der Durchschnittswert liegt bei 584€ (sd=210, min=250, max=1200), bei einer durchschnittlichen Auslastung von 160 Tagen im Jahr (sd=58, min=50, max=280). [Abb. 8]

7.2. Herausforderungen

8. Unternehmen der Branche

Die zentralen Herausforderungen bei einer Unternehmensgründung im Bereich Usability wurden anhand vorgegebener Kategorien auf Basis der häufigsten Nennungen der letzten Jahre abgefragt. Als größte Herausforderung sehen es die Befragten noch immer an, potentiellen Auftraggebern die Relevanz von Usability zu vermitteln, hier stimmten 77% der Befragten zu. Auch Kontakt zu potentiellen Auftraggebern herzustellen, stellt für viele eine Herausforderung dar, dieser Aussage stimmten 53% zu. 32% sehen es als schwierig an, die eigene Professionalität zu vermitteln und sich von unseriösen Konkurrenten abzugrenzen, und 25% berichten Probleme, bei Entwicklern Anerkennung zu finden. Die relative Häufigkeit der Zustimmung zu den vorgegebenen Kategorien hat sich damit gegenüber den Vorjahren nur unwesentlich verändert. 18% der Selbstständigen machten außerdem Angaben zur offenen Fragen nach weiteren Herausforderungen, hier wurden allerdings meist Aspekte genannt, die nicht nur die Unternehmensgründung sondern die Tätigkeit im Bereich Usability allgemein betreffen. Beispiele sind hier “In kurzer

Auf die Frage nach den bekanntesten Unternehmen der Branche wurde wie auch schon im Vorjahr am häufigsten UID

Rang

Unternehmen

Abb. 8 Stundensätze selbstständiger Usability Professionals von 2007– 2011

genannt, gefolgt von den Unternehmen SirValUse und eResult. Tabelle 2 gibt einen Überblick über die bekanntesten Unternehmen der Branche und die jeweilige Zahl der Nennungen, aufgeführt sind Unternehmen, die von mindestens 15 der Branchenreport-Teilnehmer genannt wurden. [Tab. 2]

Zahl der Nennungen

1

UID

142

2

SirValUse

113

3

eResult

54

4

Fraunhofer Institut

41

5

Ergosign

31

6

SAP

28

7

Artop

24

8

Human Interface Design

17

9/10

Scoreberlin

16

9/10

usability.de

16

11

Eye Square

15

Tab. 2 Bekannteste Unternehmen der Usability-Branche

57


104

Mehrwert für alle Mit Content Usability zu erfolgreichen Webseiten

Christian Becker kuehlhaus AG N7 5-6, 68161 Mannheim c.becker@kuehlhaus.com

Fabian Lang kuehlhaus AG N7 5-6, 68161 Mannheim f.lang@kuehlhaus.com

Abstract Viele Content derisInteraktionsgeräte, king, so kann mandie oft in lesen. jüngster Und Zeit dennoch auf den werden Marktdie gekommen eigentlichen sind, Inhalte sind gesteneiner Internetseite und touchbasiert. von vielen Diese Anbietern auf neuen als Technologien Nebensache behandelt basierenden undInteraktionsformen auch in der werden Konzeption häufig noch auch selten als natürliche berücksichtigt. Interaktion Dabeibezeichnet. ist es gerade Maus der und Content, Tastatur mit haben dem sich als die Eingabegeräte Brücke zwischenKonkurrenz den Bedürfnissen bekommen. der Nutzer Als prominente und den meist Vorreiter wirtschaftlichen sind hier dieInteressen aktuellen Smartphones der Anbieter schlagen sowie Microsoft lässt. Wir Surface möchten zu nennen. gemeinsam Damit mithat allen sichWorkshop-Teilnehmern auch der Gestaltungsraum anhand fürvon Interaktionsdesigner Beispielen aus dererweitert. Praxis erarbeiten, Die Konzeption warum von das Steuerungsgesten Thema Content-Usability kommt als vielneue mehrDimension beinhaltet hinzu. als Funktionalität. Den damit verbundenen Von einer ersten Herausforderungen Bestandsaufnahme widmet gemeinsam sich unser mit dem Tutorial. Kunden, Wirüber zeigen diedie Evaluation Bandbreite undneuer Entwicklung Interaktionsmöglichkeiten von Content, bis zum auffertigen und probieren Produktgemeinsam werden im mit Workshop den Teilnehmern verschiedene eineMethoden Methode zur entwickelt Gestaltung und von diskutiert, gestendie und Sie touchbasierter unterstützen sollen, Interaktion ihren Content aus. in Zukunft im Griff zu haben.

1. Aufbau Was ist Content-Usability? Fasst man die beiden Begriffe Content und Usability zusammen, ergibt sich das Wortkonstrukt „Gebrauchstauglichkeit von Medieninhalten“. Jedoch geht ContentUsability über die Gebrauchstauglichkeit von Medieninhalten hinaus. Sinngemäß ist die Content-Usability als Teil der User Experience anzusehen. Guter Content sollte einen höheren Anspruch haben als die Erfüllung der Mindestanforderungen. Content sollte alle Kriterien der User Experience erfüllen. Mit dem Internet sind auch seine Inhalte stetig gewachsen. Es ist für jedermann möglich, Inhalte zu erstellen und diese frei zu verbreiten. Das gleiche gilt auch für den Konsum von Inhalten. Dieser Umstand hat zur Folge, dass immer mehr Informationen zu einem Thema zu finden sind, aber die Qualität oft darunter leidet. Die zunehmende Komplexität und Verzahnung von Webangeboten und deren Inhalten machen es notwendig, Content zu organisieren, um den Überblick zu behalten und hohe Qualität zu garantieren.

58

Wir wollen in diesem Workshop gemeinsam erarbeiten, was guten Content auszeichnet, wie man ihn misst und wie man dieses Vorgehen in bestehende Arbeitsabläufe integriert. Dieser Workshop richtet sich an alle, die während des Entwicklungsprozesses einer Webseite direkt oder indirekt mit Content in Berührung kommen. 2. Was zeichnet guten Content aus und wie wird er gemessen? Guter Content hat viele Facetten. Es werden die verschiedensten Anforderungen an Content gestellt, je nachdem, aus welchem Blickwinkel man diesen betrachtet. So haben zum Beispiel Usability-Experten andere Anforderungen an guten Content als die Marketingabteilung eines Unternehmens. Ziel dieses Workshops ist es, die wichtigsten Anforderungen, die an guten Content gestellt werden, gemeinsam zu erarbeiten und zusammenzufassen. Grundlegende Elemente wie Zweckmäßigkeit, Aktualität und Korrektheit werden genauso behandelt wie Readability und Accessability. Auch für das Marketing relevante

Keywords: /// Content /// User Experience /// Usability /// Text /// Mehrwert

Themen wie Search Engine Optimization und strategische Ziele von Content werden besprochen. Nachdem alle Ansprüche an guten Content erarbeitet wurden, können auf Basis dieser Erkenntnisse Metriken zur Messung der Qualität diskutiert und ausgearbeitet werden. Unser Ziel ist es, diese Metriken in eine Methode umzusetzen, die in Ihre bestehenden Arbeitsabläufe integriert werden kann. 3. Das Vorgehensmodell der kuehlhaus AG Auf Basis unserer Erkenntnisse wurde ein iteratives Vorgehen entwickelt, um Content optimal in ein Webprojekt zu integrieren, angefangen vom ersten Kontakt mit dem Kunden, bis hin zum fertigen Produkt. Dieses Vorgehensmodell orientiert sich an dem Business Centered Design Verfahren der kuehlhaus AG. Während des Entwicklungsprozesses werden verschiedene Methoden angewandt, um die Fülle an Content zu überblicken und ein optimales Nutzererlebnis zu schaffen. Wir möchten in diesem Workshop unser Vorgehen kurz


Usability Professionals 2011 Workshops

vorstellen, um in Anschluss daran mit Ihnen darüber diskutieren zu können.

4. Diskussion

Im ersten Schritt ist es wichtig, sich darüber klar zu werden, für wen der Content bestimmt ist. Anschließend wird der Status Quo analysiert, um einen Überblick über den aktuellen Content zu gewinnen und mögliche Probleme zu identifizieren. Erst dann kann entschieden werden, ob der bestehende Content eine Daseinsberechtigung hat, und wo es Potential zur Verbesserung gibt.

Am Ende des Workshops möchten wir mit Ihnen gemeinsam unsere Vorgehensweise diskutieren und sie hinsichtlich Stärken und Schwächen analysieren. So entwickeln wir uns gemeinsam weiter und nähern uns dem Ziel, Nutzern den bestmöglichen Content zu bieten und damit die Grundidee des Internets wieder aufleben zu lassen.

Sobald ein Überblick geschaffen wurde, ist es wichtig, Richtlinien zu erstellen und Regeln festzulegen, die den weiteren Verlauf eines Projektes organisieren. Es wird festgelegt, wer für welchen Content verantwortlich ist. Grundlegende Fragen werden beantwortet und in enger Abstimmung mit der Technikabteilung umgesetzt. So werden Überraschungen im Nachhinein vermieden.

Literatur 1. Colleen Jones - Clout - The Art and Sience of Influential Web Content 2. Berkeley: New Riders, 2010 3. Kristina Halvorson - Content Strategy for the Web 4. Berkeley: New Riders, 2009 5. Erin Kissane - The Elements of Content Strategy 6. A Book Apart 2011 - http:// www.abookapart.com/products/

Nachdem die Informations-Architektur der Seite in ihren Grundzügen besteht, wird in einem iterativen Prozess, qualitativer Content generiert. In enger Abstimmung arbeiten Texter, Marketingexperten und Kunden zusammen. Parallel wird die Prototypisierung und das Layout vorangetrieben, um zum späteren Testen der Seite beide Elemente wieder vereinen zu können.

the-elements-of-content-strategy

Links 1. http://www.cheval-lab.ch/chevalwissensbasis/normen-und-richtlinien/ iso-9241-12/ 2. http://boxesandarrows.com/view/ content-analysis Weiterführende Links 1. http://www.alistapart.com/articles/

Ziel ist es, für unsere Usability-Tests Prototypen zu erstellen, die mit realem Content bestückt sind. Das bietet den Vorteil, dass klassische Usability-Tests um das Testen von Content erweitert werden können. Speziell für Content erstellte Metriken und Methoden werden angewandt und ausgewertet. Durch das Testen mit echten Nutzern kann so schon vor dem Release einer Webseite guter Content gewährleistet werden.

thedisciplineofcontentstrategy/ 2. http://aktuell.de.selfhtml.org/artikel/design/ content-usability/

Ist die Webseite erst einmal im Einsatz, fallen weitere Aufgaben an. Die Wartung und Pflege von Content ist ein stetiger Prozess der in den meisten Fällen vernachlässigt wird. Wir erläutern, was wir tun, um eine Seite aktuell und attraktiv zu halten.

59


Design the Future – Mensch & Computer Konferenz, Workshop German UPA The Better the Design, the More Invisible It becomes. The design itself is still invisible, but the experience comes to the surface. Mariya Pavlenko User Experience, Tools And Technologies (UX TNT) Dietmar-Hopp Allee 16, 69190 Walldorf mariya.pavlenko@sap.com

Martine Clémot User Experience, SAP Web Applications & Mobile Dietmar-Hopp Allee 16, 69190 Walldorf martine.clemot@sap.com

Abstract In allen Lebensbereichen ist es entscheidend, ein angst- und konfliktfreies Umfeld zu Viele schaffen, der Interaktionsgeräte, um Intuition und Kreativität die in jüngster RaumZeit zu geben. auf denEin Markt vongekommen Ängsten und sind, Konflikten sind gestenbedrohter und Mensch touchbasiert. wird versuchen Diese aufden neuen sichersten Technologien Weg zubasierenden gehen. Intuition Interaktionsformen und Kreatiwerden vität haben häufig hierbei auch wenig als natürliche Spielraum. Interaktion Wirklichbezeichnet. Neues oder Maus Besseres und Tastatur kann aus haben diesem als Eingabegeräte unfruchtbaren Nährboden Konkurrenz bekommen. heraus nicht Als entstehen. prominente In unserer Vorreiter vom sind Verstand hier diedominierten aktuellen Smartphones Welt sind defensive sowie Microsoft Entscheidungen, Surface zu also nennen. Entscheidungen Damit hat sich die gegen auch der dasGestaltungsBauchgefühl raum gehen, fürdie Interaktionsdesigner Regel. Solche Entscheidungen erweitert. Diesind Konzeption jedoch keine von Steuerungsgesten Entscheidungen die kommt nach als denneue besten Dimension Lösungen hinzu. suchen, Den sondern damit verbundenen nach jenen Herausforderungen Lösungen, bei denen widmet man sich sicham unser bestenTutorial. rechtfertigen Wir zeigen kann,die sollten Bandbreite sie nicht neuer das Interaktionsmöglichkeiten gewünschte Ergebnis liefern. auf und Ein gleichprobieren berechtigtes gemeinsam Nebeneinander mit den Teilnehmern von Rationalität eine Methode und Intuition zur Gestaltung ist der Königsweg von gestendenund es ins touchbasierter Auge zu fassenInteraktion gilt. aus.

1. Wieso „Design the Future“?

Experience“ ganzheitlich zu verstehen und auch anzuwenden.

Viele von uns glauben, dass die technische Entwicklung der Menschheit in der Zukunft die Vorstellungsgrenzen sprengen könnte - in beinahe jeder Science-FictionGeschichte faszinieren und inspirieren heute noch nicht existierende Technologien, die das Unmögliche möglich machen, viele futuristische Filme beeindrucken das Publikum mit völlig neuen Mensch-Maschine Interaktionen.

Es wird vorausgesetzt dass wir innovative Designs entwerfen, die den Anwender nicht auf seine reine Arbeitsfunktion reduziert, sondern vielmehr auf seine „menschlichen“ Bedürfnisse und Emotionen eingeht und seinen Spieltrieb und seinen Drang, die Welt zu erforschen nutzt.

Sollte das nicht als Inspirationsquelle für unsere alltägliche Arbeit dienen? Der Alltagsroutine zeigt das oftmals anders, da man mit technischen Restriktionen und knappen Deadlines arbeiten muss. Auch an sich positiv besetzte Schlagworte wie „Beautification“ und „Gamification“ können sich im Stress des Enwicklungszylus‘ als schwer zu erreichende Ideale herausstellen. Durch diese Vorgaben wird von uns immer weniger erwartet, lediglich die richtige Guideline zur passenden Technologie anzuwenden, sondern den Begriff „User

60

Deshalb sollten wir gerade während des Definitionsprozesses eines Produktes solche Methoden anwenden, die uns helfen, die Gesamtheit des Users zu erfassen. Die klassischen User Centered Design (UCD) Methoden werden deshalb immer mehr von Methoden wie dem Design-Thinking geprägt und flankiert. Wie schaffen wir es, an Wünsche, Bedürfnisse und Fantasien des Endnutzers zu dringen, so daß wir seinen Arbeitsgegenstand „menschlicher“ gestalten können? Unserer Ansicht nach sollten sich Methoden nicht nur durch eine Beobachtung des Nutzers in der Gegenwart auszeichnen, sondern – um Innovationen zu schaffen – den Blick in die Zukunft richten.

Keywords: /// Design Thinking /// Freies Denken /// Kreativität /// Die Zukunft als Visionsraum /// De-Routinierung /// Kollektives Designen /// Swarm Design

Gegenwärtige Einschränkungen und momentane Alltagsgrenzen sollten entfallen, um sich zukünftige Produkte vorurteilslos vorstellen zu können. Wir haben hierfür ein eigenes methodisches Vorgehen angedacht und werden versuchen, in unserem Workshop Kreativität gezielt freizusetzen, den RestriktionsStress „abzuschalten“ und Fantasie und Innovationsdenken zu fördern. 2. Verlauf des Workshops Wir wollen mit den Teilnehmern eine neue Kreativtechnik namens „Ein Riesensprung der Vorstellungskraft“ vorstellen. Durch ein Eintauchen in die Zeit von 1970 bis 2020 werden wir eine kurze Zeitreise durchlaufen, um damit die Entwicklung von Technik und Wissenschaft und die damit einhergehende Veränderung unserer Lebensweise und Arbeitswelt in dieser

127


Usability Professionals 2011 Workshops

kurzen Zeit spüren zu lassen, um ein Gefühl für diese rasante Entwicklung zu schaffen.

9. Dr Editha Marquardt (2006-2011) Ende der Ästhetik? Rück- und Ausblicke. Kolloquium aus Anlass der Verabschiedung von Prof Dr.

Anschließend wird in kleinen Arbeitsgruppen von maximal fünf Personen eine Zukunftsvision eines aus einer Liste von Vorschlägen gewählten Produkts entworfen und anschließend kurz vor der Gruppe vorgestellt und diskutiert.

Uta Kösser 10. Alan Kay (2007) Video about how to share ideas 11. Karen Hotzblatt (2010) history of Avatar and iPhone 2 successfull new product on the market 12. http://dmcc.acm.org/pres/?query=/

3. Unsere Ziele

dmcc///confdata/chi2010/ Centennial2/2010-04-13_09h04 13. Tagungsband UPA Professiona l 2010.

Es soll untersucht werden, inwieweit diese Methodik geeignet ist, um mit Ihr an menschliche Bedürfnisse wie Emotion und Spieltrieb heranzukommen.

Ästhetik des Anwendungsdesign: Ein Interaktionsvokabular: Dimensionen zur Beschreibung der Ästhetik von Interaktion 14. Sig Rinde, Article (2010). Three types of GUIs, past, present and the future

Sind die erzeugten Ideen realistisch genug, daß sie in den nächsten zehn Jahren erreicht werden können?

15. Intelligente Oberfläche. Thinging of product

Ist diese Herangehensweise geeignet, einen gruppendynamischen, kreativen Prozess anzustoßen.

17. Vilém Flusser (1983), « Petite Philosophie Du

memory 16. Multimodale Computing and Interaction multiple conversational Framework Design »

Über Kreativität

Unser „drei-Schritte“-Modell soll hier verifiziert und weiterentwickelt werden.

1. Marla :. Capozzi, René Dye, and Amy Howe by

Die Ergebnisse sollen letzlich diskutiert werden, um (für sich) herauszufinden, wo sich diese Methode am Besten anwenden lässt und ob sie hilfreich war, von zu engen Restriktionen bspw. bei der Produktdefinition zu befreien.

2. Creative facilitation Marc Tassoul (2009) a delft

McKinsey & Company (2011). Sparking creativity in Teams: An executive´s guide Approach 3. professional future management company Die Fünf Zukunftsbrille Medhode 4. Benno van Aerssen (2009) Revolutionäres Innovationsmanagement 5. Gartner article (2011) Schwarm intelligence worker in 10 years

Literatur Institute 1. Hasso Plattner Institut School of Design

6. DieZeit über Kreativitität http:// www.zeit.de/karriere/beruf/2010-09/

kreativtechniken-uebersicht

Thinking 2. Royal College of Art London (internet) 3. Das HyperWerk in Basel (Internet) 4. Offizielle 2020 Forschungsprojekte der Regierung 5. Über Design 6. Vera Bühlmann & Martin Wiedmer (2008), Komparatische Beiträge in Design und Lunst 7. Jan Chichase by Frog Design Design the future 8. Claudia Mareis (2011). Design als Wissenskultur, Interferenzen zwischen Design- und Wissensdiskursen seit 1960

61


186

Rapid Cognitive Modeling, Prototyping und Evaluation mit CogTool Tobias Ehni Freiberuflicher Usability Consultant Jonny-Schehr-Straße 10 99085 Erfurt tobias.ehni@googlemail.com

Abstract Viele Das hier derskizzierte Interaktionsgeräte, Tutorial stellt diedie in jüngster Open-Source Zeit auf Software den Markt CogTool gekommen vor. Es sind, ist einsind gestenWerkzeug und fürtouchbasiert. Usability Engineers, Diese auf Konzepter neuen Technologien oder Designer, basierenden um Entwürfe Interaktionsformen in einer frühen werden Entwicklungsphase häufig auchzu alsüberprüfen, natürliche Interaktion gegeneinander bezeichnet. zu testen Maus (benchmarking) und Tastatur haben oder zuals Eingabegeräte evaluieren. Auf Konkurrenz der Grundlage bekommen. von Mock-Ups Als prominente berechnetVorreiter das Programm sind hier diedie Zeit, aktuellen die ein Smartphones routinierter Benutzer sowie Microsoft braucht, um Surface einezu Aufgabe nennen. am Damit System hatauszuführen. sich auch derGrundlage Gestaltungsder raum Berechnung für Interaktionsdesigner ist das formal-analytische erweitert.Verfahren Die Konzeption KLM-GOMS. von Steuerungsgesten Mit CogTool musskommt dieses als Verfahren neue Dimension nicht mehrhinzu. von Hand Den damit durchgeführt verbundenen werdenHerausforderungen und kann schnellerwidmet erlernt werden. sich unser Die Software Tutorial.eignet Wir zeigen sich für dieeine Bandbreite Vielzahl von neuer Anwendungsbereichen Interaktionsmöglichkeiten wie Websites, auf und promobieren bile Endgeräte gemeinsam undmit Software. den Teilnehmern eine Methode zur Gestaltung von gesten- und touchbasierter Im Tutorial soll Interaktion nach einer Einführung aus. der konkrete Einsatz von CogTool erprobt und anschließend reflektiert werden.

1. Einleitung Neben klassischen Usability-Methoden, wie z. B. Usability Testing, gibt es weitere Methoden, um Interfaces oder Prototypen zu bewerten oder zu vergleichen. Unter der Bezeichnung cognitive modeling bzw. GOMS existiert eine Reihe von Verfahren, mit denen das Verhalten von Nutzern prognostiziert werden kann (Card et al. 1980, 1983). Gemeinsam ist ihnen die aufgabenanalytische Herangehensweise ohne direkten Kontakt zu Nutzern (Sarodnick & Brau 2011). Sie sind in der Literatur dokumentiert (Preece 1994, Dix 2006, Cox & Peebles 2008, Raskin 2009), scheinen sich in der Praxis aber aufgrund tatsächlicher oder wahrgenommener Hürden noch nicht auf breiter Front durchgesetzt zu haben (Kaindl 2001, John et al. 2004). Die in diesem Tutorial vorgestellte Software CogTool1 ist ein Versuch, den Lernaufwand im Umgang mit GOMS bzw. kognitiven Modellen zu verringern und somit ihren Einsatz in der Praxis zu erleichtern. CogTool wurde als Open-Source-Software für Mac und PC an der Carnegie Mellon University unter der Leitung von Prof.

62

Bonnie E. John erstellt und wird laufend weiterentwickelt.2 Bei der Entwicklung wurde darauf geachtet, an der Arbeitsweise von Konzeptern und Interface-Designern mit Prototypen, Wireframes oder Mock-ups anzuknüpfen bzw. diese direkt zu unterstützen. Die Bedienung von CogTool basiert auf bekannten Interface-Konzepten (WYSIWIG, drag & drop) und kann schnell erlernt werden. Nach der Erstellung eines Prototypen oder dem Import von Screenshots wird der Interaktionsablauf in CogTool modelliert und demonstriert. Danach berechnet das Programm die Zeit zur Aufgabenerledigung automatisch. Diese kann als Maß für Effizienz des Interfaces herangezogen werden (vgl. DIN EN ISO 9241-11). So sind Aussagen über Designalternativen bereits in frühen Entwicklungsphasen möglich, auch wenn kein Zugang zu geeigneten Testpersonen besteht. Auch die Bewertung von Interfaces oder das Benchmarking werden auf diese Weise unterstützt. Zielgruppe des Tutorials sind Konzepter, Interaktionsdesigner, Usability Engineers, User Experience Consultants (intern und extern). Vertreter aus angrenzenden

Keywords: /// cognitive modeling /// CogTool /// GOMS /// formal-analytische Methode

Berufsgruppen sind ebenso willkommen wie Universitätsangehörige mit Lehr- oder Forschungstätigkeit im Gebiet HumanComputer Interaction oder verwandter Fachrichtungen. Die Teilnehmer erhalten an einem Demoprojekt Einblick in die Arbeit mit CogTool und werden im Rahmen des Tutorials in die Lage versetzt, selbst Verhaltensprognosen zu erstellen. 2. Anwendung von CogTool Bei der Bearbeitung von Aufgaben mit interaktiven Systemen vollziehen Benutzer Arbeitsschritte, um ein bestimmtes Ziel zu erreichen (vgl. DIN EN ISO 9241- 11). CogTool ermöglicht eine Prognose der Bearbeitungszeit eines routinierten Nutzers, um eine Aufgabe am System zu erledigen (skilled task execution time als Maß für Effizienz). Um zu dieser Prognose zu gelangen, werden bei der Erstellung eines kognitiven Modells mit CogTool drei Schritte durchlaufen: 1. Anlegen eines Projekts und Erstellung eines Prototyps entweder direkt in CogTool oder durch den Import von


Usability Professionals 2011 Workshops

HTML-Dateien, Screenshots, Scans oder Bildern (.png, .gif, .jpg) 2. Erstellen des Interaktionsablaufs und Demonstrieren der Aufgaben. Die am System zu erledigenden Aufgaben werden als bekannt vorausgesetzt. 3. Automatische Durchführung der Analyse und Berechnung der Verhaltensprognose. 2.1. Interaktionsabläufe erstellen und demonstrieren In CogTool werden die Zustände eines zu bewertenden Interface oder Prototypen durch frames dargestellt. Ein frame enthält z. B. einen Screenshot einer bestehenden Anwendung und eines oder mehrere widgets. Widgets sind interaktive Elemente wie Buttons, Menüs oder Eingabefelder, an denen Benutzeraktionen definiert werden, z. B. anklicken oder Texteingabe. Zustandsübergänge werden durch transitions modelliert. Eine Transition erfolgt beispielsweise, wenn durch Interaktion mit einem Link eine neue Seite aufgerufen wird. Die Gesamtheit eines Interaktionsverlaufs wird in einem design festgehalten, das mehrere Frames enthält, die durch Transitions verbunden sind (s. Abbildung 1). Ist eine Aufgabe in einem Design durch Frames, Widgets und Transitions beschrieben, muss sie noch demonstriert werden. Dazu werden die spezifizierten Interaktionsschritte einmal ausgeführt. Parallel dazu erstellt CogTool automatisch ein script, das die Interaktionsschritte auflistet. Nach diesem Arbeitsschritt wird die Zeit der Ausführung der Aufgabe automatisch berechnet. Diese Berechnung erfolgt auf Basis von KLM-GOMS (Card et al. 1980, 1983) und wird intern in ACT-R durchgeführt, einer in der Programmiersprache Lisp implementierten kognitiven Theorie menschlicher Wahrnehmung, Informationsverarbeitung und Bewegung (vgl. Anderson and Lebiere 1998). [Abb. 1]

Ergebnisse im Projektfenster angezeigt. Hier ist ein direkter Vergleich von Bearbeitungszeiten verschiedener Entwürfe möglich. Bei Bedarf lassen sich Aufgaben in Gruppen zusammenfassen. Die Berechnung von Summe, Mittelwert, Minimum und Maximum der Aufgabenbearbeitungszeiten innerhalb einer Gruppe erfolgt ebenfalls automatisch. Eine Visualisierung der Interaktion auf Basis des kognitiven Modells ist ebenfalls verfügbar, hier können Aufgaben detailliert analysiert und miteinander verglichen werden. [Abb. 2] 2.3. Nutzen, Stärken und Schwächen CogTool vereinfacht die Erstellung kognitiver Modelle auf Basis von KLM-GOMS und macht dieses Analysewerkzeug Praktikern zugänglich (John 2010). Es besteht eine Vielzahl bereits erprobter und möglicher Anwendungsgebiete (s. Abschnitt 2.4).

Zu den Stärken des Tool zählt die Einsatzmöglichkeit in frühen Projektphasen, besonders wenn kein oder nur eingeschränkter Zugang zu echten Nutzern besteht oder viele Designalternativen verglichen werden sollen. In der Praxis scheinen sich die quantitative Metrik der Aufgabenbearbeitungszeit und die Visualisierung als positive Eigenschaften zu zeigen (LeVan & LeVan 2008). Hervorzuheben ist der bereits implementierte HTMLExport, der für anschließendes Testing mit echten Nutzern dienen kann. Zu den Schwächen zählen die begrenzte Aussagekraft (Prognosen gelten nur für routinierte Nutzer) und die Tatsache, dass Nutzungsprobleme oder Ermüdung nicht berücksichtigt werden. Auch müssen die durch CogTool zu bewertenden Aufgaben bekannt sein, so dass als Vorarbeit eine Aufgaben- oder Nutzungskontextanalyse notwendig ist. Rückschlüsse auf die Passung zwischen System und Einsatzkontext sind

Abb. 1. Modellierung in CogTool

2.2. Ergebnisse berechnen und analysieren Nach Erstellung des Skripts und Durchführung der Berechnung werden deren

Abb. 2. Skript, Ergebnisse und Visualisierung in CogTool

63


allein aus der Software heraus auch wegen des zu Grunde liegenden Analyseverfahrens (KLM-GOMS) nicht möglich (vgl. Sarodnick & Brau 2011, S. 131). CogTool berechnet nur die Zeit, die ein routinierter Nutzer entlang einer festgelegten Interaktionsfolge benötig. Diese Zeit ist ohne Vergleichswerte wenig aussagekräftig, d. h. es besteht die Notwendigkeit, Iterationen oder Benchmarks vorzunehmen. Den Einbezug echter Nutzer kann CogTool nicht ersetzen, wohl aber gibt es sinnvolle Einsatzmöglichkeiten.

2.4. Einsatzmöglichkeiten von CogTool

Literatur

Koedinger, K. (2004): Predictive Human

on patrol. In CHI ‚07 Extended Abstracts on

Performance Modeling Made Easy. In

Human Factors in Computing Systems (San

Proceedings of the SIGCHI conference on

Jose, CA, USA, April 28 - May 03, 2007), New

Human factors in computing systems (Vienna,

York: ACM, 1709-1714

Austria, April 24-29, 2004). New York: ACM,

2. Cox, A. L. & Peebles, D. (2008). Cognitive Modelling in HCI Research. In: Cairns, P. A.

455-462 12. John, B. E. & Salvucci, D. D. (2005). Multi-

and Cox, A. L., (Hrsg.): Research Methods for

Purpose Prototypes for Assessing User

Human-Computer Interaction, Cambridge:

Interfaces in Pervasive Computing Systems.

Cambridge Univ. Press, 70-87 3. DIN EN ISO 9241-11 (1998). Ergonomische

IEEE Pervasive Computing 4 (4), 27-34 13. Kaindl, H. (2001): Methods and modeling:

Anforderungen für Bürotätigkeiten mit

fiction or useful reality? CHI ‘01 extended

Bildschirmgeräten. Teil 11: Anforderungen an

abstracts on Human factors in computing

die Gebrauchstauglichkeit – Leitsätze, Berlin: Beuth Verlag

CogTool wurde bereits für verschiedene Produkte und Anwendungskontexte eingesetzt, beispielsweise Websites (John 2009), Datenbanken (John 2004), Handheld devices (John & Salvucci 2005), Expertensysteme wie z. B. Flugzeuginstrumente (John et al. 2009), Optimierung des Verhaltens von Browsertabs (Knight et al. 2007) oder interaktive Geräte in Polizeifahrzeugen (Callander & Zorman 2007). Im UCD-Prozess unterstützt CogTool das iterative Vorgehen in den Phasen Konzeption und Evaluation (vgl. DIN EN ISO 9241-210). Im Rahmen einer Marktanalyse lässt sich durch Benchmarking ein erster Eindruck der Usability von Angeboten der Mitbewerber gewinnen. Ebenfalls vorstellbar ist der Einsatz von CogTool als Werkzeug zur Kommunikation und Entscheidungsfindung im Entwicklungsteam. Auch die Definition von usabilitybezogenen Erfolgskriterien oder Kennzahlen lässt sich durch CogTool unterstützen.

11. John, B. E., Prevas, K., Salvucci, D. D. &

1. Callander, M. & Zorman, L. (2007). Usability

systems, CHI EA ’01, New York: ACM 14. Knight, A., Pyrzak, G., & Green, C. (2007).

4. Dix, A. J. (2006). Human-computer

When two methods are better than one:

interaction. 3. Aufl., Harlow: Pearson

Combining user study with cognitive

Prentice-Hall

modeling. In M.B. Rosson & D.J. Gilmore

5. Harris, B. N., John, B. E., & Brezin, J. (2010).

(Hrsg.): Extended Abstracts of the 2007

Human performance modeling for all:

Conference on Human Factors in Computing

importing UI prototypes into cogtool. In

Systems CHI 2007, San Jose: ACM, 1783-1788

Proceedings of the 28th of the international

15. LeVan, S. & LeVan, C. (2008): Predict Expert

Conference Extended Abstracts on Human

Task Time With CogTool, The Perfect Tuna,

Factors in Computing Systems (Atlanta,

http://www.perfecttuna.com/2008/07/predict-

Georgia, USA, April 10 - 15, 2010). CHI EA ‘10. New York: ACM, 3481-3486

expert-task-time-with-cogtool.html. 16. Raskin, Jef (2009): The human interface. New

6. John, B. E. (1994). Toward a deeper

directions for designing interactive systems.

comparison of methods: A reaction to Nielsen & Phillips and new data. In

11. Aufl., Boston: Addison-Wesley. 17. Sarodnick, F. & Brau, H. (2011). Methoden

Proceedings Companion of CHI, 1994

der Usability Evaluation. Wissenschaftliche

(Boston, MA, April 24-28, 1994), New York:

Grundlagen und praktische Anwendung, 2.

ACM, 285-286 7. John, B. E. (1995). Why GOMS? interactions,

Aufl., Bern: Huber 18. Snyder, C. (2003): Paper prototyping. The

2, 4, 80-89

fast and easy way to design and refine user

8. John, B. E. (2009). Collaborative Shopping.

interfaces. Amsterdam: Kaufmann

http://cogtool.hcii.cs.cmu.edu/use-today/

19. Kurzvita

examples/collaborative-shopping

20. Tobias Ehni ist Diplom-Medienwissenschaftler

CogTool wird derzeit weiterentwickelt, um 9. John, B. E. (2010). Reducing the Variability das Verhalten ungeübter Nutzer vorherzusabetween Novice Modelers: Results of a gen (Teo & John 2008) und um den direkten Tool for Human Performance Modeling Import aus verschiedenen Prototyping Tools Produced through Human-Centered Design. wie balsamiq3, iRise4 oder dijit5 zu ermögliProceedings of the 19th Annual Conference chen (Harris et al. 2010). on Behavior Representation in Modeling and

und arbeitet nach einem Volontariat bei der SirValUse GmbH als freiberuflicher Usability Consultant. Derzeit ist er wissenschaftlicher Assistent an der TU Ilmenau und Consultant für die Open Source Software GIMP. Er ist Mitglied der GC UPA und interessiert sich für

Simulation (BRIMS). Charleston, SC, March

3. Diskussion

Usability Evaluation und User Research.

22-25, 2010 10. John, B., Blackmon, M. H., Polson, P. G., Fennell, K. & Leonghwee, T. (2009).

Nach der Vorstellung und Anwendung von CogTool sollen Einsatzmöglichkeiten, Praxisrelevanz, Stärken, Schwächen und Entwicklungsmöglichkeiten reflektiert werden.

http://cogtool.hcii.cs.cmu.edu/

Rapid Theory Prototyping: An Example

1

of an Aviation Task, Human Factors and

2

Ergonomics Society Annual Meeting

3

Proceedings, 53, 794-798

4

Version 1.1.5 datiert vom März 2011

http://balsamiq.com/ http://www.irise.com/ http://dojotoolkit.org/reference-guide/dijit/

5

index.html

64


Arbeitskreise German UPA

65


150

Eingeschränkt Sehen. Eingeschränkt Hören. Interagieren. Barrierefreiheit – Spaßbremse oder zukunftsträchtiges Arbeitsfeld für Usability Professionals? Petra Kowallik Open Text Corporation Werner-von-Siemens Ring 20 85630 Grasbrunn Petra.Kowallik@opentext.com

Martin Schrepp SAP AG – User Experience Raiffeisenring 45 68789 St. Leon-Rot martin.schrepp@sap.com

Abstract Viele Vertreter der des Interaktionsgeräte, Arbeitskreises Barrierefreiheit die in jüngsterinZeit derauf German den Markt UPA diskutieren gekommenund sind,erarbeiten, sind gestenwie Barrierefreiheit und touchbasiert. in den Projektalltag Diese auf neuen von Usability Technologien Professionals basierenden integriert Interaktionsformen werden kann, werden ohne dass häufig diese auch ‚Zusatzanforderung‘ als natürliche Interaktion als Einschränkung bezeichnet. derMaus Kreativität und Tastatur empfunden habenwird. als Eingabegeräte Wir werden anhand Konkurrenz von Praxisbeispielen bekommen. Als dieprominente IntegrationVorreiter der Barrierefreiheit sind hier die in aktuellen die StanSmartphones dardmethoden sowie des User Microsoft Centered Surface Design zu nennen. (UCD) während Damit hat User sichResearch, auch der ImplementieGestaltungsraum rung und für Interaktionsdesigner Validierung vorstellen erweitert. und konkret Die Konzeption aus der Projektwirklichkeit von Steuerungsgesten einer Agentur kommtbeals richten. neueWelche Dimension Konsequenzen hinzu. Den damit ergeben verbundenen sich darausHerausforderungen für die Arbeitsweisewidmet eines Usability sich unser Professionals? Tutorial. Wo Wir liegen zeigen die die Herausforderungen Bandbreite neuer Interaktionsmöglichkeiten im Projektalltag, was hat sich auf und bewährt? probieren Ist Barrierefreiheit gemeinsamein miteher den lästiges Teilnehmern Thema, eine eine Methode Spaßbremse? zur Gestaltung Oder können von gestenwir Nutzen und touchbasierter daraus ziehen, ist Interaktion Barrierefreiheit aus. gar ein zukünftiges Arbeitsfeld? Welches Expertenwissen und welche Methoden sind dazu notwendig? Über diese Fragen und Erfahrungen möchten wir als Vertreter des AK Barrierefreiheit mit interessierten Usability Professionals diskutieren. Es ist geplant, die Ergebnisse anschließend zu publizieren.

1. Der Arbeitskreis Barrierefreiheit Der Arbeitskreis Barrierefreiheit innerhalb der German UPA ist ein Netzwerk von Experten an der Schnittstelle zwischen Usability und Barrierefreiheit. Das Hauptanliegen des Arbeitskreises ist es, das Thema Barrierefreiheit einer breiteren Öffentlichkeit zugänglich zu machen. Daneben möchten wir Usability Professionals mehr Wissen vermitteln, wie Methoden aus dem Usability Engineering erweitert oder angepasst werden können, um im Sinne eines universellen Designs (z. B. Stephanidis & Salvendy, 1999) möglichst viele Nutzer miteinzubeziehen. Ein Beitrag dazu war die Veröffentlichung der Fachschrift ‚Barrierefreiheit – Universelles Design‘ (erschienen im September 2010), die auf der German UPA Website unter Arbeitskreis Barrierefreiheit heruntergeladen werden kann und die wir auch kostenlos an Interessierte verschicken.

66

Wie auch im letzten Jahr möchten wir den Austausch mit Kollegen nutzen, um in einem Workshop darüber zu diskutieren, wie Usability Professionals Barrierefreiheit in ihren Projektalltag integrieren können, ohne es als Einschränkung ihrer Kreativität zu empfinden. Der AK Barrierefreiheit freut sich über eine aktive Mitarbeit im Workshop ebenso wie über neue Mitglieder 2. Barrierefreiheit im Arbeitsumfeld der Usability Professionals In den letzten Jahren hat die Bedeutung von Barrierefreiheit in der öffentlichen Wahrnehmung stark zugenommen. Dies wird auch durch gesetzliche Regelungen unterstützt, die die Gleichstellung behinderter Menschen sicherstellen sollen. Bekannte Beispiele sind die UN Convention on the Rights of Persons with Disabilities, die Section 508 in den USA (die bestimmt, dass von US Regierungsbehörden eingesetzte Produkte und Dienstleistungen barrierefrei sein müssen), oder die

Markus Erle Wertewerk – Barrierefreies Publizieren Aixer Str. 20 72072 Tübingen erle@wertewerk.de

Keywords: /// Barrierefreiheit /// Accessibility /// universelles Design /// Design for All

deutsche Barrierefreie InformationstechnikVerordnung (BITV). Für die Zukunft ist zu erwarten, dass die Bedeutung dieses Themas noch weiter zunehmen wird. Die Lebensarbeitszeit in westlichen Gesellschaften steigt, d.h. hier entsteht die Notwendigkeit, älteren Nutzern von Informationstechnologie möglichst lange ein produktives Arbeiten zu ermöglichen. Auch wird die Bedeutung des Internets für die Teilhabe am gesellschaftlichen Leben immer wichtiger. Immer mehr zentrale Informationen stehen nur noch im Internet zur Verfügung. Öffentliche und private Dienstleistungen werden zunehmend ins Internet verlagert, beispielsweise das Beantragen behördlicher Dokumente oder die Rückmeldung von Zählerständen an ein Energieversorgungsunternehmen. Daher werden in Zukunft auch verstärkt ältere Menschen dieses Medium nutzen. Da die Wahrscheinlichkeit körperlicher Beeinträchtigungen mit zunehmendem Alter steigt, kommt der Barrierefreiheit von Webseiten und


Usability Professionals 2011 Arbeitskreise German UPA

Webanwendungen eine entscheidende Bedeutung zu. Der Aspekt der barrierefreien Gestaltung wird daher für die Arbeit von Usability Professionals wichtiger werden. Ziel des Workshops ist es, Erfahrungen zu einigen zentralen Fragestellungen zum Thema Barrierefreiheit im Arbeitsumfeld von Usability Professionals auszutauschen. Die Aspekte, auf die wir uns im Rahmen des Workshops konzentrieren wollen, werden im Folgenden noch detaillierter herausgearbeitet. 2.1. Barrierefreiheit im User Centered Design Als Usability Professionals arbeiten wir an innovativen und attraktiven Bedienkonzepten, die es Nutzern ermöglichen sollen, die von uns gestalteten Produkte effektiv, effizient und mit Zufriedenheit zu benutzen. Dies wird idealerweise über einen an den Bedürfnissen der potentiellen Nutzer ausgerichteten Gestaltungsprozess erreicht. Hier werden systematisch die Zielgruppe und der Nutzungskontext des Produkts untersucht, um die Anforderungen der späteren Nutzer zu ermitteln. Die dabei gewonnenen Informationen dienen dann als Grundlage für unsere DesignEntscheidungen. Über Usability Tests mit Prototypen oder mit der ersten Version des Produkts wird versucht, noch bestehende Probleme zu erkennen und zu beheben. Es stellt sich die Frage, ob unsere Standardmethoden des User Centered Design den Aspekt der Barrierefreiheit berücksichtigen und wie diese gegebenenfalls zu erweitern sind.

2.1.1. Einsatz von UCD-Methoden im Umfeld der Barrierefreiheit Wie in ‚Usability Professionals und Barrierefreiheit – Der AK Barrierefreiheit in der G-UPA‘ (2010) beschrieben, werden UCD-Methoden, z. B. Personas, bereits im Umfeld der Barrierefreiheit verwendet.

Beispiele: –– Die Web Accessibility Initiative (WAI) illustriert den Nutzen von universellem Design im Internet mit Hilfe von Personas und verwendet so eine Methode des User Centered Design, um Anforderungen der Barrierefreiheit zu veranschaulichen. –– Auch Microsoft beschreibt in sog. Accessibility Profiles, wie Individuen die Accessibility-Optionen und andere assistive Hilfsmittel für die Computerarbeit benutzen.

Die Antwort lautet ‚Ja‘ – theoretisch – doch die Praxis sieht oft anders aus.

Meist sind wir Usability Professionals in unserem Arbeitsumfeld gar nicht mit dem Thema Barrierefreiheit betraut, da es für diesen Bereich andere Experten gibt, die oft erst am Ende der Entwicklung die Barrierefreiheit einer Anwendung testen. Diese Experten so spät hinzuzuziehen, ist jedoch nicht effizient und im Sinne einer optimalen Lösung auch nicht zielführend. Es ist allemal besser und kostengünstiger, Anforderungen – auch die der Barrierefreiheit – von Anfang an zu berücksichtigen, als nachträglich zu versuchen, Barrierefreiheit in ein Produkt hineinzubringen.

2.1.3. Die praktische Umsetzung – Design for All

2.1.2. Der Nutzungskontext – Berücksichtigung der größtmöglichen Zielgruppe Der erste Schritt im UCD-Prozess ist es‚ den Nutzungskontext zu verstehen und zu beschreiben. Das heißt, die Anforderungen aller potentiellen Nutzer zu berücksichtigen, auch der Benutzer mit Einschränkungen. Bedeutet dies in der konkreten Umsetzung, dass –– wir in der Research-Phase auch Interviews z. B. mit sehbehinderten oder blinden Nutzern führen müssen? –– wir beim Erstellen der Anforderungsspezifikationen auch Anforderungen von Nutzern mit Einschränkungen berücksichtigen müssen? Beispielsweise Personen, die eine Anwendung nur über die Tastatur bedienen können, aber trotzdem schnell genug interagieren müssen, um an ihrem Arbeitsplatz produktiv tätig zu sein.

Andererseits sind wir Usability Professionals diejenigen, die Anforderungen erstellen. Wir können viel erreichen, indem wir unsere Methoden entsprechend anwenden. Eine wichtige Projektphase ist die Ermittlung des Nutzungskontextes und Beschreibung der Szenarien, natürlich unter Berücksichtigung spezifischer Einschränkungen, die wir im Feld beobachtet haben.

„Behinderung ist die Unfähigkeit, mit schlechtem Design zurechtzukommen.“ (Prof. Gregg Vanderheiden, University of Wisconsin) Aus der Sicht von Usability Professionals ist es unabdingbar, bereits beim Erstellen von Spezifikationen auch Anforderungen der Barrierefreiheit zu berücksichtigen, und ein benutzerorientiertes Design für die größtmögliche Zielgruppe anzustreben. Die in den WCAG 2.0 Richtlinien für barrierefreie Webinhalte genannten Gestaltungsprinzipien sind: –– Wahrnehmbarkeit. Zugang zu Informationen auch bei eingeschränktem Sehen und Hören sicherstellen. Das heißt ausreichender Kontrast, skalierbare Texte, Alternativtexte für Bilder oder Videos und Zugänglichmachen von Informationen auf mehreren Wegen. –– Bedienbarkeit. Auch alternative Eingabegeräte berücksichtigen wie z. B. Tastatur, Trackballs. Dies umfasst volle Tastaturbedienbarkeit, aber auch Fehlertoleranz und Berücksichtigung von längeren Bedienzeiten. –– Verständlichkeit. Grundlage für Verständlichkeit sind neben der Einhaltung der allgemeinen Usability Prinzipien, wie Aufgabenangemessenheit und Erwartungskonformität, auch eine

67


klare, verständliche Sprache im jeweiligen Kontext. –– Robustheit. Nutzer sollen ihre Hilfsmittel, z. B. Browser, Screenreader oder Braillezeilen, nutzen können. Das bedeutet im Wesentlichen eine standardkonforme Programmierung, um Inhalte geräteunabhängig nutzbar zu machen. Fazit: Um Barrierefreiheit möglichst effizient zu erreichen, müssen wir die Anforderungen der Barrierefreiheit schon beim Design berücksichtigen, so dass eine größtmögliche Nutzergruppe mit unserem Produkt interagieren kann. 2.2. Barrierefreiheit im Entwicklungsprozess Neben einer Einbindung in User-ResearchAktivitäten ist für die Sicherstellung der Barrierefreiheit einer Webseite oder -anwendung auch eine kontinuierliche Beratung der involvierten Entwicklungsteams notwendig. Viele Entscheidungen, die die Barrierefreiheit der Anwendung massiv beeinflussen können, werden erst während der Implementierung einer Anwendung getroffen. Dies betrifft Entscheidungen zum generellen Ansatz (z. B. ob man den ARIA Standard verwenden will oder nicht), aber auch sehr konkrete Entscheidungen zur technischen Umsetzung einer Anforderung (z. B. die geeignete Zuordnung von ARIA-Rollen zu Controls). Um solche Entscheidungen sinnvoll treffen zu können, ist in der Regel eine sehr enge Kooperation von Barrierefreiheits-Experten und technischen Experten über den gesamten Entwicklungszeitraum notwendig. 2.2.1. Anforderungen zur Barrierefreiheit an die Entwickler kommunizieren Eine kontinuierliche Unterstützung der Anwendungsentwicklung ist gerade bei großen Projekten sehr schwierig, bei denen evtl. Hunderte von Entwicklern an mehreren Standorten an einem Projekt arbeiten. Für solche Projekte ist eine Beratung aller beteiligten Entwickler durch

68

einen Experten für Barrierefreiheit in der Regel nicht möglich. Auch der Versuch, Barrierefreiheit über Checklisten oder Styleguides sicherzustellen, gestaltet sich hier oft sehr problematisch. Man muss bedenken, dass der einzelne Entwickler neben Regeln zur Barrierefreiheit eine Vielzahl weiterer Regelwerke beachten muss. Dies sind z. B. Regeln zur konsistenten Gestaltung der Benutzeroberflächen, Regeln für die Gestaltung der Software-Architektur oder Programmierschnittstellen, Regeln für die Sicherheit oder Internationalisierbarkeit der Lösung. Die Vielzahl dieser vorhandenen Regelwerke führt oft zu einer Überforderung und damit zum Ignorieren einzelner Regeln, so dass dieser Ansatz in der Praxis oft wenig hilfreich ist. Eine mögliche Lösung dieses Problems ist es, Barrierefreiheit soweit wie möglich in die Entwicklungswerkzeuge zu integrieren. Damit müssen sich die einzelnen Anwendungsentwickler mit vielen Aspekten der Barrierefreiheit in der Praxis nicht auseinandersetzen, da diese automatisch über die verwendeten Entwicklungswerkzeuge sichergestellt werden. Beispielsweise kann die Struktur eines Formulars rein deklarativ beschrieben werden und das eigentliche Formular auf der Benutzeroberfläche wird dann unter Berücksichtigung von Regeln zur Barrierefreiheit, z. B. mit korrekten Label-Feld-Verknüpfungen, aus dieser Deklaration erzeugt. Dies ist aber nur möglich, wenn man die verwendeten Entwicklungswerkzeuge selbst beeinflussen kann, d.h. ein eigenes Framework aufgesetzt hat, in dessen Rahmen sich die Anwendungsentwickler bewegen. 2.2.2. Barrierefreiheit testen Auch bei einer erfolgreichen Betreuung der Anwendungsentwicklung in Bezug auf Aspekte der Barrierefreiheit sind am Ende der Entwicklungsphase in der Regel Tests notwendig, um letzte Fehler auszuräumen und die Qualität der Lösung sicherzustellen. Eine Möglichkeit dafür sind automatische Testverfahren, mit denen versucht wird, typische Fehler bzgl. Barrierefreiheit zu

erkennen. Solche automatischen Tests sind in der Regel mit wenig Aufwand verbunden. Sie sind allerdings auf syntaktisch erkennbare Fehler beschränkt, z. B. dass ein Icon keinen Tooltip besitzt. Viele der Anforderungen zur Barrierefreiheit sind aber nicht auf einer rein syntaktischen Ebene prüfbar, so dass zusätzlich immer noch manuelle Tests notwendig sind. Für solche manuelle Tests existieren strukturierte Verfahren, wie z. B. der BITV Test (siehe http://www.bitvtest.de/bitvtest.html). Einige Aspekte der Barrierefreiheit lassen sich sehr leicht testen, z. B. Tastaturbedienbarkeit oder ausreichende Kontraste zwischen Text und Hintergrund. Für Anforderungen blinder Nutzer sind dagegen auf Seiten des Testers besondere Kenntnisse erforderlich, da er oder sie in der Lage sein sollte, einen Screenreader zu bedienen (ein Test mit einem Screenreader ist insbesondere dann wichtig, wenn neue Steuerelemente, auch Controls genannt entwickelt werden). Hier ist zu beachten, dass das Ergebnis von zwei Komponenten abhängt. Mangelnde Bedienbarkeit durch blinde Nutzer kann einerseits durch eine fehlerhafte Implementierung in der Webseite oder -anwendung zustande kommen, aber auch durch ein fehlerhaftes Zusammenspiel zwischen dem verwendeten Browser und dem verwendeten Screenreader. Da man realistischerweise nicht in der Lage ist, alle möglichen Kombinationen von Screenreadern und Browsern zu testen, ist hier generell die Frage nach einer geeigneten Teststrategie zu stellen. Es sollte auch genau überlegt werden, was das Ziel des Tests ist. Geht es darum, vorgegebene Kriterien zur Barrierefreiheit zu erfüllen (z. B. einen firmeninternen Produktstandard oder Richtlinien wie die WCAG 2.0) oder steht eine möglichst gute Usability für behinderte Nutzer im Fokus des Tests? Im ersten Fall kann man den Test mit spezialisierten Testern durchführen. Im zweiten Fall ist eine Einbeziehung behinderter Nutzer in reguläre Usability-Tests notwendig. Ein Report der British Disability Rights Commission (2004) zeigt z. B., dass


Usability Professionals 2011 Arbeitskreise German UPA

45% der Probleme, die von Behinderten in Usability-Tests gefunden wurden, keiner der in der WCAG 1.0 gelisteten Barrieren entsprechen. Solche Probleme sind daher ohne Usability-Tests mit Behinderten nicht auffindbar. Das Erfüllen der WCAG Richtlinien ist also eine notwendige, aber keine hinreichende Voraussetzung dafür, eine Anwendung oder Webseite für behinderte Nutzer gut bedienbar zu machen. Dies dürfte auch für andere auf Checklisten basierenden Ansätze gelten. Andere Autoren (z. B. King, Evans & Blenkhorn, 2005) kommen zu dem Schluss, dass Webseiten, die die WCAG 1.0 Richtlinien verletzen, für Behinderte oft sehr gut benutzbar sind. 2.3. Der real existierende Kompromiss – Zwei Praxisbeispiele Nicht in allen Projekten stehen genügend Ressourcen für ausreichende User-Research-Aktivitäten zur Verfügung. Richtlinien und Checklisten können nur als eine grobe Orientierung dienen, da sie natürlich nicht auf individuelle Inhalte und Ausgangssituationen eingehen können. Eine wichtige Rolle spielt deswegen Erfahrungswissen: mit konkreten Nutzergruppen, mit speziellen Formaten und Technologien. 2 Praxisbeispiele aus dem Agentur- und Projektalltag können als Anstoß dienen auf der Suche nach dem real existierenden Kompromiss. Denn die faktische Barrierefreiheit für konkrete Nutzer von Websites oder digitalen Dokumenten ist ausschlaggebend, nicht nur das Erfüllen theoretischer Anforderungen. Die Beispiele sollen veranschaulichen, wie sich dies in der Agentur- und Projektwirklichkeit bewältigen lässt - zwischen Zeit- und Kostendruck, mit und ohne entwicklungsbegleitende Nutzertests. 2.3.1. Beispiel 1: „Ich kenne meine Rechte“ – Suchfunktion für Menschen mit Lernschwierigkeiten entwickeln Die UN-Konvention zur Gleichstellung von Menschen mit Behinderungen sollte als

Online-Version in Leichter Sprache auch Menschen mit Lernschwierigkeiten die Möglichkeit geben, sich über ihre Rechte zu informieren. Als besonderer Flaschenhals wurde hier die Suchfunktion erkannt. Das Budget ließ dafür nur eine Anpassung vorhandener PHP-Suchtechniken zu. Die genauen Anforderungen von Menschen mit Lernschwierigkeiten an Webinhalte – und erst recht an eine Suchfunktion – sind nur sehr rudimentär wissenschaftlich durchleuchtet. In jedem Projekt ist man hier auf eigenes Erfahrungswissen und entwicklungsbegleitende Tests angewiesen. Anforderungen an barrierefreie Inhalte dienten als Grundlage, waren jedoch für die Zielgruppe nicht exakt genug. Eine große Herausforderung war der Balanceakt, eine für alle zugängliche Suchfunktion zu entwerfen, die gleichzeitig eine Speziallösung für Menschen mit Lernschwierigkeiten darstellen sollte, da sich die Anforderungen in manchen Punkten widersprechen. Als besonders hilfreich erwiesen sich kurze entwicklungsbegleitende Tests einer Person aus der Zielgruppe, die aus dem Umfeld eines Projektmitgliedes stammte. Dies ermöglichte, Lösungsideen sehr schnell auf ihre Eignung hin zu beurteilen. Mit einem Prototyp wurde ein systematischer Nutzertest durchgeführt. Dieser wurde durch die Universität Kaiserslautern wissenschaftlich begleitet. Im Rahmen des Projektes zeigte sich besonders, dass das Erforschen von Zielgruppenbedürfnissen und das Anpassen von Usability-Methoden nur bedingt seinen Platz im Agentur- und kommerziellen Projektalltag haben kann. Standardisierte Methoden, um Cognitive Web Accessibility in einem abschätzbaren Aufwand zu realisieren, könnten einen wesentlichen Beitrag leisten, dass die Grundbedürfnisse von Menschen mit Lernschwierigkeiten stärker in Mainstream User Interfaces Berücksichtigung finden.

2.3.2. Beispiel 2: Deutsches Institut für Menschenrechte, Policy Paper Wissenschaftliche Texte und Erkenntnisse rund um die Thematik der Menschenrechte sollen in einer barrierefreien Form im Rahmen eines schlanken Workflows regelmäßig veröffentlicht werden. Manche Publikation erscheinen dabei nur als digitale Version, andere wiederum in Print und Digital. Der Schwerpunkt liegt auf einer technischen Barrierefreiheit, da die Inhalte an strikte wissenschaftliche Standards gebunden sind. Als Werkzeuge stehen nur die MainstreamPublishing-Programme zur Verfügung, deren Gestaltungsmöglichkeiten mit den Anforderungen an barrierefreie Inhalte (Web Content Accessibility Guideline WCAG 2.0) in Einklang gebracht werden müssen. Ziel des neu eingerichteten Workflows ist es, möglichst viele Barrierefreiheitseigenschaften bereits im Quellformat anzulegen. Ein besonderes Problem stellen die Fußnoten dar. Es gibt hier keine Lösung “out-ofthe-box”. Die (theoretische) Ideallösung ist zu kostenintensiv (und wird außerdem von assistiven Technologien zurzeit noch nicht unterstützt). Es wird eine Kompromisslösung gewählt, die sich an dem konkreten Nutzerverhalten orientiert: in der Dokumentstruktur erscheinen die Fußnoten als Endnoten, die als nummerierte Liste ausgezeichnet sind. Eine unsichtbare Überschrift dient als Navigationspunkt. Positiv entwickelte sich im Rahmen des Projektes die Sensibilität auf Redaktionsseite für barrierefreie Inhalte und Anforderungen. Autoren hingegen sind oft noch überfordert, auch die Anforderungen der Barrierefreiheit zu berücksichtigen, zumindest solange Lösungen und Werkzeuge dazu noch nicht integraler Bestandteil der Autorenwerkzeuge sind. Eine realistische Bestandsaufnahme und erste Ideen, wie solche Werkzeuge aussehen könnten liefert der Artikel „Wahrheit macht (barriere-)frei“. Erste Schritte

69


hierzu wären beispielsweise eine flexible Zuordnungsfunktion von Absatzformaten und Strukturelementen (Tags) und das Verlagern der Qualitätssicherung in den Erstellungsprozess selbst.

5. Disability Rights Commission (2004). The Web Access and Inclusion for Disabled People. A formal investigation conducted by the Disability Rights Commission. London: TSO. 6. Erle, M.: Wahrheit macht (barriere-)frei. Ein

2.4. Barrierefreiheit – zukunftsträchtiges Arbeitsfeld für Usability Professionals

ehrlicher Blick auf Werkzeuge und Workflows zum Erstellen barrierefreier PDF-Dokumente. http://blog.axespdf.com/index.php/ leserseite/items/wahrheit-macht-barriere-frei.

Wenn es unser Ziel ist, das beste Produkt für die größtmögliche Nutzergruppe herzustellen, ist Barrierefreiheit bereits Teil unseres Arbeitsfeldes. Deshalb möchten wir im Verlauf des Workshops mit den Teilnehmern folgende Fragestellungen diskutieren: –– Wie integriert man Barrierefreiheit in einen User Centered Design Prozess? –– Wie integriert man Barrierefreiheit erfolgreich in den Entwicklungsprozess? –– Wo liegen die größten Herausforderungen und Chancen für Usability Experten im Bereich Barrierefreiheit?

html (abgerufen am 19.05.2011) 7. King, A.; Evans, D.G.; Blenkhorn, P. (2005). The evaluation of a web browser for blind people. In Pruski, A. & Knops, H. (Eds.): Assistive Technology: From Virtuality to Reality. IOS Press, pp. 637 – 641. 8. Kowallik, P. & Weber, H. (2010). In Usability Professionals 2010 (Brau H., Diefenbach S., Göring K., Peissner M., Petrovic K. (Hrsg.): Usability Professionals und Barrierefreiheit – Der AK Barrierefreiheit in der G-UPA, Personas im Umfeld der Barrierefreiheit (S. 215-218). Stuttgart. 9. Microsoft Accessibility, Profiles of Accessibility in Action http://www.microsoft. com/enable/profiles/default.aspx (abgerufen am 16.05. 2011)

Literatur 1. Ben Caldwell, B.; Cooper, M.; Reid, L.;

10. Stephanidis, C. & Salvendy, G. (1999). Towards an information society for all: HCI

Vanderheiden, G. (2008). Web Content

challenges and R&D recommendations.

Accessibility Guidelines (WCAG) 2.0. Online

International Journal of Human-Computer

verfügbar: http://www.w3.org/TR/WCAG20/ . 2. Bergmann, S.; Erle, M.: Easy-to-Web Search

Interaction, 11(1), 1-28. 11. Web Accessibility Initiative (WAI), How

for People with Learning Disabilities as

People with Disabilities Use the Web http://

Part of an Integrated Concept of Cognitive

www.w3.org/WAI/EO/Drafts/PWD-Use-

Web Accessibility. In: Miesenberger, K.;

Web/2009/ (abgerufen am 16.05. 2011)

Klaus, J.; Zagler, W.L.; Karshmer, A.I. (Eds.): Computers Helping People with Special Needs, 12th International Conference, ICCHP 2010, Vienna, Austria, July 14-16, 2010. Proceedings, Part I. Lecture Notes in Computer Science 6179 Springer 2010, ISBN 978-3-642-14096-9: 657-660 3. Bornemann, B., Entzminger, J., Frydyada de Piotrowski, A., Kowallik, P., Rozek, P., Weber, H. & Weiland, C. (2010). Barrierefreiheit – Universelles Design, Fachschriften der German UPA, Band II. Stuttgart. Herausgegeben von German UPA e.V. 4. Chrisholm, W.; Vanderheiden, G.; Jacobs, I. (1999). Web Content Accessibility Guidelines 1.0. Online verfügbar: http://www.w3.org/TR/ WCAG10/ .

70


Usability Professionals 2011 Arbeitskreise German UPA

71


163

Der Qualitätsstandard für Usability Engineering der German UPA Aktueller Stand der Arbeiten Holger Fischer Universität Paderborn, C-LAB Fürstenallee 11, 33102 Paderborn holger.fischer@c-lab.de

Thomas Geis ProContext Consulting GmbH Von-Werth-Straße 33-35, 50670 Köln thomas.geis@procontext.de

Christian Bogner Technische Universität Kaiserslautern Erwin-Schrödinger-Straße 57, 67663 Kaiserslautern christian.bogner@sowi.uni-kl.de

Knut Polkehn artop GmbH Christburger Straße 4, 10405 Berlin polkehn@artop.de

Abstract Viele der Interaktionsgeräte, die in jüngster Zeit auf den Markt gekommen sind, sind gesten- und touchbasiert. Diese auf neuen Technologien basierenden Interaktionsformen werden häufig auch als natürliche Interaktion bezeichnet. Maus und Tastatur haben als Eingabegeräte Konkurrenz bekommen. Als prominente Vorreiter sind hier die aktuellen Abstract Smartphones sowie Microsoft Surface zu nennen. Damit hat sich auch der GestaltungsDer Arbeitskreis „Qualitätsstandards“ der German UPA hat es sich zur Aufgabe geraum für Interaktionsdesigner erweitert. Die Konzeption von Steuerungsgesten kommt macht, anhand von praktischen Erfahrungen einen Qualitätsstandard zu formulieren, der als neue Dimension hinzu. Den damit verbundenen Herausforderungen widmet sich Usability Professionals für ihre tägliche Arbeit den Zugang zu internationalen Standards unser Tutorial. Wir zeigen die Bandbreite neuer Interaktionsmöglichkeiten auf und provereinfachen, sowie einen konkreten Prozess mit Aktivitäten und daraus resultierenden bieren gemeinsam mit den Teilnehmern eine Methode zur Gestaltung von gesten- und Artefakten beschreiben soll. In diesem Qualitätsstandard werden Prozessanforderungen touchbasierter Interaktion aus. aus der Perspektive relevanter Einsatzszenarien und am Usability Engineering Prozess beteiligter Rollen beleuchtet, so dass er sowohl von erfahrenen Usability Professionals, als auch von (fachfremden) Projektleitern und Produktmanagern verstanden und sinnvoll eingesetzt werden kann. Ziel ist es, durch weitere Systematisierung von Prozesszwecken, Aktivitäten, Arbeitsprodukten, sowie notwendiger Skills, Erfahrungen und Kompetenzen das Thema Gebrauchstauglichkeit in aktuellen und zukünftigen Projekten nachhaltiger zu etablieren. Im Workshop wird der bisher erarbeitete Stand des Qualitätsstandards vorgestellt, die Anwendbarkeit illustriert, sowie Hinweise zur Verbesserung gesammelt und diskutiert. Als weiteres Aufgabengebiet des Arbeitskreises sollen Möglichkeiten der Zertifizierung von Usability Professionals miteinander erörtert werden.

1. Einleitung In der heutigen Industrie ist die Gebrauchstauglichkeit (Usability) als wichtiger Qualitätsaspekt im Softwareentwicklungsprozess zunehmend anerkannt. Allerdings ist die Integration von Usability Engineering und Software Engineering noch immer eine Herausforderung in der Praxis (Seffah et al., 2005), auch wenn die Auswirkungen einer angemessenen Gebrauchstauglichkeit offensichtlich sind: Effektivität, Effizienz und Zufriedenstellung der Nutzer bei der Erledigung ihrer täglichen Aufgaben. Auch für die entwickelnden Unternehmen liegen die Vorteile konsequenten Usability Engineerings auf der Hand, z. B. Reduzierung von Support- und Trainingskosten. Jedoch ist die Gebrauchstauglichkeit kein exklusives

72

Attribut des erzeugten Produktes, sondern vielmehr ein fundamentales Attribut des eigentlichen Entwicklungsprozesses (Fischer et al., 2011). Im Laufe der letzten zehn bis fünfzehn Jahre wurden daher einige nationale und internationale Standards entwickelt, die auf eine Verbesserung bei der Gestaltung gebrauchstauglicher Systeme abzielen. Im Bereich der Softwareentwicklung stellen Standards eine Grundlage für den Prozess der Entwicklung dar oder definieren Anforderungen an das Produkt. Obwohl für eine gute gebrauchstaugliche Software weitaus mehr als Richtlinien und Standards nötig sind, tragen diese jedoch wesentlich zur Konsistenz, einer guten Durchführung bei der Entwicklung und einem gemeinsamen Verständnis bei (Stewart & Travis 2003). Vier wesentliche Standards, welche

Dirk Zimmermann Telekom Deutschland GmbH Landgrabenweg 151, 53227 Bonn dirk.zimmermann@me.com

Keywords: /// Qualitätsstandard /// Usability Engineering /// Prozesse /// Zertifizierung /// DIN EN ISO 9241-210

die Gebrauchstauglichkeit im Entwicklungsprozess adressieren, sind DIN EN ISO 9241-210 (2010), ISO/TR 18529 (2000) und ISO/TS 18152 (2010), sowie der Leitfaden Usability der Deutschen Akkreditierungsstelle (DAkkS 2010). Die DIN EN ISO 9241-210 formuliert ein Rahmenwerk für den Gestaltungsprozess eines interaktiven Produktes im Allgemeinen. Somit ist sie nicht nur auf Software beschränkt, sondern kann auch auf Hardwarekomponenten interaktiver Systeme (z. B. Benutzerschnittstellen bei Industrieanlagen) angewandt werden. Die ISO/TR 18529 beinhaltet die Beschreibung von Prozessen mit Fokus auf benutzerzentrierte Ansätze und listet deren Komponenten und Ergebnisse, sowie die verwendeten und erzeugten Informationen auf. Die Absicht besteht darin, die Nutzer von Prozessmodellen auf die Berücksichtigung nutzerzentrierter Prozesse in


Usability Professionals 2011 Arbeitskreise German UPA

System-, Hardware- und Softwarelebenszyklen hinzuweisen. Die ISO/TS 18152 bietet ebenfalls eine Sichtweise auf die Prozesse eines Systemlebenszyklus mit Schwerpunkt auf Themen, welche auf die Nutzer eines Systems abzielen. Des Weiteren macht der Standard die Inhalte der DIN EN ISO 9241210 zugänglich für eine Begutachtung. So lässt sich die Fähigkeit einer Organisation hinsichtlich der Durchführung von benutzerorientierten Gestaltungsprozessen bewerten. Die ISO-Standards beschreiben jedoch keine konkreten Aktivitäten bzw. nur teilweise in einer Form, die im Wesentlichen nur von Usability-Experten verstanden wird. Der Leitfaden Usability der DAkkS beschreibt als einziger Standard die Methodik der Nutzungskontextanalyse, die Spezifikation von Nutzungsanforderungen und Nutzungsszenarien. Die Integration der Aktivitäten in den bestehenden Softwareentwicklungsprozess wird auf Basis der genannten Standards nicht unmittelbar erkennbar. Der Aufwand, den Aspekt der Gebrauchstauglichkeit zu adressieren, ist daher beispielsweise für einen Projektleiter oder Produktmanager zu hoch, soweit dieser nur ein geringfügiges Hintergrundwissen zu diesem Thema besitzt. Der Arbeitskreis „Qualitätsstandards“ der German UPA fokussiert daher die Entwicklung eines von der German UPA anerkannten, national gültigen Qualitätsstandards, welcher entsprechende Aktivitäten und Artefakte eines gebrauchstauglichen Gestaltungsprozess anhand der Standards DIN EN ISO 9241-210, ISO/TR 18529 und ISO/TS 18152 in einer Form beschreibt, mit der Usability-Verantwortliche jeglicher fachlicher Herkunft die Aspekte im jeweiligen Entwicklungsprozess verstehen und verankern können. Der Standard kann zugleich als Grundlage für die von der UPA international und German UPA angestrebte Personenzertifizierung dienen. Der Arbeitskreis setzt sich sowohl aus Wissenschaftlern, als auch aus Praktikern aus der Wirtschaft zusammen, die bei existierenden Standards in Normierungsgremien mitgewirkt und aber auch bereits einen benutzerzentrierten Gestaltungsprozess erfolgreich in wirtschaftlichen Projekten etabliert haben. Der angestrebte

Qualitätsstandard definiert konkrete Aktivitäten und setzt diese in Beziehung zu Arbeitsprodukten (in Form von Arbeitsergebnissen oder Dokumenten), sowie entsprechenden Rollen (Verantwortlichkeiten). Zudem werden Szenarien beschrieben, die den Leser durch den Standard leiten, in Abhängigkeit ihrer beabsichtigen Intentionen und Herkunft im Projekt. Diese Ergebnisse beruhen zum einen auf dem Wissen und den Erfahrungen der Experten des Arbeitskreises und wurden mittels eines Abgleichs mit den Standards DIN EN ISO 9241-210, ISO/TR 18529 und ISO/TS 18152 evaluiert. Anhand der erweiterten Art der Zugänglichkeit von Informationen besteht das Ziel darin, existierende Standards „lesbarer“ zu gestalten und das Thema „Gebrauchstauglichkeit“ in aktuellen und zukünftigen Projekten verstärkt zu etablieren. 2. Qualitätsstandard der German UPA Um die genannten Ziele der Zugänglichkeit zu Inhalten bestehender Standards zu ermöglichen und die Bedeutung des Qualitätsaspektes der Gebrauchstauglichkeit zu betonen, richtet sich der Qualitätsstandard der German UPA sowohl an Usability Professionals, als auch an Usability Einsteiger bzw. Personen, die sich zum ersten Mal mit dem Thema auseinandersetzen. Dabei werden auch Hinweise gegeben, wie die Empfehlungen auf konkrete Arbeitssituationen und gemäß dem bisherigen Fortschritt in einem Projekt angewendet werden können und welches Wissen, welche Fertigkeiten und welche Kompetenzen die durchführenden Personen besitzen sollten.

2.1. Zielgruppen Der Qualitätsstandard adressiert unterschiedliche Zielgruppen mit divergenten Ansprüchen an die Durchführung eines nutzerzentrierten Entwicklungsprozesses. –– Usability Verantwortliche, die ihre Prozesse in Unternehmen praxisnah formalisieren möchten –– Produkt- und Projektmanager, die Lücken in ihrem praktizierten Vorgehen schließen möchten –– Aus- und Weiterbildungsanbieter, die Kursangebote für Usability Professionals entwickeln und diese auf eine Anerkennung durch die German UPA ausrichten möchten –– Qualitätssicherer, die Qualitätsstandards für Usability im Rahmen der Produktentwicklung erarbeiten und/oder deren Einhaltung sicherstellen müssen –– UCD-Dienstleister, Usability Experten und Softwareingenieure, die auf der Basis eines anerkannten Prozessstandards arbeiten möchten 2.2. Anwendung des Qualitätsstandards Um abhängig von den zuvor genannten Zielgruppen einen leichten Zugang zu den Inhalten im Standard zu ermöglichen, beinhaltet der Qualitätsstandard Einsatzszenarien aus dem alltäglichen Projektgeschäft, die typische Rahmenbedingungen beschreiben und diese mit den entsprechenden zu berücksichtigen Abschnitten im Qualitätsstandard verknüpfen. Handelt es sich beispielsweise um ein Szenario, bei dem in einem neuen Release erstmalig die Gebrauchstauglichkeit des Produktes berücksichtigt werden soll, so werden u.a. Empfehlungen ausgesprochen, zunächst eine Analyse des Nutzungskontextes (einschließlich der Nutzer) durchzuführen, die Benutzungsanforderungen zu erheben und unter deren Berücksichtigung zu evaluieren, welche Mängel im bisherigen Produkt bestehen.

73


2.3. Aufbau und Elemente Im Hauptteil des Qualitätsstandards werden die einzelnen Prozessschritte erläutert. Die Elemente der Beschreibung wurde dabei aus der ISO/IEC TR 24774 (2010) entnommen, welche eine Vorgabe zur Formulierung von Prozessen liefert. Der „Zweck des Prozesses“ begründet, warum der jeweilige Schritt durchgeführt wird. Über den „Zustand nach Durchführung“ wird der Status definiert, anhand dessen die Durchführung des Prozesses als erfolgreich betrachtet werden kann. Die „Arbeitsprodukte“ beschreiben, in welcher Form das Ergebnis eines Prozesses dokumentiert werden muss, damit dieses für Folgeprozesse konsequent genutzt werden kann. „Empfohlene Aktivitäten zur Durchführung“ formulieren die konkreten Schritte, die eine kompetente Person durchführen muss, um das spezifizierte Arbeitsprodukt zu erarbeiten. Die „beteiligten Prozessrollen“ geben letztendlich Auskunft darüber, welche Rollen des Usability Engineering (vgl. Bogner et al., 2011) und welche Rollen des allgemeinen Projektes (bspw. Projektleiter) am Prozess beteiligt sind. 2.4. Wissen, Fertigkeiten und Kompetenzen

einer besseren Vergleichbarkeit und Transparenz der Bildungsangebote im Bereich „Usability Engineering“ beitragen und dabei helfen, die Durchlässigkeit zwischen den Bildungssektoren bzw. Bildungsanbietern zu erhöhen.

74

orientierte Gestaltung interaktiver Systeme. 5. Fischer, H., Nebe, K. & Klompmaker, F. (2011). A Holistic Model for Integrating Usability Engineering and Software Engineering Enriched with Marketing Activities. In: Proceedings of the HCI International 2011.

3. Ziel und Struktur des Workshops

Volume 16, LNCS 6776. Heidelberg: Springer Verlag. 6. Geis, T., Hofmann, B., Bogner, C. & Polkehn, K. (2010). (Qualitäts-)Standards für

Beim Workshop im Rahmen der Usability Professionals 2011 werden sowohl Usability-Experten als auch Usability-Einsteiger adressiert. Nach einer kurzen Einführung in das Thema werden die Teilnehmer in Gruppen einen ausgewählten Abschnitt im Usability Engineering Prozess selbstständig grob skizzieren, dokumentieren und dem Plenum ihre Ergebnisse präsentieren. Anschließend wird der aktuelle, inhaltliche Stand der Arbeiten am Qualitätsstandard durch den Arbeitskreis präsentiert, sowie die methodischkonzeptionelle Herausforderung bei der Erstellung eines solchen Standards verdeutlicht. Ziel ist es, die Teilnehmer des Workshops für diese Problematik zu sensibilisieren und den aktuellen Stand des Qualitätsstandards gezielt zu evaluieren und zu verbessern.

Usability Professionals – welche sind das eigentlich?. i-com Zeitschrift für interaktive und kooperative Medien, Ausgabe 1-2010. München: Oldenbourg Wissenschaftsverlag. 7. ISO/IEC TR 24774 (2010). Systems and software engineering – Life cycle management – Guidelines for process description. 8. ISO/TS 18152 (2010). Ergonomics of humansystem interaction – Specification fort he process assessment of human-system issues. 9. ISO/TR 18529 (2000). Ergonomics – Ergonomics of human-system interaction – Human-centred lifecycle process descriptions. 10. Seffah, A., Desmarais, M. C. & Metzker, E. (2005). HCI, Usability and Software Engineering Integration: Present and Future. In: Seffah, A., Gulliksen, J., Desmarais, M. C. (Hrsg.): Human-Centered Software Engineering – Integrating Usability in the Software Development Lifecycle (S. 37-58).

Literatur Damit eine kompetente Durchführung der Aktivitäten gewährleistet werden kann, sollten die durchführenden Personen über ein ausreichendes Fachwissen verfügen, spezifische Fertigkeiten erworben haben und notwendige Kompetenzen besitzen. In Abhängigkeit zu den Prozessrollen des Usability Engineering werden diese in strukturierter Form als Rahmenmodell („Kompetenzstandards“) beschrieben. Die Kompetenzstandards sollen einerseits Bildungsanbietern dabei unterstützen, ihre Bildungsangebote so zu planen und zu gestalten, dass sie die Anforderungen an eine kompetenzorientierte Ausbildung erfüllen. Anderseits stellen diese Standards eine solide Basis zur Formulierung von Strategien, Methoden und Ergebnissen einer Personenzertifizierung dar. Darüber hinaus sollen die Kompetenzstandards zu

4. DIN EN ISO 13407 (1999). Benutzer-

1. Bogner, C., Brau, H., Geis, T., Huber, P.,

Heidelberg: Springer Verlag. 11. Stewart, T. & Travis, D. (2003). Guidelines,

Lutsch, C., Petrovic, K. & Polkehn, K.

Standards, and Style Guides. In: Jacko, J.

(2011). Beschreibung des Berufsfelds

A., Sears, A. (Hrsg.): The Human-Computer

Usability / User Experience – Rollen und

Interaction Handbook - Fundamentals,

Aufgaben von Usability Professionals im

Evolving Technologies and Emerging

benutzerorientierten Entwicklungsprozess.

Applications (S. 991–1005). Mahwah, New

German UPA e.V., Arbeitskreis Berufsfeld.

Jersey, USA: Lawrence Erlbaum Associates

http://germanupa.de/german-upa/

Inc.

berufsfeld-usability-ux 2. Deutsche Akkreditierungsstelle GmbH (DAkkS) (2010). Leitfaden Usability, Version 1.3. http://www.dakks.de/sites/default/ files/71-SD-2-007_Leitfaden%20Usability%20 1.3.pdf 3. DIN EN ISO 9241-210 (2010). Ergonomie der Mensch-System-Interaktion – Teil 210: Prozess zur Gestaltung gebrauchstauglicher interaktiver Systeme.


Usability Professionals 2011 Arbeitskreise German UPA

75


GUPA

Arbeitskreis Nachwuchsförderung

Astrid Beck Hochschule Esslingen Flandernstr. 101 73732 Esslingen astrid.beck@hs-esslingen.de

Anja Wipfler SAP AG Dietmar-Hopp-Allee 16 69190 Walldorf anja.wipfler@sap.com

Abstract Junge, engagierte Menschen zu untertützen und zu fördern ist eines der vorrangigen Ziele der German UPA. Im April 2011 hat die German UPA den Arbeitskreis Nachwuchsförderung gegründet. Hier haben sich Interessierte aus Industrie, Wissenschaft und Forschung zusammengeschlossen. Ziele des Arbeitskreises sind die Ausbildung, Vernetzung mit Gleichgesinnten und erfahrenen Usability Experten sowie Angebote speziell für Studierende und Auszubildende, einschliesslich der Unterstützung bei der Suche nach Praktika und Diplomarbeiten.

Mitarbeit im Arbeitskreis – Teilnehmer gesucht! Der Arbeitskreis ist an weiteren Mitgliedern interessiert, die sich in dem Umfeld engagieren möchten. Wenn Sie Interesse an dem Thema haben, dann laden wir sie herzlich zu unserer Veranstaltung auf der Usability Professionals 2011 in Chemnitz ein, die am Mittwoch, dem 14. September von 9:00 bis 10:00 Uhr stattfindet. Usability Summer School Das erste Angebot, dass der AK Nachwuchsförderung an Studierende richtet ist die Usability Summer School, die im August 2011 erstmalig stattfand. Teilnehmerinnen und Teilnehmer hatten die Möglichkeit anhand von Vorträgen, praktischen Übungen und einem gemeinsamen Projekt in zwei Tagen Praktiker und Kommilitonen aus ganz Deutschland zu treffen und voneinander zu lernen. Es soll das Interesse und die Leidenschaft für eine Profession geweckt werden, die in einem technisch geprägten Umfeld explizit die Benutzer in den Mittelpunkt ihres Arbeiten und Entwickelns stellt.

76

Themen der Usability Summer School, die zwei Tage dauert, sind Usability Facts, Prototyping, Paper Mock-ups, Prototyping Tools und Usability Testing. Nach einführenden Vorträgen arbeiten die Teilnehmer in Gruppen an einer Gestaltungsaufgabe mit Methoden des User-Centered-Design, bei der das mitgebrachte und neu gelernte Wissen praktisch angewandt wird. Die Teams werden von Senior Experten aus Industrie und Lehre betreut. Die German UPA übernimmt Seminar- und Übernachtungskosten für die Studierenden, während sich die Referenten und Arbeitksreismitglieder wie bei der German UPA üblich ehrenamtlich engagieren. Rückblick erste G|UPA Summerschool 22. & 23. August 2011 Bereits die erste Summer School war ein Erfolg. Über 30 Studierende verschiedener Disziplinen aus ganz Deutschland, darunter mehr als die Hälfte weiblich, bewarben sich auf die begehrten 20 Plätze. Es gab auch einige Bewerbungen von Personen, die nicht mehr studieren („Young Professionals“), aber gerne an der Summer School teilgenommen hätten. Auch für diese Personengruppe könnten wir über ein geeignetes Angebot nachdenken.

Kostanija Petrovic Nokia gate5 Invalidenstr. 117 10115 Berlin kostanija.petrovic@nokia.com

Keywords: /// Nachwuchsförderung /// German UPA Summer School

Zukünftige Aktivitäten und Themen können sein: –– Betreuung und Förderung von Veröffentlichungen –– Designwettbewerbe –– Förderung von weiblichem Nachwuchs (u.a. Beteiligung am Girls’ Day) –– Netzwerktreffen –– Jobbörse –– Unterstützung von Bewerbungen –– Workshops –– Newsletter –– Unterstützung von Studium und Ausbildung –– Zusammenarbeit mit Hochschulen –– Unterstützung von Young Professionals –– Kooperation mit anderen Gruppen, die an ebenfalls an der Thematik arbeiten Aktuelle Mitglieder des Arbeitskreises sind: –– Astrid Beck, Hochschule Esslingen (Leitung) –– Anja Wipfler, SAP AG (Leitung) –– Kostanija Petrovic, Nokia gate5, (Stellvertretende Leitung) –– Simone Bürsner, Hochschule Rhein-Sieg –– Martin Schrepp, SAP AG –– Andreas Kohl, FH Deggendorf –– Lennart Hennigs, Deutsche Telekom


Nachhaltigkeit

77


133

Starke Bedienkonzepte bringen frischen Wind in Windenergieanlagen Stefanie C. Zürn s.c.z kommunikationsdesign Bremen, Germany zuern@s-c-z.de

Rebecca Rothfuß macio GmbH Kiel, Germany rebecca.rothfuss@macio.de

Abstract Viele Die Windenergiebranche der Interaktionsgeräte, ist einem die in jüngster starken internationalen Zeit auf den Markt Wachstumsgekommen undsind, Wettbesind gestenwerbsdruck undausgesetzt. touchbasiert. Der Diese Markt auf fordert neuenInnovationen, Technologienum basierenden Windenergieanlagen Interaktionsformen (WEA) werden noch effizienter häufig auch und als entsprechend natürliche Interaktion rentabler betreiben bezeichnet. zu Maus können. undEinen Tastatur großen haben Beitrag als Eingabegeräte leistet hierfür nicht Konkurrenz zuletzt die bekommen. Schnittstelle Alszwischen prominente demVorreiter Bediener sind und hier derdie Technik: aktuellen Smartphones Internationalität, sowie Sicherheit Microsoft und Surface schnelle zu Inbetriebnahme nennen. Damit hat sind sich Schlüsselworte, auch der Gestaltungsdie den raum Wettbewerb für Interaktionsdesigner bestimmen. Grund erweitert. genug für Dieden Konzeption Auftraggeber von Steuerungsgesten der Referenten, inkommt die Entals wicklung neue Dimension eines innovativen hinzu. Den Userdamit Interface verbundenen Designs zuHerausforderungen investieren. Hauptanwendungsfall widmet sich unser des Projektes Tutorial.ist Wir die zeigen intelligente die Bandbreite Inbetriebnahme neuer Interaktionsmöglichkeiten und sichere Überwachungauf von und Windprobieren energieanlagen. gemeinsam Diemit Referenten den Teilnehmern geben ineine Ihrem Methode Vortragzur einen Gestaltung Einblick von in die gestengenerelle und touchbasierter Vorgehensweise Interaktion bei der Erstellung aus. von professionellen Bedienkonzepten bzw. hochwertigem User Interface Design und gehen dabei konkret auf das Praxisprojekt ein.

1. Einordnung in das Thema In Zukunft soll die Energieversorgung immer größere Mengen an elektrischem Strom liefern und dabei jedoch mit möglichst wenig Emission auskommen. Eine Möglichkeit dies zu erreichen ist die Stromerzeugung durch Windenergie, wobei deren Effizienz für ihren weiteren Erfolg enorm wichtig ist. Jedoch kann eine Windenergieanlage immer nur so effizient funktionieren, wie es ihre Steuerung gestattet. Denn eine moderne Windenergieanlage ist ein effektives aber auch kompliziertes System zur Energiegewinnung. Um den täglichen Anforderungen gerecht zu werden, bedarf es einer intelligenten Steuerung, die mit einer entsprechenden Kontroll-Software versehen ist. Was es bei der Entwicklung dieser Software zu beachten gilt, zeigen die Referenten am Beispiel eines reellen Kundenprojektes auf. 2. Vorstellung des Projektes Projektinhalt war die Entwicklung eines innovativen Human Machine Interfaces zur

78

Inbetriebnahme & Monitoring von Windenergieanlagen (WEA). Das beauftragende Unternehmen entwickelt Windenergieanlagen sowie Einzelkomponenten und lizensiert diese weltweit an Produzenten von Windenergieanlagen. Bei dem entwickelten Projekt handelt es sich um ein weltweit eingesetztes Serienprodukt. Das Projekt wurde im Jahr 2010 durchgeführt und gleich zu Beginn in folgende Phasen eingeteilt: –– Anforderungsanalyse –– Konzept –– Design –– Pflichtenheft Software –– Softwarearchitektur –– Implementierung –– Integrationstests Insgesamt haben drei Software Entwickler und eine Designerin an dem Projekt mitgearbeitet. Die Dauer des Projektes betrug insgesamt fünf Monate. Es wurde auf der vergangenen Husum Wind 2010 der Öffentlichkeit präsentiert.

Keywords: /// User Interface Design /// Praxisprojekt /// Internationalisierung /// Entwicklungsprozess

3. Das Projekt im Detail 3.1. Anforderungen an die Windenergieanlage Eine Windenergieanlage muss vielen Anforderungen gerecht werden. Bei der Planung und Entwicklung wird stets auf eine möglichst effiziente Stromerzeugung geachtet. Hierbei müssen immer auch die Bedingungen des Standortes berücksichtigt werden, da sich diese grundlegend auf das Windrad und seinen Unterbau auswirken. So ist die gesamte Anlage permanent starken Druck- und Zugkräften ausgesetzt. Daher wird eine raffinierte Konstruktion und Steuerung benötigt, um möglichen Schäden oder Ausfallzeiten vorzubeugen. Ferner ist das Steuerungskonzept so zu entwerfen, dass die Windenergieanlage zu jedem Zeitpunkt in einem effizienten Rahmen arbeitet. Dies erreicht man unter anderem während des Betriebes durch die anhaltende Nachführung der Gondel, bei gleichzeitig optimalem Anströmwinkel der Rotorblätter. Immer unter der Maßgabe einer allgemeinen Lastenreduzierung bei jeder Wind- und Wetterlage.


Usability Professionals 2011 Nachhaltigkeit

3.2. Ein intelligent pragmatisches Steuerungskonzept Jede Windenergieanlage ist nur so gut wie ihre Kontrollsoftware. Jedoch kann diese die gesamte Steuerung nur mit perfekt auf die Anlage abgestimmten Einstellungen optimal bedienen. Die Software hat deshalb den folgenden Anforderungen zu genügen: Sie soll eine feinfühlige aber sichere Hilfe im komplizierten Inbetriebnahme-Prozess sein. Darüber hinaus in ausreichend performanter Weise die Führung der Anlage und ihrer Mechanik ermöglichen und somit der eigentlichen Anforderung – der Energieerzeugung – gerecht werden. Der grundlegende Erfolg einer Windenergieanlage liegt in einer präzisen Inbetriebnahme. In diesem Prozess gibt die Software Hilfestellung bei der Kalibrierung der Windenergieanlage: Es werden Belastungsproben und Tests zu allen denkbaren Szenarien durchgeführt und protokolliert, womit in dieser Phase die gesamte Anlage an die Bedingungen ihrer Umgebung angepasst und dabei auch justiert wird. Die aus diesem Verfahren gewonnenen Daten dienen dazu, die Steuerungssoftware so einzurichten, dass sie auf mögliche Wettereinflüsse, wie Windwechsel oder Unwetter, immer angemessen reagieren kann. Durch ein solches modifizierbares System lassen sich nicht nur die Effizienz anhaltend auf hohem Niveau halten, sondern vor allem auch wetterbedingte Ausfallzeiten vermeiden, die unter Umständen zu erheblichen finanziellen Einbußen führen könnten. [Abb. 1]

Abb. 1 Screenshot der fertigen Anwendung

3.3. Die auf das Problem zugeschnittene Lösung Die macio GmbH in Kiel bekam von dem Windenergieanlagen-Entwicklungsunternehmen den Auftrag eine Software zu entwerfen und zu realisieren, die den zuvor beschriebenen Anforderungen gerecht wird. Das Resultat dieser Zusammenarbeit ist eine Software, welche die Inbetriebnahme, Betriebsführung und Wartung

Abb. 2 Einblick in die Konzeptphase

79


einer Windenergieanlage auf Basis eines SCADA-Systems steuert. Dabei läuft sie in der jetzigen Form lokal in jeder einzelnen Windenergieanlage. Technisch basiert die Software auf der Java-Technologie mit einem stark modularisiertem Konzept. Die mechanische als auch die elektronische Inbetriebnahme mussten in einem flexiblen und modularen Konzept aufgebaut werden. Sowohl der Stand als auch der Status der komplexen Inbetriebnahme muss schnell und dennoch sicher abgelesen werden können. Dies stellt die Grundlage der gesamten Anwendung dar.

Abb. 3 Screenshot des Anlagenstatus der fertigen Anwendung in Englisch

Die enge Zusammenarbeit im ständigen Kontakt mit dem Kunden, den Entwicklern, den Technikern und den Technikern der Inbetriebnahme, – zu der Zeit auch parallel bei einem konkreten Aufbau in China – ermöglichte in vielen Tests und Iterationen eine exakt auf die Bedürfnisse des Bedieners zugeschnittene Lösung. [Abb. 2] Über animierte Darstellungen werden die folgenden Fakturen visualisiert, um dem Bediener den genauen Einblick in den aktuellen Zustand der gesamten Windenergieanlage zu gewähren: –– die aktuelle Drehgeschwindigkeit des Windrades –– die Windgeschwindigkeit –– die Windrichtung –– der Neigungswinkel der Rotorblätter –– die momentane Leistung –– und andere wichtige Informationen in Echtzeit

Abb. 4 Screenshot des Anlagenstatus der fertigen Anwendung in Deutsch

80

Außer den aktuellen Werten können auch Vergangenheitsdaten auf Tag, Monat oder Jahr bezogen, angezeigt und analysiert werden. Im Fuß des Turmes befindet sich ein per Touch-Bildschirm bedienbarer Industrie-PC, über den alle Prozesse gesteuert werden können. Zusätzlich ist es möglich das System auch über physikalische Ethernet-Schnittstellen per RemoteBedienung zu erreichen. Diese befinden sich sowohl im Fuß des Turmes als auch in der Rotorgondel, um auch dort vor Ort dem Bediener während der Inbetriebnahme einen direkten Anschluss mittels eines Laptops über eine gesonderte Authentifizierung sicher zu stellen.


Usability Professionals 2011 Nachhaltigkeit

Um auch für die unterschiedlichen Anwender verschiedene Bedingungen mit verschiedenen Rechten abzubilden, können sieben Nutzerrollen in der Administration des Systems vergeben werden. Dabei werden, je nach Berechtigungsstufe, nur bestimmte Screens angezeigt. Dadurch können an die (auch unterschiedlich geschulten) Bediener gezielt spezifische Informationen ausgegeben werden. Einerseits, um eine gelenkte Betriebssteuerung zu gewährleisten und zum anderen, um Fehlbedienungen vorzubeugen. Nicht zuletzt ist die Software selbstverständlich für die Internationalisierung aufbereitet. Lokalisiert wird sie zum Beispiel aktuell mit den Sprachen Englisch, Deutsch und Chinesisch betrieben. Eine von vornherein sehr weitreichende Anforderung an das Design war die zwar eigenständige, aber sehr neutrale Basis-Visualisierung der Software. Damit wurden für die Zukunft alle Möglichkeiten gegeben, bei der Lokalisierung nicht nur die Sprache umzustellen, sondern auch auf ein dem Land, beziehungsweise dem Betreiber vor Ort, angepasstes Design umzustellen. [Abb. 3], [Abb. 4], [Abb. 5] 4. Fazit Da die Windenergieanlagen nicht unbedingt in überwachtem Gelände stehen, waren die extrem hohen Sicherheitsbedingungen gegen ungewollte Manipulation eine gewisse Herausforderung. Des Weiteren waren die extremen klimatischen Bedingungen (z. B. Frost), unter denen die Anlagen und auch die Techniker fehlerfrei zu arbeiten haben, jenseits üblicher Arbeitsbedingungen und Vorgehensweisen im Maschinenbau.

Abb. 5 Screenshot des Anlagenstatus der fertigen Anwendung in Chinesisch

Die gelungene Umsetzung und damit einhergehend der erfolgreiche Einsatz sind nur möglich geworden durch die enge Zusammenarbeit und den intensiven und offenen Austausch aller Beteiligten. Unter diesen Voraussetzungen ist eine Anwendung entstanden, die den Bedürfnissen der Anwender – gleich welchen Nutzerrechts – vollständig entspricht, um die Windenergieanlage schnell und sicher zu bedienen.

Faszinierend war die Arbeit an dem grundlegenden, neutralen Designbaukasten, da unter diesem Aspekt weitere Bedingungen erfüllt sein müssen, die aber hier nicht Gegenstand der Betrachtung sind.

81


Der Sonne hinterher: Benutzerzentriertes User Interface Design für einen Solarthermie-Regler

Tim Schneidermeier Lehrstuhl für Medieninformatik Universität Regensburg tim.schneidermeier@ur.de

Patricia Böhm Lehrstuhl für Medieninformatik Universität Regensburg patricia.boehm@student.ur.de

Abstract Viele Abstract. der Interaktionsgeräte, Der Beitrag beschreibt die in einen jüngster nutzerzentrierten Zeit auf den Markt Ansatzgekommen für das Usersind, Interface sind gestenDesign eines und touchbasiert. Solarthermie-Reglers. Diese aufAnhand neuen Technologien einer Case Study basierenden werden HerausforderunInteraktionsformen werden gen undhäufig Einschränkungen auch als natürliche bei der Interaktion domänenspezifischen bezeichnet.Anpassung Maus und Tastatur des Userhaben Centered als Eingabegeräte Design-Ansatzes Konkurrenz im Bereichbekommen. der Nontraditional Als prominente User Interfaces Vorreiter aufgezeigt. sind hier die Nichttraditioaktuellen Smartphones nelle User Interfaces sowie Microsoft (UIs) bezeichnen Surface Mensch-Maschine-Schnittstellen, zu nennen. Damit hat sich auch der dieGestaltungskeine standarraum disierten für Interaktionsdesigner Ein- und Ausgabemethoden erweitert. aufweisen Die Konzeption (e.g. Handys, von Steuerungsgesten Steuerungen für Hauskommt als haltsgeräte neue Dimension etc.). Diehinzu. Mehrheit Den der damit Regelverbundenen und Steuergeräte Herausforderungen zeichnet sich widmet gegenwärtig sich unser durch Tutorial. ein kontraintuitives Wir zeigen Interaktionsdesign die Bandbreite neuer aus.Interaktionsmöglichkeiten Aufgrund der komplexenauf Bedienung und probieren werdengemeinsam diese nach mit Inbetriebnahme den Teilnehmern durch eine einen Methode Fachmann zur Gestaltung vom Endanwender von gestenkaum und touchbasierter benutzt. Mit Hilfe Interaktion angepasster aus. Guerilla Usability Engineering-Methoden kann sowohl den beschränkten personellen und finanziellen Projektressourcen als auch der speziellen Benutzergruppe der Heizungs- und Solarinstallateure Rechnung getragen werden. Das hier vorgestellte Interaktionsdesign konnte durch einen Nutzertest positiv evaluiert und das Gesamtkonzept auf einer Fachmesse als Erfolg verbucht werden.

1. Einleitung Die Vorteile benutzerzentrierter Entwicklung für intuitive und einfach zu benutzende interaktive Geräte sind mittlerweile anerkannt und finden nicht mehr nur in der „klassischen“ Mensch-Computer-Interaktion Anwendung. Vor allem im Bereich der Unterhaltungselektronik (Consumer Electronics) will man Kunden durch ein durchdachtes Design ein möglichst gutes Nutzungs- und Nutzererlebnis (User Experience; UX) bieten. Nicht zuletzt durch den Erfolg von Produkten wie dem Apple iPhone zeigen sich auch vermeintlich Interaktionsdesign-ferne Domänen zunehmend offen für die Ideen des User Centered Design (UCD) und des User Experience Design (UXD) (vgl. Klauser & Walker, 2007; Norman, 1988). Es wird erkannt, dass gut gestaltete Produkte mitunter für zukünftigen Markterfolg und Kundenbindung verantwortlich sind (vgl. etwa RWE Effizienz GmbH, 2011). In diesem Beitrag wird der benutzerzentrierte Entwicklungsprozess eines User Interfaces für einen Solarthermie-Regler aufgezeigt, der im Rahmen eines von der Software-Offensive

82

Bayern geförderten Forschungsprojekts1 zum Einsatz kommt. Dabei wird zum einen auf die aus Praxissicht relevanten Herausforderungen und Einschränkungen, die sich (a) aus dem Bereich der Nontraditional User Interfaces und (b) aus den vom Projekt vorgegeben Eckdaten ergeben und zum anderen auf deren Auswirkungen auf Designprozess und Usability Testing eingegangen. Nontraditional User Interfaces bezeichnen hier Mensch-MaschineSchnittstellen, die keine standardisierten Ein- und Ausgabemethoden aufweisen (e.g. Handys, Steuerungen für Haushaltsgeräte etc.) (Kortum, 2008). Der Designprozess ist durch die Kooperation zweier Usability-Experten der Universität Regensburg (Informationswissenschaft / Medieninformatik) auf der einen und Ingenieuren und Programmierern des mittelständischen Unternehmens emz-Hanauer2 auf der anderen Seite geprägt. 2. Ausgangslage und Handlungsbedarf Regel- und Steuergeräte im Facility Management zeichnen sich durch zunehmende Komplexität aus: Der

Christian Wolff Lehrstuhl für Medieninformatik Universität Regensburg christian.wolff@ur.de

Keywords: /// Mensch-Maschine Interaktion /// Guerilla HCI /// Nontraditional User Interfaces /// Facility Management /// Sustainable HCI

stetig zunehmende Funktionsumfang geht einher mit umfangreichen, zumeist unüberschaubaren und nicht nachvollziehbaren Menüstrukturen sowie heterogenen Benutzergruppen3. Das User Interface wird typischerweise von denselben Ingenieuren entwickelt, die auch für die Systemfeatures und deren Implementierung verantwortlich sind. Dabei handelt es sich zumeist um Elektrotechniker oder Informatiker, die keine formale Ausbildung im Bereich der Mensch-Maschine-Interaktionsgestaltung (MMI) haben. Usability und User Experience werden als nice to have-Features angesehen, die auf Grund von zeitlichen oder finanziellen Überlegungen oder mangelnder Kenntnis zumeist ignoriert werden (Thimbleby, 2001). Benutzerbedürfnisse sind deshalb (bisher) kaum Bestandteil des Entwicklungsprozesses. Viele UIs von Steuerungs- und Regelungsgeräten weisen ein kleines monochromes Display und eine auf Tasten und Knöpfe (hard keys) basierende Interaktionsgestaltung auf. Komplexe und kontraintuitive Bedienungsschritte wie das gleichzeigte Drücken mehrerer Tasten für eine bestimmte Zeitspanne, um ein Ereignis auszulösen, sind weit verbreitet . [Abb. 1]

126


Usability Professionals 2011 Nachhaltigkeit

4. Rahmenbedingungen 4.1. Notwendigkeit angepasster Methoden

Abb. 1 Zwei Beispiele am Markt erhältlicher State of the Art-Solarregelungsgeräte.

Wegen der schwer zu erlernenden (und erinnerbaren) Interaktionsschritte und des wenig durchdachten Interfacekonzeptes wird diese Art von Geräten nach der Erstinstallation durch einen Fachmann vom Endanwender kaum benutzt4. Nichtsdestoweniger bieten Solarregler Funktionen und Einstellungsmöglichkeiten an, die Nutzerbedürfnisse vor allem in Hinblick auf Energieeffizienz und -einsparung (green energy, Umweltschutz) unterstützen können. Eine höhere Nutzungsintensität auch durch den Endnutzer ist folglich im Sinne der Sustainable HCI5 (DiSalvo, Sengers, & Brynjarsdóttir, 2010) wünschenswert. Ein benutzerfreundliches Interface für den Endkunden muss hierzu als Voraussetzung angesehen werden.

Ergonomie genügt, sondern zusätzlich durch ästhetisches und innovatives Design die Zufriedenheit und letztendlich die User Experience aller Benutzergruppen zu verbessern vermag (Zhou & Fu, 2007). Konkrete Anforderung war die Gestaltung eines intuitiven UIs, welches ohne die Verwendung einer Anleitung bedient werden kann. Das sehr technisch anmutende look and feel von state of the art-Reglungsgeräten und die damit verbundenen Hemmschwellen sollten abgebaut und eine regelmäßige Nutzung erreicht werden. [Abb .2] Eine Umfrage unter potenziellen Benutzern konnte neben einer hohen funktionellen Qualität des Geräts eine intuitive und einfache Steuerung, sowie ein verständliches Menü als Ziele bestätigen.

Wünschenswert wäre auch im Usability Engineering, stets die am besten geeigneten Methoden wählen zu können. Die Praxis zeigt jedoch, dass in vielen Projekten Faktoren wie Projektressourcen, Zugang zur Zielgruppe oder spezielle Anforderungen an das UI berücksichtigt werden müssen und daher Einschränkungen bei der Methodenwahl und/oder -operationalisierung an der Tagesordnung sind. Discount oder Guerilla Usability Engineering-Methoden (Nielsen, 1994) versuchen diesen Einschränkungen durch vereinfachte Methodik zu begegnen (e. g. Heuristische Evaluation, Scenarios). Angesichts beschränkter finanzieller und personeller Ressourcen wurden hier vor allem low cost-Verfahren innerhalb des Entwicklungsprozesses eingesetzt. Dabei bedurfte es einer domänenspezifischen Anpassung der Methoden an den Bereich der Nontraditional User Interfaces. 4.2. Usability-Anforderungen Anhand von Interviews mit Domänenexperten und potenziellen Nutzern wurden typische Aufgaben und Anforderungen an Regelungsgeräte erhoben. Dabei konnten zwei Hauptbenutzergruppen identifiziert werden: Installateure und Endnutzer unterscheiden sich wesentlich im Benutzungsverhalten und in der technischen Expertise hinsichtlich Steuerungsgeräten und dem Bereich der Solaranlagen im allgemeineren (Fachvokabular etc.). Während

3. Ziele Mit der Entwicklung des SolarthermieReglers smart sol sollte der oben beschriebenen Situation durch Verwendung von Methoden des User-Centered Designs begegnet werden. Abbildung 2 zeigt den verwendeten iterativen Designprozess6. Es sollte ein User Interface entwickelt werden, das nicht nur den Anforderungen und Normen der Usability und (Software-) Abb. 2 Angewandter UserCentered Design Prozess.

83


Installateure eine Effizienzsteigerung in der Ersteinrichtung und Wartung der Anlage wünschen, verlangen die Endnutzer nach einer einfachen, intuitiven und selbsterklärenden Bedienung des Regelungsgerätes. Eine weitergehende Differenzierung der Endnutzer erscheint plausibel (z. B. (Erst-) Installateur – Wartungstechniker – Hausmeister mit regelmäßigen Wartungsaufgaben – ambitionierter Techniknutzer – technikphober Gelegenheitsnutzer), konnte aber im Projekt bisher nicht näher untersucht werden. 4.3. Nontraditional User Interfaces Normen und Guidelines sowie vordefinierte Eingabemethoden (e.g. Maus, Tastatur) beschränken und strukturieren den Designraum in der Mensch-Computer Interaktion. Jedes Programm besitzt zwar andere Funktionalität, dennoch kann der Benutzer eine konsistente Bedienung für Standardabläufe wie Öffnen oder Schließen erwarten. Als nichttraditionelle Benutzerschnittstellen gelten hier solche Schnittstellen, die von dem Windows, Icons, Menus, Pointer-Grundkonzept (WIMP) traditioneller PC-Software abweichen. Das Design von Nontraditional UIs verlangt angesichts nicht standardisierter Ein- und Ausgabe-Geräte und -methoden weit mehr Gestaltungsentscheidungen: Neben dem Onscreen-Interface muss eine Entscheidung hinsichtlich des Eingabekonzepts erfolgen (e.g. Tasten, Knöpfe, Drehencoder, Touchscreen etc.). Während dies im Bereich der Personal Computer beinahe keine Rolle mehr spielt, muss hier mit knappen vorhandenen HardwareRessourcen ökonomisch umgegangen werden. Weitere Einschränkungen sind die Geräteausmaße, insbesondere Größe und Auflösung der Displays sowie die ungewöhnlichen und variierenden Interaktions- und Nutzungskontexte (Baumann & Thomas, 2001; Kortum, 2008; Zühlke, 2004).

84

5. Vorgehen 5.1. Iteratives Prototyping Aufgrund des vorgegebenen Produktionszyklus musste zunächst die Hardware gestaltet werden. Auf Basis von Wettbewerbsanalysen und Expertenreviews wurde in Kooperation mit einem auf IndustrieDesign spezialisiertem Unternehmen ein erster (kaum funktioneller) Hardware-Prototyp entworfen (Abbildung 3). Die MMI basiert auf einem Clickwheel (Drehencoder mit Drückfunktion) für Navigation und Bestätigung und einer Escape-Taste. Drehencoder sind insbesondere für ein schnelles Einstellen von Parametern mit großer Spannweite geeignet (Baumann, 2001). Die Escape-Taste ermöglicht dem Benutzer das einfache Rückgängigmachen der letzten Aktion. Mit Hilfe von Domänenexperten und Probanden wurde Positionierung und Form der Interaktionselemente evaluiert und iterativ verbessert. [Abb. 3]

Die Papierprototypen der letzten Iterationsphase dienten als Grundlage für einen HTML-basierten Mockup des UIs. Die Herausforderung bestand darin, die komplette MMI möglichst realitätsnah virtuell zu repräsentieren. Dazu war es notwendig, neben der GUI auch die weiteren Bestandteile der MMI (Clickwheel, Escape-Taste) originalgetreu (Maße, Auflösung etc.) und funktionell umzusetzen und zudem den Gerätekorpus zu versinnbildlichen. [Abb. 4]

Abb. 4 Interaktiver Mockup

5.2. Guerilla Usability Testing Den Rahmenbedingungen des Projekts wurde durch angepasste Methodik Rechnung getragen. Im hier vorgestellten Ansatz wurde versucht durch Flexibilität und Improvisation diesen Herausforderungen zu begegnen (siehe auch Bias & Mayhew, 1994; Kane, 2003).7 5.2.1. Virtuelles Setup

Abb. 3 Hardwareprototyp

Für eine erste Evaluation der graphischen Benutzerschnittstelle (GUI) wurden Papierprototypen verwendet. Diese eigneten sich sehr gut für das Vermitteln der prinzipiellen Designideen an Stakeholder und Benutzer und konnten mit wenig Aufwand iterativ angepasst werden (siehe auch Snyder, 2003).

Das iterativ erarbeitete Interaktionskonzept sollte vor Produktion des Reglers einem möglichst umfassenden Usability-Test unterzogen werden. Infolge von hohem Termindruck und finanzieller Einschränkungen musste das Interaktionskonzept ohne funktionellen Hardware-Prototypen unter Einsatz des interaktiven Mockups getestet werden (Abbildung 4). Eine Berücksichtigung des Nutzungskontextes durch einen Feldtest war unter den gegebenen Bedingungen nicht realisierbar.


Usability Professionals 2011 Nachhaltigkeit

5.2.2. Probandenrekrutierung Eine weitere Herausforderung stellte die Rekrutierung geeigneter Probanden dar. Üblicherweise werden Probanden für eine Usability-Studie durch eine Agentur angeworben und mit einer Aufwandsentschädigung vergütet. Angesichts limitierter finanzieller und zeitlicher Ressourcen mussten in diesem Fall andere Wege beschritten werden. Hinzu kam, dass beide ermittelten Hauptbenutzergruppen (Installateur, Endnutzer) miteinbezogen werden sollten. Während potenzielle Endnutzer (Studenten) relativ einfach und in angemessener Menge anzuwerben waren, stellte sich vor allem der quantitative Faktor bei der Gruppe der Installateure als Schwierigkeit dar. So wurde nicht nur auf das Netzwerk der Firma emz-Hanauer zurückgegriffen, sondern es mussten auch und vor allem private Kontakte zum hauseigenen Installateur genutzt werden. Um die Bereitschaft der freiwilligen Teilnahme zu steigern, wurde das Usability Testing in einen informellen Abend inkl. (seltener) Firmenführung und kleiner Verkostung integriert. Immerhin konnten 11 von potenziell 20 Installateuren erfolgreich für den Versuch gewonnen werden. 5.2.3 Paralleles Test-Setup Der merklich geringen Motivation und Bereitschaft der Probanden wurde mit einem parallelem Test-Setup begegnet. Dadurch sollte der zeitliche Aufwand minimiert werden, um sicherzustellen, dass die ohnehin schon wenigen Testpersonen an allen Testsessions teilnehmen. Das Testsetting umfasste einen Nutzertest mit vorgegebenen Tasks, Card Sorting und einen abschließenden Fragebogen. Es wurden zwei laborähnliche Testumgebungen in Büroräumen der Firma emz-Hanauer geschaffen. Ein Raum wurde für die Benutzertests mit Laptops ausgestattet, welche den interaktiven Mockup bereits implementiert hatten, ein anderer wurde mit einer ausreichend großen Anzahl an Tischen bestückt, auf denen die Materialien für das papierbasierte Card Sorting bereit lagen.

5.2.4. Testleiterrekrutierung

Abb. 5 Unterweisung der Testleiter

Für einen reibungslosen Ablauf und eine optimale Datenerfassung sollte jedem Probanden während des Benutzertests ein eigener Testleiter zugeteilt werden, der auf vorgefertigten Protokollbögen alle Kommentare des Thinking Aloud erfasst und dokumentiert. Zusätzlich sollte er gegebenenfalls Fragen beantworten und notfalls eine kleine Hilfestellung geben. Darüber hinaus sollten mindestens zwei Testleiter das parallel stattfindende Card Sorting betreuen. Daraus ergab sich ein personeller Aufwand von mindestens 13 (qualifizierten) Testleitern. Da das Projekt aber lediglich zwei Usability-Experten umfasst, mussten zusätzliche Testleiter gefunden werden. Domänenexperten sowie weitere Mitarbeiter der Firma emz-Hanauer (ohne einschlägige Erfahrungen im Bereich Usability Testing) wurden als Testleiter rekrutiert und erhielten vor ihrem Einsatz eine Einführung in die benötigten Methoden des Usability Engineerings und deren Ziele. [Abb. 5] Laut einer Umfrage fühlten sich nach der Einführung alle Unterwiesenen gut vorbereitet für die Funktion als Testleiter.

5.2.5. Ablauf Die Probanden wurden in zwei Gruppen aufgeteilt, die jeweils in umgekehrter Reihenfolge den Benutzertest und das Card Sorting zu absolvieren hatten. Somit sollte eine statistische Auswirkung der Reihenfolge minimiert werden. Um die Nachverfolgbarkeit der Ergebnisse zu garantieren wurden spezielle Protokollbögen erstellt und jedem Testleiter bereitgestellt. Jedem Probanden wurde eine Mappe mit allen Unterlagen (Einführung, Anleitung, Testaufgaben, Protokollbögen für die Testleiter) mit seiner bereits versehenen anonymen ID ausgehändigt. Um Verwechslungen zu vermeiden, wurden die Probanden gebeten die Unterlagen mit Ihrer ID während des Tests stets mit sich zu führen, insbesondere beim notwendigen Wechsel zwischen den Räumen von Card Sorting zu Benutzertest und umgekehrt. [Abb. 6] Der Benutzertest umfasste zwei in Szenarien eingebettete Aufgaben. Diese wurden den Probanden in schriftlicher Form ausgehändigt. Zunächst sollte die Erstinstallation des Reglers mit Hilfe des im Rahmen dieses Projekts neuentwickelten Inbetriebnahme-Assistenten absolviert werden. Als zweite Aufgabe sollte eine Fehlermeldung des Solarthermie-Reglers quittiert und per Service-Assistent der zugrunde liegende Fehler gefunden werden (Abbildung 6). Alle Probanden waren angehalten, im Sinne der Thinking Aloud-Methode laut zu denken. Der jeweils zugeteilte Testleiter dokumentierte sämtliche Äußerungen und Probleme auf den vorbereiteten Protokollbogen. [Abb. 7]

Abb. 6 Service-Assistent.

85


Inbetriebnahme-Assistenten optimiert und ihren Anforderungen angepasst. In Interviews mit Nutzern konnte zusätzlich das Bedürfnis nach einer Verbesserung des Fehlermanagements erkannt werden. Für das Identifizieren (und ggf. Beheben) einer möglichen Fehlerquelle und zur Unterstützung des Nutzers wurde der ServiceAssistent entworfen.

Abb. 7 Benutzertest mit Hilfe eines interaktiven Mockups

Als Basis der Informationsarchitektur und für die Optimierung der Menüstruktur sowie der bestmöglichen Repräsentation des mentalen Modells der Benutzer wurde die Card Sorting-Methode verwendet. Zunächst wurde ein online-basiertes Open Card Sorting (ohne vorgegebene Kategorien) mit beiden Benutzergruppen durchgeführt. Es zeigte sich jedoch zum einen, dass ein offenes Card Sorting in diesem Bereich zu heterogene und deshalb kaum verwertbare Ergebnisse liefert und zum anderen, dass die Resonanz innerhalb der Gruppe der Installateure äußert gering war (nur ein einziger Teilnehmer). Es wurde daher ein zweites Card Sorting in zwei Phasen durchgeführt. In einer ersten Phase wurde erneut ein Online-Verfahren für die Gruppe der Endnutzer eingesetzt, dieses Mal jedoch mit einem Closed Card Sorting mit vorgegebenen Menüoberpunkten. Aufgrund des Scheiterns des Online Card Sorting der Installateure wurde im Rahmen des parallelen Setups auf ein traditionelles Vorgehen mit Papierkarten zurückgegriffen (ebenfalls mit vorgegebenen Kategorien). Nachdem beide Gruppen sowohl die Benutzertests als auch das Card Sorting vollendet hatten, wurden Sie gebeten, abschließend einen Fragebogen auszufüllen, der neben demographischen

86

Angaben Fragen zu den gerade bearbeiteten Aufgaben beinhaltete. 6. Diskussion und Ergebnisse In diesem Beitrag wurde ein benutzerzentrierter Ansatz zur Gestaltung des User Interfaces eines Solarthermie-Reglers beschrieben. Durch die konsequente Einbeziehung der Nutzergruppen konnte bereits in frühen Phasen des Designprozesses iterative Anpassungen vorgenommen und so die tatsächlichen Bedürfnisse der unterschiedlichen Benutzergruppen umgesetzt werden. Auf der Basis eines frühen (nicht funktionalen) Hardware-Prototyps wurden die Interaktionselemente evaluiert und verbessert (z. B. wurde die Tiefe des Clickwheel angepasst). Mockups dienten zur Validierung der Gestaltung und Verständlichkeit des On-screen Designs (Aufbau, Farbgebung, Icons etc.). Die Card SortingMethode ermöglichte den Entwurf und die Umsetzung einer klar verständlichen Menüstruktur. Begriffliche Unschärfen bei Menüpunkt- oder Kategorienterminologie wurden durch einen Fragebogen erhoben und beseitigt. Der Ablauf der Erstinbetriebnahme des Solarreglers wurde durch das Feedback der Installateure im

Ein adaptierter Guerilla HCI-Ansatz wurde verwendet, um trotz projektbedingter Einschränkungen eine möglichst gute User Experience zu erreichen. Den domänenspezifischen Herausforderungen (Nontraditional UIs; Facility Management) und den beschränkten finanziellen wie personellen Ressourcen konnte somit erfolgreich begegnet werden. Dabei wurden bereits bestehende low cost-Methoden (e.g. Nielsens Discount Usability) aufgegriffen und dem domänenspezifischen Kontext angepasst. Das Interaktionskonzept und -design des Solarthermie-Reglers smart sol wurde 2010 erfolgreich beim Fachpublikum bei Intersolar Europe8 präsentiert. Sowohl dieses positive Feedback als auch die Resonanz während und nach der Usability Testing-Session zeigen, dass Guerilla Usability-Methoden auch in Bereichen außerhalb des Desktops erfolgreich eingesetzt werden können. Die Wichtigkeit domänenspezifischer Anpassungen – gerade auch in der Forschung – zeigt sich ganz aktuell in der Tatsache, dass erstmalig ein European Workshop on HCI Design and Evaluation focusing on the influence of domains9 stattfand. Im beschriebenen Entwicklungsprozess wurden UCD-Methoden erfolgreich in einen bisher kaum beachteten Kontext umgesetzt. Eine Verallgemeinerung dieser Ergebnisse bedarf allerdings weiterer empirischer Untersuchungen. Die zukünftige Forschung der Autoren fokussiert sich auf einen effizienten Ansatz zum Management von Variabilitäten im Mensch-Maschine Interaktionsdesign nichttraditioneller Interfaces, in dem bestehende Ergebnisse aus dem Bereich der Software-Produktlinienforschung aufgegriffen und transferiert werden.


Usability Professionals 2011 Nachhaltigkeit

Literatur

12. Thimbleby, H. (2001). The computer science

1. Baumann, K. (2001). Controls. In Baumann,K.

of everyday things. In Proceedings Second

& Thomas,B. (Hrsg.), User Interface Design

Australasian User Interface Conference. AUIC

for Electronic Appliances, 131-161: {CRC}

2001, 3-12. IEEE Comput. Soc. doi: 10.1109/

Press. 2. Baumann, K., & Thomas, B. (2001). User

AUIC.2001.906270. 13. Zhou, H., & Fu, X. (2007). Understanding,

Interface Design of Electronic Appliances:

measuring, and designing user experience:

CRC Press.

the causal relationship between the

3. Bias, R. G., & Mayhew, D. J. (1994). Cost-

aesthetic quality of products and user affect.

Justifying Usability (Interactive Technologies):

In Proceedings of the 12th international

Morgan Kaufmann.

conference on Human-computer interaction:

4. DiSalvo, C., Sengers, P., & Brynjarsdóttir, H. (2010). Mapping the landscape of

interaction design and usability. 340-349. 14. Zühlke, D. (2004). Useware-Engineering für

sustainable HCI. In Proceedings of the 28th

technische Systeme: Mensch-Maschine-

international conference on Human factors

Systeme für die Praxis (VDI-Buch).

in computing systems - CHI ’10, 30332, 1975.

Berlin:Springer.

New York, New York, USA: ACM Press. doi: 10.1145/1753326.1753625. 5. Kane, D. (2003). Finding a place for discount usability engineering in agile development:

1

FKZ IUK 0910-0003.

2

http://www.emz-hanauer.de, mittelständisches

throwing down the gauntlet. In Proceedings

Unternehmen aus Nabburg, Bayern. Zu

of the Agile Development Conference,

den Kerngebieten gehören Haus- und

2003. ADC 2003, 40-46. Ieee. doi: 10.1109/

Umwelttechnik, ebenso wie Hausgeräte [letzter Zugriff am 20. Juni 2011].

ADC.2003.1231451. 6. Klauser, K., & Walker, V. (2007). It ’ s About

3

Clock.In Proceedings of the 2007 Conference

4

Ergebnisse von Nutzer und Experteninterviews (von den Autoren 2009/

on Designing pleasurable products and

2010 durchgeführt).

interfaces. 407--420. ACM, Helsinki, Finland (2007).

Ergebnisse einer Marktanalyse, durchgeführt von emz - Hanauer GmbH & Co KGaA 2009.

Time : An Affective and Desirable Alarm

5

Sustainable HCI bezeichnet hier das Design von UIs für die Unterstützung der Nutzer im

7. Kortum, P. (2008). HCI Beyond the GUI: Design for Haptic, Speech, Olfactory, and

nachhaltigen Umgang mit Energieressourcen

Other Nontraditional Interfaces (Interactive

(vgl. auch DiSalvo, Sengers, & Brynjarsdóttir, 2010).

Technologies): Morgan Kaufmann. 8. Nielsen, J. (1994). Guerrilla HCI: using

6

Eine ausführliche Beschreibung des

discount usability engineering to penetrate

UCD-Prozesses findet sich in Böhm,

the intimidation barrier, 245-272. In Bias, R.G.

Schneidermeier, Wolff : Smart Sol – Bringing

und Mayhew, D.J. (Hrsg.) Cost-Justifying

User Experience to Facility Management:

Usability 245--270. San Francisco: Morgan

Designing the User Interaction of a Solar

Kaufmann Publishers.

Control Unit. To appear in: Proceedings of HCI International 2011 (2011).

9. Norman, D. A. (1988). The Psychology Of Everyday Things. New York: Basic Books.

7

Vgl. auch Böhm, Schneidermeier, Wolff: Customized Usability Engineering for a Solar

10. RWE Effizienz GmbH. (2011). RWE SmartHome - Die Energiesteuerung fürs

Control: Adapting Traditional Methods to

Zuhause. Die Haussteuerung vernetzt

Domain and Project Constraints. To appear in: Proceedings of HCI International 2011 (2011).

per Funk Wärme, Licht und Strom. RWE SmartHome - so funktioniert moderne

Intersolar Europe: Weltweit größte Messe für

8

Solartechnik (www.intersolar.de)

Hausautomatisierung. http://www.rwesmarthome.de/web/cms/de/448330/

9

http://sites.google.com/site/ehcide/

smarthome/. – letzter Aufruf am 28.05.2011 11. Snyder, C. (2003). Paper Prototyping: The Fast and Easy Way to Design and Refine User Interfaces (Interactive Technologies). Amsterdam: Morgan Kaufmann.

87


116

Outdoor-Nutzertest eines Leitsystems im öffentlichen Raum Beschreibung der Anwendung einer Methode zur Identifizierung von Schwachstellen Paul Müller Agentur Siegmund GmbH Leuschnerstraße 3 70174 Stuttgart p.mueller@agentur-siegmund.de

Oliver Siegmund Agentur Siegmund GmbH Leuschnerstraße 3 70174 Stuttgart o.siegmund@agentur-siegmund.de

Abstract Viele Der Beitrag der Interaktionsgeräte, behandelt die Herangehensweise die in jüngster Zeit anauf dieden Konzeption, Markt gekommen Planung und sind,Durchfühsind gestenrung eines undNutzertests touchbasiert. im öffentlichen Diese auf neuen Raum: Technologien Was sind diebasierenden allgemeinenInteraktionsformen Herausforderunwerden gen, welche häufig Lösungsansätze auch als natürliche gibt es Interaktion und wie kann bezeichnet. man diese Maus weiter und Tastatur optimieren? haben Hierbei als Eingabegeräte werden zunächst Konkurrenz wichtige Überlegungen bekommen. Als improminente Vorfeld undVorreiter anschließend sind hier dasdie methodische aktuellen Smartphones Vorgehen anhand sowie eines Microsoft realenSurface Projektszu(Evaluierung nennen. Damit des hat Leitsystems sich auchder derStuttgarter GestaltungsStraraum ßenbahnen für Interaktionsdesigner AG) beschrieben. erweitert. Der FokusDie liegtKonzeption dabei vor allem von Steuerungsgesten auf der Konzeption kommt und als Durchführung, neue Dimension die Auswertung hinzu. Den wird damitnur verbundenen am Rand behandelt. Herausforderungen Neben denwidmet allgemeinen sich Heunser rausforderungen Tutorial. Wireines zeigen Outdoor-Nutzertests die Bandbreite neuer im öffentlichen Interaktionsmöglichkeiten Raum werden abschließend auf und probieren auch mögliche gemeinsam Optimierungspotentiale mit den Teilnehmern und eineein Methode Ausblick zurhinsichtlich Gestaltungder von vorgestellten gesten- und touchbasierter Methode vorgestellt. Interaktion aus.

1. Überlegungen im Vorfeld 1.1. Einführung Die Aufgabenstellung des Kunden lautete, eventuell vorhandene Schwachstellen im Leitsystem aufzudecken. Dies sollte durch einen qualitativen Nutzertest mit zehn Probanden überprüft werden. Da die SSB AG bei der Benutzung ihrer öffentlichen Verkehrsmittel eine „lückenlose Informationskette von Tür zu Tür“ verspricht, war dies eine interessante Herausforderung. Basierend auf der Aufgabenstellung wurden gründliche Überlegungen hinsichtlich der Testart und des Ablaufs angestellt: Wie testet man ein Leitsystem im öffentlichen Raum? Wie lässt man Probanden unter realistischen Bedingungen eine vorgegebene Strecke fahren und kann deren Verhalten dabei beobachten bzw. aufzeichnen und dadurch auch im Nachhinein noch nachvollziehen? Trotz ausführlicher Recherche konnten keine erwähnbaren Referenzen zu diesem Thema gefunden werden. Hieraus resultierte die Entwicklung einer eigenen Methode für den Nutzertest im öffentlichen Raum.

88

1.2. Theoretische Planung Bei einem Nutzertest des Leitsystems sollte dieses von der entsprechenden Zielgruppe unter möglichst realistischen Nutzungsbedingungen genutzt werden. Um dies zu gewährleisten und den Probanden während des Tests ein freies Agieren zu ermöglichen, wurde entschieden, dass sowohl auf einen begleitenden Moderator, als auch die gängige Methode „Thinking Aloud“ während der eigentlichen Nutzung durch die Probanden verzichtet wird. Stattdessen fiel die Wahl auf einen Mix aus szenariobasiertem und streckenweise explorativen Test sowie anschließender Befragung durch Einsatz der Methode „Retrospective Thinking Aloud“, im Folgenden RTA genannt. Um nach der Nutzung entsprechendes Videomaterial für die RTA zu haben, wurden die Probanden jeweils mit einem unauffälligen Brillengestell ausgestattet, in welchem eine kleine hochauflösende Kamera mit Ton integriert war. Hintergrund war hierbei, dass es den Probanden ermöglicht werden sollte, sich möglichst unauffällig fortzubewegen und keine unnötigen

Keywords: /// Outdoor-Nutzertest /// Leitsystem /// Evaluation /// Methode /// Retrospective Thinking Aloud

Blicke oder Reaktionen von anderen Fahrgästen auf sich zu ziehen. Eine versteckte Kamera in der Kleidung stellt hier nur eine unzureichende Alternative dar, lassen sich doch nur durch eine am Kopf angebrachte Kamera auch die Kopfbewegungen und damit der Sichtbereich der Probanden festhalten. Da ein realistisches Nutzungsverhalten der Probanden im Vordergrund stand, wurde bewusst auf einen zur Blickaufzeichnung in Frage kommenden Eye Tracker verzichtet. Ein komplett realistisches und neutrales Verhalten der Probanden wird zwar auch in diesem Fall nicht erreicht, da die Probanden im Vorfeld von dem Test wissen, durch den Einsatz der unauffälligen Videobrille kommt man einem realistischen Nutzungsverhalten seitens der Probanden aber sehr nahe. 2. Der Nutzertest in der Praxis 2.1. Die Konzeption 2.1.1. Die Zielgruppe Ein wesentlicher Punkt ist die Rekrutierung der richtigen Probanden, welche fundamental wichtig für das Ergebnis der


Usability Professionals 2011 Nachhaltigkeit

Evaluation sind. Da gerade das Leitsystem für öffentliche Verkehrsmittel für eine sehr breite Zielgruppe funktionieren muss, wurde hier basierend auf existierenden Nutzerdaten der SSB AG ein grober Querschnitt von zehn Probanden aus der Zielgruppe ausgewählt.

mehrere Tage hinweg herausgefunden werden. Eingeteilt wurden diese jeweils vormittags, nachmittags und abends zur Rush Hour.

Um das Leitsystem auf eventuell vorhandene Schwächen zu testen, sollten die Personen möglichst wenig Vorerfahrung im Umgang mit öffentlichen Verkehrsmitteln (Fokus auf U-Bahn) aufweisen. Um dies sicherzustellen, wurde bei der Auswahl ein kleiner Trick angewandt: Gesucht wurden Personen, welche ein eigenes Auto besitzen sowie gerne und viel mit dem Auto unterwegs sind. Diese überzeugten Autofahrer, so die Annahme, nutzen öffentliche Verkehrsmittel in der Regel nicht und wenn, nur durch besondere Umstände und mangels Alternativen. Bestätigt wurde diese Annahme später durch die Aussagen von mehreren Probanden.

Für das Szenario wurde zunächst eine Strecke festgelegt, welche die Probanden während der Nutzung abfahren sollten. Der Fokus lag hierbei auf der Orientierung der Probanden bei den drei Aktionen Einsteigen, Umsteigen und Aussteigen, aber auch auf der Orientierung innerhalb der U-Bahn. Da der allgemeine Testablauf vor allem durch die RTA viel Zeit in Anspruch nimmt, war die Anzahl der Stationen und damit die zu fahrende Strecke eine besondere Herausforderung. So sollte diese auf der einen Seite lang genug sein, um den Probanden Zeit für eine mögliche Orientierung innerhalb der Bahn zu geben, auf der anderen Seite aber so kurz wie möglich gehalten werden, um den Test nicht unnötig in die Länge zu ziehen. Allgemein sollte beachtet werden: Je länger das Video der Nutzung, desto länger auch die RTA im Anschluss, während welcher das Video zusammen mit dem Probanden angeschaut wird.

Da eine Vertrautheit mit der Aufmachung von Aushanginformationen und Eigenheiten des Leitsystems ausgeschlossen werden musste, wurden Personen gesucht, die außerhalb der Kernstadt Stuttgart (Umland Stuttgart ohne direkte U-Bahn-Anbindung) wohnen und nur selten in anderen Städten unterwegs sind. Ob es einen Unterschied im Verhalten von Neukunden und Vielfahrern gibt, sollte außerdem durch zwei Probanden ermittelt werden, welche die öffentlichen Verkehrsmittel in Stuttgart täglich nutzen. Um die Architektur der Haltestellen und die dafür nötigen Informationen auch auf vorhandene Barrierefreiheit zu testen, wurde einer der Probanden mit einem ca. sechs Kilo schweren Trolley ausgestattet, welchen er während der Nutzung mit sich führen musste. Besondere Beobachtung lag hierbei auf dem Finden und Benutzen von Aufzügen und Rampen. Eventuelle Auswirkungen durch die Tageszeit und dem damit verbundenen Menschenaufkommen vor allem innerhalb von unterirdischen Passagen, sollten durch eine Verteilung der Probanden über

2.1.2. Das Szenario

Außerdem sollten die zu durchlaufenden Stationen die Probanden nicht unterfordern. Bei einer Haltestelle mit nur einem Gleis und wenigen verkehrenden Linien, wird ein Proband potentiell weniger Schwierigkeiten haben als bei einer großen mit vielen Gleisen und vielen verschiedenen Linien. Ähnlich einem Leistungstest für elektronische Geräte, sollte hier aufgezeigt werden, ob das Leitsystem in der Lage ist, den Probanden auch an architektonisch unübersichtlichen Haltestellen die nötige Orientierung zu geben und die richtigen Informationen zu vermitteln, um ans Ziel zu kommen. Um potentiell kritische Stellen aufzudecken, wurde die geplante Strecke zunächst vom Testleiter abgefahren. Dabei ist ein großes Maß an Empathie wichtig. Dies gilt insbesondere, wenn der Testleiter bereits im Vorfeld mit der Nutzung öffentlicher

Verkehrsmittel und insbesondere den ausgewählten Haltestellen oder dem Leitsystem vertraut ist. Neben dem Festhalten von potentiell kritischen Stellen, wurden außerdem sämtliche auf dem Weg befindliche Informationsaushänge und Schilder per Fotokamera dokumentiert. Dies ist einerseits hilfreich, um die Strecke auch vom Schreibtisch aus nochmals im Kopf durchgehen zu können und eine Art „optimalen Lösungsweg“ zu kennen, andererseits aber auch als Material für die spätere RTA. Sollte das Bild im aufgenommenen Video an wichtigen Schlüsselstellen nur mangelhaft sein, kann so alternativ auf ein Foto zurückgegriffen werden. Im Vorfeld wurden auch reale Plätze als Einstiegs- und Endpunkt festgelegt, von welchem aus die Probanden das Szenario beginnen bzw. beenden. Der Einstiegspunkt entsprach in diesem Fall auch dem Treffpunkt mit den Probanden. Um den Probanden keine Gelegenheit zu geben, sich zuvor über das Leitsystem zu informieren und so einen Einfluss der Ergebnisse zu verhindern, wurde für den Nutzertest ein fiktiver Titel gewählt. So wurde sichergestellt, dass die Probanden den Nutzertest ohne zusätzliches Vorwissen beginnen konnten. Über das eigentliche Testziel erfuhren die Probanden vom Testleiter erst kurz vor der späteren RTA. In dem Szenario wurde den Probanden außerdem ein Grund für das Benutzen der U-Bahn gegeben, was wichtig für die Glaubwürdigkeit der Situation ist. In diesem Fall handelte es sich dabei um einen Arzttermin bei einem Spezialisten. Diesen muss der Proband aufsuchen, nachdem er sich zuvor mit einem Bekannten in einem Cafe getroffen hat. Der Bekannte rät dem Proband kurz vor der Verabschiedung, das Auto doch stehen zu lassen und vom Cafe aus mit der U-Bahn weiter zu fahren. Bei dem Cafe handelte es sich außerdem um den realen Treffpunkt von Proband und Testleiter. Des Weiteren erfuhr der Proband über das Szenario nur die Haltestellen für den Ein-, Um- und Ausstieg. Die korrekte Linien sowie die richtige Fahrtrichtung mussten eigenständig

89


herausgefunden werden. Hierfür werden sowohl ein lückenloses Leitsystem als auch weitere Informationsaushänge benötigt, die von den Probanden wahrgenommen und verstanden werden mussten.

2.2. Die Durchführung 2.2.1. Phase eins – der Outdoor-Nutzertest Der Testleiter traf sich mit den Probanden am Einstiegspunkt des Szenarios. Nach dem Ausfüllen der Vorbefragung und dem Unterschreiben der Einverständniserklärung wurde den Probanden vor Beginn ein Fahrticket in einem Umschlag ausgehändigt, welchen diese allerdings erst nach Auffinden eines Ticketautomaten öffnen sollten. Hintergrund war die Entscheidung, eine Nutzung des Fahrkartenautomaten innerhalb des Testszenarios auszuschließen, da eine Evaluation dessen den zeitlichen und damit auch wirtschaftlichen sowie inhaltlichen Rahmen des Projekts sprengen würde. Die Probanden wurden außerdem gebeten, keine Dritten nach dem Weg zu fragen und sich die nötigen Informationen für ein Erreichen des Ziels über die vorgegebene Station selbst zu beschaffen. Hilfe von außen sollte nur im Notfall in Anspruch genommen werden und deutete bei der späteren Auswertung dementsprechend auf eine vorhandene Schwachstelle an diesem Punkt hin. Vor Testbeginn konnten sich die Probanden mit der Videobrille vertraut machen, was wichtig war, um eventuelle Vorbehalte gegenüber dem Gerät abzulegen. Im Gegensatz zu den meisten männlichen Probanden waren vor allem einige der weiblichen Probanden der Videobrille gegenüber anfangs eher negativ eingestellt. Obwohl das Gestell der Brille so unauffällig wie möglich gewählt wurde, akzeptierten diese das Gerät erst nach einem prüfenden Blick in den Spiegel, welcher den Probanden zur Verfügung gestellt wurde. An dieser Stelle wurde die Entscheidung, aus optischen Gründen bewusst auf einen wesentlich auffälligeren Eye Tracker zu verzichten, von den Probanden bestätigt.

90

Dass die Probanden das Szenario komplett alleine durchlebten, kam zwar einerseits einer möglichst realistischen Nutzungssituation am nächsten, beinhaltete aber auch das Risiko, dass etwas völlig Unvorhersehbares eintreten könnte. So könnte ein Proband zum Beispiel komplett die Orientierung verlieren oder von anderen Fahrgästen beeinflusst bzw. gestört werden. Um den Kontakt mit den Probanden nicht komplett zu verlieren, wurden deswegen vor Testbeginn die Handynummern ausgetauscht. So konnte sichergestellt werden, dass die Probanden auch im Notfall erreichbar und somit zu lokalisieren waren.

Analyse nicht zu gebrauchen gewesen. Die Probanden wurden deshalb gebeten, das eben Erlebte noch für sich zu behalten und darauf erst bei der anschließenden RTA einzugehen.

Abschließend wurde die Aufnahme an der Videobrille vom Testleiter gestartet und dem jeweiligen Probanden zusammen mit dem ausgedruckten Szenario übergeben. Der Proband begann im Anschluss mit dem Durchlauf des Szenarios.

Zum Einstieg der RTA wurden die Probanden gebeten, kurz ihre Einstellung zu öffentlichen Verkehrsmitteln zu schildern. Außerdem wurden sie danach gefragt, wann und wo sie das letzte Mal mit öffentlichen Verkehrsmitteln unterwegs waren. Anschließend wurden die Probanden gebeten, während des Betrachtens der Videoaufzeichnung laut zu denken, also ihre Gedanken laut zu artikulieren. Die Audiospur der Videobrille wurde für die RTA deaktiviert und nur bei Bedarf aktiviert, so dass sich der Proband ganz auf das Bild konzentrieren konnte.

Der Testleiter begab sich daraufhin zum Endpunkt des Szenarios und wartete dort auf das Eintreffen des jeweiligen Probanden. Diese Wartezeit war individuell je nach Proband sehr verschieden, was neben dem Finden der korrekten Linien auch mit den Abfahrtszeiten der U-Bahnen zusammenhing. Am Ende des Szenarios sollten die Probanden nach dem Aussteigen aus der U-Bahn den korrekten Haltestellenausgang wählen, eine bestimmte Straße aufsuchen und dort am Straßenschild auf den Testleiter warten. Nach dem Eintreffen des Probanden wurde diesem die Videobrille vom Testleiter wieder abgenommen und die Aufnahme gestoppt. Anschließend begaben sich Proband und Testleiter in das sich in unmittelbarer Umgebung befindliche Usability-Labor. Während dieses Weges wurde der Proband vom Testleiter in einem Gespräch mit einem anderen Thema abgelenkt. Hintergrund ist, dass die Probanden dazu tendierten, direkt nach dem Testlauf auf ihre Erlebnisse einzugehen und diese zu artikulieren. Allerdings wurde dies zu dem Zeitpunkt nicht aufgezeichnet und wäre so für eine Auswertung und spätere

Im Labor angekommen, wurde dem Proband ein Getränk angeboten. Währenddessen wurden die Videodaten von der Videobrille auf einen Computer kopiert, um ein flüssiges Abspielen während der RTA zu gewährleisten. 2.2.2. Phase zwei – die RTA

Die gesamte Sitzung wurde wiederum mit Hilfe der Software Morae aufgezeichnet. Im Einzelnen war dies die originale Aufzeichnung der Videobrille mit einem zusätzlichen Bild des Probanden in der unteren rechten Ecke sowie der eigentliche RTA-Audiokommentar des Probanden. Die komplette Sitzung wurde in einen Nebenraum übertragen, wo von einem weiteren Mitarbeiter Protokoll geführt wurde. Zusätzlich zu diesem Protokoll konnte der Moderator während der RTA ebenfalls Marker in der Aufzeichnung setzen und so auf aus seiner Sicht wichtige Stellen hinweisen. Durch das Zusammenspiel der Videoaufnahme des Probanden während des eigentlichen Nutzertests und dessen Kommentierung konnten die jeweiligen Situationen vom Moderator während der RTA gut nachvollzogen werden. Bei Bedarf konnte dieser außerdem jederzeit nachfragen. Um auch eventuell nicht genutzte Elemente des Leitsystems


Usability Professionals 2011 Nachhaltigkeit

von den Probanden bewerten zu lassen, wurden nach der eigentlichen RTA noch diverse Schildtypen des Leitsystems vorgelegt und die Probanden dazu befragt. Dabei wurden auch Fotos genutzt, welche die Schilder an ihren realen Einsatzorten zeigten. Anschließend wurden die Probanden gebeten, ihren Eindruck des gesamten Leitsystems mit allen zugehörigen Informationsträgern zu schildern. Das Ende der RTA stellten ein den Probanden auszufüllendes Polaritätsprofil sowie der SMEQ (Subjective Mental Effort Questionnaire) dar, durch welchen sich der subjektiv erlebten Stress des Probanden festhalten lässt. 2.3. Die Auswertung Neben der Auswertung der Fragebögen, wurden aus den aufgenommenen RTA-Sitzungen Video-Highlights erstellt, in welchen am häufigsten auftretende Probleme und interessante Bemerkungen der Probanden enthalten waren. Neben offensichtlichen Problemen der Probanden während des Testdurchlaufs, wurden an dieser Stelle auch viele weitere interessante Äußerungen der Probanden hinsichtlich der Nutzung von öffentlichen Verkehrsmitteln festgehalten. Die gefundenen Probleme wurden anschließen in der Abfolge der von den Probanden abgefahrenen Haltestellen sortiert und die Häufigkeit des Auftretens festgehalten. Besondere Herausforderung waren hierbei die vielen kleineren individuellen Probleme der Probanden, welche sich aber weder einem bestimmten Geschlecht, noch dem Alter oder der Tageszeit zuordnen ließen. Letztlich wurden aussagekräftige Erkenntnisse über die allgemeine Gestaltung von Schildern und Informationsaushängen des Leitsystems als auch die Positionierung selbiger in den jeweiligen Haltestellen gewonnen.

3. Ausblick 3.1. Bewertung Ziel dieser Methode war es, das Verhalten und Erleben der Probanden im öffentlichen Raum trotz des Wissens um die Testsituation und der mitlaufenden Videoaufzeichnung möglichst realistisch zu halten. Eine theoretisch optimale Alternative wäre die Beobachtung und anschließende Befragung einer nicht eingeweihten Person. Alle Testpersonen müssten allerdings die gleiche Strecke abfahren, um die Häufigkeit von auftretenden Problemen nachvollziehen zu können. Es ist allerdings unklar, ob ein derartiges Vorgehen praktisch überhaupt machbar ist, würde dies doch einen enormen zeitlichen und damit auch wirtschaftlichen Aufwand bedeuten, der die Grenzen des machbaren deutlich sprengt. In diesem Fall wurde ein aus Sicht des Testleiters optimaler Kompromiss aus Beobachtung und realistischem Nutzungsverhalten angestrebt, welcher anhand des glaubhaften Szenarios im Zusammenspiel mit der eingesetzten Videobrille erreicht wurde. Durch die Kopplung von Beobachtung und Befragung können Probleme auch im Nachhinein analysiert und nachvollzogen werden. 3.2. Optimierungspotentiale Obwohl das oben beschriebene Vorgehen zufriedenstellende Ergebnisse lieferte, gibt es durchaus auch Punkte, welche für den weiteren Ausbau der Methode optimiert werden können. So war die Bildqualität der Videobrille mit einer HD-Auflösung von 720p allgemein sehr gut. Allerdings ist das Videomaterial trotz Bildstabilisator besonders bei schnellen und hektischen Kopfbewegungen auf Dauer anstrengend anzuschauen. Ein weiterer Nachteil ist die Lichtempfindlichkeit der Kamera in dunklen Passagen. Zwar ist auch diese qualitativ gut, beleuchtete Schilder wirken aber öfters überblendet,

was ein Erkennen von Schrift oder Symbolen teilweise stark erschwert. Als Alternative wurden deshalb im Vorfeld Fotos aller auf der Strecke befindlichen Schilder und Informationen erstellt. Zwar hält die Videobrille die Kopfdrehungen fest und zeigt so weitestgehend den Blickwinkel der Probanden, die genaue Augenbewegung wird jedoch nicht erfasst. Hierzu könnte das Equipment um einen mobilen Eye Tracker erweitert werden, mit dessen Hilfe die tatsächliche Fixation von Elementen überprüft werden kann. Dies geht allerdings zu Lasten des Realismus der Testsituation. Obwohl es mittlerweile mobile Eye-Tracker-Brillen gibt, die hierfür geeignet wären, sind diese optisch noch nicht unauffällig genug gestaltet, als dass sich Probanden damit ohne aufzufallen im öffentlichen Raum bewegen könnten. Fragende Blicke von anderen Fahrgästen oder gar ein direktes Ansprechen von Probanden hinsichtlich der Technik könnten diese von ihrem Ziel ablenken und die Ergebnisse dementsprechend verfälschen. 3.3. Weitere Schritte Die angewandte Methode wird von der Agentur Siegmund in naher Zukunft weiter erforscht und mit einem Testsetting mit begleitendem Moderator und der Methode „Thinking Aloud“ verglichen. Außerdem soll untersucht werden, inwiefern Probanden den Umgang mit einem Leitsystem und dessen Informationsträgern erlernen können. Dafür wird längerfristig ein zweiter Testlauf angestrebt, in welchem einige Probanden des ersten Tests erneut rekrutiert und ein ähnliches Szenario mit anderen Haltestellen durchlaufen werden. Auch der Einfluss des Faktors Zeit könnte in Zukunft noch weiter untersucht werden. Hierzu könnten weitere Probanden die gleiche Strecke abfahren, denen allerdings ein zeitlicher Rahmen vorgegeben wird, innerhalb dessen sie dann das Endziel erreichen müssen. Hier wird interessant sein zu sehen, inwiefern sich der so erzeugte Stress auf die Wahrnehmung von Informationen auswirkt.

91


Literatur 1. Sarodnick, F. & Brau, H. (2006). Methoden der Usability Evaluation. Wissenschaftliche Grundlagen und praktische Anwendungen. Bern: Hogrefe. 2. Nielsen, J. (1993). Usability Engineering. San Diego: Academic Press. 3. Foad A., Kain S., Schels C. (1993). Über Leitund Orientierungssysteme. Diplomarbeit an der HfG Schwäbisch Gmünd. 4. Kaikkonen, A., Kallio, T., Kekäläinen, A., Kankainen, A. & Cankar, M. (2005). Usability Testing of Mobile Applications: A Comparison between Laboratory and Field Testing. In Journal of Usability Studies, 1, 4-16. 5. Tobii Technology (2009). Retrospective Thinking Aloud and Eye Tracking. URL: http://www.slideshare.net/AcuityETS/usingretrospective-think-aloud-with-eye-trackingusability-testing 6. Dhana Sauernheimer (o.J.). Usability Tests in the Field. URL: http://www.medien.ifi.lmu. de/lehre/ws0708/mmi1/essays/sauernheimer. html

92


Natural User Interfaces (NUI)

93


Räumliche Gestenerkennung und Natural User Interfaces mit Microsoft Kinect Björn Oltmanns Fachhochschule Kaiserslautern mail@bjoernoltmanns.de

Denis Kruschinski Fachhochschule Kaiserslautern kontakt@deniskruschinski.de

Abstract Viele Der vorliegende der Interaktionsgeräte, Beitrag stelltdie Ansätze in jüngster zur Realisierung Zeit auf denvon Markt gestenbasierten gekommen sind, User-sind gestenInterfaces und und touchbasiert. Anwendungen Diese aufauf Basis neuen des Technologien 3D Sensors Microsoft basierenden Kinect Interaktionsformen in Verbindung werden mit Frameworks häufig auch wie als OpenNI natürliche und NITE Interaktion vor. Nach bezeichnet. einer kurzen MausEinführung und Tastatur in die haben genutzals Eingabegeräte te Hard- und Software Konkurrenz wird bekommen. eine prototypische Als prominente Applikation Vorreiter und die sind dieser hier zu dieGrunde aktuellen Smartphones liegenden Interaktionskonzepte sowie Microsoft Surface skizziert. zu nennen. Hierbei kommen Damit hatneben sich auch ein- der undGestaltungsmehrhändigen raum Gesten fürinsbesondere Interaktionsdesigner auch Konzepte erweitert. wieDie virtuelle Konzeption Cursorvon undSteuerungsgesten Echtzeit Motion Capturing kommt als zur neue Analyse Dimension der Körperhaltung hinzu. Den — damit lokalverbundenen als auch im räumlichen Herausforderungen Kontext — widmet zum Einsatz. sich Im unser drittenTutorial. Teil werden Wir zeigen die vorgestellten die Bandbreite Interaktionskonzepte neuer Interaktionsmöglichkeiten schließlich diskutiert auf und undproauf bieren Herausforderungen gemeinsam mit undden Probleme Teilnehmern — wieeine die Methode Unterscheidung zur Gestaltung zwischenvon intentionalen gesten- und und touchbasierter nicht-intentionalen Interaktion Gestenaus. — eingegangen.

1. Einleitung

2. Hardware und Frameworks

Im November 2010 stellte Microsoft den Kinect Sensor als Zubehör für die Spielekonsole Xbox 360 vor. Innerhalb kürzester Zeit wurde mit der Veröffentlichung von Frameworks wie OpenNI und NITE die Möglichkeit geschaffen, Kinect als Low-Budget-Grundlage zur plattformunabhängigen Entwicklung von Natural User Interfaces (NUI) einzusetzen. Mit dem Begriff NUI werden hierbei Interaktionsansätze angesprochen, die von Benutzern als natürliche Erweiterungen der eigenen Körperlichkeit empfunden werden, während die eigentliche Schnittstelle zu Applikationen weitgehend in den Hintergrund tritt. NUIs erlauben durch ihre intuitive Bedienbarkeit und schnelle Erlernbarkeit einen raschen Übergang vom Anfänger zum Experten. Unter „natural“ ist hierbei insbesondere ein „natürliches Gefühl“ bei der Verwendung solcher „Natural User Interfaces“ zu verstehen.

Um natürliche Interaktionskonzepte auf der Basis räumlicher Gesten zu ermöglichen, müssen Benutzer im Raum präzise erfassbar sein. Der Kinect Sensor ist hierzu mit einer Farbkamera, einem Infrarotlaser, einer Infrarotkamera sowie einem Mikrofonarray ausgerüstet und gestattet eine dreidimensionale Rekonstruktion des jeweiligen Raums. Hierzu projiziert der Kinect-Laser ein für menschliche Benutzer nicht sichtbares Muster in die Szene, vorhandene Objekte verzerren dieses Muster und werden von der Infrarotkamera aufgezeichnet um schließlich zu einer Tiefendarstellung transformiert zu werden. Diese Tiefendarstellung wird dann durch geeignete Algorithmen analysiert. Die im Rahmen der vorliegenden Arbeit eingesetzten Frameworks OpenNI und NITE bieten als Grundlage dieser Analyse folgende Optionen: –– Zugriff auf Rohdaten von Farbund Infrarotkamera sowie auf das Tiefenbild; –– Erfassung von Benutzern und deren räumlicher Lokalisierung;

94

Dieter Wallach Fachhochschule Kaiserslautern ERGOSIGN GmbH dieter.wallach@fh-kl.de

Keywords: /// Kinect, Natural User Interfaces /// Natural Interaction /// Räumliche Gesten

–– Rekonstruktion einer elementaren Skelettstruktur von Benutzern und Analyse von deren Bewegungen; –– Erfassung der Hände von Benutzern als Grundlage der Gestenidentifikation; –– Eine begrenzte Anzahl an vordefinierten und anpassbaren räumlichen Gesten. 3. Entwicklung von Natural User Interfaces Auf Basis des Kinect Sensors und der genannten Frameworks wurde eine interaktive Anwendung entwickelt, die mehrere kleinere Apps zur Erkundung zentraler Konzepte der räumlich-gestischen Interaktion umfasst. Nach dem Start dieser Anwendung wird der Benutzer zunächst durch einen Kalibrierungsprozess geführt, bei dem die Adaptierung des Frameworks an die Statur des Benutzers und die Handerfassung erfolgt. Nach erfolgreicher Kalibrierung steht Benutzern ein durch räumliche Gesten gesteuertes Menü zur Verfügung, welches die Apps KINOTE, SENSE TV und SNOWHITE miteinander verknüpft. Die

153


Usability Professionals 2011 Natural User Interfaces (NUI)

Auswahl bzw. das Starten einer App erfolgt durch eine sagittale Handbewegung (nach vorne/hinten) als Push-Geste im Raum. Das Verlassen einer App und die Rückkehr zum Hauptmenü erfolgt jeweils durch die Ausführung einer transversalen (rechts/ links) Wave-Geste. KINOTE verbindet eine Slideshow-Anwendung mit einem virtuellen Presenter der eine Interaktion mit ein- und beidhändigen Gesten ermöglicht, die jeweils durch rekonstruierte Skelettdaten des Benutzers unterstützt werden. Durch Swipe-Gesten können Folien vor und zurückgeblättert werde; eine dem 2D Touch verwandte, zweihändige Zoom-Geste gestattet die vergrößerte Darstellung von Folienbereichen; mit einer greifenden Bewegung der rechten Hand kann hierzu ein Ausschnitt selektiert werden. Durch eine Swipe-Geste nach unten wird eine virtuelle Folienübersicht zur Direktauswahl aktiviert, und über eine Verschiebung der Hand und Push-Gesten bedient. Präsentationen können mit KINOTE vollständig ohne externe Fernbedienung auf der alleinigen

Grundlage räumlicher Gesten gesteuert werden. SENSE TV ist ein adaptiver User-Sensing Video Player, dessen Darstellungsmodus jeweils die Präsenz und räumliche Nähe von Benutzern berücksichtigt. Die Interaktion mit SENSE TV erfolgt durch Veränderung der Benutzerposition im Raum und Einhandgesten, beispielsweise zum Zurückspulen und Pausieren eines Videos. Der Videoplayer reagiert dabei auf die Abwesenheit von Benutzern, indem er das Video beispielsweise bei deren Verlassen des Raumes pausiert und die Wiedergabe bei Wiederkehr fortsetzt. Nähert sich der Benutzer dem Sensor bzw. Bildschirm, werden zusätzliche Informationen zum Video eingeblendet. Die App SNOWHITE ist ein Augmented Reality-Spiegel zur interaktiven Kleideranprobe. SNOWHITE integriert in Echtzeit Realbild- und Skelettdaten. Benutzer können Kleidungsstücke aus verschiedenen Kategorien durch „Berührung“ virtueller Kontrollelemente auswählen,

die mit Hilfe von Skelettdaten an den Benutzer angepasst und superpositioniert über dem Real-Bild dargestellt. Hierbei ist auch die Aufnahme von Fotos dieser „virtuellen Modeschau“ möglich. Die Selektion der virtuellen Kontrollelemente, die über den Bilddaten des Sensors dargestellt werden, erfolgt durch ein nachfolgend erläutertes Pointer Mapping auf der Basis von Skelettdaten der Hände des Benutzers. [Abb. 1] 4. Interaktionskonzepte mit Kinect Im Folgenden werden räumlich-gestische Interaktionskonzepte beschrieben, welche sich mit Hilfe des Kinect Sensors und der zuvor angeführten Frameworks umsetzen lassen. Die Ansätze werden anhand der realisierten Lösungen zu KINOTE, SENSE TV und SNOWHITE verdeutlicht und um zusätzliche theoretische Betrachtungen ergänzt.

Abb. 1. SNOWHITE, Augmented Reality Kleideranprobe auf Skelettdatenbasis

95


4.1. Realisierung räumlicher Gesten

anschließend können diese mit einer PushGeste ausgewählt werden. [Abb. 2]

Räumliche Gesten im eigentlichen Sinne stellen das wohl am stärksten mit Kinect assoziierte Interaktionskonzept dar. Bei räumlichen Gesten handelte es sich wohldefinierte Bewegungen von einer bzw. beiden Händen eines Benutzers. Die Frameworks OpenNI und NITE verfügen über eine Anzahl von vordefinierten Gesten: –– Die transversale Wave-Geste, eine Winkbewegung der Hand, wurde bei den oben skizzierten Anwendungen zum Verlassen der jeweiligen App als eine Art „Goodbye“-Geste eingesetzt. –– Swipes sind transversale (rechts/ links) oder longitudinale (oben/unten) Wischgesten, ähnlich ihren Verwandten aus 2D Touch Systemen. Swipes eignen sich zum Wechseln zwischen einzelnen Sichten und wurde zum Vor- bzw. Zurückblättern von Folien bei KINOTE verwendet. –– Push, eine sagittale (nach vorne/ hinten), drückende Vorwärtsbewegung der Hand wurde zum Selektieren von Elementen – etwa beim Auswählen von Menüelementen genutzt. –– Steady, ein ruhiges Halten der Hand. –– Die Circle Geste, einer Kreisbewegung der Hand

Gesten werden im NITE Framework durch eine proprietäre Mustererkennung realisiert. Sie sind grundsätzlich nur von einer als Primärpunkt registrierten Hand eines einzelnen Benutzers ausgeführt werden. In der beschriebenen Anwendung wurde während der Kalibrierung eine Wave-Geste benutzt, um den Primärpunkt auf der ausführenden Hand zu registrieren.

Neben den zuvor beschriebenen „offenen“ Gesten, existieren im Framework NITE noch zwei „geschlossene“ Gesten, die sogenannte false-positives für bestimmte Anwendungsfälle erheblich reduzieren können. Unter einem false-positive versteht man die nicht-intentionale Auslösung einer Geste im Sinne einer Fehlinterpretation einer Benutzerbewegung durch das System. Bei den „geschlossenen“ Gesten handelt es sich um ein- und zweidimensionalen Slider mit jeweils N oder NxN Elementen. Solche Slider bieten sich insbesondere zur Realisierung von Menüs an und wurden beispielsweise für den oben angesprochenen Auswahlscreen (vgl. Abbildung 2) zum Starten einer App eingesetzt. Elemente des Startscreens werden durch Handbewegungen vorselektiert und in einen Hover-Zustand versetzt,

96

Zur Realisierung einer möglichst „natürlichen“ Interaktion sollten räumliche Gesten zur Interaktion mit einem User Interface möglichst ikonisch im Sinne eines nachvollziehbaren Mappings auf reale physische Gesten eingesetzt werden. In diesem Sinne bilden etwa Swipe-Gesten eine Blättern in einem Katalog oder ein manuelles Wechsel von Folien angemessen ab.

Abb. 2. Gestengesteuerter 2x2 Slider des Hauptmenüs

4.1.1. Intentionale vs. nicht-intentionale Gesten Als Herausforderung bei der Realisierung der skizzierten Apps stellte sich die zuverlässige Diskriminierung zwischen intentionalen- und nicht-intentionalen Gesten heraus. Räumliche Gesten verfügen über keinen physischen „Schalter“ der diese aktiviert oder deaktiviert. Bei touchbasierten Interfaces stellt der physische Kontakt mit einem virtuellen Control dieses Schalterelement dar – räumliche Gesten erweisen sich indes als in diesem Sinne immer aktiv(ierend). Zur Erläuterung kann die robuste Identifikation einer Swipe-Geste dienen, die als gleichförmige transversale oder longitudinale Bewegung definiert ist. Ohne die Berücksichtigung einschränkender


Usability Professionals 2011 Natural User Interfaces (NUI)

Bedingungen ließe sich KINOTE kaum nutzen ohne fortlaufend unabsichtlich zwischen Folien hin und her zu springen. Was geschieht wenn eine Benutzerin nach einem Swipe nach links (zum Blättern auf die nächste Folie) ihre Hand nach rechts zurück in eine Ruhestellung bewegt? Wie kann die Bewegung in die Ruhestellung von einem Swipe nach rechts, der ein ungewolltes Rückblättern auslösen könnte, unterschieden werden? Sollte hierbei eine „Ruhezeit“ zwischen zwei Gesten definiert werden? Zur robusten Diskriminierung zwischen intentionalen und nicht-intentionalen Gesten können beispielsweise folgende Restriktionen eingeführt werden: –– Definition eines Zeitfensters innerhalb dessen die Bewegung der SwipeGeste von Beginn zu deren Abschluss erfolgen muss. –– Definition einer maximalen Winkelabweichung aus der Bewegungsachse heraus. –– Definition einer Mindest- und Maximalgeschwindigkeit für die Durchführung einer Bewegung. Bereits einfache räumliche Gesten bringen hierbei jedoch eine überraschende Komplexität mit sich, die einer allgemeinen Festlegung von statischen Parametern der Handbewegung entgegen stehen und den Einbezug weiterer Benutzerdaten wie dessen Körperhaltung oder auch die Einführung von virtuellen Schalterkonzepten zur zuverlässigen Gestenerkennung nahe legen. Neben der Feinabstimmung der Parameter elementarer Gesten wurden im Zuge der Entwicklungsarbeiten daher zusätzliche folgende Mechanismen analysiert: –– Definition von reservierten Gesten als Trigger: Die jeweilige Anwendung verbleibt in einem Ruhezustand bis zur Auslösung einer solchen Trigger-Geste, erst nach Aktivierung erfolgt eine Auswertung von Steuerungsgesten. Wird über einen definierten Zeitraum keine Geste identifiziert, oder der Benutzer als nicht aktiv oder gar abwesend erkannt (siehe Abschnitt

User Sensing), geht das System in einen Ruhezustand zurück. –– Einbezug des räumlichen Kontextes: Gesten können nur in einem definierten virtuellen Raum vor dem Benutzer ausgeführt werden. Als Beispiel kann hier die Festlegung einer virtuellen Ebene in einer festgelegten räumlichen Ausdehnung vor dem Benutzer genannt werden. Diese Ebene muss zur Ausführung von Gesten mit den Händen durchstoßen werden. Zur Realisierung dieses Konzeptes ist ein alleiniges Tracking von Handkoordinaten nicht mehr hinreichend, vielmehr muss der Torso eines Benutzers zur Berechnung der Ebene erfasst werden. Die darüber hinausgehende Kombination von räumlichen Gesten mit nichtspatialen Hand- oder Fingergesten wurde im Rahmen der bisherigen Arbeiten zur Anwendungsentwicklung nicht betrachtet, da diese mit den genutzten Frameworks nicht oder nur mit sehr weitgehenden Erweiterungen realisierbar wären. So böte beispielsweise die von Wigdor und Wixton (2011) vorgeschlagene Pinch-Geste einen angemessenen Ausgangspunkt zur Abgrenzung von nicht-intentionalen Gesten. Dabei wird die durchzuführende Interpretation als Geste durch ein Zusammendrücken der Fingerspitzen während der Ausführung der selbigen jeweils explizit signalisiert. Ähnlich zeigt die Arbeit von Gawron, Głomb, Miszcza und Puchała (2011), wie Fingergesten algorithmisch mit Hilfe von Eigenvektoren aus den Daten eines Datenhandschuhen rekonstruiert werden können. Segers und Connan (2009) zeigt hohe Erkennungsraten für eine Auswertung von statischen Gesten auf Basis von 2D Bilddaten, jedoch unter Einschränkung auf eine Betrachtungsrichtung. Grundsätzlich steigt die Wahrscheinlichkeit einer nichtintentionalen Auslösung mit der Anzahl zu einem Zeitpunkt prinzipiell verfügbaren Gesten (false positives), was eine Limitierung der zu betrachtenden Interaktionsgesten nahe legt. Die falsenegatives lassen sich beispielsweise durch den Einsatz virtuellen Affordances und

eines aussagekräftigen visuellen Feedbacks reduzieren. Bei der vorgestellten Applikation wurden daher Icons eingesetzt um entsprechende Interaktionsgesten zu signalisieren. 4.2. Pointer Mapping Neben den oben angeführten komplexeren Algorithmen der spatialen Gestenerkennung lassen sich auch Konzepte realisieren, die auf dem direkten Einbezug der Handkoordinaten beruhen. So lassen sich bei dem sogenannten Pointer Mapping die Koordinaten einer oder beider Hände auf Bildschirmkoordinaten übertragen und z. B. als virtueller Cursor interpretieren. Diese Zuordnung sollte von lokalen Koordinaten eines dynamischen Handkoordinatensystems auf Bildschirm- oder UI-Koordinaten erfolgen. Hierzu werden Benutzer in einem virtuellen Koordinatensystem platziert, das sich mit ihnen durch den realen Raum bewegt. Für das Auslösen von Aktionen mit Hilfe solcher virtueller Cursor sind verschiedene Ansätze denkbar: –– Eine verlässliche Methode ist das sogenannte Hovering mit sich „aufladenden“ Controls. Der Benutzer hält hierbei den (virtuellen) Cursor für eine definierte Zeit über ein User Interface Control. Das UI Control lädt sich dann für die Dauer der Platzierung des Cursor über dem Element auf, bis schließlich eine Auslösung erfolgt. Die Aufladung sollte jeweils auf den Elementen visualisiert werden um Benutzern ein angemessenes Feedback zu geben. –– Eine weitere Möglichkeit zur Auslösung einer Aktion stellen räumliche Gesten dar. Als Beispiel kann eine Push-Geste angeführt werden, die durch eine Vorwärtsbewegung der Hand – als Durchbrechen der zweidimensionalen Ebene – repräsentiert wird. –– Ebenso sind multimodale Konzepte denkbar. Bei Verwendung des Kinect Sensors bieten sich hierzu Sprachkommandos an, die sich jeweils

97


auf Elemente unter dem virtuellen Cursor beziehen. Die zuvor beschriebenen Konzepte machen es notwendig, Interface Controls für das Pointer Mapping relativ groß anzulegen um eine hohe Verlässlichkeit zu erreichen, da die Präzision von Handbewegungen im freien Raum stark eingeschränkt ist und sensorbedingte Toleranzen zu berücksichtigen sind. 4.3. Skeleton Tracking Während das Pointer Mapping eine zweidimensionale Projektion der Hände darstellt, beschreibt das Skeleton Tracking eine dreidimensionale Interaktion unter Rückgriff auf den Körper des Benutzers. Mit dem Kinect Sensor und den Frameworks OpenNI und NITE ist in diesem Sinne eine

Abb. 3. Einblendung von Zusatzinhalten in SENSE-TV

98

Variante des Echtzeit Motion Capturing von Benutzern möglich. Die betrachteten Frameworks gestatten die (rudimentäre) Rekonstruktion der Skelettstruktur eines Benutzers in Form von 15 repräsentativen Punkten, den sogenannten Joints. Position und Orientierung von Kopf, Nacken, Torso Mittelpunkt, Schultern, Hüfte, Hände, Ellenbogen, Knie und Füßen stehen damit für weiterführende Auswertungen zur Verfügung. Voraussetzung des Skeleton Tracking ist jedoch eine Kalibrierung auf einen Benutzer. Hierdurch ist zum Beispiel die direkte Steuerung von virtuellen Charakteren realisierbar. Ebenso ist die Anpassung von virtuellen Elementen an die Statur des Benutzers möglich, wie dies im virtuellen Spiegel SNOWHITE realisiert wurde. Mit dem Skeleton Tracking stehen sowohl weitergehende Möglichkeit zur Realisierung komplexerer Gesten, als auch

Ansätze zur Unterscheidung zwischen intentionalen und nicht-intentionalen Gesten zur Verfügung. So können neben den Händen auch die Körperhaltung, Position und Orientierung des Benutzers im Raum analysiert werden. Im Rahmen der umgesetzten Apps wurde hierauf aufbauend eine komplexe zweihändige „Zoom“Geste auf Skelettbasis realisiert. Hierzu werden beide Hände im freien Raum voneinander entfernt oder aufeinander zu bewegt. Das Schalterelement stellt hierbei die Stellung der Arme in Relation zum Körper des Benutzers dar. Wird eine Hand gesenkt und die führende Hand weiter vor dem Körper gehalten, kann von einem Zoom- in einen Panning-Modus gewechselt werden. Auf diese Weise erlaubt beispielsweise KINOTE die Verschiebung des Bildausschnittes einer Folie durch die Bewegungen der führenden Hand.


Usability Professionals 2011 Natural User Interfaces (NUI)

Werden die zuvor vorgestellten Konzepte des Skeleton Trackings und des Pointer Mappings mit Bilddaten der Realität kombiniert, so lassen sich weitere Interaktionskonzepte erschließen. 4.4. Augmented Reality Durch die Kombination von realen Bilddaten des Sensors mit den rekonstruierten Benutzer- und Skelettdaten aus den Frameworks werden benutzerzentrierte Anwendungen der erweiterten Realität realisierbar. Im Gegensatz zum Pointer Mapping, wird hierbei in der Regel kein lokales Koordinatensystem verwendet, sondern eine zweidimensionale Projektion von Raum- auf Bildkoordinaten durchgeführt. Konzeptuell wurde dies in SNOWHITE durch eine Kombination des Pointer Mappings und Skeleton Trackings realisiert, bei welchem die Hände des Benutzers virtuelle Cursor in der zweidimensionalen Projektion darstellen.

des Sensors bewegende Benutzer durch das Framework leicht erfassbar. SENSE TV reagiert auf die Abwesenheit von Benutzern durch Pausieren und blendet distanzabhängig Zusatzinformationen zu laufenden Filmen ein. [Abb. 3] 5. Ausblick Mit dem Kinect Sensor steht eine äußerst kostengünstige technische Grundlage zur Realisierung von Natural User Interfaces auf der Basis räumlich-gestischer Interaktionskonzepte zur Verfügung. Die im Rahmen dieses Beitrags vorgestellten Apps und die darin explorierten Interaktionsmechanismen geben einen ersten Einblick in die Möglichkeiten und Herausforderungen von Natural User Interfaces auf Basis von Kinect und können als Ausgangspunkt zur Entwicklung robuster räumlicher Interaktionsgesten gesehen werden. Literatur 1. Gawron, P., Głomb, P., Miszczak, J. P. &

Hierbei lassen sich virtuelle Controls im Bild anlegen, welche z. B. durch „Berührung“ mit der Hand – ggf. kombiniert mit einer Push-Geste oder dem Prinzip der Aufladung – aktiviert werden. Für die Positionierung der Controls oder anderer interaktiver Elemente kann zwischen einer festen Positionierung im Bild oder einer an den Benutzer angepassten Positionierung unterschieden werden. Im virtuellen Spiegel SNOWHITE wurden die Controls zur Auswahl von Kleidungsstücken fest positioniert, entsprechend ist auch die Position des Benutzers zur deren Bedienung im Raum festgelegt.

Puchała, Z. (2011). Eigengestures for natural human computer interface. arXiv:1105.1293v1 2. Segers, V. & Connan, J. (2009). Real-time gesture recognition using eigenvectors. Proc. Southern Africa Telecommunication Networks and Applications Conference (SATNAC 2009). 363-366. Swaziland 3. Widgor, D., Wixon, D. (2011). Brave NUI World: Designing Natural User Interfaces for Touch and Gesture. Burlington: Morgan Kaufmann

4.5. User Sensing Bei SENSE TV wurde die Identifikation anwesender Benutzer in das Interaktionskonzept einbezogen, sowie deren Position im Raum als Interaktionsvariante erschlossen. Für ein einfaches User Sensing ist im Vergleich zum Skeleton Tracking keine Kalibrierung notwendig. Bewegungszentrum und Benutzerumriss sind für sich in den Erfassungsbereich

99


146

Positive User Experience durch natürliche Interaktion Systematische Anwendung von Interaktionspatterns bei der Entwicklung eines Multi-Touch-Prototyps zur Modellierung von Workflows Kerstin Klöckner Fraunhofer IESE Fraunhofer Platz 1 67663 Kaiserslautern kerstin.kloeckner@iese.fraunhofer.de

Claudia Nass Fraunhofer IESE Fraunhofer Platz 1 67663 Kaiserslautern claudia.nass@iese.fraunhofer.de

Rudolf Klein a3 systems GmbH Saarbrücker Straße 51 66130 Saarbrücken rudolf.klein@a3systems.com

Abstract Viele Neueder Interaktionsgeräte, Interaktionsgeräte, die die beispielsweise in jüngster Zeit überauf eine den berührungsempfindliche Markt gekommen sind, Obersind gestenfläche (Touchscreen) und touchbasiert. bedient Diese werden, auf neuen bietenTechnologien Möglichkeiten, basierenden auch im beruflichen Interaktionsformen Alltag werden eingesetzt häufig zu werden. auch alsAber natürliche welcheInteraktion Interaktionskonzepte bezeichnet. sind Maussinnvoll? und Tastatur Eignen haben sich solche als Eingabegeräte Interaktionsgeräte Konkurrenz dazu, effizient bekommen. im Arbeitsalltag Als prominente genutzt Vorreiter zu werden? sind hier Und die lässtaktuellen sich Smartphones damit die Usersowie Experience Microsoft steigern? Surface zu nennen. Damit hat sich auch der Gestaltungsraum In diesem für Interaktionsdesigner Beitrag beschreibenerweitert. wir den systematischen Die KonzeptionEinsatz von Steuerungsgesten von Interaktionspatterns kommt als bei neue der Entwicklung Dimension hinzu. eines Software-Prototyps. Den damit verbundenen Dieser Herausforderungen Prototyp basiert auf widmet einer Applikasich unser tion, die Tutorial. von Mitarbeitern Wir zeigen die in einem Bandbreite Call Center neuergenutzt Interaktionsmöglichkeiten wird, um Problemlösungsschritte auf und probieren zu modellieren. gemeinsam Er wird mit den mit Ausnahme Teilnehmern von eine Texteingaben Methode zur ausschließlich Gestaltung von pergestenTouch-Gesten und touchbasierter bedient. In einer Interaktion zweistufigen aus.Studie mit Endanwendern wurde der Prototyp bezüglich Attraktivität, hedonischer und pragmatischer Qualitäten im Vergleich zur bisherigen Applikation untersucht. Außerdem wurde die Qualität der Interaktion erhoben und die Zeit zur Erledigung einer typischen Aufgabe gemessen. Es konnte gezeigt werden, dass der Prototyp eine ernsthafte Alternative im Arbeitsalltag darstellt, wenn die Gesten mit der auszuführenden Aktion zusammenpassen. Dieser Beitrag stellt die Entwicklung des Prototyps unter Einbeziehung von Interaktionspatterns vor und beschreibt die Ergebnisse der Studie.

1. Einleitung Neue, mit natürlichen Interaktionsformen (NI) wie beispielsweise Berührung oder Gesten zu bedienende Geräte, bieten die Möglichkeit, auch im beruflichen Alltag eingesetzt zu werden. Aber welche Interaktionskonzepte sind sinnvoll? Eignen sich solche Interaktionsgeräte dazu, effizient im Arbeitsalltag genutzt zu werden? Und lässt sich damit die User Experience (UX) steigern? Dieser Fragestellung widmete sich das Forschungsprojekt FUN-NI [FUN-NI], das sich mit der Identifikation, Evaluation und Generalisierung von Software-Interaktionskonzepten – sog. Patterns – für natürliche Interaktion (NI-Patterns) beschäftigte. In den folgenden Kapiteln wird das Arbeitsmodell der User Experience für

100

natürliche Interaktion (Kapitel1.1) sowie der Pattern-basierte Software-Entwicklungsansatz (Kapitel 1.2) beschrieben. Kapitel 2 detailliert die Fallstudie mit der Konzeption, Implementierung und Evaluation des Prototyps. Kapitel 3 schließt mit einer Diskussion der Ergebnisse. 1.1. User Experience für natürliche Interaktion Beginnen wir mit der Klärung der Frage, was User Experience (UX) im Kontext von natürlicher Interaktion bedeutet. Das dem Projekt zugrunde liegende UX-Modell baut auf Kaptelinins dreistufiger Aktivitätstheorie [Kaptelinin] auf, wonach Aktivitäten hierarchisch angeordnet sind (Tätigkeiten – Handlungen – Operationen) und immer sowohl ein Subjekt und Objekt als auch die damit verbundene Aktion und Reaktion umfassen.

Hartmut Schmitt a3 systems GmbH Saarbrücker Straße 51 66130 Saarbrücken hartmut.schmitt@a3systems.com

Keywords: /// user experience /// patterns /// natural interaction /// multi-touch

Übertragen auf User Experience lassen sich drei aufeinander aufbauende Ebenen von UX unterscheiden: die Ebenen des WARUM, WAS und WIE (s. Abbildung 1): Die WARUM-Ebene beschäftigt sich mit den Bedürfnissen, die einer Tätigkeit oder Aufgabenausführung zugrunde liegen und die Tätigkeit auslösen. Die WAS-Ebene bezieht sich auf die konkrete Handlung zur Ausführung der Aufgabe, bei der ein Produkt (z. B. eine Software) benutzt wird. Die WIE-Ebene befasst sich mit der Operation, also der konkreten Art und Weise, wie eine Interaktion ausgeführt wird [Hassenzahl10]. Abbildung 1 verdeutlicht die drei Ebenen anhand der Handlung „Eine Freundin anrufen“. [Abb. 1] Diese Einteilung verdeutlicht, dass gerade bei natürlicher Interaktion die unterste Ebene, auf der die Art und Weise der Interaktion definiert werden kann, also die


Usability Professionals 2011 Natural User Interfaces (NUI)

2. Case Study / Prototyp Als Anwendungsfall für unseren Ansatz diente das Redesign des Software-Systems „Graphical Knowledge Editor“ (GKE), das im Call Center von sogenannten Autoren genutzt wird, um Problemlösungsschritte (Troubleshoots) zu modellieren. Eine typische Aufgabe besteht darin, neue Prozesse aus bestehenden Prozessbausteinen zu konstruieren.

Abb. 1. Arbeitsmodell der User Experience (links) mit Beispiel (rechts)

WIE-Ebene, von zentraler Bedeutung ist. Daher steht im Rahmen dieser Arbeit die Beeinflussung und Messung der UX auf der WIE-Ebene im Fokus. Neue (natürliche) Eingabemethoden wie Touch oder Gesten ermöglichen es Designern, Interaktionen detaillierter zu gestalten und zu spezifizieren als bisher und dadurch das Erleben des Benutzers zu beeinflussen: Objekte lassen sich nicht mehr einfach nur per Mausklick steuern – sie können angetippt, verschoben, vergrößert, gedreht, etc. werden. Diese Aktionen können mit unterschiedlichen Qualitätsausprägungen erfolgen, nämlich schnell oder langsam, präzise, kraftvoll, etc. Dies bringt natürlich auch neue Herausforderungen mit sich bezüglich der konkreten Ausgestaltung der Interaktion, denn natürliche Interaktionsformen ermöglichen es, Aktionen auf unterschiedliche Art und Weise auszuführen, wie das vorherige Beispiel verdeutlicht hat. Dies bietet dem Interaktionsdesigner eine Fülle an Möglichkeiten, überfordert den unerfahrenen Designer aber in gleichem Maße. Denn nur eine Passung von Geste zur auszuführenden Aufgabe führt zu einer positiven User Experience. Der Lösungsansatz, der im Rahmen des Projekts verfolgt wird, basiert auf der Identifikation, Evaluation und Dokumentation bzw. Wiederverwendung bereits etablierter NI-Patterns (siehe Kapitel 1.2), welche die

Geste in Zusammenhang mit einer Aktion und der System-Reaktion beschreiben. 1.2. Patterns Patterns als konstruktiver Lösungsansatz haben sich in den verschiedenen Phasen der Software-Entwicklung bewährt, beispielsweise in der Software-Architektur [Gamma], im User Interface Design [Welie, Tidwell], zur Steigerung der User Experience [Klöckner et al.], aber auch zur Beschreibung von Erfahrungen [Hassenzahl10]. Aktuell existieren bereits NI-Patterns, die sich allerdings auf unterschiedlichen Beschreibungsniveaus befinden: So wird einerseits die reine Ausführung einer Geste beschrieben (z. B. „flick: Press, slide quickly, and then release“ [Microsoft]), andere beschreiben die Verknüpfung von Geste und Aufgabe (z. B. „tap to open“ [Saffer]). Unser Ansatz basiert darauf, dass NI-Patterns nur dann sinnvoll im konstruktiven Software-Engineering eingesetzt werden können, wenn sie a) in Kombination mit der Aufgabe oder elementaren Aktion, die der Benutzer ausführt, dargestellt werden und b) angemessen dokumentiert werden, um von anderen Interaktionsdesignern wiederverwendet werden zu können. Im nächsten Kapitel beschreiben wir die Entwicklung eines Prototyps unter Einsatz von NI-Patterns.

Als neues Interaktionsgerät wurde ein Multi-Touch-PC gewählt, denn er verbindet die Möglichkeit, Troubleshoots per TouchBedienung zu modellieren, aber auch andere Aufgaben wie beispielsweise längere Texteingaben weiterhin bequem per Tastatur zu tätigen. Das Modellieren der Troubleshoots in einem grafischen Editor wurde als besonders geeignet zur Ausführung mit Touch bewertet, denn es bietet viele Ansatzpunkte für die Verwendung von NI-Patterns. Weiterhin ermöglicht es dem Interaktionsdesigner, sowohl die Aktion des Benutzers als auch die Reaktion des Systems auszugestalten. Im Folgenden wird die Anforderungserhebung, Konzeption und zweistufige Implementierung und Evaluation des Prototyps beschrieben. 2.1. Anforderung und Konzeption Das Redesign begann mit einer Anforderungserhebung, in welcher mit der Endnutzergruppe eine Benutzer-, Aufgaben- und Kontextanalyse durchgeführt und die Ergebnisse dokumentiert wurden. Darauf aufbauend wurden eine Persona und ein Szenario abgeleitet, sowie die vom neuen System zu unterstützenden Systemfunktionen identifiziert. Insgesamt wurden neun Systemfunktionen identifiziert, wie beispielsweise den Editor zur Modellierung zu öffnen oder Prozessbausteine zu suchen und zu verbinden. Basierend auf den Systemfunktionen wurden durch Interaktionsdesigner passende NI-Patterns identifiziert und ausgewählt. Eine Liste aller

101


Systemfunktion

Pattern

Enthalten in Prototyp

Information anlegen

tap to open

P1+P2

Editor öffnen

hold and slide to open

P1+P2

Editor scrollen

two fingers to scroll slide to scroll fling to scroll

P2 P2 P2

Editor zoomen

Auszoomen: pinch to shrink P2 Einzoomen: spread to enlarge

PB suchen

tap to open/activate

P1+P2

PB übernehmen

drag to move object

P1+P2

PB verbinden

drag and drop to connect, hold and tap to connect

P1 P2

PB löschen

rub to delete

P2

PB verschieben

drag to move object

P1+P2

einem Format dokumentiert, welches insbesondere das Zusammenspiel von Benutzer-Aktion und System-Reaktion, das bei natürlicher Interaktion besonders wichtig ist, verdeutlicht und dadurch die Wiederverwendung erleichtert. Abbildung 3 zeigt einen Ausschnitt der Patternbeschreibung des NI-Patterns „hold and tap to connect“. Eine Übersicht über das Format und alle in diesem Format beschriebenen Patterns sind auf der Projektwebseite [FUN-NI] zu finden. [Abb. 3]

hold and tap to connect Was Das Pattern „hold and tap to connect“ bietet die Möglichkeit, zwei UI-Elemente in einer Touch-Bedienoberfläche miteinander zu verbinden.

Tab. 1. Zuordnung Systemfunktionen zu NI-Patterns

Wie

Die neu identifizierten Gesten “hold and slide to open”, “hold and tap to connect” und “rub to delete“ dienen dazu, die verschiedenen Bereiche des GKE zu öffnen (vgl. Abbildung 2 links), Prozessbausteine miteinander zu verbinden (vgl. Abbildung 2 Mitte) und Prozessbausteine zu löschen (vgl. Abbildung 2 rechts) . [Abb. 2]

und der Reaktion des Systems, wurde unter Zuhilfenahme von DESIGNi spezifiziert, einer Workbench, welche den Interaktionsdesigner systematisch bei der Konzeption und Spezifikation von Interaktionsformen unterstützt [Nass et al.]. In diese integriert ist ein Interaktionsvokabular, das dazu benutzt werden kann, um die Qualität von Interaktionen zu beschreiben und zu differenzieren [Diefenbach et al]. Es umfasst elf Dimensionen in Form von gegensätzlichen Adjektivpaaren, mithilfe derer grundlegende Eigenschaften von Interaktion beschrieben werden können. Basierend auf dem Interaktionsvokabular können die vom Nutzer wahrgenommenen Interaktionseigenschaften in Form eines Fragebogens erfasst werden. Im Rahmen dieser Studie wurde es sowohl konstruktiv als auch evaluativ (vgl. Kapitel 2.2) eingesetzt. Das visuelle Design des Prototyps wurde mithilfe von Microsoft Expression Studio erstellt.

Die konkrete Mensch-System-Interaktion, bestehend aus der Aktion des Benutzers

Im Anschluss an die Implementierung (s. nächstes Kapitel) wurden die NI-Patterns in

Systemfunktionen und NI-Patterns ist in Tabelle 1 zu finden. [Tab. 1] Insgesamt wurden zwölf unterschiedliche Patterns in den Prototyp integriert (s. Tabelle 1, mittlere Spalte), wobei drei davon neue Patterns sind, die im Rahmen des Projekts konzipiert wurden (diese sind kursiv markiert). Die restlichen Patterns entstammen bereits bekannten und bewährten Gesten wie beispielsweise „spread to enlarge“ zum Vergrößern oder „tap to open“ zum Öffnen von Elementen.

Abb. 2. Neu konzipierte Gesten “hold and slide to open” (links), “hold and tap to connect” (Mitte) und „rub to delete“ (rechts)

102

Aktion des Benutzers Der Benutzer berührt das erste UI-Element (Ursprungselement) mit der Fingerspitze bzw. mit dem Fingerballen eines einzelnen Fingers. Er behält die Position dieses Fingers bei und tippt mit einem anderen Finger ein zweites UI-Element (Zielelement) an. Hat der Benutzer beide UI-Elemente berührt, so lässt er die Bildschirmoberfläche wieder los. Reaktion des Systems Das System stellt, sobald der Benutzer das Zielelement angetippt hat, eine Verbindung zwischen beiden UI-Elementen her. Was muss bei der Gestaltung der Interaktion beachtet werden? Der Benutzer sollte die Aktion mit den Fingerspitzen oder Fingerballen einer Hand (z.B. Daumen und Zeigefinger) oder beider Hände (z.B. Zeigefinger der linken und der rechten Hand) ausführen können. Abb. 3. Auszug aus der Patternbeschreibung „hold and tap to connect“.


Usability Professionals 2011 Natural User Interfaces (NUI)

2.2. Implementierung und Evaluation Die Implementierung des Multi-TouchPrototyps erfolgte unter Windows 7 auf der Silverlight-Technologie und Microsoft Expression Blend 3. Als Interaktionsgerät wurde ein Acer Aspire Z5600 PC benutzt. [Abb. 4] Ziel war es, alle zehn spezifizierten NIPatterns zu implementieren. Aufgrund von technischen Schwierigkeiten, der fremden Implementierungsumgebung und vor allem der allerersten Erfahrung mit der Implementierung von Gesten konnte in der ersten Stufe nur eine Teilmenge der vorgesehenen Patterns implementiert werden. Ebenso konnte die zum Verbinden von Prozessbausteinen vorgesehene MultiTouch-Geste nicht in der vorgesehen Form („hold and tap to connect“) implementiert werden. Da es sich dabei um eine essentielle Systemfunktion handelt, wurde die Geste vom Programmierer dahingehend geändert, dass Prozessbausteine per „drag and drop to connect“ verbunden werden, also dem Aufeinanderschieben von Ursprungs- auf Zielelement, wobei eine gerichtete Verbindung vom Ursprungszum Zielelement hergestellt wird. Die in der ersten Stufe implementierten Patterns sind mit „P1“ in Tabelle 1, rechte Spalte, gekennzeichnet. Dieser Prototyp wurde in einer Feldstudie mit der Endbenutzergruppe evaluiert (mehr dazu im nächsten Kapitel „Evaluationsdesign“). Aufgrund des vielversprechenden und positiven Feedbacks der Autoren während der ersten Evaluierung wurde beschlossen, den Prototyp weiterzuentwickeln. Diese Weiterentwicklung sollte zum einen die Behebung von Störungen umfassen, zum anderen sollten diejenigen Patterns ergänzt werden, die in der ersten Version nicht oder nur modifiziert umgesetzt werden konnten. Bezogen auf die modifizierte Geste zum Verbinden von Prozessbausteinen zeigten die Evaluationsergebnisse, dass die Benutzer mit dieser Geste Schwierigkeiten hatten. Zum einen, weil es beim Ausführen häufig zu Kollisionen mit anderen Elementen kam, zum

Abb. 4. Interaktion mit dem Multi-Touch-Prototyp, z. B. Vergrößern des Bildschirminhalts mit „spread to enlarge“ (rechts)

anderen, weil es nicht intuitiv klar war, in welcher Richtung die gerichtete Verbindung hergestellt wird. Dies wurde in der zweiten Implementierungsstufe behoben, indem die ursprünglich spezifizierte Geste implementiert wurde. 2.2.1. Evaluationsdesign In diesem Kapitel ist das Evaluationsdesign der zweistufigen Evaluation beschrieben. Im ersten Schritt wurde der erste Prototyp, in dem eine Teilmenge der Patterns umgesetzt wurde (P1), gegen den mit Maus und Tastatur zu bedienenden GKE evaluiert. Dabei mussten die Teilnehmer eine typische Aufgabe zuerst mit dem mit Maus und Tastatur zu bedienenden GKE und danach mit dem Prototyp erledigen. Im zweiten Schritt wurde der erweiterte Prototyp (P2) evaluiert und die Ergebnisse mit P1 vergleichen. In beiden Evaluationen wurden die Applikationen in einer Fallstudie mit Teilnehmern aus der Zielgruppe der Autoren evaluiert in Hinblick auf Attraktivität, hedonische und pragmatische Qualitäten (erhoben mit dem AttrakDiff [Hassenzahl03]). Weiterhin wurde die Zeit zur Erledigung einer typischen Aufgabe gemessen und die Interaktionseigenschaften mit Hilfe des Interaktionsvokabulars erhoben. Diese Wahrnehmung der Teilnehmer wurde mit der Spezifikation des Interaktionsdesigners verglichen.

2.2.2. Ergebnisse der ersten Evaluationsstufe An der Studie nahmen zwölf Personen teil (1w, 11m). Das Durchschnittsalter belief sich auf 36 Jahre (min=29 Jahre; max=43 Jahre), die durchschnittliche Erfahrung mit dem GKE auf vier Jahre (min=3 Jahre; max=5 Jahre). Die Ergebnisse legen nahe, dass der MultiTouch-Prototyp eine ernsthafte Alternative zum bisherigen GKE darstellt (allerdings muss hierbei berücksichtigt werden, dass es sich um eine Studie mit relativ kleiner Teilnehmerzahl handelt): Beide Bedienformen schnitten hinsichtlich der pragmatischen Qualität gleichermaßen gut ab – der Bedienung mit Touch wurde aber ein höheres Ausmaß an hedonischer Qualität zugeschrieben. Besonders bezüglich der Attraktivität ist die TouchAnwendung der Maus-Anwendung überlegen: Eine Analyse der Zusammenhänge zwischen globaler Bewertung (z. B. ATT) und dem wahrgenommenen Ausmaß an hedonischer Qualität (HQ) und pragmatischer Qualität (PQ) zeigte, dass die positive Bewertung von Touch stärker durch HQ (Korrelation zu ATT=.92) als durch PQ (Korrelation zu ATT=.52) bestimmt ist. Das wahrgenommene Ausmaß an pragmatischer Qualität war für beide Interaktionsformen auf ähnlichem Level, die hedonische Qualität der Bedienung mittels Touch (M=5,86) war jedoch signifikant höher

103


als die HQ der Bedienung mit der Maus (M=3,71; T=5,28, p<.001). Bei der Bearbeitung der Aufgabe mit P1 wurden geringe Zeiteinbußen gemessen – für die Bearbeitung der Aufgabe mit P1 mit Touch-Bedienung benötigten die Teilnehmer mit durchschnittlich 13,3 Minuten signifikant mehr Zeit als für die Bearbeitung in der gewohnten Arbeitsumgebung mit der Maus (9,58 Minuten; T=2,22, p=.048). Dies könnte darauf zurückzuführen sein, dass die Benutzer bereits über rund vier Jahre Bedienerfahrung mit dem GKE und über weitere Jahre allgemeine Mauserfahrung verfügten. Weiterhin ließ sich bei P1 eine stärkere Varianz der Bearbeitungszeiten feststellen. Manche Benutzer erledigten ihre Aufgabe sogar schneller als mit der Maus. Beim Vergleich zwischen der Spezifikation der NI-Patterns durch den Designer mit der Wahrnehmung der Interaktion durch die Probanden – beides wurde mithilfe des Interaktionsvokabulars beschrieben – konnte ein hohes Maß an Übereinstimmung festgestellt werden (Profilkorrelation r = .67). Dies legt nahe, dass die Gesten weitgehend so implementiert wurden, wie vom Interaktionsdesigner spezifiziert, und dass sie auch vom Benutzer so wahrgenommen wurden. Die Dimensionen mit geringer Übereinstimmung liefern wichtige Hinweise bezüglich des Verbesserungspotenzials. Da die Benutzer nicht jede Geste einzeln bewertet haben, sondern ihren Gesamteindruck abgegeben haben, wurde ein Vergleich der gemittelten Bewertungen der Benutzer mit der Spezifikation jeder Geste des Designers vorgenommen. Für die modifizierte Geste zum Verbinden von Prozessbausteinen „drag and drop to connect“ zeigt sich im Vergleich der spezifizierten Werte mit der Wahrnehmung der Teilnehmer eine starke Abweichung bezüglich der Dimensionen „offensichtlich – verdeckt“ (die Geste wurde als weitaus verdeckter wahrgenommen), „anspruchslos – aufmerksamkeitsbedürftig“ (die Geste wurde als weitaus aufmerksamkeitsbedürftiger wahrgenommen), und „ungefähr - präzise“ (die Aktion wurde

104

als weniger präzise wahrgenommen). Dies und die Kommentare der Teilnehmer legen nahe, dass Verbesserungspotenzial bei dieser Geste vorhanden ist. Dies ist nicht verwunderlich vor dem Hintergrund, dass der Designer eine ganz andere Geste spezifiziert hatte, welche aufgrund von technischen Problemen nicht in der Form implementiert werden konnte. Daher wurden im weiteren Verlauf der Implementierung die ursprünglich spezifizierte Geste sowie weitere Gesten, die in der ersten Implementierungsphase nicht umgesetzt werden konnten, implementiert und in der im Folgenden beschriebenen zweiten Evaluationsstufe evaluiert. 2.2.3. Ergebnisse der zweiten Evaluationsstufe An der zweiten Studie nahmen 14 Personen teil (1w, 13m). Das Durchschnittsalter belief sich auf 37 Jahre (min=30 Jahre, max=44 Jahre), die durchschnittliche Erfahrung mit dem GKE auf 4,6 Jahre (min=0 Jahre, max=5,5 Jahre). Die Ergebnisse unterscheiden sich kaum von den Ergebnissen der ersten Studie, die sechs Monate vorher stattfand: Die Zeit zur Erledigung der Aufgabe mit P2 belief sich auf durchschnittlich 12 Minuten (min=7 Min., max=20 Min.), d.h. schneller als bei P1, aber immer noch langsamer als mit der Maus. Bezüglich der Maße des AttrakDiff gab es keine signifikanten Unterschiede zwischen den Evaluationsergebnissen von P1 und P2: manche Werte sind z.T. geringfügig niedriger, andere z.T. geringfügig höher (z. B. ATT). Hinsichtlich des Vergleichs zwischen Spezifikation und Wahrnehmung der Interaktion mithilfe des Interaktionsvokabulars sind Näherungen an die Spezifikation hinsichtlich der Dimensionen „offensichtlich – verdeckt“, „anspruchslos – aufmerksamkeitsbedürftig“ und „ungefähr - präzise“ zu verzeichnen. Die von den Teilnehmern geäußerten Kommentare bestätigen die

Wichtigkeit dieser Geste: als entscheidender Aspekt für Intuitivität wurde das Verbinden der Prozessbausteine genannt. 3. Diskussion Dieser Beitrag zeigt, dass NI-Patterns im Rahmen der konstruktiven Softwareentwicklung eine Möglichkeit darstellen, um Softwareprodukte mit positiver User Experience herzustellen. Voraussetzung ist dabei, dass Gesten und Aktionen zusammenpassen müssen. Dies haben wir an einer Fallstudie gezeigt, in der eine Software zur Modellierung von Lösungsschritten unter Zuhilfenahme von NIPatterns neu gestaltet wurde und nun mit Multi-Touch-Technologie bedient werden kann. Die Ergebnisse einer vergleichenden Evaluation zwischen der per Maus und Tastatur zu bedienenden Software und des mit Multi-Touch zu bedienenden Prototyps legen nahe, dass der Prototyp eine ernsthafte Alternative zur bisherigen Software darstellt. Dies belegen sowohl die objektiven Ergebnisse als auch die offenen Kommentare seitens der Teilnehmer, aus denen hervorgeht, dass diese sich Touch als neue Bedienform auch wirklich vorstellen können: „Super Idee“, „Würde am liebsten gleich weiter damit arbeiten“. Insbesondere die Notwendigkeit der Passung von Geste zu Aktion konnte anhand der unterschiedlichen Umsetzung der Aktion „Prozessbausteine verbinden“ demonstriert werden. Speziell in Kontext dieses Prototyps ist noch die Frage zu klären, wie das TouchInterface im Arbeitsalltag genutzt werden kann. Vor allem die aufrechte Positionierung des berührungsempfindlichen Monitors macht das Bedienen auf Dauer anstrengend. Es gilt zu klären, ob eine liegende oder variable Positionierung des Monitors eine dauerhafte Lösung darstellt. Auch muss geklärt werden, ob es in Zukunft reine Touch-Arbeitsplätze geben wird, oder Touch als optionale Bedienform angesehen wird.


Usability Professionals 2011 Natural User Interfaces (NUI)

Die im Rahmen des Projekts identifizierten und benutzten NI-Patterns wurden dokumentiert und sind auf der Projektwebseite frei zugänglich. Somit erweitern sie bestehende Patternsammlungen und können von Interaktionsdesignern wiederverwendet werden.

8. Microsoft. (2009). Microsoft Surface User Experience Guidelines. Microsoft Corporation. 9. Nass, C., Klöckner, K., Diefenbach, S., Hassenzahl, M. (2010). DESIGNi – A Workbench for Supporting Interaction Design. In Proceedings of the NordiCHI 2010 Nordic Conference on Human-Computer

Danksagung Wir danken der Firma Telefónica Germany GmbH & Co. OHG, deren Mitarbeiter sich für die Studie zur Verfügung gestellt haben. Die Arbeiten wurden durch das vom BMBF geförderte Projekt FUN-NI finanziert (Förderkennzeichen: 01 IS 09007).

Interaction (747-750). 10. Saffer, D. (2008). Designing Gestural Interfaces. Sebastopol, CA: O‘Reilly. 11. Tidwell, J. (2005): Designing Interfaces. O’Reilly Media. http://designinginterfaces. com/; zuletzt besucht: 03.05.2011 12. van Welie, M. (2000). Hallvard Traetteberg. Interaction patterns in user interfaces. 7th

Literatur

Pattern Languages of Programs Conference.

1. Diefenbach, S., Hassenzahl, M., Klöckner,

Allerton Park Monticello, Illinois, USA.

K., Nass, C., Maier, A. (2010). Ein

http://www.welie.com/patterns/index.php;

Interaktionsvokabular: Dimensionen zur

zuletzt besucht: 03.05.2011

Beschreibung der Ästhetik von Interaktion. In H. Brau, S. Diefenbach, K. Göring, M. Peissner, K. Petrovic (Hrsg.): Usability Professionals 2010 (27-32). Stuttgart: German Chapter der Usability Professionals‘ Association e.V 2. http://fun-ni.org/?page_id=303, zuletzt besucht am 11.05.2011 3. Gamma, E. & Helm, R. (1995). Design Patterns: Elements of Reusable ObjectOriented Software, Addison-Wesley. 4. Hassenzahl, M., Burmester, M., Koller, F. (2003). AttrakDiff: Ein Fragebogen zur Messung wahrgenommener hedonischer und pragmatischer Qualität. In J. Ziegler & G. Szwillus (Hrsg.), Mensch & Computer 2003: Interaktion in Bewegung (187-196). Stuttgart, Leipzig: B.G. Teubner. 5. Hassenzahl, M. (2010). Experience Design: Technology for All the Right Reasons. Morgan & Claypool. 6. Kaptelinin, V. & Nardi, B. (2006). Acting With Technology. Activity Theory and Interaction Design. 7. Klöckner, K., Nass, C. (2009). “Veto”: Eine empirische Studie über die Steigerung der User Experience durch Autonomie. In: H. Brau, S. Diefenbach, M. Hassenzahl, K. Kohler, F. Koller, M. Peissner, K. Petrovic, M. Thielsch, D. Ullrich, D. Zimmermann (Hrsg): Usability Professionals 2009 (13-17). Stuttgart: Fraunhofer Verlag.

105


128

(Multi-)Touch me! Ergonomische Analyse von Fehlern bei Multitouch-Interaktionen

Christina König Institut für Arbeitswissenschaft Technische Universität Darmstadt Petersenstraße 30, 64287 Darmstadt koenig@iad.tu-darmstadt.de

Marko Seidel Fachbereich Maschinenbau Technische Universität Darmstadt Petersenstraße 30, 64287 Darmstadt marko.seidel@gmx.net

Andreas Röbig Institut für Arbeitswissenschaft Technische Universität Darmstadt Petersenstraße 30, 64287 Darmstadt roebig@iad.tu-darmstadt.de

Abstract Viele Touchscreens der Interaktionsgeräte, werden in immer diemehr in jüngster Anwendungsbereichen Zeit auf den Markt eingesetzt. gekommen Die sind, Interaktion sind gestenscheint einfach und touchbasiert. und intuitiv,Diese mit wenigen auf neuen Tipps, Technologien Wischs und basierenden DrehungenInteraktionsformen ist die Eingabe werden vollbracht, häufig insbesondere auch als natürliche bei Multitouch-Displays. Interaktion bezeichnet. Jedoch Maus birgt gerade und Tastatur die Multitouchhaben als Eingabegeräte Interaktion einige Konkurrenz Fallen fürbekommen. den Nutzer: Als Schnell prominente passieren Vorreiter Fehler sind und unerwünschte hier die aktuellen Smartphones Eingaben, Funktionen sowie Microsoft werden Surface aus Versehen zu nennen. ausgelöst. DamitFür hatsicherheitskritische sich auch der GestaltungsAnwenraum dungen fürkann Interaktionsdesigner das problematisch erweitert. sein, Eingabefehler Die Konzeption müssen von Steuerungsgesten vermieden werden.kommt Eine als Analyse neue möglicher DimensionUrsachen hinzu. Den vondamit Fehleingaben verbundenen könnte Herausforderungen dabei helfen, Systeme widmet besser sich zu unser gestalten Tutorial. und die WirEingabesicherheit zeigen die Bandbreite zu verbessern. neuer Interaktionsmöglichkeiten auf und probieren In einergemeinsam experimentellen mit den Studie Teilnehmern wurden daher eine Methode unterschiedliche zur Gestaltung Interaktionen von gestenauf einem und touchbasierter großformatigem Interaktion Multitouch-Display aus. durchgeführt und die entstehenden Eingabefehler analysiert. Durch Variation der Eingaben, der Nutzereigenschaften sowie der Umgebungsbedingungen konnten unterschiedliche Fehlerkennungen erzeugt werden. Der Beitrag beschreibt Vorgehen und wesentliche Ergebnisse dieser Studie und gibt Gestaltungshinweise für Multitouch-Displays in sicherheitskritischen Nutzungskontexten.

1. Einleitung Multitouch-Displays lassen sich einfach und intuitiv bedienen und werden immer häufiger in unterschiedlichen Anwendungsfeldern eingesetzt, z. B. bei Handys, Computern oder auch CNC-Steuerungen (u. a. Bollhoefer, Meyer & Witzsche, 2009). Eingaben erfolgen mit dem Finger, damit scheinen Maus und Tastatur überflüssig, und die Bedienung beansprucht nur minimale kognitive Ressourcen (vgl. Wickens und Hollands, 1999). Während bei SingleTouch-Screens nur jeweils ein Kontaktpunkt erkannt wird und die Interaktion daher häufig aus mehreren Schritten besteht, erkennen Multitouch-Displays nahezu natürliche Bewegungen der Hand: Das virtuelle Blatt Papier wird verschoben und gedreht, eine Liste nach unten oder oben gescrollt, … (vgl. Buxton & Myers, 1986). Häufig wird eine höhere Bedienleistung im Vergleich zu herkömmlichen Eingabegeräten angenommen (z. B. Kellerer, Eichinger, Sandl & Klingauf, 2009), vorteilhaft

106

insbesondere in sicherheits- und zeitkritischen Nutzungskontexten wie der Flugsicherung. Der Weg von einer innovativen Technologie zu einem einsatzfähigen grafischen Interface ist hier jedoch nicht einfach. Bediensicherheit spielt eine wesentliche Rolle, fehlerhafte Eingaben können ein Sicherheitsrisiko darstellen und sind nicht akzeptabel. Es muss sorgfältig untersucht werden, welche Fehleingaben möglich sind, und wie man sie durch eine geeignete Interface-Gestaltung vermeiden kann. Der vorliegende Beitrag stellt eine Studie vor, bei der unterschiedliche Fehleingaben auf einem Multitouch-Display provoziert und ihre Ursachen analysiert wurden. 2. Fehler bei Multitouch-Displays Touchscreens sind berührungsempfindliche Displays. Berührungen können auf unterschiedliche Weise erfasst werden (vgl. Abb. 1). Jede Technologie hat Vorund Nachteile, wie z. B. die Erfassung nur jeweils eines einzelnen Berührpunkts. Multitouch-Geräte (meist optische oder

Ralph Bruder Institut für Arbeitswissenschaft Technische Universität Darmstadt Petersenstraße 30, 64287 Darmstadt bruder@iad.tu-darmstadt.de

Keywords: /// Multitouch-Display /// sichere Interaktion /// Fehler /// experimentelle Studie /// Flugsicherung

kapazitive Systeme) erkennen dagegen mehr als einen Berührpunkt gleichzeitig (Schöning et al., 2008), so dass komplexere Gesten oder die Bedienung durch mehrere Personen möglich sind. [Abb. 1] Für Interface-Designer ist die Auswahl einer geeigneten Technologie abhängig vom Anwendungsfall wesentlich, da neben konstruktionsspezifischen Parametern (z. B. Bauvolumen) auch der Funktionsumfang (z. B. die Anzahl der zu erkennenden Berührpunkte) und mögliche Fehler variieren. Optische Systeme können beispielsweise die Form des eingebenden Objekts (Finger, Stift o. ä.) erkennen und so theoretisch zwischen einem Tipp mit dem Finger und dem unbeabsichtigten Abstützen des Handballes auf der Scheibe oder einem aus Versehen abgelegten Blatt Papier unterscheiden. 2.1. Technische Grundlagen Das für die Studie verwendete Multitouch-Gerät nutzt optische Verfahren zur


Usability Professionals 2011 Natural User Interfaces (NUI)

Detektion der Berührungspunkte und kann in zwei Modi betrieben werden: (Rear) Diffused Illumination (DI) und Frustrated Total Internal Reflection (FTIR). Diffused Illumination ist einfach umsetzbares und kostengünstiges Verfahren (Spath et al., 2010). Wesentliche Elemente sind neben einem bildgebenden Element (z. B. Beamer) eine infrarote (IR) Lichtquelle und eine Infrarot-Kamera, welche unter der Berühr- und Projektionsfläche angebracht werden. Die Lichtquellen sind so positioniert, dass sie die Projektionsfläche, welche in der Regel aus eine angerauten oder matten Acrylglasscheibe besteht, gleichmäßig ausleuchtet (vgl. Abb. 1, NUI Group, 2009). [Abb. 2] Nähert man sich nun mit einem Finger der Projektionsscheibe, so nimmt die Reflexion der Infrarot-Strahlung an dem Objekt zu. Berührpunkte erscheinen wesentlich heller als die Umgebung (vgl. Abb. 2, NUI Group, 2011) und können mittels Bilderkennung interpretiert werden. [Abb. 3] In der experimentellen Studie kam ein selbst gebauter 50-Zoll-Multitouch-Tisch im Diffused-Illumination-Modus zum Einsatz (Abb. 3), bestehend aus Beamer (1), Infrarotstrahler (2), Acrylglasplatte (3), Infrarot-Kamera (4), Computer (5) und Umlenkspiegel (6). [Abb. 4]

Abb. 1. Eigenschaften von Touchscreen-Technologien

Eingabepunkt) gewertet (Abbildung 4; links oben das ungefilterte IR-Kamerabild, rechts oben das gefilterte IR Kamerabild mit „Blobs“). [Abb. 5] 2.2. Interaktionsfehler

Mithilfe der Software „Community Core Vision 1.4“ (NUI Group, 2011) wurden erkannte IR-Reflexionen in Befehle umgerechnet. Filtereinstellungen in der Software ermöglichten die Anpassung des Aufbaus an die Umgebungsbedingungen, wie beispielsweise Streulicht oder andere Störfaktoren. Reflektierte Infrarotstrahlung wurde im Programm als weißer „Blob“ (erkannter

Beim Interagieren können dem Nutzer jedoch Fehler unterlaufen. Er zielt beispielsweise auf einem Punkt auf dem Display, trifft aber daneben aufgrund eines Parallaxe- oder Verdeckungsfehlers, rutscht ab oder setzt vor dem eigentlichen Eingabefeld mit einem anderen Finger auf und löst unfreiwillig eine andere Funktion aus. Beim Drag & Drop verliert er möglicherweise den Kontakt zur Displayoberfläche und unterbricht damit den

Abb. 2. Rear Diffused Illumination

Abb. 3. Reflexion der IR-Strahlung

Eingabevorgang vorzeitig. Auch Interaktionen wie Doppelklick können Nutzern schwerfallen, wenn sie nicht schnell genug tippen oder den Finger beim Aufsetzen leicht verschieben (womit sie dann ein Drag & Drop auslösen). Ein Fehler ist hier eine Abweichung vom gewünschten Handlungsziel (vgl. Badke-Schaub, Hofinger & Lauche, 2008). Er kann schon bei der Wahrnehmung der angezeigten Inhalte, aber vor allem in der Handlungsausführung entstehen. Typische Fehlerquellen bei MultitouchDisplays sind entweder in der verwendeten Technologie, in den Eigenschaften des Nutzers oder in der Gestaltung der Softwareoberfläche begründet: Hardware kann durch mangelnde Zuverlässigkeit oder nicht-ergonomische Bauweise zur Zielabweichung beitragen. Software kann schlecht programmiert oder nicht auf das Anwendungsszenario zugeschnitten sein. Der Mensch als Anwender kann eine Vielzahl von Fehlern begehen, indem er die Software anders bedient als vom Entwickler gedacht oder mangelnde Aufmerksamkeit oder motorisches Geschick zeigt. Ursachen auf menschlicher Seite können auch in fehlerhaften

107


Abb. 4. Aufbau des Prototyps

Informationsverarbeitungsprozessen begründet sein: Entweder weil ein Verarbeitungsschritt wie beispielsweise die Informationserkennung oder Auswahl einer Handlungsalternative fehlerhaft ist (sequentielle Modelle) oder weil mehrere Tätigkeiten die vorhandenen Ressourcen des Menschen übermäßig beanspruchen und ein Ressourcenengpass vorliegt (Ressourcenmodelle) (Schlick, Bruder & Luczak, 2010). Fehlersystematiken werden u. a. bei Badke-Schaub et al. (2008) beschrieben. Dahm (2006) unterscheidet zwischen intellektuellen Fehlern, flexiblen Handlungsmustern und sensumotorischen Fehlern, ähnlich wie die Fehler auf der wissensbasierten, regelbasierten und fertigkeitsbasierten Ebene nach Rasmussen (1986). Im Rahmen dieser Studie wurde vor allem zwischen technologiespezifischen (treten nur bei DI auf) und allgemeinen Fehlern unterschieden. Bei der Verwendung der Diffused Illumination Technologie sowie einem 50-Zoll-Display mit grafischer Oberfläche sind insbesondere Fehler durch fehlerhafte Eingabeerkennung (technisch bedingt) und unbeabsichtigte Eingaben (nutzerbedingt) zu erwarten. Denn auch Objekte oberhalb der Bildschirmfläche können reflektieren und werden als Eingabe interpretiert. Das kann dazu führen, dass Eingaben zu früh angenommen werden oder eigentlich unbeteiligte Objekte (abgestützte Hand, Ärmel, Uhr, abgelegter Stift) Eingaben verursachen,

108

Abb. 5. Arbeitsfenster der Software „Community Core Vision 1.4“.

insbesondere bei sehr großen Displays und Eingaben in größerer Entfernung zum Nutzer bzw. in der Bildschirmmitte (höhere Wahrscheinlichkeit der Handablage). Hier spielt sowohl eine mangelhafte Abstimmung der sensorischen und motorischen Prozesse des Nutzers als auch mangelnde Konzentration eine Rolle. Da man diese Faktoren als Entwickler nur bedingt beeinflussen kann, wäre es sinnvoll, solche Fehleingaben von beabsichtigten Eingaben softwareseitig zu unterscheiden. Hier setzt die experimentelle Studie an, indem sie bewusst Fehleingaben durch Nutzer provoziert und die beeinflussenden Faktoren sowie die Erkennungsleistung der DI-Technologie untersucht. 2.3. Einsatzbereich Flugsicherung Auch in der Welt der Flugsicherung, in der Sicherheit und Effizienz eine entscheidende Rolle spielen, könnten die Vorteile von Multitouch-Displays für zukünftige Entwicklungen genutzt werden. Aufgrund der hohen Gestenvielfalt wäre es z. B. möglich, Bedieneingaben einfacher und schneller zu gestalten als bei momentan verwendeten Single-Touch-Displays bei gleichzeitiger Verringerung der Menükomplexität. Auch ein Multi-User-Betrieb, bei dem mehrere Lotsen gleichzeitig an einem System kooperativ arbeiten könnten, wäre denkbar.

Allerdings sind die Anforderungen an die Technik hier auch besonders hoch. Ein unbeabsichtigtes Auslösen von Funktionen könnte gefährliche Folgen haben, führt mindestens jedoch zu einem erhöhten kognitiven und ggf. manuellen Aufwand, wenn der Fehler bemerkt und korrigiert werden muss. Der in großen Towern herrschende Zeitdruck verstärkt die Problematik. 3. Experimentelle Studie 3.1. Annahmen In der Studie sollten Fehler beobachtet, die Ursachen analysiert und Vermeidungsmöglichkeiten abgeleitet werden. Es wurde vermutet, dass Fehleingaben durch frühzeitige Erkennung von Unterarm und Kleidungsstücken oder durch starke Reflexion von metallischem Schmuck verursacht werden. Technologiebedingt kann alles eine Eingabe verursachen, was sich in geringem Abstand zur Eingabefläche befindet und Infrarotstrahlung reflektiert. Fehleingaben wurden vor allem bei einem geringen Winkel zwischen Arm und Displayfläche angenommen. Variiert wurden daher der Neigungswinkel des Tisches (0°, 10°, 25°), die Position der Eingabefelder und die Größe der Probanden. So wurden sowohl typische als auch extreme Armhaltungen mit voraussichtlich unterschiedlichen Erkennungsmustern


Usability Professionals 2011 Natural User Interfaces (NUI)

Abb. 6. Interaktionsfläche mit Eingabefeldern, Bild III und V liegen außerhalb des zulässigen Greifbereichs

provoziert. Besonders in den entfernt liegenden Zonen (außerhalb des Greifbereichs) wurden mehr Fehlerkennungen erwartet. 3.2. Vorgehen Im Versuch führten 20 Probanden festgelegte Interaktionen auf dem Display aus, u. a. Tippen mit einem Finger auf die einzelnen Eingabefelder, Zoomen durch Auseinanderziehen von zwei Fingern, Drehen des Bilds durch eine Drehbewegung von zwei Fingern und Verschieben durch Drag & Drop. Abbildung 5 zeigt die Interaktionsfläche mit Greifbereich (vgl. Schlick et al., 2010) sowie den fünf Eingabefeldern. Drei Kameras zeichneten die Eingaben auf. Bei der Auswertung wurden die einzelnen Stufen der Bilderkennung Schritt für Schritt nachvollzogen, um ein besseres Verständnis der Fehlerursachen bzw. des Systemverhaltens zu erhalten. [Abb. 6] 3.3. Ergebnisse 3.3.1. Technologiebedingte Fehleingaben Unter technologiebedingte Fehleingaben fallen alle, die sich aus dem Aufbau ergeben und die der Nutzer somit nur schwer oder überhaupt nicht vermeiden kann. Wie erwartet hatte die Neigung einen

Abb. 7. Fehleingaben durch aufliegende Kleidungsteile

großen Einfluss auf die erhaltenen Ergebnisse: Je flacher der Winkel zwischen Eingabearm und Touchscreen, desto stärker war der Grad der Reflexion und damit der Fehlerkennung. Dieser Zusammenhang konnte bei allen Probanden beobachtet werden, besonders jedoch bei kleinen Personen (ca. 160 cm). Teilweise reichte bereits ein kontaktfreies Schweben von Körper- oder Kleidungspartien über dem Display aus.[Abb. 7] Je weiter ein Proband sich aus dem zulässigen Greifbereich entfernte, desto häufiger kam es zu Fehleingaben, bei Rechtshändern also vor allem im oberen linken Bereich. [Abb. 8], [Abb. 9] Weitere Fehlerquellen waren der Einfluss von Umgebungslicht und reflektierendem Schmuck oder Kleidungsstücken. Dunkle sowie metallische Elemente verursachten hierbei weniger starke Reflexionen als helle. 3.3.2. Allgemeine Fehleingaben Während sich die bisher genannte Fehler auf die Technologie zurückführen lassen, traten außerdem Fehler auf, die vor allem auf die Versuchspersonen zurückzuführen sind. So wurden einige Fehler durch eine flache Handhaltung verursacht. Für eine korrekte Erkennung wäre es jedoch besser,

wenn der Nutzer den Finger senkrecht zur Oberfläche aufsetzt, so dass nur die Fingerkuppe reflektiert wird und die restliche Hand und der Arm keine Fehleingaben verursachen, oder wenn die Software diese Art von Fehleingaben berücksichtigen könnte. Auch neigten 70% der Probanden in Interaktionspausen dazu, ihre Hände auf dem Rahmen des Multitouch-Tisches abzulegen. Dies führte in Einzelfällen zu ungewollten Eingaben am unteren Bildschirmrand. Weitere Fehler wurden durch unsaubere Gestenausführung, das Verfehlen von Objekten aufgrund von Parallaxe- oder Verdeckungsfehlern oder die Verwechslung von Eingabegesten verursacht (für eine ausführlichere Darstellung der Ergebnisse siehe Seidel, 2011). 4. Diskussion der Ergebnisse In der experimentellen Studie wurden unterschiedliche Fehleingaben beobachtet, erfasst und analysiert. Insgesamt dominierten technologiespezifische Fehler, hauptsächlich durch unerwünschte Reflexionen der IR-Strahlung. Die Fehlerhäufigkeit nimmt mit zunehmendem Winkel zwischen Arm und Display stark ab. Auch die Position, an der die Interaktion ausgeführt werden sollte, hat einen wesentlichen Einfluss.

109


Hier könnte eine bessere Bilderkennung sowie eine Anpassung der MultitouchAnzeige und -Neigung an den jeweiligen Nutzer, evtl. auch die Wahl einer anderen Technologie zur Fehlervermeidung beitragen. Trotzdem wurden auch Fehler beobachtet, die unabhängig von der gewählten Technologie bei allen Multitouch-Geräten zu erwarten sind, wie z. B. Parallaxefehler oder das Abstützen auf dem Display. Auch spielt die Gestaltung der grafischen Oberfläche, insbesondere die Position der Bedienfelder, eine wichtige Rolle.

um eine zuverlässige, flüssige und sichere Interaktion an einem Multitouch-Display zu erhalten. In einem nächsten Schritt sollen nun diese Ergebnisse mit denen aus früheren Studien (z. B. zu Interaktionskonzepten für Multitouch-Displays, König, Röbig, Hofmann & Bruder, 2010) zusammengeführt und ein Konzept für robuste bzw. sichere Interaktionen für sicherheitskritische Anwendungskontexte entwickelt werden.

Abb. 8. IR-Kamerabild für Interaktion in Displaymitte

Literatur 1. Bader, T., & Klaus, E. (2008). Blickverhalten bei gestenbasierter Interaktion an

Es reicht jedoch nicht aus, Fehlerquellen in einer solchen Laborsituation zu identifizieren. In einem realen Arbeitsumfeld spielen zusätzliche Faktoren eine Rolle, wie z. B. hoher Zeitdruck, notwendige Bewegungsabläufe bzw. Bewegungen im Raum, weitere Nutzer im Raum, weitere Bedienaufgaben, zusätzliche Eingabegeräte etc. Um sicherzustellen, dass ein entwickeltes Interface ausreichend gebrauchstauglich ist, sollten daher während des gesamten Entwicklungsprozesses zukünftige Nutzer integriert sowie regelmäßig die Gebrauchstauglichkeit unter realen Bedingungen evaluiert werden (z. B. analog zum nutzerzentrierten Gestaltungsprozess nach DIN EN ISO 9241-210). Insbesondere gilt das für die Entwicklung von Interfaces für die Flugsicherung, um frühzeitig UsabilityProbleme zu identifizieren und sichere, gebrauchstaugliche und akzeptierte Interaktionskonzepte zu entwickeln.

großflächigen Anzeigen. In M. Grandt (Hrsg.). Beiträge der Ergonomie zur Mensch-SystemIntegration, 50. Fachausschusssitzung Anthropotechnik der Deutschen Gesellschaft für Luft- und Raumfahrt Lilienthal-Oberth e. V. Bonn: Deutsche Gesellschaft für Luft- und Raumfahrt (DGLR), S. 107-120. 2. Badke-Schaub, P., Hofinger, G., & Lauche, K. (Hrsg.). (2008). Human Factors - Psychologie sicheren Handelns in Risikobranchen. Heidelberg: Springer. 3. Bollhoefer, K. W., Meyer, K. & Witzsche, R. (2009). Microsoft Surface und das 4. Natural User Interface (NUI). White Paper. Berlin: Pixelpark. 5. Buxton, W. & Myers, B. A. (1986). A study

nuigroup.com. Letzter Zugriff: 27.05.2011. 11. Rasmussen, J. (1986). Information Processing and Human-Machine Interaction: An Approach to Cognitive

Institute.

Engineering. Amsterdam, The Netherlands:

6. Dahm, M. (2006). Grundlagen der MenschComputer-Interaktion. München: Pearson. 7. Kellerer, J., Eichinger, A., Sandl, P. & Usability Untersuchung eines neuartigen Bedienkonzepts in einem repräsentativen

North-Holland. 12. Schlick, C. M., Bruder, R. & Luczak, H. (2010). Arbeitswissenschaft. Berlin: Springer. 13. Schöning, J. et al. (2008). Multi-touch surfaces: A technical guide. Technical Reports of the Technical University of Munich. 14. Seidel, M. (2011). Untersuchung von

Mittelpunkt technischer Systeme. 8. Berliner

Usability-Aspekten bei einem Multitouch-

Werkstatt Mensch-Maschine-Systeme, 07. -

Display. Bachelorarbeit. Darmstadt:

09. Oktober 2009, Tagungsband. Berlin: VDI

Technische Universität, Institut für

Verlag, 2009. 8. König, C., Röbig, A., Hofmann, T., &

Arbeitswissenschaft. 15. Spath, D. et al. (2010). Studie Multi-

Bruder, R. (2010). Systematisierung von

Touch. Technologie, Hard-/Software und

Interaktionsparadigmen für Multitouch-

deren Anwendungsszenarien. Stuttgart:

Displays in der Flugsicherung. In

Fraunhofer Institut für Arbeitswirtschaft und

USEWARE 2010: Grundlagen - Methoden - Technologien, VDI Berichte, Bd. 2099. Düsseldorf: VDI-Verlag, S. 246-265. 9. NUI Group. (2011). URL: http://ccv.nuigroup. com/. Letzter Zugriff: 27.05.2011.

110

Technologies. Version 1.0. URL: http://www.

of Toronto, Computer Systems Research

Belastungskontext. In: Der Mensch im

Das mögliche Verhalten der Nutzer und die spezifischen Eigenschaften des jeweiligen Displays müssen bei der Gestaltung von Multitouch-Displays undbedingt berücksichtigt werden. Auch Faktoren wie die Kleidung der Probanden oder die Körpergröße relativ zur Neigung und Höhe des Displays können Einfluss auf die Bediensicherheit und -präzision haben. Technologie, Nutzereigenschaften und Gestaltungsoptionen sollten daher gleichermaßen berücksichtigt werden,

10. NUI Group Authors. (2009). Multi-Touch

in two-handed input. Toronto: University

Klingauf, U. (2009). Panoramic Displays -

5. Fazit

Abb. 9. IR-Kamerabild für Interaktion außerhalb des zulässigen Greifbereichs

Organisation. 16. Wickens, C. & Hollands, J. G. (2000). Engineering psychology and human performance. Upper Saddle River NJ: Prentice Hall.


Einflussfaktoren

111


Erwartungshaltung versus Usability: Der Effekt von negativer Erwartungshaltung auf die Akzeptanz von Software-Systemen. Roman Szymanski Technische Universität Darmstadt Alexanderstraße 10 64283 Darmstadt szymanski@psychologie.tu-darmstadt.de

Daniel Ullrich Technische Universität Darmstadt Alexanderstraße 10 64283 Darmstadt ullrich@psychologie.tu-darmstadt.de

Abstract Viele Für die der Akzeptanz Interaktionsgeräte, von Software-Systemen die in jüngstersind Zeitverschiedene auf den MarktFaktoren gekommen ausschlaggebend. sind, sind gestenDer vorliegende und touchbasiert. Beitrag zeigt Diese amauf Beispiel neuender Technologien Evaluation basierenden eines im Rahmen Interaktionsformen der Studienwerden reform eingeführten häufig auch als Campus-Management-Systems, natürliche Interaktion bezeichnet. dassMaus neben und Effizienz Tastatur und haben Funktionaals Eingabegeräte litäten auch die Konkurrenz Erwartungshaltung bekommen. der Nutzer Als prominente eine RolleVorreiter spielt. Drei sindSubstudien hier die aktuellen (N=213, Smartphones 75, 66) zeigen,sowie dass die Microsoft neuen Surface Funktionen zu nennen. des Systems Damitzwar hat sich gewünscht auch der sind, Gestaltungsaber denraum noch nur für Interaktionsdesigner eine mäßige Akzeptanz erweitert. und Zufriedenheit Die Konzeption mit dem von Steuerungsgesten System seitens derkommt Nutzer als besteht. neue Ein Dimension Hauptgrund hinzu.scheint Den damit die negative verbundenen Haltung Herausforderungen vieler Studierender widmet gegenüber sich unser der Studienreform Tutorial. Wir zeigen im Allgemeinen die Bandbreite zu sein, neuer welche Interaktionsmöglichkeiten sich auch auf die in diesem auf und Rahmen probieren neu eingeführten gemeinsamSoftwaresysteme mit den Teilnehmern erstreckt. eine So Methode empfanden zur Gestaltung trotz objektiver von gestenEffizienzund touchbasierter steigerung vieleInteraktion Nutzer dasaus. System als Mehraufwand; die Tatsache, dass gleichzeitig andere Aufgaben entfielen, wurde nicht wahrgenommen. Auch wurden übliche Probleme während der Pilotphase (System-Verfügbarkeit, Unvollständigkeit der Inhalte etc.) stark kritisiert. Insgesamt konnte die negative Erwartungshaltung der Nutzer, die sich bereits vor Aktivierung des Systems manifestiert hatte, durch spät installierte Feedback-Kanäle nur teilweise abgemildert werden.

1. Einleitung Der Bologna-Prozess bezeichnet das Vorhaben, international vergleichbare Studienabschlüsse innerhalb der Europäischen Union bis zum Jahr 2010 einzuführen. In Deutschland wurde nach einem Beschluss der Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland die Studiengänge allgemein in einen konsekutiven Studiengang überführt. Die Vorgaben verlangten, dass die Studiengänge modularisiert und dabei mit einem Leistungspunktesystem ausgestattet werden. Die Hochschulreform der Studiengänge resultierte schließlich darin, dass in einem Studium aufbauend auf einem grundständigen Studiengang mit der allgemeinen Bezeichnung Bachelor, anschließend der Masterabschluss als postgraduales Studium angestrebt werden kann. Man versprach sich von dieser Hochschulreform einige Vorteile. Durch das

112

Keywords: /// Campus-Management System /// Technologie-Einführung /// Nutzer-Akzeptanz

Leistungspunktesystem, welches durch die Vergabe von Creditpoints pro Veranstaltung und der damit verbundenen Prüfung realisiert wird, erhalten Studierenden schon zu Beginn ihres Studiums frühzeitig differenzierte Leistungsrückmeldungen. Daneben ist durch den Bachelor ein berufsqualifizierender Abschluss unterhalb des Diploms möglich. Diese Maßnahmen gelten nicht nur als Vorteil von Bachelor und Masterstudiengängen, sondern werden auch als Gründe für eine Senkung der Abbruchquote von Studiengängen diskutiert (Gold, 1999).

und sein wesentlicher Bestandteil, das Onlineportal TUCaN vorgestellt. Es wird aufgezeigt, wie das Onlineportal in einer Pilotphase und durch eine Evaluation getestet wurde. Schließlich werden ausgewählte Ergebnisse aus der Evaluation dargestellt und im Anschluss in Bezug zu der Erwartungshaltung der Studierenden diskutiert.

In den folgenden Abschnitten wird zunächst dargestellt, warum sich dennoch Studierende von der Hochschulreform kaum Vorteile versprechen. Im Anschluss daran wird aufgezeigt, dass mit der Hochschulreform die Anforderung an die Organisation des Studiums gestiegen sind und wie die Technische Universität auf diese Anforderrungen reagiert hat. Hierbei wird das Campus-Management-System

Die vermeintlichen Vorteile der Hochschulreform sorgen aber gleichzeitig für Kritik unter den Studierenden. Beklagt wird beispielsweise die erhöhte Belastung durch die jetzt hauptsächlich studienbegleitenden Prüfungen. Teilweise wird jede einzelne Veranstaltung mit einer Prüfung abgeschlossen, während in den „alten“ Studiengängen, wie Diplom oder Magister, häufig nur zwei Prüfungen pro Semester abzulegen waren.

1.1. Der Bologna Prozess – Warum Studierende kaum Vorteile durch die Hochschulreform erwarten

182


Usability Professionals 2011 Einflussfaktoren

Ein weiterer Kritikpunkt ist die Umsetzung der Hochschulreform, welche auf vielfältige Ablehnungen stößt. Als Gründe werden häufig die steigende Bürokratie, die damit einhergehenden höheren Kosten und die Verschlechterung der Hochschulbildung genannt. Die Bildung leidet vor allem darunter, dass häufig die Lehrinhalte von Magisterbzw. Diplomstudiengänge auf drei Jahre Bachelorstudium komprimiert werden. Dadurch fällt es den Studierenden schwer in ihren gestrafften Studiengängen Schwerpunkte zu setzen oder auch sich interdisziplinär in Angebote andere Studiengänge hinein zu schnuppern. Das Studium hat allgemein durch die Hochschulreform an Flexibilität verloren, weil die Bachelorstudiengänge verschulter sind, als es die „alten“ Studiengänge waren (Blüthmann, Lepa & Thiel, 2008). Diese Veränderungen der Struktur der Studiengänge wirken sich schließlich auf die Zufriedenheit mit dem Studium und

den Studienabbrüchen aus. Blüthmann et al (2008) konnten zeigen, dass ein wichtiger Faktor für einen Studienabbruch in den Bachelorstudiengängen die Studienbedingungen sind, welche sich zum Beispiel darin äußern, wie schlecht ein Studium organisiert ist und wie verschult es wahrgenommen wird. Dass die Organisation des Studiums sich wesentlich auf die Zufriedenheit des Studiums gerade in den neuen Bachelor und Master Studiengängen auswirkt, wird deutlich, wenn man betrachtet, welche Anforderungen in der Organisation des Studiums sich an Studierende stellen, die in diesen neuen Studiengängen studieren. Durch die Modelarisierung, die damit einhergehende „Verschulung“ der Studiengänge und die gestiegene Anzahl an Prüfungen sind die Vorgaben, an die sich ein Studierender in seiner Studienorganisation halten muss gestiegen, wie der nächste Abschnitt zeigt.

1.2. Die Hochschulreform am Beispiel der Technischen Universität Darmstadt – Höhere Anforderungen auch an die Studienorganisation Durch die Vorgaben in den Bachelor- und Masterstudiengängen sind die Studierenden im Vergleich zu den „alten“ Studiengängen bei der Planung und Durchführung des Studiums mit neuen Aufgaben und Schwierigkeiten konfrontiert. Die Modellierung der Studiengänge verlangt bei der Organisation des eigenen Studiums einer gewissen Struktur, die eingehalten werden muss, um das Studium in der vorgegebenen Semesteranzahl erfolgreich abschließen zu können. Die Studierenden müssen wissen, welche Module Pflicht sind, welche Module sie frei wählen können und welche Veranstaltung zu welchem Modulbaustein gehört. Das Leistungssystem verlangt nicht nur, dass die Studierenden zu fast jeder Veranstaltung eine differenziertere Bewertung als

Abb. 1. Startseite des Onlineportals TUCaN

113


nur „bestanden bzw. nicht bestanden“ vorlegen können, sondern dass die Studierenden auch Kenntnis darüber besitzen, wie die einzelne Leistung im Vergleich zu anderen Modulbausteinen zu gewichten ist. Damit das Leistungssystem greift und rechtlich gesichert ist, ist eine hohe Bürokratie nicht abzuwenden. Beispielsweise müssen neben der Anmeldung zu den Veranstaltungen, nun auch alle dazugehörigen semesterbegleitenden Prüfungen rechtzeitig angemeldet werden. Bei zehn Veranstaltungen entspricht dies zehn Prüfungsanmeldungen. 2. Das Campus-Management-System TUCaN Um die Organisation des Studiums zu erleichtern führte die Technische Universität Darmstadt ein System ein, welches sowohl für die Verwaltung, als auch für die Lehrenden und Studierenden als zentrales Organisationsinstrument für Studium und Lehre dienen soll. Um das System in die Verwaltung der Studiengänge zu integrieren, wurde zunächst neben der Modularisierung der Studiengänge eine Dezentralisierung des zentralen Prüfungssekretariats durchgeführt. Das zentrale Prüfungssekretariat wurde dabei auf individuelle Studienbüros der 15 Fachbereiche der Universität aufgeteilt, wobei jedes Studienbüro zuständig für die Studierenden seines Fachbereichs ist. Dies war eine vorbereitende Maßnahme für die Übernahme einer Software, welche den Namen „Campus-ManagementSystem“ trägt und den Studienbüros ermöglichen soll, die Studierendendaten zu verwalten und das Lehrangebot zu managen. Somit ist das Ziel des CampusManagement-Systems, in erster Linie den administrativen Arbeitsaufwand für das Verwaltungspersonal aber auch für die Lehrende zu reduzieren. Damit dies gelingt enthält das CampusManagement System ein Onlineprotal namens TUCaN über welches die Studierenden ihr Studium online organisieren sollen (siehe Abbildung 1), während von den Lehrenden verlangt wird, über das On-

114

lineportal TUCaN ihre Lehrveranstaltungen zu managen und Prüfungsergebnisse einzutragen. Über das Onlineportal ist es den Studierenden möglich, sich zu Modulen, Veranstaltungen und Prüfungen anzumelden. Sie bekommen zudem über TUCaN einen Stundenplan erstellt und können jederzeit Einsicht in ihre Leistungsübersicht erhalten. Zu diesen Funktionen gelangt man über eine Linkleiste, die einem zur Verfügung steht, sobald man sich in TUCaN eingeloggt hat. [Abb. 1] Das Onlineportal TUCaN ist ein wesentlicher Bestandteil des Campus-Management Systems, da durch die Onlineanmeldungen der Studierenden z. B. den Lehrenden ermöglicht wird, die Noten der Studierenden direkt ins System einzutragen, wobei das jeweilige Studienbüro Zugriff auf alle Daten besitzt. Über die Onlineorganisation der Studierenden und deren Aktivitäten auf dem Onlineportal TUCaN bekommen die Studienbüros somit die notwendigen Daten, um jeden einzelnen Studierenden zu verwalten, indem sie z. B. die Information über fehlende oder nicht bestandene Leistungen direkt geliefert bekommen und anhand der im System eingetragenen Leistungen Abschlüsse feststellen und Zeugnisse generieren können. Das Onlineportal soll dabei nicht nur dazu dienen, die administrativen Aufgaben zu erleichtern, sondern auch die Anforderungen, die durch das Organisieren des Studiums an die Studierenden gestellt sind, sollen durch das Onlineportal gemindert werden. Wie sehen diese Anforderungen ohne ein System wie das Campus-ManagementSystem aus? Die Studierenden müssten zu Semesterbeginn die notwendigen Lehrveranstaltungen belegen und im Laufe das Semester die dazugehörigen Prüfungen schriftlich im Studienbüro anmelden. Einen Überblick darüber, welche Veranstaltung sie aktuell besuchen, oder besucht haben, welche noch abzulegen sind, welche Leistungen sie mittlerweile erzielt haben usw. müsste sich jeder Studierende selbständig erstellen. Dabei wäre es zum einen leicht, bei der Modularisierung der Studiengänge und der damit gestiegenen Anzahl

an Prüfungsleistungen den Überblick zu verlieren, zum anderen müssten die Studierenden für jede Anmeldung und auch für jede Abmeldung das Studienbüro aufsuchen, sich an die Öffnungszeiten halten und ihre An- bzw. Abmeldung schriftlich einreichen. Dies wäre nur mit viel Zeitaufwand für jeden einzelnen Studierenden zu bewerkstelligen. Der Zeitaufwand für die Verwaltung wäre noch sehr viel höher. Trotz dieser theoretischen Vorteile stellt sich die Frage, wie das Onlineportal TUCaN von Studierenden in Hinblick auf die Organisation des Studiums bewertet wird. Werden diese Vorteile von den Studierenden wahrgenommen? Und welche Faktoren könnten möglicherweise eine Beurteilung von TUCaN durch die Studierenden noch beeinflussen? In dem Zusammenhang stellt sich die Frage, wie ein System bewertet wird, welches eine Erleichterung einer Studienorganisation bewirken soll, die von vielen Studierenden auf Ablehnung stößt? Wie Studien über Abbruchquoten (vgl. Thiel et al. 2006) und die Kritik an der Hochschulreform zeigen, kann davon ausgegangen werden, dass die Hochschulreform aufgrund der damit einhergehenden Verschulung der Studiengänge eher auf eine Ablehnung bei den Studierenden stößt. Nicht nur die Anforderungen durch den Anstieg an semesterbegleitenden Prüfungen sorgen hierbei für Unmut. Die gesamte Studienstruktur hat sich verändert, so dass nun auch die Anforderungen an die Organisation des eigenen Studiums gestiegen sind. Wird die Erleichterung in diesem Fall überhaupt wahrgenommen, oder überschatten die erhöhten Anforderungen in der Studienorganisation die Erwartungen der Studierenden an so ein System? 3. Das Campus-Management-System auf dem Prüfstand Im Wintersemester 2010/11 wurde in allen Fachbereiche der Technischen Universität Darmstadt das Campus-ManagementSystem eingeführt. Im vorhergehenden Semester beauftragte das Präsidium der


Usability Professionals 2011 Einflussfaktoren

Technischen Universität Darmstadt das Institut für Psychologie, das Onlineportal TUCaN in einem Pilotprojekt zu testen. Es sollte erhoben werden, inwieweit die Studierenden mit dem Onlineportal zurechtkommen und wie sie die Handhabung und das Design der Seiten bewerten. Mit der Evaluation wollte man sich ein Bild davon machen, welchen Eindruck TUCaN insgesamt bei den Studierenden hinterlässt, bevor es schließlich ein Semester später verpflichtend eingeführt würde. Insgesamt nahmen sieben Fachbereiche an dem Pilotprojekt teil, wobei das System insbesondere von den Studierenden beurteilt werden sollte. Das Evaluationskonzept umschloss eine Online-Befragung, die in zwei Phasen durchgeführt wurde, und eine experimentelle Untersuchung. Der Tabelle 1 kann man einen groben Zeitplan der Erhebungen entnehmen. [Tab. 1]

Die Anwendungen, die es zu beurteilen galt, waren das Anmelden von Modulen, das Anmelden von Veranstaltungen, das Anmelden von Prüfungen, das Einsehen der Leistungsübersicht und das Ansehen des Stundenplans. Zu jedem Anwendungsblock wurden die Teilnehmer befragt, wie lange sie für die spezifischen Aufgaben benötigt haben und wie (un-)zufrieden sie mit der Umsetzung sind. Zusätzlich wurde erfasst, wie die Studierenden die neue Möglichkeit empfinden, die Funktionen nun online verfügbar zu haben und wie sie es bewerten, dass die Funktionen in Zukunft ausschließlich über das CampusManagement-System zugänglich sind. Das Laborexperiment wurde in der Semestermitte durchgeführt und hatte zum Ziel, die subjektiven Erfahrungen aus den Online-Erhebungen mit Ergebnissen aus

Datum

Ereignis

März 2010

Zugang zu dem Onlineportal TUCaN wird für die Studierenden freigeschaltet.

April 2010

Semesterbeginn

Mai 2010

1. Online-Befragung

Juni 2010

Experimentelle Untersuchung

Juli 2010

Semesterende

September 2010

2. Online-Befragung

Tab. 1. Zeitplan der TUCaN Evaluation

Die Online-Befragung richtete sich an alle Studierenden der teilnehmenden Fachbereiche und hatte zum Ziel, ein realistisches Bild der Erfahrung mit dem System im universitären Alltag zu zeichnen. Die Befragung wurde in identischer Form einmal zu Beginn des Semesters durchgeführt, um einen ersten Eindruck der Studierenden zu erfassen, und ein weiteres Mal zu Semesterende, um eine retrospektive Einschätzung zu ermitteln. Die Beurteilung des Campus Management Systems durch den Onlinefragebogen erfolgte in mehreren Abschnitten, wobei jeder Abschnitt aus einer ausführlichen Befragung zu jeweils einer der TUCAN Anwendungen bestand.

standardisierten Aufgaben zu ergänzen. Das Experiment war analog zur OnlineErhebung konzipiert und erfasste alle Aufgabenbereiche, die das CampusManagement-System abdeckt. Zu jedem Aufgabenbereich mussten die Teilnehmer definierte Tasks durchführen und anschließend das System und ihr eigenes Befinden bewerten. Leistungsdaten wie Effektivität (Anteil der erfüllten Aufgaben) und Performanz (benötigte Zeit) wurden hierbei ebenfalls erfasst. Abschließend wurde das System mit standardisierten Fragebögen wie dem AttrakDiff2 (Hassenzahl 2003), INTUI (Ullrich & Diefenbach 2010) und PANAS (Krohne 1996).

Durch E-Mail Verteiler und Aushänge wurden die Studierenden gebeten an der Online-Erhebung und dem Experiment teilzunehmen. Bei der ersten OnlineErhebung nahmen 213 Studierende teil und schlossen den Fragebogen komplett ab, bei der zweiten Erhebung waren es 75 Teilnehmer. An dem Laborexperiment nahmen 66 Personen teil. Dass bei der zweiten Online-Erhebung weniger Teilnehmer vorhanden waren, mag damit zusammenhängen, dass der Zeitpunkt der zweiten Online-Erhebung mitten in den Semesterferien lag und viele Studierende für eine Teilnahme nicht zugänglich waren. 4. Ergebnisse Im Folgenden werden ausgewählte Ergebnisse der Evaluation vorgestellt. Zunächst wird auf die Ergebnisse der experimentellen Untersuchung eingegangen, diese anschließend um die Ergebnisse aus den Online-Befragungen erweitert und verglichen. Abschließend findet eine Gegenüberstellung der vorgestellten Ergebnisse mit den Antworten aus den offenen Fragen der Online-Erhebungen statt. 4.1. Ermöglicht TUCaN eine effiziente Organisation des Studiums? Wie das Experiment zeigt, können Schritte, welche die Organisation des Studiums betreffen, von jedem Studierenden mittels TUCaN effizient erledigt werden und das zu jeder Zeit und von jedem Ort aus, an dem es einen Internetanschluss gibt. In Tabelle 2 ist die jeweilige durchschnittliche Dauer aufgelistet, welche die jeweilige Aufgabe des Experiments benötigt hat. Für die Anmeldung zu fünf Modulen und den dazugehörigen Lehrveranstaltungen sind im Schnitt weniger als 10 Minuten nötig. Ein Stundenplan ist daraufhin in weniger als fünf Minuten ausgedruckt, während die Anmeldung zu den Prüfungen zu den Lehrveranstaltungen in sechs Minuten geschehen kann. Für die Erledigung aller Aufgaben benötigten die Teilnehmer im Schnitt weniger als eine halbe Stunde. [Tab. 2]

115


Aufgabe

Bearbeitungszeit in min. (sd)

Einloggen in TUCaN Anmelden zu vorgegebenen fünf Modulen und den dazugehörigen Lehrveranstaltungen

9,51 (3,63)

Erstellen und Ausdrucken eines Stundenplans

4,21 (1,00)

Anmelden von den Prüfungen zu den zuvor angemeldeten Lehrveranstaltungen

6,10 (2,43)

Ermitteln einer Note in einem Modul Ermitteln, welche Prüfungen nicht bestanden wurden Ausdrucken des Leistungsspiegels

2,62 (1,22)

Anmelden zu der Prüfung, durch die man durchgefallen ist

3,72 (2,12)

Gesamt

26,13 (6,29)

Tab. 2. Durchschnittliche Bearbeitungsdauer in Minuten.

Mit einer sechsstufigen Skala wurde im Experiment jeweils abgefragt, ob sich durch TUCaN das Studium übersichtlicher gestalten lässt und ob TUCaN das Zeitmanagement im Studium verbessern wird. In Abbildung 2 sind die Mittelwerte der Antworten der Teilnehmer auf beiden Fragen dargestellt. Je höher der Wert, umso positiver wurde TUCaN in Bezug auf beide Fragen eingeschätzt. Es zeigt sich, dass die Studierenden davon ausgehen, dass TUCaN dabei helfe, das Studium übersichtlich zu gestalten (m=3,27), aber eher der Meinung sind, TUCaN habe keinen Einfluss auf das Zeitmanagement im Studium. Hier liegt der Mittelwert (m=2,84) der Antworten nahe der Skalenmitte von 2,5, was bedeutet, dass weder von einer Verschlechterung, noch von einer Verbesserung ausgegangen wird. [Abb. 2]

und Prüfungen in wenigen Minuten vollzogen werden kann, viele Studierende die Anmeldungen als eher langsam empfanden. In Abbildung 3 ist dargestellt, wie viel Prozent der Onlinebefragten bei den drei Anwendungen Module anmelden, Veranstaltungen anmelden und Prüfungen anmelden, die jeweiligen Anmeldungen als „schnell bis. sehr schnell“, „weder schnell noch langsam“ und „langsam bis sehr langsam“ empfanden.

angegeben, dass die Anmeldungen langsam bis sehr langsam vonstattengehen. Bei der Anmeldung von Prüfungen sind es 64,9% der Studierenden. Signifikant weniger als die Hälfte der Studierenden empfand bei den drei Anwendungen, dass die Anmeldungen schnell bis sehr schnell ablaufen (Anmeldung Module: Chi²(1)= 16,42; p< .001; Anmeldung Veranstaltungen: Chi²(1)= 29,35; p<.001; Anmeldung Prüfungen Chi²(1)= 16,98; p<.001) [Abb. 3]

Bei allen drei Anwendungen wurde von dem Großteil der Studierenden

Vergleicht man die Mittelwerte auf die Fragen, wie praktisch man die jeweilige

4.2. TUCaN ist effizient, aber damit gleich gut? Zwar stellt TUCaN eine Erleichterung dar, was die zeitliche Anforderung betrifft, dies wird jedoch von den Studierenden nicht so wahrgenommen. Wie aufgezeigt, gehen die Studierenden eher davon aus, dass TUCaN keinen Einfluss auf ihr Zeitmanagement ausübt. Weiterhin ergab sich bei den Onlinebefragungen, dass obwohl eine Anmeldung zu Modulen, Veranstaltungen Abb. 2. Subjektive Einschätzung von Studierenden, ob TUCaN dabei hilft das Studium übersichtlicher zu gestalten und das Zeitmanagement zu verbessern (0= Verschlechterung; 5= Verbesserung)

116


Usability Professionals 2011 Einflussfaktoren

Anwendung findet und wie man es bewertet, dass die jeweilige Anwendung ab dem Wintersemester 10/11 ausschließlich über TUCaN verfügbar sein wird, fällt auf, dass vor allem die Leistungsübersicht und der Stundenplan positiv bewertet werden, während bei den Anwendungen zur Anmeldung zu Modulen, Veranstaltungen und Prüfungen die Bewertung im Vergleich dazu wesentlich schlechter ausfallen (vgl. Abbildung 4). Dieses Ergebnis könnte man im Zusammenhang mit der Bewertung der übersichtlichen Gestaltung und dem Zeitmanagement im Studium sehen. Die Leistungsübersicht und der Stundenplan sind die Hilfsmittel, die dabei dienen das Studium übersichtlich zu gestalten, die Anwendungen, die die Anmeldung und damit das Zeitmanagement betreffen, werden eher durchschnittlich bewertet. Weiterhin wird es in allen Fällen schlechter bewertet, dass die jeweilige Anwendung ab dem Wintersemester 10/11 ausschließlich über TUCaN verfügbar sein wird. [Abb. 4] 4.3. Diskussion – Diskrepanz Erwartung vs. Realität Als Dozenten der Universität einerseits und in der Rolle der Evaluierenden andererseits zeichnete sich für uns bereits vor der Pilotphase ab, dass die Erwartungshaltung vieler Studierenden teilweise nicht ganz unvoreingenommen war. In den offenen Fragen der Online-Befragungen machten sich dann auch einige Studierende Luft und konstatierten beispielhaft, dass TUCaN „nur die Bürokratie von ausgebildeten Spezialisten (SekretärInnnen, Studienbüros) auf kostenlose Arbeitskräfte, den Studenten [verlagert]... wenn man es bösartig formulieren will“. Auf die Frage inwieweit TUCaN noch zu vervollständigen wäre, gaben 76 von 213 (36%) Teilnehmer einen negativen Kommentar ab. 13 (17%) der Teilnehmer gaben an, dass ihnen eine fachübergreifende Anmeldung zu Veranstaltungen fehlen würde und sie bemängelten auch, dass es nicht mal eine Einsicht in fachübergreifende Veranstaltungen gäbe.

Abb. 3. Empfundene Zeitdauer für die verschiedenen Anmeldefunktionen (Anteil der Studierenden in Prozent)

Insgesamt überwogen solch negative Beurteilungen, wie sich auch am Beispiel der Funktion der Modulanmeldung zeigt. Hier haben 48 von 213 Teilnehmern (23%) einen negativen Kommentar zu dem Prozedere der Anmeldung hinterlassen. 34 (16%) gaben an, dass das Anmelden ihnen grundsätzlich zu kompliziert sei. Weitere 8 (4%) brachen den Vorgang sogar vorzeitig ab, weil er ihnen zu lange dauerte. Auch die Schätzungen, wie lange die typische Anmeldung dauerte, lag mit 36 Minuten (16 für die Module, weitere 20 für die Veranstaltungen) sehr hoch. Die tatsächliche Zeit, die für die Anmeldung notwendig ist, wurde im

Laborexperiment ermittelt und lag bei 9:30 Minuten – für alle Modul- und Veranstaltungsanmeldungen. In den Selbstauskünften wurde die benötigte Zeit also nahezu auf das Vierfache geschätzt als im Laborexperiment benötigt wurde, wobei im Experiment sogar mehr Anmeldungen notwendig waren (5 komplette Module) als die Studierenden durchschnittlich belegten (m=3,89, med=4) und was die Grundlage ihrer Schätzung darstellte. Insgesamt lässt sich feststellen, dass Prozesse, welche die Hochschulreform notwendig macht, wie das Anmelden von Module, Veranstaltungen und Prüfungen eher negativ von den Studierenden bewertet wurden. Interessant ist an

117


Abb. 4. Vergleich der Praktikabilität von TUCaN und der Tatsache, die Funktionalitäten ausschließlich in TUCaN verwenden zu können (1= sehr praktisch; 7= gar nicht praktisch, bzw. 1= sehr gut; 7= sehr schlecht).

dieser Stelle die Tatsache, dass selbst bei angenommener schlechter Performanz das Campus-Management-System dem traditionellen Verfahren (persönlich das Studienbüro aufsuchen und sich handschriftlich anmelden) immer noch überlegen wäre, was sich aber nicht in den Bewertungen der Studierenden zeigt (vgl. Abbildung 3). In diesem Zusammenhang kann man auch sehen, dass die Studierenden TUCaN positiv bewerten, was die Übersicht über das Studium betrifft. Dies spiegelt sich auch darin wider, dass der Stundenplan und die Leistungsübersicht

118

sehr positiv bewertet wurden. Im Vergleich dazu schnitten die Anmeldungen zu Modulen, Veranstaltungen und Prüfungen schlecht ab, wobei diese eine Vorrausetzung für die durch TUCaN gewonnene Übersicht sind. Ohne die Anmeldungen erstellt sich der Stundenplan nicht und bleibt die Leistungsübersicht unvollständig. D.h. selbst Studierende, welche die Anmeldungen abgebrochen haben, haben den Stundenplan und die Leistungsübersicht positiv bewertet, obwohl diese zwangsläufig unvollständig aufgrund der fehlenden Anmeldungen waren. Auch

hier zeigt sich, dass TUCaN als positiv aufgenommen wird, wenn es rein um eine Hilfestellung wie Übersichten über Veranstaltungstermine und Prüfungen geht, während die Erleichterung , welche TUCaN beim Zeitmanagement bieten soll, nicht wahrgenommen wird. 5. Fazit Im Laufe der Evaluation des CampusManagement-Systems hat sich gezeigt, dass das System – neben allen typischen


Usability Professionals 2011 Einflussfaktoren

Problemen, die bei der Einführung eines solch komplexen Systems auftreten – die an es gerichteten Erwartungen hinsichtlich Funktionalität erfüllt und eine performante Nutzung ermöglicht. Trotz überzeugender objektiver Daten wie kurzer Anmeldezeiten wurde das System nicht wie erhofft von den Studierenden angenommen. Wir vermuten, dass eine negative Erwartungshaltung seitens der Nutzer, die auf die Umwälzungen im universitären Umfeld zurückzuführen sind, die Akzeptanz der neuen Technologie verringerten und die Produktwahrnehmung entsprechend verzerrten.

Die Autoren danken darüber hinaus allen Studierenden der Technischen Universität Darmstadt für die Teilnahme an der Pilotphase und der Bewertung des Campus-Management-Systems. Literatur 1. Blüthmann, I., Lepa, S. & Thiel, F. (2008). Studienabbruch und -wechsel in den neuen Bachelorstudiengängen Untersuchung und Analyse von Abbruchgründen. ZFE, 11, 406-429 2. Gold, A. (1999): Studienabbruch und Studienerfolg. In: Schröder-Gronostary, M., Daniel, H.-D. (Hrsg.) (1999): Studienerfolg und Studienabbruch. Beiträge aus Forschung

Da der Bologna-Prozess Realität ist (die Autoren verzichten an dieser Stelle auf eine Diskussion Pro & Contra), kommen die Universitäten nicht um eine Anpassung ihrer Strukturen und Prozesse herum, was eine technologische Unterstützung wie ein Campus-Management-System nahelegt. Die Akzeptanz dieser Veränderungen ist jedoch ein Aspekt, der abseits technologischer Lösungen angegangen werden muss.

und Praxis. Neuwied, S. 52–68. 3. Hassenzahl, M., Burmester, M. & Koller, F. (2003). AttrakDiff: Ein Fragebogen zur Messung wahrgenommener hedonischer und pragmatischer Qualität. In Szwillus, G., Ziegler, J.(2003): Mensch & Computer, 187-196. 4. Krohne, H. W., Egloff, B., Kohlmann, C.-W. & Tausch, A. (1996). Investigations with a German version of the Positive and Negative Affect Schedule (PANAS). Diagnostica, 42(2),

Projektverantwortlichen, die planen, ähnliche Systeme einzuführen, sollten von vorneherein erheben, welche ungewollten Aspekte eines Prozesses, die systemunabhängig sind, eine negative Bewertung des Systems bewirken könnten. Sollte die Einführung des Systems zur gleichen Zeit einer Umstrukturierung gewohnter Prozesse stattfinden, ist darauf zu achten, welche Beurteilungen ausschließlich auf das System zurückfallen und welche durch die Umstrukturierung bedingt werden. Im Idealfall sollte die Umstrukturierung abgeschlossen sein, bevor das System bewertet wird. Sollte das System die Umstrukturierung bedingen, dann sollte man sich im Klaren darüber sein, dass eine Beurteilung des Systems schlechter ausfallen wird, wenn die Umstrukturierung nicht gewollt ist.

139-156. 5. Thiel, F., Blüthmann, I., Lepa, S. & Ficzko, M. (2006): Ergebnisse der Befragung der Studierenden in den Bachelorstudiengängen an der Freien Universität Berlin im Sommersemester 2006. Interner Abschlussbericht. – Berlin: Freie Universität. 6. Ullrich, D. & Diefenbach, S. (2010). INTUI. Exploring the Facets of Intuitive Interaction. In J. Ziegler & A. Schmidt (Hrsg.)(2010): Mensch und Computer 2010, 251-260. München: Oldenbourg.

Danksagung Die Autoren danken dem Präsidium der Technischen Universität Darmstadt und dem Institut für Psychologie für die finanzielle und organisatorische Unterstützung, ohne die die Evaluation in diesem Ausmaß undenkbar gewesen wäre.

119


129

Warum „gutes Aussehen“ nicht immer von Vorteil ist Über den Einfluss der optischen Gestaltung von Prototypen auf das Nutzerverhalten im Usability-Test Andrea Struckmeier eResult GmbH Ludwig-Erhard-Str. 18 20459 Hamburg andrea.struckmeier@eresult.de

Abstract Viele Der Beitrag der Interaktionsgeräte, stellt zunächst verschiedene die in jüngster Annahmen Zeit auf den vor zum Markt Einfluss gekommen der visuellen sind, sind gestenVerfeinerung und touchbasiert. (Aussehen) von Diese Prototypen auf neuen aufTechnologien die Ergebnisse basierenden einer Usability-Evaluation. Interaktionsformen werden Im Anschluss häufigwerden auch als die natürliche die Ergebnisse Interaktion einerbezeichnet. Grundlagenstudie Maus und derTastatur eResulthaben GmbHals Eingabegeräte zum Einfluss visueller Konkurrenz Verfeinerung bekommen. von Prototypen Als prominente dargelegt. Vorreiter In dieser sind hier Studie die aktuellen wurde die Smartphones visuelle Verfeinerung sowie Microsoft als unabhängige Surface zu Variable nennen. manipuliert, Damit hat um sichdie auch bisher der Gestaltungsbestehenden raum (heterogenen) für Interaktionsdesigner Befunde zu überprüfen. erweitert. Die Konzeption von Steuerungsgesten kommt als Dieneue Ergebnisse Dimension der Studie hinzu. Den legendamit nahe,verbundenen dass Usability-Tests Herausforderungen mit Prototypen widmet von geringer sich unser Verfeinerung Tutorial.dazu Wir zeigen führen, die dassBandbreite tendenziellneuer mehrInteraktionsmöglichkeiten funktionale Probleme (z. B.auf hinsichtlich und probieren der Navigationsstruktur, gemeinsam mit den desTeilnehmern Wordings) von eineden Methode Versuchspersonen zur Gestaltung erkannt von gestenwerden und als touchbasierter dies bei Prototypen Interaktion der Fall aus. ist, die visuell stark ausgereift sind. Zudem lässt sich vermuten, dass die Bewertung der subjektiv empfundenen Usability ebenfalls vom Grad der visuellen Verfeinerung abhängt. Die Befunde aus der Studie werden abschließend kritisch diskutiert und es werden einige Hinweise gegeben, welche visuelle Verfeinerung bei der Konzeption von Prototypen zu beachten sind bzw. welche visuelle Verfeinerung vor dem Hintergrund welcher Fragestellungen empfehlenswert ist.

1. Hintergrund und Fragestellung Schlechte Usability kann teuer werden: Die Behebung von Usability-Problemen nach der Implementierung kostet bis zu zehn Mal mehr als in der davorliegenden Designphase (Bias & Mayhew, 1994). Eine Methode, mit der zentrale Probleme neuer Interaktionskonzepte bereits frühzeitig identifiziert werden können, ist das Prototyping. Mit Hilfe von Prototypen können Konzepte für z. B. Webseiten oder Software frühzeitig einem Nutzertest unterzogen werden. Dies kann einerseits in frühen Konzeptionsphasen geschehen, in denen zumeist erste Scribbles und Seitentemplates erstellt werden. Hier gibt es häufig mehrere Alternativen hinsichtlich des Konzeptes, die mit Hilfe von Prototypen gegeneinander getestet werden können. Doch auch während der Konkretisierung des Konzeptes ist es immer wieder sinnvoll, die Bedienbarkeit anhand von Prototypen

120

im Nutzertest zu überprüfen. Aber: Die richtige Charakterisierung, Auswahl und Gestaltung von Prototypen für einen Usability-Test birgt einige Herausforderungen. Zu klären ist vor allem die Frage danach, ob der Prototyp bereits das vollständige Layout der späteren Anwendung abbilden muss, um wesentliche Usability-Probleme im Test zu identifizieren oder ob Nutzer qualitativ und quantitativ die gleichen Probleme identifizieren, wenn sie lediglich mit einem sehr groben graphischen Entwurf der Anwendung konfrontiert werden. Dieser Frage wurde auch in der in diesem Beitrag skizzierten Untersuchung nachgegangen. Bevor näher auf diese eingegangen wird, sollen vorab Hintergrund und Ursprung der zu Grunde liegenden Fragestellung genauer beleuchtet werden.

Keywords: /// Prototyping /// Konzeption /// Fidelity /// Usability-Testing /// iteratives Testing

1.1. Prototypen und ihre Fidelity In der Praxis lassen sich im Wesentlichen vier verschiedene Formen von Prototypen unterscheiden, anhand derer Anwendungen evaluiert werden können: –– Storyboard-Präsentationen, bei denen dem Nutzer verschiedene Screens einer Anwendung gezeigt werden. –– Papier-Prototypen, bei denen ein sog. Facilitator die Reaktion des Programmes auf die Aktionen der Nutzer simuliert und die Papierscreens entsprechend austauscht. –– Wizard-of-Oz-Simulationen, bei denen komplexere Funktionen (wie Spracherkennung) durch einen Mensch simuliert werden. –– Voll-funktionsfähige ComputerPrototypen, die bereits (in Teilen) eine vollständige Interaktion mit dem System ermöglichen (z. B. öffnen von Fenstern, Dateneingabe).


Usability Professionals 2011 Einflussfaktoren

Die Charakterisierung von Prototypen erfolgt dabei anhand ihrer Fidelity. Diese wird in der Literatur häufig wie folgt definiert: “(…) the degree to which the prototype accurately represents the appearance and interaction of the product (…), not the degree to which the code and other attributes invisible to the user are accurate. (Rudd & Stern, 1996, S. 78). Mit anderen Worten: Je geringer der für den Nutzer augenscheinliche Unterschied zwischen einem Prototyp und der Originalanwendung, desto höher ist die Fidelity des Prototyps. Dementsprechend werden Papier-Prototypen und Storyboard-Präsentationen häufig als low-Fidelity-Prototypen bezeichnet und voll funktionsfähige Computer-Prototypen als high-Fidelity-Prototypen. Doch welche Prototyp-Fidelity ist für welche Phase im Designprozess geeignet? Hierzu gibt es äußerst unterschiedliche Befunde und Ansichten. 1.2. Studien zum Einfluss der Fidelity In der Literatur wird häufig empfohlen, in frühen Entwicklungsphasen eher mit lowFidelity-Prototypen zu arbeiten und weit fortgeschrittene Konzepte mit high-Fidelity-Prototyen zu evaluieren (Rudd, Stern, & Isensee, 1996). Dieser Empfehlung liegt die Annahme zu Grunde, dass UsabilityProbleme mit dem späteren System besser vorausgesagt werden können, wenn ein Prototyp diese Anwendung hinsichtlich der Optik und der Interaktionsmöglichkeiten möglichst genau abbildet. Einige Autoren gehen allerdings davon aus, dass low-Fidelity-Prototypen auch in späteren Entwicklungsphasen sehr gut für die Systemevaluation geeignet sind (z. B. Sefelin, Tscheligi, & Giller, 2003; Snyder, 2003). Diese Autoren kommen in ihren Studien zu dem Ergebnis, dass Prototypen von geringer und hoher Fidelity sich nicht signifikant in der Anzahl und Qualität der Usability-Probleme unterscheiden, die sie aufdecken.

Als eine Ursache dieser unterschiedlichen Annahmen kann auch die Tatsache gesehen werden, dass die Fidelity in den in den verschiedenen Studien häufig sehr unterschiedlich definiert wurde. Manche Studien zählten Papier-Prototypen grundsätzlich zu den low-Fidelity-Prototypen (Nielsen, 1990; Rudd et al., 1996; Lim, 2006). Andere Studien machten hingegen deutlich, dass allein das verwendete Medium (Papier vs. Computer) nicht ausschlaggebend für die Höhe der Realitätsnähe sein muss (Walker, Takayama, & Landay, 2002; Sefelin et al., 2003). Sie machten die Einstufung eines Prototyps als high oder low Fidelity von der visuellen Ausarbeitung und den Interaktionsmöglichkeiten abhängig. 1.3. Von high und low Fidelity zum Konzept der mixed Fidelity Die o.g. Sachverhalte verdeutlichen, dass eine einfache Unterscheidung in high und low Fidelity nicht ausreicht, um die Vielzahl verschiedener Prototypen zu charakterisieren und auszuwählen. Je nach System oder Fragestellung der Evaluation ergeben sich sehr unterschiedliche Anforderungen an den Aufbau des Prototyps: Möchte man z. B. nur eine einzige Funktion eines gesamten Programmes untersuchen oder soll das gesamte Navigationskonzept evaluiert werden? Geht es eher um das Layout oder die Verständlichkeit von Eingabemöglichkeiten? Hier wird sehr schnell deutlich, dass die Frage nach der angemessenen Fidelity nicht pauschal mit „high“ oder „low“ beantwortet werden kann. Vielmehr gibt es eine Vielzahl von Aspekten, über deren Fidelity im einzelnen und je nach Fragestellung entschieden werden muss.

Vor diesem Hintergrund entwickelte McCurdy (2006) das sogenannte Konzept der mixed Fidelity. Dieses trägt der o. g. Vielzahl von Aspekten Rechnung, die bei der Konzeption von Prototypen berücksichtigt werden müssen. Bei diesem Konzept wird die Fidelity eines Prototyps auf mehreren Dimensionen definiert, welche unabhängig voneinander in Bezug auf high bzw. low Fidelity variiert werden können. Diese Dimensionen sind: –– Visuelle Verfeinerung (Aussehen) –– Breite der Funktionalität –– Tiefe der Funktionalität –– Umfang der Interaktionsmöglichkeiten –– Vollständigkeit des Datenmodells Ein mixed-Fidelity-Prototyp ist nach dieser Definition ein Prototyp, der in Bezug auf einige (oder eine) Dimensionen über hohe Fidelity verfügt und während die Fidelity der übrigen Dimensionen mittel bis gering ausgeprägt ist (McCurdy, 2006, S. 1233). Möchte man also, wie oben genannt, nur eine einzige Funktion eines Systems untersuchen, sollte demnach die Tiefe der Funktionalität stark ausgearbeitet sein, damit der Nutzer im Test den gesamten Ablauf erproben kann. Die Breite der Funktionalität kann hier über geringe Fidelity verfügen, da andere Funktionen nicht relevant sind und daher zwar auf oberster Ebene abgebildet werden können – sie müssen jedoch nicht klickbar sein. Es zeigt sich, dass das Konzept der mixed Fidelity es ermöglicht, sehr differenziert festzulegen, welche Dimensionen eines Prototyps für eine bestimmte Fragestellung ausgearbeitet sein sollten und welche vernachlässigt werden können. [Abb. 1] So wird auch vermieden, dass unnötige zeitliche und finanzielle Ressourcen in

Abb. 1. Unabhängige Manipulation einzelner Fidelity-Dimensionen (Quelle: eigene Darstellung).

121


Ausarbeitung von Bereichen investiert werden, die für eine Evaluation gar nicht notwendig wären. 1.4. Befunde zum Einfluss der visuellen Verfeinerung Wenngleich das Konzept der mixed Fidelity eindeutig Vorteile gegenüber der ursprünglichen dichotomen Unterscheidung bietet, so gibt es dennoch bislang kaum Studien, die sich mit dem Einfluss einzelner Dimensionen auf z. B. die Identifikation von Usability-Problemen oder das Nutzerverhalten im Usability-Test befassen. Aus der bisherigen Forschung zur Fidelity und auch zur Ästhetik von Prototypen lässt sich jedoch die Vermutung ableiten, dass vor allem die Dimension der visuellen Verfeinerung ein beeinflussender und somit entscheidender Faktor sein könnte. Häufig wird empfohlen, einen Prototyp erst dann mit einem kompletten Design auszustatten, wenn dieses auch evaluiert werden soll. Dies wird zum einen damit begründet, dass die Nutzer ansonsten zu viele Kommentare zu kosmetischen Aspekten des Prototyps abgeben und sich weniger auf funktionale Aspekte konzentrieren (Snyder, 2003; McCurdy, 2006). Auch legen manche Studien nahe, dass Nutzer größere Hemmungen haben, einen Prototyp zu kritisieren, der über ein komplett ausgearbeitetes Layout verfügt und dementsprechend „vollständig“ wirkt (z. B. Snyder, 2003). Darüber hinaus gibt es aber auch Studien, die belegen, dass die Bewertung der Ästhetik eines Systems auch die Bewertung der subjektiv empfundenen Usability beeinflusst – je „schöner“ das System eingestuft wird, desto höher wird auch die Usability bewertet. Eine Studie zu diesem Thema stammt von Tractinsky et al. (2000). Die Teilnehmer dieser Studie wurden in drei Gruppen aufgeteilt und bewerteten zunächst neun Screens in Bezug auf die Kriterien „Ästhetik“, „Usability“ und „Menge der Informationen“. Im Anschluss daran führte jede Versuchsperson mit

122

einem der Screens einige Aufgaben durch, wobei die tatsächliche Usability der Screens experimentell manipuliert war (niedrig vs. hoch, operationalisiert durch die Reaktionszeit des Systems oder der Buttons). Die Teilnehmer wurden den Kategorien hohe bzw. geringe Usability zufällig zugeordnet.

zurückzuführen waren oder durch Wechselwirkung mit weiteren Faktoren entstanden.

Im Anschluss an die Aufgabenbearbeitung bewerteten die Teilnehmer das System, mit dem sie gearbeitet hatten, erneut in Bezug auf die drei bereits

Dabei wurde von folgenden Annahmen ausgegangen:

genannten Kriterien. Es zeigte sich dabei, dass die Bewertung der subjektiven Usability nur wenig von der tatsächlichen Usability des Systems beeinflusst wurde, sondern eher davon, wie schön die Nutzer das System fanden. Dies legt die Vermutung nahe, dass Nutzer einen Prototyp hoher visueller Verfeinerung hinsichtlich der Usability besser bewerten könnten als einen funktionsgleichen Prototyp geringer Verfeinerung, wenn sie diesen aufgrund der mangelnden Ausgestaltung als weniger schön empfinden. Die bisher aufgezeigten Befunde machen deutlich, dass hinsichtlich des Einflusses der Dimension „visuelle Verfeinerung“ noch Klärungsbedarf besteht. Fördert ein nur grob ausgearbeiteter Prototyp mehr und qualitativ hochwertigere Probleme zutage als ein Prototyp, der bereits über ein vollständiges Layout verfügt? Führt das Vorhandensein visueller Details in einem Prototypen-Test dazu, dass sich Nutzer eher auf eben diese „kosmetischen“ Aspekte beziehen und somit weniger Feedback zu funktionalen Aspekten abgeben? Und beeinflusst die ästhetische Wirkung die Beurteilung der Usability? Eine eindeutige Antwort auf diese Fragen kann aus den bisher skizzierten Befunden nur schwer abgeleitet werden, da all diese Studien neben der visuellen Verfeinerung noch weitere Faktoren variierten (wie z. B. das Medium, die Informationsarchitektur). Somit konnte nicht zweifelsfrei geklärt werden, ob Gruppenunterschiede jeweils tatsächlich auf die Optik des Prototyps

In der im Folgenden beschrieben Studie wurde daher zum ersten Mal gezielt der Einfluss der visuellen Verfeinerung auf das Verhalten von Nutzern und die Problemerkennung im Usability-Test untersucht.

–– Prototypen von hoher und geringer visueller Verfeinerung fördern eine ähnliche Anzahl und Qualität von Usability-Problemen zu Tage (Sefelin et al., 2003; Virzi, Sokolov, & Karis, 1996). –– Der Prototyp von hoher visueller Verfeinerung wird im Test besser bezüglich der Attraktivität besser bewertet als der Prototyp von geringer visueller Verfeinerung. Dementsprechend wird auch die Usability des Prototyps von hoher visueller Verfeinerung besser bewertet als die des Prototyps von geringer visueller Verfeinerung (Tractinsky et al., 2000). 2. Grundlagenstudie zur visuellen Verfeinerung 2.5. Methodik und Ablauf der Studie Bei der durchgeführten Untersuchung handelt es sich um ein einfaktorielles Design mit zwei Stufen, bei der die visuelle Verfeinerung als unabhängige Variable auf den Stufen “hoch” und “niedrig” variiert wurde. Hierzu wurde ein Zwei-GruppenVergleich durchgeführt. Jeweils eine Gruppe (à 12 Testpersonen) durchlief einen Usability-Test mit einem Webseiten-Prototyp, der über geringe visuelle Verfeinerung verfügte (Abb. 2) und hauptsächlich in Graustufen gehalten war. Weitere 12 Testpersonen durchliefen den gleichen Test mit einem Prototyp von hoher visueller Verfeinerung (Abb.3). Im Hinblick auf die übrigen vier Dimensionen der Fidelity (nach McCurdy, 2006) unterschieden sich die beiden Prototypen nicht voneinander. Auf diese Weise konnte gewährleistet werden, dass ein eventueller Unterschied


Usability Professionals 2011 Einflussfaktoren

zwischen den Gruppen eindeutig auf die Manipulation der unabhängigen Variablen (visuelle Verfeinerung) zurückzuführen ist. [Abb. 2], [Abb. 3] Im Rahmen der durchgeführten Untersuchung war hierbei vor allem der Einfluss auf folgende abhängigen Variablen von Interesse: –– Anzahl und Qualität erkannter Usability-Probleme –– Bewertung der Attraktivität und der subjektiv empfundenen Usability Beim dem verwendeten Testgegenstand handelte es sich um einen frühen Konzeptentwurf für ein online-basiertes Nutzertagebuch – da keiner der Testpersonen bisher mit einem solchen Tool gearbeitet hatte, konnte so auch ein Einfluss eventueller Erfahrungswerte der Nutzer ausgeschlossen werden. Jede der Testpersonen absolvierte im Rahmen des Tests fünf Aufgaben mit dem Prototyp. Im Anschluss an die Aufgabenbearbeitung erfolgte eine sogenannte Videokonfrontation (Hamborg & Greif, 1999). Zudem füllten die Testpersonen abschließend einen Fragebogen aus, mit dem die Attraktivität und die subjektive empfundene Usability der Seite erfasst wurden. Der Fragebogen bestand aus 14 der 21 Items aus dem AttrakDiff (Hassenzahl et al., 2003) – je sieben davon erfassten die wahrgenommene Attraktivität bzw. die wahrgenommene Usability (operationalisiert über die Items zur pragmatischen Qualität aus dem Fragebogen).

Abb. 2. Prototyp geringer visueller Verfeinerung

2.6. Zentrale Ergebnisse 2.6.1. Anzahl und Qualität gefundener Usability-Probleme Die Auswertung zeigte, dass sich die Anzahl der gefundenen Usability-Probleme in beiden Bedingungen nicht signifikant voneinander unterscheidet. So konnten bei hoher visueller Verfeinerung insgesamt 30 Probleme identifiziert werden; bei geringer Verfeinerung waren es 28 (jeweils ohne Redundanzen). Darüber hinaus wurden

Abb. 3. Prototyp hoher visueller Verfeinerung

123


Geringe Verfeinerung

Hohe Verfeinerung

Anzahl der Probleme pro Gruppe (inkl. Redundanzen)

41

36

Anzahl der Probleme pro Gruppe (ohne Redundanzen)

30

28

Anzahl alleinig gefundener Probleme

7

5

Anzahl aller gefundenen Probleme insgesamt über beide Gruppen (ohne Redundanzen)*

49

2.6.2. Bewertung der Attraktivität und der subjektiv empfundenen Usability

Tab. 1. Anzahl identifizierter UsabilityProbleme bei geringer bzw. hoher visueller Verfeinerung

Kategorie

Geringe Verfeinerung

Hohe Verfeinerung

Wording

14

11

Navigation allgemein

3

1

unklare Unterteilung Tagebuch vs. Fragen

2

3

Navigation zu persönlichen Nachrichten

5

0

Seitenaufbau (Informationsarchitektur)

5

6

Kommentarfeld (unklare Funktion)

1

2

Gestaltung (Ablenkung durch graphische Elemente)

0

4

Logout

0

1

Gesamt

30

28

Tab. 2. Anzahl identifizierter Usability-Probleme bei geringer bzw. hoher visueller Verfeinerung differenziert nach Problemkategorie.

unter jeder Bedingung einzelne Probleme identifiziert, die jeweils nur hier aufgedeckt wurden. [Tab. 1] Für diejenigen Bereiche, in der nur von je einer Gruppe ein Usability-Problem festgestellt wurde, zeigte sich zumindest teilweise ein Unterschied zwischen den Gruppen: So wurden unter geringer visueller Verfeinerung mehr Probleme aufgedeckt, die sich auf die Navigation und das Wording bezogen (Fehlermeldung, Eingabeaufforderung in einem Formular). [Tab. 2]

124

zeitaufwendig ist. Hohe visuelle Verfeinerung förderte hingegen eher die Identifikation von Problemen zu Tage, die auf die Gestaltung einzelner Seitenelemente zurückzuführen waren. So wurden einzelne Testpersonen laut eigener Aussage z. B. von graphischen Elementen „abgelenkt“ oder sie bemängelten die farbliche Gestaltung einzelner Seitenbereiche.

Die Auswertung des Fragebogens zur Bewertung der Attraktivität und der subjektiv empfundenen Usability des Tools zeigt, dass sich im Hinblick auf die Bewertung ein signifikanter Unterschied in Bezug auf die Bewertung der Attraktivität ergab (df=13; p=0,01), nicht aber hinsichtlich der Usability (df = 13; p=0.118), wobei auch hier die Bewertung des Prototyps geringer visueller Verfeinerung tendenziell schlechter ausfällt wie Abb. 4 erkennen lässt. [Abb. 4] Weiterhin ergab die Analyse, dass die Korrelation zwischen der Bewertung Attraktivität und Usability bei hoher Verfeinerung generell höher ausfiel (r=.863) als bei geringer Verfeinerung (r=.606). 3. Implikationen für die Praxis

Vor allem Probleme hinsichtlich der Navigation und hinsichtlich des Wordings wurden im Vergleich zur hohen Verfeinerung häufiger gefunden. So fiel nur den Testpersonen, die mit dem schwarzweißen Prototypen arbeiten auf, dass einer der Navigationspfade sehr viele Klicks erforderte, um ans Ziel zu gelangen. Dies wurde als sehr umständlich bewertet – vor allem im Hinblick auf die häufige Nutzung dieser Funktion. Bei hoher Verfeinerung fiel dieser Sachverhalt den Testpersonen nicht auf, da sie aufgrund der farblichen Hervorhebung schnell ans Ziel gelangten – sie erkannten jedoch nicht, dass dieser Prozess bei häufiger Nutzer sehr

Die Ergebnisse zeigen, dass sich die visuelle Verfeinerung nicht auf die Anzahl identifizierter Usability-Probleme im Test auswirkt. Auch hinsichtlich der Qualität der Probleme wird deutlich, dass sich hier kein wesentlicher Unterschied ergibt. So gab es hohe Übereinstimmungen in der Problemidentifikation in Bezug auf die Funktionen und Seitenbereiche, die die Nutzung der Anwendung beeinträchtigen. Obgleich der Unterschied in Problemquantität und -qualität nicht signifikant war, lässt sich dennoch die Tendenz erkennen, dass geringe visuelle Verfeinerung dazu führt, dass sich die Testpersonen eher auf funktionale Aspekte konzentrieren wie z. B. das Wording und die Navigationsstruktur.


Usability Professionals 2011 Einflussfaktoren

Dementsprechende Probleme wurden z. T. bei geringer Verfeinerung erkannt, bei hoher Verfeinerung jedoch nicht. Das deutlichste Beispiel hierfür in der vorliegenden Studie war die Navigation von der Startseite zu einer persönlichen Nachricht für den Nutzer (siehe Tabelle 2, „Navigation zu persönlichen Nachrichten“). Bei hoher Verfeinerung war der Weg zu dieser Nachricht für die Nutzer aufgrund einer farblichen Hervorhebung in der Navigation recht leicht zu erkennen. Dass jedoch die Navigation dorthin sehr viele Klicks erfordert und dadurch sehr zeitaufwändig war, wurde nur unter geringer Verfeinerung erkannt. Der Navigationspfad wurde daraufhin in der anschließenden Optimierungsphase deutlich verkürzt, wodurch die Nutzerfreundlichkeit und die Effizienz der Nutzung erhöht werden konnten. Wäre nur mit einem Prototyp von hoher Verfeinerung getestet worden, wäre das Problem im Test nicht zu Tage gefördert worden. Hieraus lässt sich schließen, dass funktionale Aspekte wie Navigation, Wording oder Informationsarchitektur einer Anwendung mit einem Prototyp geringer Verfeinerung ggf. sogar besser evaluiert werden können als mit einem Prototyp hoher Verfeinerung, da sie aufgrund der mangelnden visuellen Ausgestaltung eine Konzentration der Nutzer auf die grundlegenden funktionalen Aspekte fördern. Einschränkend muss jedoch gesagt werden, dass dies nicht für jede Art von Anwendung gilt – hierauf soll weiter unten noch einmal eingegangen werden. Die Analyse der Bewertung der subjektiv empfunden Usability legt zudem die Vermutung nahe, dass die empfundene Attraktivität bei hoher Verfeinerung stärker auf die Bewertung der Usability einwirkt als dies bei geringer Verfeinerung der Fall ist. Die Bewertung der Usability und der Einfluss der empfundenen Attraktivität auf die wahrgenommene Usability wichen in beiden Bedingungen jedoch nicht signifikant voneinander ab. Dennoch ließ sich die Tendenz dahingehend erkennen, dass der Prototyp hoher Verfeinerung hinsichtlich seiner Usability besser bewertet wurde – und das, obwohl sich Qualität

Abb. 4. Bewertung der subjektiv empfundenen Usability und der Attraktivität

und Quantität der identifizierten UsabilityProbleme in beiden Bedingungen nicht signifikant voneinander unterschieden. Auf Grundlage der Daten kann allerdings keine eindeutige Aussage darüber getroffen werden, inwiefern die visuelle Verfeinerung eines Prototyps die Bewertung der Usability tatsächlich beeinflusst – diese Frage sollte daher mit einer größeren Stichprobe noch einmal erörtert werden. Für die Konzeption von Prototypen zum Zwecke der nutzerbasierte Evaluation von Anwendungen lassen sich aus der Studie abschließend einige Hinweise ableiten: 1. Prototypen von geringer visueller Verfeinerung sind für die Evaluation funktionaler Aspekte ebenso gut geeignet wir Prototypen von hoher visueller Verfeinerung. Sie fördern eine ähnlich hohe Anzahl von UsabilityProblemen zu Tage wie Prototypen hoher Verfeinerung und auch die Qualität der gefundenen Probleme unterscheidet sich nicht wesentlich voneinander. 2. Die Ergebnisse legen nahe, dass

sich Versuchspersonen bei geringer visueller Verfeinerung tendenziell eher auf funktionale Aspekte konzentrieren (wie z. B. Eindeutigkeit der Navigation, Wording) und somit ggf. Probleme identifizieren, die bei hoher Verfeinerung unentdeckt bleiben. 3. Zudem legen die Ergebnisse die Vermutung nahe, dass hohe visuelle Verfeinerung trotz ähnlicher identifizierter Usability-Probleme eher dazu führt, dass der Prototyp in Bezug auf seine Usability besser bewertet wird als dies bei geringer Verfeinerung der Fall ist. Inwiefern dies tatsächlich der Fall ist, bleibt abzuklären – dennoch sollte dieser Aspekt berücksichtigt werden, wenn die Usability eines Prototyps zusätzlich mit Hilfe eines Fragebogens erhoben wird – insbesondere wenn mit hoher visueller Verfeinerung getestet wird. Nicht zuletzt, da es ebenfalls denkbar ist, dass ein solcher Prototyp auch deshalb besser bewertet wird, da die Anwendung bereits recht „vollständig“ wirkt und die Versuchspersonen ihre

125


Bewertung daher aus Rücksicht auf die Entwickler weniger kritisch ansetzen (Snyder, 2003). Dennoch ist ein Test mit geringer visueller Verfeinerung nicht für alle Anwendungen empfehlenswert. Vielmehr muss vor der Entscheidung über den Grad der visuellen Verfeinerung vorab die genaue Fragestellung bzw. das Ziel der Evaluation analysiert werden. Generell lässt sich sagen, dass Prototypen geringer visueller Verfeinerung vor allem eignen für Fragestellungen, die sich auf funktionale Aspekte einer Anwendung beziehen wie z. B.: –– die Evaluation früher Konzepte und Ideen –– Wording oder Navigationsstruktur –– Verständlichkeit von Funktionalitäten und Features In anderen Fällen ist ein Test mit geringer visueller Verfeinerung eher nicht empfehlenswert. Dies gilt z. B. wenn: –– emotionale Qualitäten erhoben werden sollen (Joy of Use, Wirkung des Designs) –– das Design dem Nutzer eine wesentliche Orientierungshilfe auf der Seite bietet (z. B. beim Test von Anwendungen, die sehr viel Text oder anderes Datenmaterial enthalten, dass z. B. durch farbliche Hinterlegung oder Hervorhebung voneinander abgegrenzt werden soll). In diesen beiden Fällen ist eine visuelle Verfeinerung durchaus notwendig, wenn auch in unterschiedlicher Ausprägung: Da die Optik im ersteren Fall ein zentraler Bestandteil der Fragestellung ist, sollte das Aussehen des Prototyps der späteren Anwendung so ähnlich wie möglich sein, um auch z. B. den Joy of Use des späteren Systems korrekt vorherzusagen. Dies macht auch deutlich, dass die visuelle Verfeinerung oftmals erst gegen Ende des User-Centered-Designprozesses über hohe Fidelity verfügen kann, da ein genau ausgearbeitetes Layout zumeist erst zu einem späteren Zeitpunkt festgelegt wird.

Nutzer im Test negativ gegen den Prototyp beeinflusst werden, da besonders bei einer hohen Informationsmenge auf der Seite die Orientierung sehr schwer fällt, wenn nicht auf graphische Elemente zurückgegriffen wird. Hier muss die visuelle Verfeinerung sich zwar nicht detailgetreu am späteren Layout orientieren; sie sollte aber zumindest soweit ausgearbeitet sein, dass sie dem Nutzer hinreichende Orientierung bietet. Dies sollte auch ohne Weiteres schon in früheren Phasen des Konzeptionsprozesses möglich sein.

126

barrier: An examination of current characterization of prototypes and an example of a mixed fidelity success. CHI 2006 Proceedings, 1233-1243. 9. Nielsen, J. (1990). Paper versus Computer Implementations as Mockup scenarios for heuristic evaluation. In D. Diaper (Hrsg.), Human Computer-Interaction: Interact 90, S. 315-320. Amsterdam: Elsevier. 10. Rudd, J., Stern, K. & Isensee, S. (1996). Low vs. high-fidelity prototyping debate. Interactions, 3 (1), 76-85. 11. Sefelin, R., Tscheligi, M., & Giller, V. (2003).

Abschließend lässt sich demnach festhalten, dass – bei entsprechender Fragestellung – auf eine detaillierte visuelle Ausarbeitung von Prototypen verzichtet werden kann. Besonders wenn funktionale Aspekte im Vordergrund stehen, sollte man explizit davon Abstand nehmen, einen Prototyp mit einem kompletten Layout auszustatten. Denn geringe visuelle Verfeinerung lenkt die Aufmerksamkeit der Nutzer eher auf eben diese funktionalen Aspekte und die tatsächliche Usability einer Anwendung. Eine Beeinflussung des Urteils durch die Optik der Anwendung ist hier weniger wahrscheinlicher als bei hoher Verfeinerung. So kann es teilweise sogar empfehlenswert sein, einen Prototyp auch dann mit nur geringer visueller Verfeinerung zu testen, wenn bereits ein ausgearbeitetes Layout vorliegt, um die grundsätzliche Bedienbarkeit einzelner Funktionen oder des gesamten Konzeptes zu testen. Literatur 4. Bias, R. G. & Mayhew, D. J., (Hrsg.) (1994). Cost-Justifying Usability. San 5. Francisco: Morgan Kaufmann Publishers. 6. Hamborg, K.-C. & Greif, S. (1999). Hierarchische Aufgabenanalyse. In: H. Dunckel (Hrsg.). Handbuch psychologischer Arbeitsanalyseverfahren. Zürich: vdf. 7. Hassenzahl, M. Burmeister, K., & Holler, F. (2003). AttrakDiff: Ein Fragebogen zur Messung wahrgenommener hedonischer und pragmatischer Qualität. In: J. Ziegler & G. Szwillus (Hrsg.): Mensch und Computer 2003. Interaktion in Bewegung. Stuttgart: Teubner, S. 187-196.

Im zweiten Fall kann eine geringe visuelle Verfeinerung sogar dazu führen, dass die

8. McCurdy, M. (2006). Breaking the fidelity

Paper prototyping - what is it good for?: a comparison of paper- and computer-based low-fidelity prototyping. CHI ‘03 extended abstracts on Human factors in computing systems, 778-779. 12. Snyder, C. (2003). Paper prototyping: The fast and easy way to design and refine user interfaces. San Francisco: Morgan Kaufman. 13. Tractinsky, N., Katz, A.S., & Ikar, D. (2000). What is beautiful is usable. Interacting with Computers, 13, S. 127-145. 14. Virzi, R. A., Sokolov, J. L. & Karis, D. (1996). Usability Problem Identification using both low- and high-fidelity prototypes. Proceedings of CHI 96, S. 236-243.


127


„Da ham se mich aber reingelegt, dat muss man sich ja zuerst ganz durchlesen (...)“ Eine empirische Forschungsarbeit zur Relevanz sprachlicher Faktoren bei der Instruktionsgestaltung für Ältere Claudia M. Nick Institut für Arbeitswissenschaft der RWTH Aachen, Bergdriesch 27, 52062 Aachen, c.nick@iaw.rwth-aachen.de

Alexander Mertens Institut für Arbeitswissenschaft der RWTH Aachen, Bergdriesch 27, 52062 Aachen, a.mertens@iaw.rwth-aachen.de

Abstract Viele Der demographische der Interaktionsgeräte, Wandeldie wird in in jüngster vielen Bereichen Zeit auf den einMarkt Erneuern gekommen der Strukturen sind, sind erforgestendern. Insbesondere und touchbasiert. der Gesundheitssektor Diese auf neuen Technologien wird vor Herausforderungen basierenden Interaktionsformen gestellt werden. werden In diesem häufig Zusammenhang auch als natürliche befinden Interaktion sich sogenannte bezeichnet. elektronische Maus und„Nursing-Assistants“ Tastatur haben als Eingabegeräte auf dem Vormarsch, Konkurrenz welchebekommen. unterstützend Alsbei prominente der Versorgung Vorreiter und sind Pflege hier Älterer die aktuellen eingeSmartphones setzt werden sollen. sowie Microsoft Problematisch Surface gestaltet zu nennen. sich hierbei Damit hat die sich altersgerechte auch der Gestaltungssprachliche raum Gestaltung, für Interaktionsdesigner welche einen wesentlichen erweitert.Beitrag Die Konzeption zur Akzeptanz von Steuerungsgesten und Bedienbarkeit kommt der als Geräte neueleistet. Dimension Insbesondere hinzu. Den Faktoren damit verbundenen wie die Verwendung Herausforderungen von Signalwörtern, widmetaktiveN sich unser Formulierungen, Tutorial. WirFremdwörtern, zeigen die Bandbreite das Gliedern neuer des Interaktionsmöglichkeiten Textes in überschaubareauf Abschnitte, und probieren sowie visuelle gemeinsam Hervorhebungen mit den Teilnehmern von Schlüsselwörtern eine Methodeund zurEinhaltung Gestaltungzeitlicher von gestenIkonizität und touchbasierter spielen für ein gelungenes Interaktion aus. Textverständnis eine wesentliche Rolle. In einem 45 Personen umfassenden Versuch wurde die Relevanz dieser Faktoren empirisch untersucht. Die Probanden erhielten 4x3 Instruktionen, welche es möglichst schnell und fehlerfrei umzusetzen galt. Die Ergebnisse des Versuchs belegen die Relevanz zeitlicher Ikonizität für das Textverständnis Älterer im Umgang mit Instruktionen.

1. Einführung Wohl kaum eine soziale Gruppe weist eine derart stark ausgeprägte Heterogenität auf, wie die der „Älteren“. Unterschiedlichste Biographien mit verschiedensten Bildungswegen und eventuelle Krankheiten machen es schwer, überhaupt von „der Gruppe der Älteren“ zu sprechen. Unbeachtet dieser Definitionsproblematik scheint jedoch Einigkeit über die Tatsache zu existieren, dass mit zunehmendem Alter kognitive und physiologische Leistungsveränderungen auftreten. Oftmals werden die Betroffenen durch physiologische Beeinträchtigungen in ihrer Selbstständigkeit eingeschränkt, ihren Alltag eigenständig zu meistern. Neue Technologien versuchen diesem Problem zu begegnen, und ein autonomes Leben bis ins hohe Alter zu ermöglichen. Eine besondere Rolle spielt dabei die Gestaltung von Anleitungen, denn die elaborierteste Technik nutzt nichts, wenn sie nicht vom Nutzer bedient werden kann. Wirtz, Jakobs und Ziefle (2009) haben dazu 20 unterschiedliche Arten von Usability Problemen identifiziert

128

und diese in 5 Kategorien gefasst. Diese Kategorien lauten: Kohärenz, Sprachliche Faktoren, Feedback, Layout und Struktur (Wirtz, Jakobs & Ziefle 2009). In dem durchgeführten Versuch wurden drei dieser Kategorien genauer betrachtet: die Sprache betreffende -, Layout- und Struktur- Faktoren. 1.1. Struktur-Faktoren Das Problem der strukturellen Gestaltung betrifft den allgemeinen inhaltlichen Aufbau des Textes. Für die Erhebung wurde der Aspekt der zeitlichen Ikonizität evaluiert. 1.1.1. Zeitliche Ikonizität Es ist nachvollziehbar, dass ein nicht chronologischer Textaufbau schwieriger zu verstehen ist, als ein Text, dessen Struktur den chronologischen Ablauf der Geschehnisse wiedergibt (vgl. Smith et al. 1983). Letzteres beschreibt den Begriff der zeitlichen Ikonizität. Zeitliche Ikonizität „(…) occurs

Stefan Krüger Medizinische Klinik I des Universitätsklinikums der RWTH Aachen, Pauwelsstraße 30, 52074 Aachen, stkrueger@ukaachen.de

Keywords: /// Textverständlichkeit /// 50+ /// zeitliche Ikonizität /// Layout-Faktoren /// Sprachliche Faktoren

whenever the linear relations in a text stand for temporal (…) relations between the referents in the world described by that text.” (Enkvist 1981, 99). Haspelmath, welcher den Begriff geprägt hat, nennt als Beispiel für einen solchen zeitlich ikonen Satz, den berühmten Ausspruch: “Er kam, er sah, er siegte.“ (vgl. Haspelmath 2003, 2). Nicht ikon wäre hingegen „Bevor er siegte, kam und sah er“. Bislang gab es zur Relevanz zeitlicher Ikonizität jedoch auseinander gehende Befunde. Während Van Horen et al. zu dem Ergebnis kommen, dass “the results of Experiment II suggest that temporal iconicity of instructions is not helpful.” (Van Horen et al. 2009, 51), fanden Maxim und Bryan heraus, dass “sentences in which the order of mention was the same as the order of occurrence were significantly easier to understand than sentences where the order of mention was not the order of occurrence.” (Maxim & Bryan 1994, 36) Vor dem Hintergrund, dass mit dem Alter die Leistungen des Kurzzeit-Gedächtnisses abnehmen (vgl. Mc Daniel, Einstein & Jacoby, 2008) und bei nicht ikonen Texten, Informationen länger im Gedächtnis

119


Usability Professionals 2011 Einflussfaktoren

behalten werden müssen, um nach Erhalt aller Informationen die Reihenfolge der Ereignisse rekonstruieren zu können, sollten Ältere nicht nur von zeitlicher Ikonizität in Texten profitieren können; zeitliche Ikonizität sollte unter Berücksichtigung der kognitiven Veränderungen im Alter sogar eins der wichtigsten Kriterien zur Erreichung von Textverständlichkeit sein. Aus diesem Grund wurde diesem Faktor, im Versuch eine besondere Position eingeräumt. 1.2. Sprachliche Faktoren Die im Versuch betrachteten sprachlichen Faktoren sind die Verwendung von Fremdund Signalwörtern, sowie der Gebrauch von passiven Satzformulierungen. 1.2.1. Fremdwörter In einer Befragung von Jakobs, Lehnen & Ziefle wurde nach Störfaktoren bei Bedienungsanleitungen gefragt. 45,8% der Teilnehmer gaben an, dass diese ihrer Meinung nach unverständlich seien. Ursache dafür seien Fachausdrücke bzw. Fachchinesisch, unbekannte englische Ausdrücke und Abkürzungen (vgl. Jakobs, Lehnen & Ziefle 2008, 57), aber auch sonstige unklare bzw. unverständliche Begriffe (vgl. Jakobs, Lehnen & Ziefle 2008, 69). Und auch in den “ETSI 2006 user education guidance and guidelines” wird das Problem einer nicht angemessen Sprache thematisiert (vgl. Stephanidis 2009, 17). Ein wichtiger Aspekt der Verständlichkeit von Texten, ist der Bekanntheitsgrad der verwendeten Wörter. „Es ist offensichtlich, dass Wortformen, die selten vorkommen, weniger geläufig sind und daher beim Dekodieren mehr Mühe bereiten als häufig auftretende.“ (vgl. Amstad 1978, 33ff). Wörter, die einen geringen Bekanntheitsgrad aufweisen, wurden im Rahmen dieser Arbeit unter dem Begriff der „Fremdwörter“ zusammengefasst. Darunter fallen sowohl englische Bezeichnungen und Fachbegriffe, als auch deutsche Ausdrücke, die weniger geläufig sind. Ownby fand heraus, dass „(…) complexity of

vocabulary is the most consistent aspect of text that differentiates text (…) whose overall ratings indicate that they are easier or more difficult to read.“ (Ownby 2005, 587). Und auch Ziefle und Bay geben die Empfehlung, Fremdwörter, Abkürzungen und technische Fachbegriffe zu vermeiden (Ziefle & Bay 2005, 386). Es sollten also entweder Wörter verwendet werden, welche einen hohen Bekanntheitsgrad haben (vgl. Fisk et al. 2004, 22) oder wenn dies nicht möglich ist, adäquate Umschreibungen geliefert werden (vgl. Jakobs, Lehnen & Ziefle 2008, 58). 1.2.2. Signalwörter Mit Signalwörtern sind Wörter gemeint, welche keinen neuen inhaltlichen Beitrag zum Thema leisten, aber welche gewisse Aspekte des semantischen Inhalts betonen oder bestimmte strukturelle Aspekte hervorheben, wie z. B. „schließlich“ oder „um…zu“ (vgl. Meyer, 1975). Sie erleichtern das Erfassen gewisser textueller Strukturen und helfen, eine korrekte und kohärente mentale Repräsentation des Textes zu bilden (vgl. Lorch & Lorch, 1996). Da Signalwörter also die Anforderungen an die kognitiven Kapazitäten reduzieren (vgl. Meyer, Marsiske & Willis 1993, 2) sollten insbesondere Ältere von deren Verwendung profitieren (vgl. Van Horen et al. 2009, 44). 1.2.3. Passivverwendung Ein zentraler Aspekt bei der Gestaltung von Technologien ist das Treffen der Wünsche und Erwartungen der Nutzer. Insbesondere Ältere erwarten eine „zielgruppenorientierte Adressierung z. B. „direktes Ansprechen des Anwenders“ (Jakobs, Lehnen & Ziefle 2008, 58). Dass die Verwendung von passiven Formulierungen zu erschwertem Textverständnis führt, wurde sowohl von Obler et al. (1985), als auch in einer jüngeren Studie von Ownby (2005) bestätigt (Obler et al. 1985, zitiert nach Bayles & Kaszniak 1987, 149; vgl. Ownby 2005, 587).

1.3. Layout-Faktoren Hinsichtlich der gestaltungstechnischen Gesichtspunkte wurden die optische Hervorhebung einzelner Elemente, sowie die Gliederung des Gesamttextes betrachtet. Andere ergonomische Gestaltungsaspekte wie Farbkontraste, Schriftgröße etc. wurden außen vor gelassen. 1.3.1. Optische Hervorhebung Signale, welche den kognitiven Aufwand zum Verstehen eines Textes reduzieren, können nicht nur durch bestimmte Wörter gesetzt werden. Signale können auch akustisch oder visuell erzeugt werden. Was akustisch die Betonung einzelner Wörter ist (vgl. Cohen & Faulkner 1986, 91), sind im Visuellen der Schriftschnitt (bspw. fett oder kursiv), Unterstreichungen oder besondere Positionierungen innerhalb einer Tabelle oder eines Dokuments (vgl. Meyer, Marsiske & Willis 1993, 2). Unabhängig von der Art des Signals, können ältere Menschen generell von Elementen profitieren, welche die Aufmerksamkeit lenken (vgl. Fisk et al 2004, 21). 1.3.2. Optische Gliederung Doch auch “changes in spatial layout can have significant consequences on accuracy and speed.” (vgl. Detweiler & Ellis 1996, 183). So fand Cohen heraus, dass Altersunterschiede weniger evident sind, wenn die vermittelten Informationen gut strukturiert dargeboten werden (vgl. Cohen 1987, 224). Dass eine gute Gliederung des Textes auch im Sinne der Nutzer ist, zeigt das Ergebnis der, bereits unter 1.2.1 erwähnten Umfrage von Jakobs, Lehnen & Ziefle. Da wurde auf die Frage „Was stört an Bedienungsanleitungen?“ von 39,6% der Personen geantwortet, dass diese unübersichtlich seien. Konkret wurden eine unübersichtliche Struktur und fehlende oder unpräzise Schritt-für-Schritt-Anweisungen bemängelt (vgl. Jakobs, Lehnen & Ziefle 2008, 57). Strukturierte Absätze ermöglichen es dem Leser einfacher zwischen der Anleitung

129


Version

Unabhängige Variable 1

Unabhängige Variable 2

A

zeitlich ikon

strukturierte Textgliedrung, aktiv, hervorgehobene Schlüsselwörter, keine Verwendung von Fremdwörtern und Verwendung von Signalwörtern

B

zeitlich ikon

unstrukturierter Fließtext, passiv, keine Hervorhebungen, Verwendung von Fremdwörtern und keine Verwendung von Signalwörtern

C

zeitlich nicht ikon

strukturierte Textgliederung, aktiv, hervorgehobene Schlüsselwörter, keine Verwendung von Fremdwörtern und Verwendung von Signalwörtern

D

zeitlich nicht ikon

unstrukturierter Fließtext, passiv, keine Hervorhebungen, Verwendung von Fremdwörtern und keine Verwendung von Signalwörtern

Tab. 1. Die vier untersuchten Instruktionsversionen

und dem zu bedienenden Gerät hin- und herzuwechseln (vgl. Steehouder & Karreman, 2000), da sie verdeutlichen, wann der Nutzer aufhören kann zu lesen und wann er anfangen kann, den erfassten Text umzusetzen. Außerdem erleichtern sie die Orientierung innerhalb des Textes, so dass insbesondere die älteren Nutzer weniger Gefahr laufen, einen Schritt zu wiederholen oder versehentlich zu überspringen (vgl. Van Horen et al. 2009, 51). 2. Empirische Studie Um ein Verständnis vom Versuch und dessen Ablauf zu bekommen, soll im Folgenden zunächst das Versuchsdesign mit den abhängigen und unabhängigen Variablen erläutert werden. Danach wird die Gruppe der Probanden skizziert. 2.1. Versuchsdesign Bei dem durchgeführten Versuch handelt es sich um einen Reaktionstest. Bei Reaktionstests geht es “(…) um ein Ausführen von Anweisungen, die im getesteten Text enthalten sind. An der Art, wie die Versuchsperson reagiert, kann man dann erkennen, ob und in welchem Umfang sie den Text verstanden hat“ (Amstad 1978, 43). Konkret sollten die Versuchspersonen bestimmte Instruktionen umsetzen, die ihnen auf einem 10 Zoll Tablet-PC

130

mit Touchscreen präsentiert wurden. Um hierbei nicht quantifizierbare Effekte, verursacht durch alternsbedingte Veränderungen des visuellen Systems, zu minimieren, wurde eine Schriftgröße von 18 pt eingehalten (vgl. Fisk et al. 2004) sowie eine serifenfreien Schrift verwendet (vgl. Hartley, 1994). Des Weiteren wurde die Position des Bildschirms auf die Anthroprometrie des jeweiligen Probanden eingestellt. Es gab drei verschiedene Instruktionsarten in jeweils vier verschiedenen Versionen. Diese vier Versionen ergeben sich aus der Kombination der zwei unabhängigen Variablen [Tab. 1]: –– Die Art der Formulierung in Hinblick auf die Ikonizität –– Die Art der Formulierung in Hinblick auf weitere förderliche Layout- und Sprachfaktoren An Aufgabenstellungen wurden folgende Instruktionstypen unterschieden. Zum einen gab es Aufgaben des Typs „Tabletten setzen“ (T). Dabei sollten die Versuchspersonen verschiedenfarbige Perlen nach einem in der Instruktion beschriebenen Schema, in eine dafür vorgesehene Tablettendose sortieren. Bei Instruktionen der Art „Termin machen“ (N) sollten die Teilnehmer durch den Tablet-PC navigieren und einen Termin für eine Dienstleistung, wie beispielsweise eine Putzhilfe vereinbaren. Bei der Instruktionskategorie „KörperKoordination“ (K). sollten die Probanden

Bewegungsabläufe koordinieren (z. B. die rechte Hand auf das Kinn und mit der linken Hand über den Kopf greifen) [Abb. 1] Diese Instruktionen wurden den Probanden in unterschiedlicher Reihenfolge gegeben. Das Erstellen der Abfolgen erfolgte gemäß dem Williams-Design. „The Williams design is a special case of the cross-over and Latin square designs. A Latin square, in which every treatment is represented once, and once only, in each column and in each row, yields uniform cross-over designs; (...) Such a cross-over design (...) is said to be balanced with respect to first-order carry-over effects“1. (Wang, Wang & Gong 2009, 2f). Charakteristisch für das Williams-Design ist, dass pro Durchlauf jede Variante nur einmal vorkommen darf und jede Variante bei jedem Durchlauf an einer anderen Stelle auftreten muss. [Abb. 2] Somit nahm jeder Proband an vier Versuchssequenzen teil. Jede Versuchssequenz bestand aus jeweils drei Instruktionen, wobei jede Aufgabenart (T, N, K) in jeder Sequenz nur genau einmal vorkam und keine Formulierungsversion (A, B, C, D) innerhalb einer Sequenz zweimal auftrat. Zudem wurde die Reihenfolge in der die Versionen in jeder Sequenz auftreten, variiert. Dies hat zur Folge, dass sich in der anschließenden Auswertung Effekte, die eventuell mit der Position der Version innerhalb der Reihenfolge zusammenhängen aufheben.2 Darüber hinaus wurde zwischen den Sequenzen immer eine halbe Stunde Pause gemacht, um einen eventuellen Lerneffekt abzumildern. Als abhängige Variablen wurden die, für das Lesen und Umsetzen, benötigte Zeit (t) und die Anzahl, der bei der Umsetzung gemachten Fehler (F) betrachtet. 2.2. Probanden Es wurden 45 Personen getestet. Acht davon absolvierten den Pretest, die restlichen 37 Personen nahmen an der eigentlichen Datenerhebung teil. Von diesen 37 Probanden wurde einer ausgeschlossen, da er kein deutscher Muttersprachler war und Schwierigkeiten im Textverständnis


Usability Professionals 2011 Einflussfaktoren

Abb. 1. Screenshot einer Instruktion (K) in Version A

Abb. 2. Screenshot einer Instruktion (K) in Version D

somit nicht eindeutig auf die in den Instruktionen verwendeten Formulierungskriterien zurückzuführen sind.

ausgemacht werden können. Die Mittelwerte der einzelnen Kategorien können [Tab. 2] entnommen werden.

24 der eingeschlossenen Testpersonen waren männlich, 12 waren weiblich. Mit 47,2% war die Altersgruppe zwischen 61 und 70 Jahren, die unter den Teilnehmern am stärksten vertretene. 33,3% waren zwischen 71 und 80 Jahre alt, 11,1% waren zwischen 50 und 60 Jahren. 8,3% der Probanden waren im Alter zwischen 81 und 90 Jahren.

Betrachtet man die Mittelwerte der einzelnen Aufgabentypen, so fällt auf, dass sowohl bei den Aufgaben der Kategorie (T) als auch der Gruppe (K), Instruktionen der Version B geringere Fehlerwerte aufweisen, als Instruktionen des Typs A. So wurden bei (K) in Version A 8,25% mehr Fehler gemacht, als bei Instruktionen von Typ B. Bei Instruktionen der Gruppe (T) waren es sogar 35,38% mehr Fehler, die in Variante A aufgetreten sind. Schaut man jedoch auf die Mittelwerte der Zeiten, so stellt man fest, dass Aufgaben in den Versionen A schnellere Umsetzungszeiten aufweisen, so dass die besseren Fehlerwerte bei B durch einen speedaccuracy trade-off erklärt werden können. Das bedeutet, dass sich die Probanden bei den (T) und (K) Instruktionen in Version B mehr Zeit zur Umsetzung genommen und dadurch weniger Fehler gemacht haben.

3. Analyse der Ergebnisse Im Folgenden sollen die zentralen Ergebnisse der Studie präsentiert werden.3 In der Analyse wurden ANOVAs für die Zeit- und Fehlerwerte aller Aufgaben erstellt. Dabei konnten sowohl für die Zeit- (p = 0,03) als auch für die Fehlerauswertungen (p = 0,00) signifikante Unterschiede hinsichtlich der Verwendung von zeitlicher Ikonizität festgestellt werden. Somit scheinen ikone Formulierungen wesentlich verständlicher zu sein, als nicht ikone Formulierungen. Die durchschnittliche Fehleranzahl für Instruktionen der Kategorien A und B lag bei ÆF = 0,5 (SD 0,84), während bei Aufgaben der Versionen C und D durchschnittlich ÆF = 1,78 (SD 1,86) Fehler gemacht wurden. Die Mittelwerte der Zeiten lagen für Instruktionen von A und B bei Æt = 90,57 s (SD 43,78) und bei C und D bei Æt = 106,34 s (SD 60,75). Der Bonferroni-Test ergab, dass jedoch keine signifikanten Unterschiede für die Fehler- und Zeitwerte zwischen den beiden ikonen respektive den beiden nicht ikonen Versionen untereinander

Im Durchschnitt ließen sich Probanden bei Instruktionen der Gruppe (K) in Version B ca. 6,5% mehr Zeit, bei Instruktionen der Gruppe (T) waren es 9,88% mehr Zeit, die zwischen den Versionen A und B lagen.

Tabletten setzen (T)

Es konnten keine Effekte für Alter und Geschlecht gefunden werden, wobei jedoch zu berücksichtigen ist, dass die Stichprobe nicht balanciert war. Ein deutlicher Effekt, der an dieser Stelle jedoch noch erwähnt werden soll, bezieht sich auf die Nutzung von Computern. In dem Fragebogen, welcher vor Beginn der Testung ausgefüllt werden musste, gaben 21,6% an, noch nie einen Computer bedient zu haben. 45,9% bedienen einen Computer täglich, 21,6% 2-3 mal pro Woche und 10,8% haben selten Umgang mit Rechnern. Der Unterschied in der Umsetzungsleistung der Gruppe derer, welche noch nie einen Rechner bedient haben zu den Leistungen der anderen Gruppen, war sowohl für die Fehler- als auch für die Zeitwerte stark signifikant (pt = 0,00; pF = 0,00). Der Mittelwert der Fehler lag bei den Computernutzern bei ÆF = 0,97 (SD 1,41) Fehlern pro Aufgabe, während der der Gruppe, welche nie Computer nutzt, bei ÆF = 1,84 (SD 1,99) Fehlern pro Aufgabe lag. Die Mittelwerte der Zeiten waren für die der Nicht-Nutzer Æt = 113,32 s (SD 70,14), für die anderen Æt = 94,87 s (SD 48,05).

Termine machen (N)

Körper-Koordination (K)

Æ: F

Æ: t

Æ: F

Æ: t

Æ: F

Æ: t

Version A

0,639

112,5*

0,167*

70,61*

0,722

74,31*

Version B

0,472*

123,61

0,333

83,28

0,667*

79,14

Version C

1,431

128,61

0,472

89,92

3,111

82,39

Version D

1,583

133,5

0,722

102,03

3,347

101,6

Tab. 2. Mittelwerte der Fehler(absolut) und Zeitwerte (in s) nach Aufgabentypen *= markiert das beste Ergebnis der Gruppe nach UV

131


4. Diskussion und Fazit Die Ergebnisse der Erhebung legen nahe, dass zeitliche Ikonizität bei der Gestaltung von Instruktionen eine wesentliche Rolle spielt. Anweisungen, welche zeitlich ikon waren, konnten schneller und fehlerfreier umgesetzt werden, als Anweisungen, welche nicht ikon waren. Eine differenzierte Evaluation der Relevanz der anderen Faktoren, war im Rahmen dieses Versuchs nicht möglich. Betrachtet man jedoch die Unterschiede hinsichtlich der Zeit- und Fehlerquote zwischen den nicht ikonen Versionen C und D, so schneiden Instruktionen, welche die anderen förderlichen Faktoren, wie aktive Formulierungen, strukturierte Textgliederung, hervorgehobene Schlüsselwörter, Auslassung von Fremdwörtern und das Verwenden von Signalwörtern berücksichtigen, sowohl zeitlich als auch hinsichtlich der Anzahl der gemachten Fehler, besser ab. Die Stichprobe des Versuchs konzentrierte sich auf die Zielgruppe 50+, dennoch hat eine ergonomische Gestaltung von Anleitungstexten einen altersunabhängigen positiven Effekt auf die Verständlichkeit der Instruktionen und ein damit verbundenes subjektives Kontrollempfinden des Nutzers zum Vorteil. Diese Untersuchung stellt wissenschaftlich abgesicherte Grundlagenforschung zur Entwicklung von nutzerfreundlicher und gebrauchstauglicher Mensch-MaschineInteraktion dar.

Taylor & Francis Ltd.

17. Ownby, R., L. (2005). Influence of Vocabulary

3. Cohen, G. (1987). Speech comprehension in

and Sentence Complexity and Passive Voice

the elderly. British Journal of Audiology, 21,

on the Readability of Consumer-Oriented

221-226.

Mental Health Information on the Internet.

4. Cohen, G. & Faulkner, D. (1986). Does “Elderspeak” work? The effect of intonation and

AMIA 2005 Symposium Proceedings. 585-588. 18. Stephanidis, C. (2009). The Universal Access

stress on comprehension and recall of spoken discourse in old age. Language & Communi-

Handbook. New York: CRC Press. 19. Smith, S. W., Rebok, G. W., Smith, W. R., Hall,

cation, 6, 91-98.

S. E., & Alvin, M. (1983). Adult age differences

5. Detweiler, M., C. & Ellis, R., D. (1996). The

in the use of story structure in delayed free

Effects of Display Layout on Keeping Track

recall. Experimental Aging Research, 9(3),

of Visual-Spatial Information. In Rogers, W., A., Fisk, A., D. & Walker, N. (Hrsg.) Aging and

191-195. 20. Steehouder, M., & Karreman, 1. (2000). De

Skilled Performance. (S.157-184). Mahwah:

verwerking van stapsgewijze instructies. Tijd-

Lawrence Erlbaum Associates, Inc. Publishers. 6. Enkvist, N. E. (1981). Experiential iconicism in

schrift voor Taalbeheersing, 22, 218-237. 21. Van Horen, F., Jansen, C., Noordman, L. &

text strategy. Text, 1(1), 97-111.

Maes, A. (2009). Manuals for the elderly:

7. Fisk, A., D., Rogers, W., A., Charness, N.,

Text characteristics that help or hinder older

Czaja, S., J. & Sharit, J. (2004). Designing for

users. In Hayhoe, G. F & Grady, H. M (Hrsg.)

older adults – Principles and Creative Human

Connecting people with technology – Issues

Factors Approaches. New York: CRC Press.

in professional communication (S. 43-53). New

8. Hartley, J. (1994). Designing instructional text for older readers: A literature review. In:

York: Baywood Publishing Company, Inc. 22. Wang, B. S., Wang, Li, X. J. & Gong, L. K.

British Journal of Educational Technology 25,

(2009). The Construction of a Williams Design

172-188.

and Randomization Cross-Over Clinical Trials

9. Haspelmath, M. (2003). Against Iconicity and

Using SAS. Journal of Statistical Software,

Markedness. (Über:

29. (Über: http://www.jstatsoft.org, zuletzt

10. http://email.eva.mpg.de/~haspelmt/IconicityMarkedness.pdf, zuletzt besucht Juni 2011)

besucht Juni 2011) 23. Wirtz, S., Jakobs, E., M. & Ziefle, M. (2009).

11. Jakobs, E. M., Lehnen, K. & Ziefle, M. (2008).

Age-specific usability issues of software

Alter und Technik – Studie zu Technikkonzep-

interfaces. Proceedings of the IEA 2009 – 17th

ten, Techniknutzung und Technikbewertung

World Congress on Ergonomics (Bejing, China. CD-Rom).

älterer Menschen. Aachen: Apprimus Verlag. 12. Maxim, J. & Bryan, K. (1994). Language of the

24. Ziefle, M. & Bay, S. (2005). How older adults

elderly: A clinical perspective. London: Whurr

meet complexity: aging effects on the usabi-

Publishers, Ltd.

lity of different mobile phones. Behaviour & Information Technology 24 (5), 375-389.

13. Mc Daniel, M., A., Einstein, G., O. & Jacoby L., L. (2008). New considerations in aging and memory: The glass may be half full. In Craik,

Danksagung Unser Dank geht an alle Probanden der Studie, sowie an die Mitarbeiter des KKS und CTCA des Universitätsklinikums Aachen, welche uns bei der Umsetzung des Versuchs tatkräftig unterstützt haben.

F., I. & Salthouse, T., A. (Hrsg.) The Handbook

1

bei einer Reihe von Testungen, die Ergebnisse

York: Psychology Press.

eines Durchgangs durch die vorherigen Durchgänge ungewollt beeinflusst wird.

14. Meyer, B. J. F. (1975). The organization of prose and its effects on memory. Amsterdam:

Bei „carry-over Effekten erster Ordnung“

North Holland Pub. Co.

betrachtet man dabei lediglich die Beeinflussung durch den direkt vorgelagerten

15. Meyer, B. J. F., Marsiske, M. & Willis, S. L.

Literatur

(1993). Text processing variables predict the

1. Amstad, T. (1978). Wie verständlich sind

readability of everyday documents read by

unsere Zeitungen? Abhandlung zur Erlangung der Doktorwürde der Philosophischen

Man spricht von „carry-over Effekten“ wenn

of Aging and Cognition (S. 251-310). New

Durchgang. 2

Insgesamt wurde jede Formulierungsversion jeweils neun Mal an erster, respektive zweiter

older adults. Read Res Q, 28(3)

und dritter Stelle gegeben.

16. Meyer, B., J., F. & Rice, G., E. (1981). Informa-

Für die Ergebnisse weiterer

Fakultät I der Universität Zürich. Zürich:

tion recalled from prose by young, middle

Studenten-Schreib-Service.

and adult readers. Experimental Ageing

Detailauswertungen kann sich gerne per Email

Research, 7, 253-268.

an die Verfasser des Papers gewandt werden.

2. Bayles, K., A. & Kaszniak, A., W. (1987).

Communication and Cognition in normal aging and dementia. London:

132

3


Webseiten Best Practices

133


Themenbühnen im Internet aus UsabilitySicht – Ergebnisse einer Usability-Studie Torsten Bartel usability.de Plaza de Rosalia 4 30449 Hannover torsten.bartel@usability.de

Gesine Quint usability.de Plaza de Rosalia 4 30449 Hannover gesine.quint@usability.de

Abstract Viele Der Beitrag der Interaktionsgeräte, stellt Planung, Design die inund jüngster ersteZeit Ergebnisse auf den einer MarktUsability-Studie gekommen sind, zursind Nutgestenzung vonund Themenbühnen touchbasiert. vor. Diese Themenbühnen auf neuen Technologien werden inzwischen basierenden auf unterschiedlichsten Interaktionsformen werden Websites häufig eingesetzt, auch als umnatürliche auf einemInteraktion festen Bereich bezeichnet. die wichtigsten Maus und Themen Tastaturder haben Seiteals in Eingabegeräte Kombination mit Konkurrenz oft großflächigen bekommen. Hintergrundgraphiken Als prominente Vorreiter und Interaktionselementen sind hier die aktuellen zur Smartphones Steuerung durch sowie dieMicrosoft Benutzer Surface vorzustellen. zu nennen. In der Damit Studiehat wurde sichdurch auch der 20 Usability-Tests Gestaltungsraum und begleitendes für Interaktionsdesigner Eye Trackingerweitert. untersucht, Diewie Konzeption sich Benutzer von Steuerungsgesten auf Websites verhalten, kommt die als dieses neue Element Dimension einsetzen. hinzu. Neben Den damit Usability-Problemen verbundenen Herausforderungen bei der Benutzung widmet von Themensich unser bühnen, Tutorial. stand Wir in der zeigen Studie diedie Bandbreite Frage nach neuer demInteraktionsmöglichkeiten Nutzen (engl. Usefulness) auf vonund Themenprobieren bühnengemeinsam auf unterschiedlichen mit den Teilnehmern Seiten im Vordergrund. eine Methode zur Gestaltung von gesten- und touchbasierter Interaktion aus.

1. Einleitung Immer häufiger begegnen uns auf der Startseite von Websites so genannte Themenbühnen: Das Weiße Haus in Washington auf whitehouse.gov setzt dieses interaktive Element ebenso ein wie etwa das Landesportal Nordrhein-Westfalens (nrw. de) oder die Online-Präsenz des Frauenmagazins Brigitte (brigitte.de). [Abb. 1]

Einsatz und zum idealen Aufbau dieses innovativen Elements auf einer Website. Über die Usability hinausgehend schließen sich aber auch Fragen nach dem Nutzen von Themenbühnen generell an: Erschließt sich der Mehrwert dieses Elements den Nutzern? In welchem Kontext und für welche Art von Inhalten stellen Themenbühne eine gute und benutzbare Alternative zu klassischen Seiteneinstiegen dar?

Auf einem festen Bereich werden in Kombination mit Hintergrundgraphiken die wichtigsten Themen der Seite vorgestellt. Der Aufbau der Themenbühne variiert dabei sehr: Auf weniger komplexen Themenbühnen können die Benutzer z. B. über drei verlinkte Punkte oder die Zahlen „1“, „2“, „3“ zwischen drei Themen auswählen, die jeweils durch einen kurzen Text, ein großes Foto und einen Link zur entsprechenden Unterseite angeboten werden. Komplexere Varianten hingegen bieten auch mehr als drei Themen zum Explorieren an, integrieren weitere Unterthemen pro Thema und ergänzen das Ganze mit zusätzlichen Steuerelementen wie beispielsweise Start- und PauseButtons. Aus Usability-Sicht ergeben sich verschiedene spannende Fragen zum

Abb. 1. Themenbühne auf der Startseite von brigitte.de

134

Steffen Weichert usability.de Plaza de Rosalia 4 30449 Hannover steffen.weichert@usability.de

Keywords: /// Themenbühne /// Eye Tracking /// Usability-Studie /// User Experience /// Usefulness

In diesem Artikel wird vorgestellt, was genau unter einer Themenbühne zu verstehen ist, welche Fragestellungen in der Usability-Studie zu Themenbühnen untersucht wurden, welche Methodik hierzu eingesetzt wurde und welche ersten Ergebnisse die Auswertung in Bezug auf die User Experience und insbesondere den Nutzen von Themenbühnen hervorbrachte.

112


Usability Professionals 2011 Webseiten Best Practices

2. Themenbühne: Abgrenzung und Definition Auffällig bei der Beschäftigung mit der Thematik Themenbühnen war, dass sich in eingängigen Web- und Usability-Blogs keine einheitliche Benennung für das Seitenelement Themenbühne finden ließ. Die im englischen Sprachgebrauch verbreiteten Begriffe wie Content Slider, Slideshow oder Carousel erschienen zu breit angelegt für das Element, das sich auf vielen Seiten wiederfinden ließ. Der Begriff Content allein umfasst sowohl textuelle Informationen, wie auch Produkte im E-Commerce oder Videos auf Musikportalen. Unter der Annahme, dass beispielsweise für die Präsentation von Produkten im E-Commerce andere Regeln gelten, als etwa für die Präsentation von aus Text und Bild zusammengesetzten Sach-Informationen und aktuellen Themen, wurden im Vorfeld der Usability-Studie ein Benchmarking und eine ausführliche Analyse von Websites mit themenbühnenartigen Elementen durchgeführt. Aufbauend auf diesem Benchmarking und der Untersuchung von Gemeinsamkeiten und Unterschieden wurde eine Arbeitsdefinition entwickelt, die den Untersuchungsgegenstand Themenbühnen wie folgt definiert und gegenüber ähnlichen aber nicht deckungsgleichen Konzepten wie z. B. einem reinen Produktkarussell zum Durchblättern verschiedener Artikel oder einer Foto-Slideshow abgrenzt: Definition: Eine Themenbühne ist ein auf einer Website zentral platziertes, interaktives Element, mit dem ausgewählte Themen der Website vorgestellt werden. Themenbühnen sind auf einen festen Bereich beschränkt, in der Regel im oberen Bereich der Startseite platziert und ohne scrollen beim Aufruf der Seite sichtbar. Eine Themenbühne besteht dabei aus –– einer Reihe von Bildern, auf denen die Themen platziert werden –– mindestens einer zum ausgewählten Bild passenden Überschrift, die das Thema beschreibt

–– mindestens einer Verlinkung zu einer Unterseite, auf der das Thema ausführlich behandelt wird –– einer Animation, die einen automatischen Bildwechsel bewirkt –– einer Möglichkeit zur Navigation, mithilfe derer Benutzer zu einem anderen Thema in der Themenbühne wechseln können. Optional enthält eine Themenbühne eines oder mehrere der folgenden Elemente: –– Interaktionselemente zur Steuerung der automatischen Animation, z. B. Start- und Pause-Buttons –– Positionsanzeige und Paginierung zur Orientierung: Welches Thema ist ausgewählt? Welche weiteren Themen stehen zur Verfügung? Wie viele Themen sind insgesamt vorhanden? –– Teasertext, der das durch Überschrift und Hintergrundbild vorgegebene Thema näher beschreibt –– Videos –– Audiodateien 3. Ablauf der Usability-Studie 3.1. Studiendesign Die im Zeitraum März bis Mai 2011 durchgeführte Studie umfasste die folgenden Schritte: 1. Analyse: Insgesamt 50 internationale und nationale Websites, die Themenbühnen oder themenbühnenähnliche Elemente einsetzen, wurden im Rahmen einer Benchmark-Analyse untersucht und Gemeinsamkeiten, Spezifika und Unterschiede gesammelt. 2. Klassifikation: Aufbauend auf der Analyse wurden typische Bestandteile (z. B. Fotos/Bilder, Überschriften etc.) und Eigenschaften (Animation, Interaktionsmöglichkeiten, etc.) klassifiziert und zu einer Taxonomie zusammengeführt. 3. Arbeitsdefinition und Eingrenzung: Die Taxonomie wurde herangezogen um eine Arbeitsdefinition für den Begriff Themenbühne festzulegen und eine deutliche Abgrenzung gegenüber verwandten Konzepten

vornehmen zu können. Auf diese Weise wurde die Auswahl an potentiellen Untersuchungsgegenständen aus der Benchmark-Analyse weiter eingeschränkt. 4. Thesen: Auf Basis der Analyse- und Benchmark-Ergebnisse wurden Thesen zur benutzerfreundlichen Darstellung und zum Nutzen von Themenbühnen aufgestellt, bei denen das Hintergrundwissen der beteiligten Usability-Experten ebenso einflossen wie eine Usability-Analyse mittels Cognitive Walkthrough-Verfahren. 5. Auswahl der Testobjekte: Aus den Websites, die durch die Verwendung der Themenbühne in die erarbeitete Definition fielen, wurden schließlich sechs Testobjekte für die Studie ausgewählt. Die Auswahl fiel auf Websites aus möglichst verschiedenen Themenbereichen (z. B. Politik, Organisation, Unternehmen), um den Einfluss unterschiedlicher Themen auf den Nutzen und die Benutzung von Themenbühnen in die Studie einzubeziehen. Darüber hinaus war für die Eignung als Testobjekt relevant, dass sich die Inhalte der Themenbühnen nicht zu häufig verändern, um über den Testverlauf von einer Woche eine konstante Vergleichbarkeit der Ergebnisse sicherzustellen. Bei der Auswahl wurden Themenbühnen mit starkem Fokus auf eine spezielle Zielgruppe (z. B. brigitte.de mit der Zielgruppe weibliche Benutzer) ausgeschlossen, um Testteilnehmer jedweden Geschlechts und unterschiedlichen Alters einbeziehen zu können. Weiteres Entscheidungskriterium bei der Auswahl der Testobjekte war eine möglichst breit gefächerte Verwendung der in der Arbeitsdefinition festgehaltenen Merkmale und Navigationselemente, sodass schließlich sowohl eher minimalistische Themenbühnen in die Auswahl gelangten, als auch Themenbühnen, die das Maximum an Eigenschaften und Interaktionselementen beinhalteten. 6. Usability-Tests mit Eye Tracking: Zur Überprüfung der Thesen wurden

135


Abb. 2. Themenbühne auf www.drk.de

20 leitfadengestützte UsabilityTests mit Blickverlaufsmessung (Eye Tracking) inklusive Vor- und Nachbefragungsanteilen mit 20 Teilnehmern durchgeführt. Bei den Tests kam sowohl die Concurrent Think-Aloud (CTA) Methodik als auch die Retrospective Think-Aloud (RTA) Methodik zum Einsatz. 7. Auswertung und Überprüfung der Thesen: Nach der Durchführung der Tests wurden die Ergebnisse der Usability-Tests quantitativ und qualitativ ausgewertet und zu einer Ergebnissammlung zusammengestellt. 8. Empfehlungen: Im letzten Schritt wurden Handlungsempfehlungen für die benutzerfreundliche Gestaltung von Themenbühnen abgeleitet und formuliert. 3.2. Untersuchungsgegenstand Für die Untersuchung der Thesen zu Nutzen und Benutzerfreundlichkeit von Themenbühnen wurden die Websites von CDU, UPS, Stadt Hamburg, Brot für die Welt, Deutsche Bahn und Deutsches Rotes Kreuz ausgewählt. Bei der Auswahl war entscheidend, dass sich die Inhalte nicht mehrmals täglich inhaltlich stark verändern.

136

Abb. 3. Themenbühne auf www.brotfuerdiewelt.de

Der Webauftritt sollte außerdem alle Altersgruppen und beide Geschlechter gleichermaßen ansprechen, sodass die Identifikation mit den Szenarien cf. Kapitel 3.4.2 optimal war. Die Themenbühnen sollten sich zudem in ihren Merkmalen und Navigationselementen ausreichend unterscheiden, um eine große Varianz an Ergebnissen sicherzustellen. Im Folgenden werden die Besonderheiten der Testobjekte detailliert beschrieben. 3.2.1. Themenbühne auf www.drk.de Die Themenbühne auf www.drk.de wird über zwei große Pfeile links und rechts des Bildes navigiert. Die Themenbühne enthält keine Statusanzeige über die Gesamtzahl der verfügbaren Themen. Der Text zur Beschreibung des Themas besteht aus Überschrift und zweizeiligem Teasertext und befindet sich im unteren, farblich abgehobenen Bereich. [Abb. 2] 3.2.2. Themenbühne auf www.brotfuerdiewelt.de Die Themenbühne der Organisation Brot für die Welt stellt insgesamt vier Themen vor. Die Anzahl der Themen sowie das

aktuell angezeigte Thema wird den Benutzern durch die Paginierung in der Mitte der Themenbühne kommuniziert. Mit Hilfe der Paginierung können die Themenbühnenseiten angewählt werden. Zusätzlich enthält die Themenbühne einen Pause-Button, mit dem die automatische Animation angehalten und erneut gestartet werden kann. Es befinden sich zwei knappe Überschriften im linken unteren Bereich des Bildes, abgehoben durch einen weißen Hintergrund. Verlinkt ist nur die größere der Überschriften. Teasertext zur näheren Erläuterung des Themas kommt nicht zum Einsatz. [Abb. 3] 3.2.3. Themenbühne auf www.cdu.de Die Themenbühne der CDU-Website dominiert die Startseite deutlich, indem sie einen großen Teil der Seite einnimmt und eine herkömmliche Seiten-Navigation fast vollständig ersetzt. Sie stellt insgesamt 12 Themen vor, die durch einen mehrzeiligen Teasertext mit zwei Überschriften vorgestellt werden. Die Verlinkung erfolgt über einen „Weiter lesen“-Link unterhalb des Texts. Zur Navigation und Orientierung stehen dem Benutzer eine Paginierung, zwei Pfeile im linken unteren Bereich sowie ein „Alle Themen“-Button zur Verfügung.


Usability Professionals 2011 Webseiten Best Practices

Abb. 4. Themenbühne auf www.cdu.de

Dieser führt zu einer Art visuellem Inhaltsverzeichnis der Themen: Klickt der Nutzer auf diesen Button, werden zwölf kleine Vorschaubilder der verschiedenen Themen sowie bei Mouse-over die dazugehörige Überschrift angezeigt. [Abb. 4] 3.2.4. Themenbühne auf www.hamburg.de Auf der Seite von Hamburg.de nimmt die Themenbühne im Gegensatz zu den anderen untersuchten Websites relativ wenig Platz ein. Trotz der geringen Größe entspricht sie dennoch der aufgestellten Definition einer Themenbühne: Sie beinhaltet ein Bild auf dem abhängig von den insgesamt fünf präsentierten Themen Text platziert ist. Die Menge des Textes variiert dabei von Thema zu Thema. Außer dem Teasertext sind auf der Themenbühne bis zu vier Textlinks platziert, die zu verschiedenen Unterseiten führen, die mit dem aktuell ausgewählten Thema verwandt sind. Verlinkt sind pro Seite immer das Bild, die zusätzlichen Textlinks sowie ein Link-Icon, das dem Teasertext nachgestellt ist. Navigiert wird die Themenbühne über eine Zeile unter den Bildern. Dort wird für jede Seite jeweils ein Schlagwort zum angezeigten Thema dargestellt. Rechts und links

Abb. 5. Themenbühne auf www.hamburg.de

dieser Schlagworte finden sich außerdem Pfeile. Über die Schlagworte kann ein beliebiges Thema angewählt werden. Mit den Pfeilen kann der Nutzer vorwärts und rückwärts blättern. Verwendet der Besucher eine der Navigationsmöglichkeiten, stoppt die Animation automatisch. [Abb. 5] 3.2.5. Themenbühne auf www.ups.de Die Themenbühne auf der deutschen Website des Paketdienstleisters UPS enthält den Zugang zu insgesamt drei Themen. Für die Auswahl eines Themas sowie die Übersicht über mögliche Themen steht eine Navigationszeile zur Verfügung. Sie befindet sich im unteren Bereich des Bildes und zeigt einen Ausschnitt aller Themenbühnenbilder als verkleinerte Version verbunden mit einem Schlagwort, welches ebenfalls dem jeweiligen Thema entnommen ist. In dieser Navigationszeile kann der Nutzer durch Mouse-Over ein Thema auswählen. Bei Klick auf das entsprechende Bild wird die zugehörige Inhaltsseite geladen. Zu jedem Bild gehören kurze schlagwortartige Überschriften, ein Teil ist farblich abgehoben und erscheint auch durch das nachgestellte Icon verlinkt. Tatsächlich ist jedoch das gesamte Bild, der vollständige

Teasertext und die Themenbühnennavigation verlinkt.Beim Aufruf der Website vergehen einige Sekunden bis die Themenbühne vollständig geladen ist. [Abb. 6] 3.2.6. Themenbühne auf www.deutschebahn.de Auf der Seite der Deutschen Bahn befindet sich die Themenbühne an oberster Stelle noch über der Seitennavigation der Website. Beim Aufruf der Seite vergehen einige Sekunden bevor das erste Thema inklusive Bild vollständig geladen ist. Die vier präsentierten Themen werden jeweils durch ein Bild und eine kurze Überschrift im rechten Bereich dargeboten. Das Thema wird dabei auf einem grau hinterlegten Bereich dargestellt. Die aktuell nicht ausgewählten Themen werden nur bei MouseOver über einen der insgesamt vier Pfeile im rechten Bereich aufgeklappt. Diese Pfeile fahren beim automatisch animierten Themenwechsel aus und zeigen eine kurze Überschrift. Bei Mouse-Over über diese Überschrift fahren die Reiter weiter aus, werden breiter, zeigen weiteren Text sowie ein Bild oder einen Film. Erst an dieser Stelle wird ein Link angeboten (> mehr), der noch nicht zur Themen-Detailseite führt, sondern zunächst eine ausführliche

137


Abb. 6. Themenbühne auf www.ups.de

Themenbeschreibung auf der Themenbühne selbst evoziert. Aus diesem ausführlicheren Teasertext wird auf die zum Thema gehörende Inhaltsseite verlinkt. [Abb. 7] 3.3. Fragestellungen Einige Kernfragen, die durch die Studie beantwortet werden sollten, lauteten wie folgt: –– Wird die Themenbühne der jeweiligen Website (überhaupt) genutzt und zu welchem Zeitpunkt? –– Erfolgt der Einstieg in ein Thema über die Themenbühne oder über eine andere Möglichkeit auf der Website und warum? –– Nutzt die Testperson die Navigationselemente der Themenbühne? –– Welche Schwierigkeiten hat die Testperson gegebenenfalls bei der Verwendung der Themenbühne? –– Welche Interaktionselemente eignen sich gut für den Einsatz auf Themenbühnen, welche weniger gut (Tab-Navigation, Buttons, Links, Zahlen („1“, „2“, „3“), geometrische Formen (Kreis, Quadrat, …)? –– Wo werden weiterführende Links am besten platziert?

138

Abb. 7. Themenbühne auf www.deutschebahn.de

–– Wie komplex darf eine Themenbühne maximal sein, damit sie ihren Zweck ein interessantes Thema präsentieren erfüllt, dabei aber kontrollierbar bleibt? –– Werden die verschiedenen Themen in der Themenbühne wahrgenommen? –– Werden alle Themen der Themenbühne wahrgenommen? –– Werden Texte in der Themenbühne gelesen? –– Welche Rolle spielt die Länge und die Aufbereitung des Texts, der ein Thema beschreibt? –– Welche Rolle spielt die Auswahl der Bilder für die Wahrnehmung und Nutzung der Themenbühne? –– Welche Art von Graphiken sind geeignet um ein Thema angemessen zu unterstützen? –– Wie werden die Themenbühnen im Kontext der jeweiligen Website bewertet?

durchschnittliche Alter betrug 34,5 Jahre (Median = 32 Jahre).

3.4. Ablauf der Usability-Tests 3.4.1. Stichprobe

In der zweiten Aufgabe wurde ein zielgerichtetes Informationsbedürfnis in den Vordergrund gestellt. Durch diese Unterscheidung der Szenarien wurde erreicht, dass zunächst der Schwerpunkt auf die Wahrnehmung der Website als Ganzes gelegt werden konnte (Wird die Themenbühne überhaupt wahrgenommen und genutzt?), bevor im zweiten Schritt die

Die Usability-Tests wurden mit 20 Teilnehmern (11 Frauen, 9 Männer) im Alter von 20 bis 56 Jahren durchgeführt. Das

3.4.2. Szenarien Für jede der sechs ausgewählten Websites wurden Szenarien entwickelt, die der Testperson eine Intention gaben sich auf der Website zu bewegen. Dabei gab es für jedes Testobjekt zwei Aufgaben. Eine Aufgabe war dabei möglichst offen formuliert, sodass sich die Testperson frei auf der Website bewegen konnte. Ein Beispiel für ein freies Szenario auf der Website der CDU lautete: „In wenigen Wochen finden die nächsten Wahlen statt. Sie möchten sich deshalb einen Überblick über die aktuellen politischen Themen verschaffen. Sie beginnen auf der Website der CDU.“


Usability Professionals 2011 Webseiten Best Practices

Rolle der Themenbühne für ein spezifisches Informationsbedürfnis überprüft wurde. Ein zielgerichtetes Szenario für die Website der CDU lautete: „Sie haben in der Zeitung einen Artikel über das Thema Vereinbarkeit von Familie und Beruf gesehen, in dem die politische Diskussion zu dem Thema beschrieben wird. Nun möchten Sie sich auf der Seite der CDU darüber informieren, wie diese Partei zu dem Thema steht.“ 3.4.3. Methodik Die insgesamt 20 Testteilnehmer wurden per Zufallsverfahren in zwei Gruppen eingeteilt. Die Teilnehmer der Gruppe A untersuchten die Websites der CDU, der Deutschen Bahn und von Brot für die Welt. Die Probanden der Gruppe B untersuchten die Websites von UPS, der Stadt Hamburg und des Deutschen Roten Kreuz. Um Reihenfolgeeffekte auszuschließen wurden die Szenarien in rotierender Reihenfolge dargeboten. Dabei wurde die erste Website immer mit dem offenen Szenario und die anderen zwei Websites mit den zielgerichteten Szenarien untersucht. Für die ersten beiden Szenarien wurde auf die Methode des gleichzeitigen Lauten Denkens (Concurrent Think-Aloud – CTA) verzichtet und der Moderator unterbrach die Testperson während der Bearbeitung nicht. Die Testpersonen wurden gebeten sich zur Bearbeitung der Aufgaben so viel Zeit zu nehmen wie nötig. Signalisierte die Testperson nicht vorher, die Aufgabe aus ihrer Sicht zufriedenstellend bearbeitet zu haben, griff der Testleiter erst nach ca. fünf Minuten ein und beendete die Aufgabe. Beim dritten und letzten Szenario pro Test wurde CTA eingesetzt und die Teilnehmer gebeten während der Bearbeitung der Aufgabe laut zu Denken. Dieses Vorgehen diente vor allem dazu konkrete Erkenntnisse zur Usability der Themenbühnen zu erhalten, selbst wenn die Teilnehmer diese in den freien Szenarien noch nicht verwendet hatten.

Nach der Bearbeitung aller drei Szenarien folgte der Teil des Tests, in welchem die Methode des nachträglichen Lauten Denkens (Retrospective Think-Aloud - RTA) eingesetzt wurde: In dieser Testphase betrachteten die Teilnehmer gemeinsam mit dem Moderator das aufgezeichnete Videomaterial der freien Szenarien inklusive des visualisierten Blickverlaufs (Gaze Plot). Die Testperson wurde dabei gebeten, ihre eigenen Handlungen auf der Website sowie die Augenbewegungen anzusehen und ihre Vorgehensweise auf den jeweiligen Websites retrospektiv zu beschreiben oder zu kommentieren. Dieses zweistufige Vorgehen war im Kontext dieser Studie besonders wichtig, da in einem ersten Schritt überprüft werden sollte, inwieweit die Themenbühnen auf der Website überhaupt genutzt werden (Usefulness), was durch die stille Bearbeitung ohne CTA möglich war. Ergänzend zur Bearbeitung der Szenarien wurde eine User Experience Befragung der Teilnehmer durchgeführt, bei der neben der Usability auch Faktoren wie Spaß bei der Benutzung (Joy of Use) und Nutzen (Usefulness) untersucht wurden. 4. Erste Ergebnisse der Studie 4.1. Teilnehmer verwenden die Themenbühne nicht Das überraschendste und zugleich schwerwiegendste Ergebnis der umfassenden Studie bestand darin, dass die Teilnehmer in 70% aller Nutzungsfälle die Themenbühnen auf der Website nicht verwendeten, selbst wenn sie sich einige Minuten auf der Website aufhielten. Um in ein für sie interessantes Thema einzusteigen verwendeten die Teilnehmer statt der Themenbühne alternative Einstiege wie z. B. einen Navigationseintrag oder einen Mehr-Link in einem Artikel. Die Gründe hierfür waren vielfältig: –– Manche bemerkten die automatische Animation nicht und verkannten dadurch die Möglichkeit weitere

Themen der Themenbühne ansehen zu können: „Ich hatte das erste Thema da angesehen und dann woanders weitergesucht, weil es nicht das war, wonach ich gesucht habe. Dass da noch mehr kommt, hatte ich nicht bemerkt.“ (Zitat eines Testteilnehmers) –– Die Themenbühne wurde vollständig übersehen oder bewusst ausgeblendet, da sie in der Anmutung als Werbebanner oder als Werbung der Website-Betreiber in eigener Sache wahrgenommen wurde. –– In einigen Fällen wurde die Themenbühne ausschließlich als grafisches Element wahrgenommen, das das Seitendesign angenehm unterstützt. Die Interaktions- und Navigationsmöglichkeit wurde in diesen Fällen nicht bemerkt. –– Stieß das erste dargestellte Thema der Themenbühne nicht auf das Interesse der Benutzer, so suchten sie nach einem alternativen Einstieg auf der Website. –– Einige Teilnehmer empfanden die Themenbühne nicht als relevantes Instrument, um in die Website einzusteigen. Sie bevorzugten z. B. die Hauptnavigation der Website. 4.2. Themenbühne für die zielgerichtete Navigation nicht geeignet Nachdem die Teilnehmer verschiedene Themenbühnen ausprobiert und teilweise verwendet hatten, kamen sie zu dem Schluss, dass sie für die zielgerichtete Navigation nicht geeignet seien. Begründet wurde dies unter anderem damit, dass die Wahrscheinlichkeit zu gering sei, bei manuell vom Website-Betreiber ausgewählten Inhalten eine Deckung mit dem eigenen spezifischen Informationsbedürfnis zu haben: „Es ist schon sehr unwahrscheinlich, dass der Betreiber der Seite hier etwas platziert, das zufällig dem entspricht, was ich gerade suche.“ (Zitat eines Testteilnehmers)

139


Abb. 8. Überblicksseite über alle Themen der Themenbühne auf cdu.de

Abb. 9. Auf www.cdu.de empfinden die Benutzer den Kontrast von Schrift zum Hintergrundbild als zu gering

4.3. „Alle Themen“-Link kommt sehr gut an

das sind die Themen, die die CDU gerad pushen will.“ (Zitat eines Testteilnehmers)

Fünf der sechs untersuchten Themenbühnen boten keine Überblicksseite zu allen dargebotenen Themen. Die Teilnehmer empfanden das Blättern auf diesen Themenbühnen als sehr aufwendig. Der „Alle Themen“-Link auf der Themenbühne des CDU-Portals wurde von mehreren Teilnehmern hingegen als sehr nützlich hervorgehoben. Gelobt wurde insbesondere die Möglichkeit mit einem Klick einen Überblick über alle Themen der Themenbühne zu erhalten. Die Gestaltung der Überblicksseite dagegen wurde als wenig hilfreich empfunden, da die Themenübersicht dort lediglich auf Bilder beschränkt war und somit schwer zu erkennen war, um welche Themen es sich handelt. [Abb. 8]

4.5. Themenbühnen ohne eine Form der „Inhaltsübersicht“ schneiden schlechter ab

4.4. Themenauswahl nur eingeschränkt nachvollziehbar Nach der Verwendung einer Themenbühne äußerten einige Testpersonen, dass ihnen die Zusammenstellung der Themen nicht klar sei. Insbesondere bei der Website von Hamburg.de wurde die Auswahl der Themen als undurchsichtig bezeichnet. Außerdem konnte beobachtet werden, dass die Benutzer bereits aus dem ersten oder den ersten zwei Themen Vermutungen über die noch kommenden Themen aufstellten und daraus ungeprüft ableiteten, ob sich ein Weiterblättern lohnt: „Ok, hier brauch nicht weiterzuschauen,

140

Die Benutzer empfinden die „häppchenweise“ Darbietung der Themen und einen ausschließlichen Wechsel beispielsweise durch Klick auf einen Pfeil wie bei www. drk.de als zu mühsam. Bevorzugt wurde gegenüber dieser Herangehensweise eine Übersicht über alle Themen, beispielsweise durch Nennung der aktuell nicht ausgewählten. „Hier auf drk.de wäre es hilfreich, wenn man auch gleich sehen könnte, welche Themen einen noch erwarten – wie bei ups.de. Das erfahre ich nur, wenn ich mich mühsam durchklicke.“ (Zitat eines Testteilnehmers) 4.6. Verwendete Bilder der Themenbühne sind entscheidend für die Wahrnehmung und Nutzung Insbesondere bei der Themenbühne des CDU-Portals konnte beobachtet werden, dass Testpersonen nur das erste Bild der Themenbühne betrachteten und danach die Interaktion mit der Themenbühne abbrachen. Auf Nachfrage im Rahmen des RTA erläuterten sie später, dass das erste Bild auf sie „unpassend“ oder „abschreckend“ wirkte und sie deshalb die Themenbühne insgesamt als uninteressant abstempelten. Ein umgekehrter Effekt trat

bezüglich der Bildauswahl auf ups.de auf: Hier weckte das Bild die Neugierde zweier Testpersonen. Auf Nachfrage erläuterten diese Teilnehmer, dass sie sich nur aufgrund des Bildes von der Themenbühne angesprochen gefühlt hätten. 4.7. Navigationselemente der Themenbühne zu unauffällig Insbesondere auf dem Portal der CDU und der Unternehmenswebsite der Deutschen Bahn übersahen die Teilnehmer aus unterschiedlichen Gründen die Möglichkeit zwischen den Themen zu wechseln oder in ein Thema einzusteigen: Auf www. cdu.de lag es daran, dass der Kontrast der Navigation bzw. dem „weiter lesen“ Link zum Hintergrundbild oftmals ungenügend war. [Abb. 9] Auf der Seite der Deutschen Bahn hingegen war es die Tatsache, dass drei der vier Themen eingeklappt und somit auf einen sehr kleinen Bereich reduziert waren. Das einzige ausgeklappte Element hingegen wies in den meisten Fällen wiederum zu wenig Kontrast zum Hintergrundbild auf, was für 5 von 10 Teilnehmern ein erhebliches Problem darstellte. [Abb. 10] 4.8. Benutzer verlassen die Startseite, bevor die Themenbühne vollständig geladen ist. Bei den Websites der Deutschen Bahn und des Versanddienstleisters UPS vergehen


Usability Professionals 2011 Webseiten Best Practices

der Mehrwert einer Themenbühne noch nicht erschließt. Demgegenüber steht der Aufwand, mit dem eine Themenbühne entwickelt und die Inhalte gepflegt werden sowie der oft große Platz, den sie auf der Startseite einer Website einnehmen. Damit dieser Aufwand nicht nur einen kosmetischen Beitrag zum Gesamteindruck der Website leistet, gilt es verschiedene Regeln einzuhalten. Abb. 10. Die Themen-Navigation auf www.deutsche-bahn.de ist zu unauffällig

beim Aufrufen der jeweiligen Startseite mehrere Sekunden bis die Themenbühne im oberen Bereich vollständig geladen ist. Ein Teilnehmer hatte bereits zu einer Unterseite weiternavigiert, bevor die Themenbühne überhaupt komplett angezeigt wurde. Andere hatten sich schon anderen interessanten Inhalten der Website zugewendet und fanden dort eine geeignete Einstiegsmöglichkeit. Berücksichtigend dass ein Zweck einer Website-Startseite darin besteht, die Benutzer so schnell und unkompliziert wie möglich zu einer passenden Detailseite zu führen, sollte die Startseite auf lange Ladezeiten für die Themenbühne verzichten. 4.9. Text-Informationen auf Themenbühne sind sehr wichtig Die Themenbühnen von Brot für die Welt und der Deutschen Bahn enthalten im Vergleich zu den anderen untersuchten Themenbühnen wenig Textinformation. Vier von zehn Teilnehmern äußerten hier explizit, dass mehr Text ihnen helfen würde, die Relevanz der dargestellten Themen für ihr aktuelles Informationsbedürfnis abschätzen zu können. 4.10. Navigation auf Themenbühnen bereitet zum Teil erhebliche Schwierigkeiten Unterschiedliche Aspekte der Navigation bereiteten den Benutzern Schwierigkeiten. Die größten Probleme bestanden bei der Themenbühnen-Navigation der Deutschen

Bahn. Hier empfanden 8 von 10 Teilnehmern das Verhalten der animierten Balken sowie der Themenbühnennavigation insgesamt als viel zu unruhig („zappelig“) und hatten erhebliche Schwierigkeiten ein Thema zu wechseln oder ein gewünschtes Thema auszuwählen. Bei UPS bestand ein Navigationsproblem vor allem darin, dass der Wechsel eines Themas durch Mouse-Over für die Benutzer nicht erwartungskonform war. Irritiert und teilweise verärgert reagierten die Benutzer, wenn sie bei Klick auf ein Thema direkt auf die entsprechende Detailseite weitergeleitet wurden und nicht – wie erwartet – lediglich das Thema auf der Themenbühne gewechselt wurde.

Eine fundierte Auswertung der StudienErgebnisse wird hierzu weitere und detailliertere Rückschlüsse erlauben. Die vollständigen Ergebnisse der Studie, quantitative Daten sowie konkrete Strategien und Empfehlungen zum Aufbau und zur Verwendung von Themenbühnen sind der usabiliy.de-Studie Themenbühnen aus Usability-Sicht (Bartel & Quint 2011) zu entnehmen.

Literatur 1. Bartel, T.; Quint, G. (Hrsg.) (2011): Themenbühnen aus Usability-Sicht (unveröffentlichte Studie).

Auf der Themenbühne von www.hamburg.de können Themen über die Reiter angewählt werden oder mit den Pfeilen durchgeklickt werden. Von dieser redundanten Navigation waren vier von zehn Teilnehmern irritiert. 5. Fazit und Ausblick Die ersten Ergebnisse der Studie zeigen, dass Themenbühnen derzeit ihr Potential nicht nur hinsichtlich der Benutzerfreundlichkeit ungenügend ausschöpfen. Interessant scheint vor allem, dass Website-Betreiber zukünftig beim Einsatz dieses innovativen Elements neben der Usability vor allem dem Thema Usefulness ausreichend Aufmerksamkeit schenken sollten, da sich den Benutzern derzeit

141


Iterative Überarbeitung der Homepage und des Headers von ImmobilienScout24 User Experience Research in der Praxis Jekaterina Cechini Teamleiterin User Insights Immobilien Scout GmbH Andreasstraße 10, 10243 Berlin Jekaterina.cechini@immobilienscout24.de

Abstract Der Beitrag beschreibt die Besonderheiten und Herausforderungen der iterativen Überarbeitung von Homepage und Header von ImmobilienScout24. Das Projekt wurde im Sommer 2010 innerhalb des Unternehmens gestartet und seitdem durch kontinuierliche Nutzertests begleitet. Dieser Vortrag handelt von den Abhängigkeiten und Unwägbarkeiten eines solchen Projekts in der Praxis, die es unmöglich machen, viele Monate im Voraus zu planen oder strikt nach Lehrbuch vorzugehen. Er zeigt eine Möglichkeit auf, wie damit umgegangen werden kann. Anhand eines Mixes verschiedener Usability-Methoden wird gezeigt, wie globalere Erkenntnisse über den User erlangt werden können.

1. Einführung in das Projekt Homepage und Header einer Website spiegeln wider, wofür das Unternehmen steht und was der User auf der Website erwarten kann. Genauso wie sich das Unternehmen hinsichtlich seiner Inhalte, Themen und seines Markenauftritts weiterentwickelt, müssen Homepage und Header mit dieser Entwicklung Schritt halten. Das bedeutet, dass sie sich regelmäßig einer kritischen Überprüfung unterziehen müssen. Bei ImmobilienScout24 startete im Sommer 2010 eine Neuauflage des Projekts „Überarbeitung von Homepage und Navigation“ unter dem Arbeitstitel „Neue Nutzerführung“. Die strategischen Ziele des Projekts „Neue Nutzerführung“ waren: –– Anpassung der Contentstruktur bzw. der Navigation an die derzeitigen Produkt-Prioritäten –– Bessere Positionierung der Wachstumsthemen –– Erhöhung von Browse Rate und Time Spent durch eine bessere Anbindung von Zusatzcontent

142

–– Konsequente Umsetzung von Corporate Identity und Markensignalen im Header Insgesamt sollten Homepage und Navigation den Nutzern sowohl Orientierung geben als auch zur tieferen Exploration der angebotenen Themen anregen. Hinzu kamen Anforderungen aus verschiedenen Bereichen, so z. B. aus dem Produktmanagement-Team „Suche“, das einen Direktsucheinstieg auf der Homepage einzuführen plante, oder spezielle Wünsche zur Einbindung von Advertisement im Header und auf der Homepage. [Abb. 1] 2. Besondere Herausforderungen Die Vielzahl der Ziele zeigt bereits eindrucksvoll die Relevanz des Themas für unterschiedliche Parteien innerhalb des Unternehmens. Das Projekt hatte sich von Beginn an mit besonderen Herausforderungen auseinander zu setzen: –– Hohe Anzahl an Stakeholdern Über Homepage und Navigation erhalten die zahlreichen Business-Bereiche ihren hauptsächlichen Traffic. Demzufolge hat

Keywords: /// Iterative Weiterentwicklung /// Homepage /// Header /// Praxis /// Nutzertests

das jeweils für einen Bereich verantwortliche Produktmanagement ein ernsthaftes Interesse daran, einen gut erkennbaren Zugang im sichtbaren Bereich der Homepage bzw. in der Hauptnavigation zu erhalten. Homepage und Header sind darüber hinaus die „Aushängeschilder“ des Unternehmens, so dass auch die Geschäftsführung und das Marketing Mitspracherecht an der Weiterentwicklung einforderten. Weitere in das Thema involvierte Personen kamen aus der IT, dem CMS-Team und dem Advertising. Dies erwies sich als besonders herausfordernd, eine klare Content Strategie zu entwickeln, zumal die unterschiedlichen Anforderungen nicht immer zeitgleich und zum Teil nicht explizit vorlagen. Gerade der Kernsatz „Do less, not more“ (Halvorson, 2009) ist angesichts der Tatsache, dass so viele Beteiligte einen klaren Zugang innerhalb von Homepage und Header wünschen, nicht einfach zu berücksichtigen. –– Hohe ökonomische Risiken (Trafficeinbruch in bestimmten Bereichen) Als Haupteinstieg in das Portal hat die Homepage natürlich auch die Aufgabe, die User in die für sie interessanten Bereiche zu führen. Änderungen konnten dabei

152


Usability Professionals 2011 Webseiten Best Practices

Abb. 1. Homepage und Header (mit Hauptnavigation) zu Beginn des Projekts im Sommer 2010

143


einzelnen Veränderungen auf den Traffic abschätzen zu können. 3. Vorgehensweise im Rahmen des User Research

Abb. 2. Themen für den A/B-Test der Homepage

zu einer Verringerung des Traffics oder der Conversion führen, was wiederum ökonomische Auswirkungen haben konnte. –– Eine über die Jahre stetig gewachsene Portalarchitektur Durch das seit Jahren kontinuierlich gewachsene Portal haben sich Besonderheiten in der Architektur entwickelt, die eine Rolle für die Durchführung von A/B-Tests spielen. Es existieren im Unternehmen zwei unterschiedliche Setups zur Durchführung von Split-Tests mit entweder statischen oder dynamischen Seiten. Da die Homepage statisch und die Navigation dynamisch ins Portal eingebunden sind, mussten dafür unterschiedliche TestSetups angewandt und z. T. weiterentwickelt werden.

Homepage einzubinden und direkt im Header zu integrieren, musste gegenüber dem Ziel, die Browse Rate und Time Spent zu erhöhen, abgewogen werden. Das hatte auch einen Einfluss auf die Möglichkeit, Zusatzcontent einzubinden. Da der sichtbare Bereich auf der Homepage begrenzt und heiß begehrt ist, tat sich auch hier ein potentieller Zielkonflikt auf. –– Parallele Projekte auf der Homepage Das Produktmanagement-Team „Suche“ führte zeitgleich A/B-Tests auf der Homepage durch, um den Direktsucheinstieg zu testen und zu optimieren. Hier mussten Absprachen getroffen werden, um die Tests nacheinander zu takten, um anschließend methodisch korrekt die Effekte der

–– Unterschiedliche, teils schwer zu vereinbarende Anforderungen von verschiedenen Stakeholdern Das strategische Ziel, Corporate Identity (CI) und Markensignale konsequenter umzusetzen, führte zu Zielkonflikten, da die CI des Unternehmens nicht deckungsgleich mit der CI der übergeordneten Holding ist. Der Wunsch der Advertising-Abteilung, mehr Werbung im sichtbaren Bereich der

144

Abb. 3. Weiterentwicklung des Headers in zwei Schritten: a) hin zu einem helleren Design und b) Ausblenden von zwei Themen mit geringerer Unternehmenspriorität

Durch die zahlreichen mit dem Projekt verbundenen Anforderungen und Risiken wurde ein iterativer, agiler Prozess bevorzugt, der durch stetige User-Tests begleitet wurde. Die Tests sollten die Risiken kalkulierbarer machen und Input für die weitere Produktentwicklung liefern. Sie sollten zum einen eine Schätzung erlauben, wie sich Änderungen von Homepage und Header auf den Traffic auswirken würden und zum anderen Interpretationen dafür liefern. Dies erforderte sowohl quantitative als auch qualitative Tests. Über A/B-Tests wurde der Impact auf den Traffic abgeschätzt. Diese wurden separat für die Homepage und den Header durchgeführt, um Effekte unabhängig voneinander analysieren zu können. Allerdings lieferten diese Tests nur Erkenntnisse zur Performance konkreter Änderungen. Um Ideen für die Richtung der Produktentwicklung zu erhalten, wurden zusätzlich qualitative Tests durchgeführt. Sie ermöglichten eine Interpretation des beobachteten User-Verhaltens. 3.1. A/B-Tests auf der Homepage Einige Themen waren in ihrer Konzeption schon recht weit vorangeschritten und wiesen keine Interdependenzen zu anderen


Usability Professionals 2011 Webseiten Best Practices

Abb. 4. Gegenüberstellung der Ergebnisse des „Usabilla“und des Eye Tracking Tests: Auf die Frage, wo die Teilnehmer eine Immobilie inserieren würden, zeigen sich die gleichen Hot Spots.

Themen auf. Diese Themen wurden mit A/B-Tests hinsichtlich ihrer Auswirkungen auf den Traffic untersucht (siehe Abbildung 2). Dazu zählten: 1. Veränderte Anordnung der Links in der Suchbox 2. Einführung des Direktsucheinstiegs 3. Die Anordnung von zusätzlichen Themen in einem Listenformat (statt in einem Boxenformat, wie es aktuell der Fall ist) 4. Die Einführung eines Teasers für Spezialimmobilien. Die Entwürfe wurden nacheinander in A/BTests evaluiert. Da es sich bei der Homepage um eine statische Seite handelt, konnten Seiten mit neuem Layout im CMS angelegt werden. Per Zufall wurden einem definierten Prozentsatz von Usern die zu testenden Versionen zugespielt. Per Cookie wurde wiederkehrenden Usern immer die gleiche Version gezeigt. [Abb. 2] Die Tests wurden sowohl mit der Webtracking-Software Nedstat als auch mit einem Tool zur Erfassung von Klick-, Movement- und Scrollingmaps (m-pathy) ausgewertet. Die Erkenntnisse wurden im qualitativen Lab-Test verifiziert und liefen anschließend auf eine Umgestaltung der Homepage hinaus.

Zunächst wurden die Links in der Suchbox für eine kurze Zeitspanne anders angeordnet (Quick Win), um anschließend dem Direktsucheinstieg zu weichen. Die Anordnung von Zusatzthemen im Listenformat und der Spezialimmobilienteaser erwiesen sich als nicht zielführend, so dass auf eine Einführung verzichtet wurde.

–– Der Header wurde in einem helleren, leichteren Design dargestellt. Es wurde untersucht, inwieweit die Themen im Header ausreichend Aufmerksamkeit erhielten und geklickt wurden. [Abb. 3]

3.2. A/B-Tests des Headers

Der A/B-Test des Headers wurde durch eine Online-Befragung auf der Website begleitet. Damit sollte nicht nur sichergestellt werden, dass der Traffic nach einer Designanpassung stabil blieb, sondern gleichzeitig die Anmutung und Akzeptanz des neuen Designs erfasst werden.

Den Header einem A/B-Test zu unterziehen, erwies sich als schwieriger, da er nicht nur auf einer Seite ausgetauscht werden konnte, sondern auf jeder Seite der Website angezeigt wird. Er ist darüber hinaus ein Element, das dynamisch in die Seite eingebunden ist. Nach einigen Fachberatungen mit dem Content-ManagementTeam und der IT wurde eine Lösung gefunden, bei der das CSS (Cascading Style Sheet) des Headers per Zufall für einen geringen Prozentsatz der User in einer anderen Variation dargestellt wurde. Auf diese Weise konnten zwei Fragestellungen untersucht werden: –– Zwei Reiter im Header wurden ausgeblendet und der Einfluss auf den Traffic in diese Bereiche wurde gemessen.

3.2.1. Begleitende Online-Befragung

Die Befragung erfolgte über ein Pop-under und enthielt ein Semantisches Differential und Fragen zur Navigationseffizienz. Nachdem der neue Header positiver beurteilt wurde, wurde er auf dem Portal eingeführt. 3.3. Qualitativer Lab-Test Während der A/B-Test gut geeignet war, um schon sehr konkrete Ideen und Anforderungen zu testen und bei Erfolg umzusetzen, war der qualitative Test wichtig, um die mittel- und langfristige Vision der „neuen Nutzerführung“ zu entwickeln.

145


Abb. 5. Homepage und Header Stand Mai 2011

Dar체ber hinaus sollten die Erkenntnisse des A/B-Tests verifiziert und interpretiert werden. Ein anderer Aspekt war, dass Headervarianten getestet werden sollten, die aufgrund technischer Restriktionen nicht per Split-Test getestet werden konnten.

146

Der Inhalt dieses Tests waren verschiedene Headerversionen, zwei verschiedene Varianten der Suchbox (Direktsucheinstieg vs. Linkliste), zwei verschiedene Varianten der Darstellung der Zusatzthemen (Liste vs. Boxen) und die Darstellung der Homepage mit vs. ohne Bild. Aus diesen Elementen wurden verschiedene

Varianten zusammengesetzt, die mit Hilfe eines 10-Sekunden-Tests, Suchaufgaben, Pr채ferenzurteilen und eines Interviews evaluiert wurden. Den Abschluss bildete eine Aufgabe, bei der die Teilnehmer gebeten wurden, sich aus Papierelementen ihre ideale Homepage und Navigation selbst zusammenzusetzen.


Usability Professionals 2011 Webseiten Best Practices

Dieses Test-Setup war auch für uns ein Experiment, da wir komplett auf klickbare Entwürfe verzichteten und nur mit Screens arbeiteten. Aus den A/B-Tests und dem qualitativen Test wurden folgende Erkenntnisse extrahiert: –– Die Direktsuche erwies sich als zielführender. –– Das Listenformat der Zusatzthemen wurde verworfen, da die User dadurch nicht tiefer scrollten. Das Boxenformat wurde stattdessen beibehalten. –– Auf die Bilder wurde vorerst verzichtet. Die Idee wurde als positiv befunden, wohingegen die Umsetzung noch optimierbar war. –– Bei den Headern wurden vier neue Konzepte entwickelt, die in einem weiteren Test weiter evaluiert werden sollten.

–– Header2: CI-Vorgaben aus dem Marketing –– Navigation mit einer Ebene: –– Header3: mit integriertem Werbemittel –– Header4: CI-Vorgaben der Holding Getestet wurde mit dem Tool Usabilla (www.usabilla.com), das ermöglicht, Screens hochzuladen und Aufgaben dazu zu formulieren. Die gewählten Aufgaben waren Suchaufgaben, die per Klick beantwortet werden konnten. Es nahmen 106 Personen an diesem Test teil. Die Teilnehmer wurden in vier Gruppen eingeteilt, die jeweils eine andere Suchaufgabe auf einem Header lösen sollten (Betweensubjects-Design). Anschließend wurde die Qualität der Klicks (richtig gesetzt) vs. die Performance der Klicks (Zeitdauer bis zum richtigen Klick) ausgewertet. Zusätzlich wurden die Teilnehmer gebeten, ihre Präferenz bezüglich der Header mitzuteilen.

Damit war zumindest schon einmal der vorläufige Aufbau der Homepage geklärt. Wie der Header aussehen sollte, wurde in einem anschließenden Remote-UsabilityTest untersucht.

Es zeigte sich, dass sowohl bei der Performance als auch bei der Präferenz die beiden Header mit Reiterdesign am besten abschlossen.

3.4. Micro-Remote-Usability-Test

3.5. Usability-Test mit Eye Tracking

4. Ergebnis Als Ergebnis der Testfolge wurden die Homepage angepasst und der Header schrittweise implementiert, der am besten performte und von den Usern bevorzugt wurde. Im Laufe der Testabfolge kamen weitere Anforderungen auf, die wieder neu evaluiert und in die bestehende Homepage integriert werden mussten. So sollte beispielsweise ein visuelles Element, das in einer TV-Kampagne eingeführt wurde, ebenfalls auf der Homepage vertreten sein. Der Header wird derzeit weiterhin kontinuierlich angepasst, so dass er dem Nutzungsverhalten der User entgegenkommt. Es ist nicht ausgeschlossen, dass zwischenzeitlich Themen re-priorisiert werden und daher einen anderen Stellenwert in der Nutzerführung erhalten. Das iterative Vorgehen, d.h. die kurze zeitliche Abfolge von Tests und Anpassungen, ermöglicht es jedoch, flexibel und effizient auf solche Anforderungen zu reagieren. [Abb. 5] Literatur 1. Halvorson, K. (2009). Content-Strategy for the

Der qualitative Test hatte Erkenntnisse und Erklärungen geliefert, welche Headervarianten von den Nutzern präferiert wurden. Allerdings fehlten hierzu noch quantitative Daten. Wie bereits oben erwähnt, war es aufgrund des spezifischen Aufbaus der Website nicht möglich, A/B-Tests mit dem Header durchzuführen, die über Anpassungen des CSS hinausgingen. Aus diesem Grund wurden die Header noch in einem Remote-Usability-Test evaluiert. Für den Remote-Usability-Test wurden vier grundsätzlich verschiedene Headerkonzepte entwickelt, die einerseits die erfolgversprechenden Merkmale aus dem qualitativen Lab-Test in sich vereinten und andererseits Anforderungen aus verschiedenen Businessbereichen genügten: Reiter-Navigation (zwei Ebenen): –– Header1: eine leicht abgewandelte Form des jetzigen Headers

Die Erkenntnisse des Remote-UsabilityTests wurden noch einmal in einem Usability-Test mit Eye Tracking verifiziert. Dabei wurden die gleichen Suchaufgaben verwendet wie in dem „Usabilla“-Test. Es wurden vier Gruppen mit je 12 Personen pro Gruppe gebildet, die jeweils in einem balancierten Testdesign eine andere Aufgabe mit einem anderen Header lösen sollten. Das Ziel war, die Aufmerksamkeitsverteilung auf dem Header zu ermitteln.

Web. Berkeley: New Riders. 2. Webtrackingtool: http://www.nedstat.de/ 3. Tool für Onsite-Tracking: http://www.m-pathy. com/cms/startseite 4. Tool für Micro-Remote-Usability-Tests: http:// www.usabilla.com/

Die Erkenntnisse fielen konsistent mit denen aus dem Remote-Usability-Test aus. Die Testpersonen konnten auf den zwei Headern mit Reiterdesign schneller die gesuchten Einstiege finden. Die Aufmerksamkeit war bei den zwei anderen Headern breiter über die Seite verteilt. [Abb. 4] Abbildung 4 illustriert eine Beispielaufgabe mit den dazugehörigen Ergebnissen des „Usabilla“– und des Eye Tracking Tests.

147


125

WELT ONLINE – Joy of Use für Nachrichten in digitalen Medien Klaus Cloppenburg Geschäftsführer, interactive tools GmbH, Agentur für digitale Medien, Berlin Schönhauser Allee 12, 10119 Berlin klaus.cloppenburg@interactive-tools.de

Roland Schweighöfer Beratung und Projektmanagement, interactive tools GmbH, Agentur für digitale Medien, Berlin Schönhauser Allee 12, 10119 Berlin roland.schweighoefer@interactive-tools.de

Abstract Wie können Nachrichten in digitalen Kommunikationskanälen so aufbereitet werden, dass sowohl die Themenvielfalt wie auch komplexe und täglich zu aktualisierende Informationstiefe für den Nutzer nicht nur übersichtlich, sondern auch leicht und schnell abrufbar ist? Damit die Leser im Netz eine sehr gute „User Experience“ erfahren, steht die Usability-Beratung im Fokus bei der Umsetzung des Online-Mediums für News-Anbieter. Wir demonstrieren am Beispiel des WELT ONLINE Relaunchs, was in den einzelnen Projektschritten beachtet werden muss, damit das Ergebnis am Ende die Erwartungen der User voll erfüllt – und gleichzeitig den Anforderungen des Kunden hinsichtlich Redaktion und Vertrieb/Marketing gerecht wird: 1. Usability Tests – das Leseverhalten der Nutzer im Netz beobachten und Erkenntnisse daraus für die Umsetzung ziehen 2. Konzeptionsphase: Weniger ist mehr – mit einer klar strukturierten Gliederung den Leser durch komplexe Inhalte und vielfältige Informationen begleiten 3. Alles Wichtige auf einen Blick: Joy of Use & Interface Design für ein Nachrichten-Portal 4. Zielgerichteter Einsatz von multimedialen Modulen und interaktiven Features

1. Das Projekt WELT ONLINE – Wie alles begann Im Frühjahr 2010 trat der Axel Springer Verlag an interactive tools mit der Aufgabenstellung eines umfassenden Relaunches des Online News-Portal

Abb. 1. Jahr 2000

148

WELT ONLINE heran. Im Vorfeld waren in mehreren Usability Testings und Userbefragungen die wesentlichen Verbesserungsmöglichkeiten am damaligen Auftritt identifiziert worden. Die Evolution der digitalen Marke der WELT im Wandel der Zeit [Abb. 1 – 4]

Abb. 2. Jahr 2007

Keywords: /// Joy of Use /// User Experience /// Themenvielfalt /// Informationstiefe /// Marketing


Usability Professionals 2011 Webseiten Best Practices

Abb. 3. Jahr 2009

2. Die Aufgabe – WELT ONLINE Relaunch – Das Spannungsfeld der Interessen Redaktion: –– Stärkung der digitalen Marke WELT ONLINE –– Bessere Wahrnehmung, höhere Reichweite für redaktionelle Inhalte Vermarktung –– Hochqualitativer nachrichtlicher Content in bestmöglicher Usability aufbereitet 2.1. Die Aufgaben im Einzelnen

Abb. 4. Jahr 2010

–– Deutliche Themenschwerpunkte setzen –– Platzierung der erforderlichen Werbeplätze Dies bedeutete im Einzelnen: –– Prominentes Aufmachermodul in 2 Zuständen –– Platzierung im sichtbaren Bereich von: –– Newsticker –– Empfehlungsmodul –– Suche –– Platzierung weiterer Content-Module –– Anforderungen aus der Vermarktung –– Integration der vorgegeben Bannerplatzierungen und Online-Werbeformate –– Schaffen von neuen Werbeflächen und Integrationen [Abb. 5 – 10]

Anforderungen aus der Sicht der User: –– Der User möchte zügig und umfassend informiert werden. –– Er möchte schnell zu dem gewünschten Inhalt oder Themengebiet gelangen. –– Andererseits möchte er durch die redaktionelle Priorisierung der tagesaktuellen Themen „geführt“ werden. –– Er hat hohe Erwartungen an Aktualität und an klarer Strukturierung des Content sowie an eindeutiger Orientierung innerhalb der Website. –– UND: er möchte so wenig wie möglich von den redaktionellen Contents durch „Werbung“ abgelenkt werden.

Anforderungen des Verlages: –– Stärkung des redaktionellen Profils –– Klarere Content-Struktur und erkennbare Gliederung der Inhalte Abb. 5. Beispiel Platzierung von Standardwerbeformaten

149


Abb. 7. Das neue Aufmachermodul

Abb. 6. Beispiel Platzierung von Sonderwerbeformaten

Abb. 9. Kommentarfunktion und Social Media Integration

Abb. 10. Die „Sticky Fußleiste“ Abb. 8. Zeilenaufbau der Startseite

150


Usability Professionals 2011 Webseiten Best Practices

3. Erfolgskontrolle Studienanordnung: –– Studientyp: Taskbasierter Usability Test mit Eye Tracking. –– Testablauf: Vorinterview zum Nutzungsverhalten >Betrachtung der Entwürfe > Interview zu den einzelnen Seiten > Nachinterview zu dem Prozess insgesamt. –– % 50 % weiblich; 50 % männlich; Alter: 28 - 45; MW: 37. –– Alle Probanden sind Online-Informationsaffin. –– Bildung: Abitur mit Studium 58%; Abitur ohne Studium 17%; Mittlere Reife 25% –– Durchführungsort: i²Lab in Berlin –– Feldphase: 18. bis 20. Januar 2010 Forschungsfragen des Usability Testings: –– Wie gut der erste Eindruck der Seite? –– Wie gut können die Probanden mit den Webseiten umgehen? –– Entspricht die Navigation ihren Bedürfnissen? –– Können die Teilnehmer problemlos das Gesuchte finden? –– Wie wird der Nutzen der Webseiten empfunden? –– Welche Inhalte wünschen sich die Nutzer? –– Wie gefällt den Nutzern die Gestaltung der Webseiten? –– Wie viel Spaß bringt die Nutzung von WELT ONLINE? –– Wie ist der Aufmerksamkeitsverlauf auf den Webseiten? –– Wie ist die Orientierung auf der Seite?

–– Die Anzahl der innerhalb der Ressorts dargestellten Artikel und Bilder entspricht den Bedürfnissen der Nutzer. –– Die kurzen Texte zum Einstieg wecken das Interesse und regen dazu an, tiefer in die Themen einzusteigen. –– Die Verteilung der Artikel auf zwei Spalten stellt für die Nutzer kein Hindernis dar 3.1. Exemplarisches Einzel-Ergebnis Fazit: Die Startseite mit mehr Bildern kann Blicke im oberen Bereich besser binden. [Abb. 11]

4. Ausblick – Rebrush WELT ONLINE 2011 1. Die goldene Mitte zwischen Redaktions-, Vermarktungs und Nutzerinteressen anstreben 2. Nutzungsverhalten und technische Innovationen im Auge behalten 3. Regelmäßige Erfolgskontrolle durchführen 4. Kontinuierliche Verbesserungen der Usability umsetzen 5. Eine starke digitale Newsmarke kontinuierlich pflegen [Abb. 12]

Abb. 11. Eye-Tracking der Startseite

Management Summary Use Lab Die Neustrukturierung der WELT ONLINE Seite ist sehr gelungen und wird von den Nutzern positiv aufgefasst. Einige Aspekte (Auszug):

–– Die Strukturierung der Startseite in Ressorts ermöglicht eine gute Orientierung. –– Die Abgrenzung der Ressorts durch die blauen Leisten ermöglicht einen schnellen Überblick. Abb. 12. Fazit: Der Weg ist das Ziel

151


152


Gesch채ftssoftware

153


109

Barrierefreiheit von Web Anwendungen mit dem ARIA Standard sicherstellen Erste Erfahrungen aus einem Anwendungsprojekt Annett Hardt SAP AG – User Experience Dietmar-Hopp-Allee 16 69190 Walldorf, Germany annett.hardt@sap.com

Martin Schrepp SAP AG – User Experience Raiffeisenring 45 68789 St. Leon-Rot martin.schrepp@sap.com

Abstract Das Internet hat sich von einem reinen Informationsmedium zu einem Zugang für viele wichtige Dienstleistungen entwickelt. Für die Teilnahme behinderter Menschen am gesellschaftlichen Leben ist die Barrierefreiheit solcher Online-Dienstleistungen eine wichtige Voraussetzung. Allerdings handelt es sich bei vielen dieser Angebote nicht mehr um einfache HTML-Formulare, sondern um komplexe interaktive Anwendungen. Solche interaktiven Web-Anwendungen barrierefrei zu gestalten, kann mit den herkömmlichen Mitteln schwierig sein. Hier soll der neue ARIA (Accessible Rich Internet Applications) Standard des W3C Abhilfe schaffen. Die Grundidee des ARIA Standards ist es, vorhandene Markup-Sprachen anzureichern, um assistiven Technologien die notwendigen Informationen zu Art, Zustand und Veränderungen von Elementen der Benutzeroberfläche zu liefern. Wir beschreiben die Grundprinzipen hinter dem ARIA Standard anhand praktischer Beispiele aus einem Projekt. Dabei werden wir die Vorteile dieses neuen Standards herausarbeiten, aber auch auf nach wie vor bestehende Probleme hinweisen. Es wird weiterhin über konkrete Erfahrungen zur Umsetzung des Standards im Projekt berichtet.

1. Einleitung Das Internet hat sich in den letzten Jahren von einem reinen Informationsmedium zu einem Zugang für viele wichtige Dienstleistungen entwickelt. Hier fallen einem natürlich zuerst eCommerce Lösungen ein, die es erlauben eigentlich alle Arten von Produkten direkt in einem Online-Shop zu bestellen, den Ablauf der Auslieferung zu verfolgen und fehlerhafte Lieferungen zu reklamieren. Aber auch im öffentlichen Bereich (eGovernance) werden zunehmend Leistungen über Online-Services angeboten. Beispiele sind das Beantragen eines neuen Personalausweises, Meldungen zu Adressänderungen innerhalb einer Gemeinde, das Beantragen behördlicher Dokumente (z. B. eines Gewerbescheins) oder die Abgabe der Steuererklärung. Auch viele kommerzielle Dienstleister bieten mittlerweile ihren Kunden Online-Dienste zur Vereinfachung von Verwaltungsvorgängen an. Ein Beispiel ist hier die von vielen

154

Energieversorgungsunternehmen angebotene Möglichkeit, Zählerstände für Wasser oder Stromverbrauch selbst abzulesen und über das Internet zurückzumelden. Für die möglichst uneingeschränkte Teilhabe behinderter Menschen am gesellschaftlichen Leben ist die Barrierefreiheit solcher Angebote eine sehr wichtige Voraussetzung. Das Design der Benutzungsschnittstelle solcher Anwendungen sollte sich daher am Prinzip des Universellen Designs (siehe z. B. Stephanidis & Salvendy, 1999 oder Bühler & Stephanidis, 2004) orientieren. Ziel dieses Designkonzepts ist es, Benutzungsoberflächen so zu gestalten, dass diese von möglichst vielen Menschen direkt oder mit Hilfe assistiver Technologien (z. B. Screen Reader, Braillezeile oder Screen Magnifier) genutzt werden können. Allerdings handelt es sich bei solchen Online-Diensten oft nicht mehr um einfache HTML-Formulare oder statische Web-Seiten, sondern um zum Teil recht

Keywords: /// Barrierefreiheit /// ARIA Standard /// interaktive Web-Anwendungen

komplexe interaktive Anwendungen. Diese basieren in der Regel auf HTML in Verbindung mit Java-Script oder anderen Technologien, wie z. B. MS Silverlight oder Adobe Flex. Solche interaktiven Web-Anwendungen barrierefrei zu gestalten, kann mit den herkömmlichen Mitteln schwierig sein. Hier soll der neue ARIA (Accessible Rich Internet Applications) Standard des W3C Abhilfe schaffen. Dieser Standard ist im Moment im Zustand Candidate Recommendation, d.h. dieser Standard ist noch nicht endgültig verabschiedet. Allerdings haben die Anbieter von Browsern oder assistiven Technologien, wie z. B. Screen Readern, schon begonnen den Standard zu unterstützen. Es ist damit möglich diesen Standard bereits jetzt in Projekten einzusetzen, um die Barrierefreiheit hoch interaktiver Benutzungsoberflächen im Internet sicherzustellen. Wir beschreiben in diesem Beitrag den Einsatz des ARIA Standards in einem Projekt der SAP AG.


Usability Professionals 2011 Geschäftssoftware

2. Wie funktioniert der ARIA Standard? Die Grundidee des ARIA Standards (Craig & Cooper, 2011) ist es, vorhandene Markup-Sprachen anzureichern, um assistiven Technologien die notwendigen Informationen zu Art und Zustand von Elementen der Benutzeroberfläche zu liefern. Vorhandene Markup-Sprachen, wie z. B. HTML, stellen schon eine Reihe von Mechanismen zur Herstellung von Barrierefreiheit zur Verfügung. Ziel des ARIA Standards ist es nicht, diese Mechanismen komplett zu ersetzen, sondern die Lücken in den vorhandenen Markup-Sprachen zu füllen. D.h. die Vorgabe des Standards ist es, nur dann auf die ARIA Mechanismen zurückzugreifen, wenn keine entsprechende Möglichkeit in der verwendeten Technologie vorhanden ist. Zum Beispiel bietet HTML die Standardmöglichkeit ein Eingabefeld mit einem Bezeichner zu versehen (über <label for=“id“ …>Labeltext</label>). Auch der ARIA Standard definiert eine solche Möglichkeit (über die Eigenschaft arialabelledby). In einer auf HTML basierenden Anwendung sollte man aber immer den Standardmechanismus, d.h. in diesem Fall das Label-Tag verwenden, bevor man auf die entsprechenden ARIA Mechanismen zugreift.

Beispiele für solche Zustände sind aria-checked (gibt für eine Checkbox oder einen Radiobutton an, ob er im Moment markiert ist oder nicht) oder aria-invalid (kann verwendet werden, um anzuzeigen, dass der in ein Control eingegebene Wert nicht korrekt ist). Zustände können sich also während einer Interaktion eines Nutzers häufiger ändern, Eigenschaften bleiben im Normalfall unverändert. Die Informationen zu den Rollen und Eigenschaften können in der Regel statisch zum Markup eines Controls hinzugefügt werden. Die Änderung der Zustände eines Controls muss abhängig von den Nutzeraktionen über Scripting angepasst werden. Zum Beispiel muss beim Klicken auf eine bisher unmarkierte Checkbox deren Zustand per Scripting von aria-checked = false auf aria-checked = true geändert werden. 3. Vorteile des ARIA Standards

Der ARIA Standard definiert Rollen (roles), Eigenschaften (properties) und Zustände (states):

Der Control-Umfang der meisten Markup-Sprachen ist eher auf statische Webseiten ausgelegt. Bei sehr interaktiven Web-Anwendungen stößt man hier schnell an Grenzen. Zum Beispiel ist in HTML kein Slider-Control vorhanden. Der ARIA Standard bietet über die vorhandenen Rollen die Möglichkeit auch Controls zu nutzen, die in der verwendeten Markup-Sprache nicht vorhanden sind.

–– Eine Rolle beschreibt den Typ eines Elements der Benutzerschnittstelle. So gibt es zum Beispiel die Rollen Checkbox, Button und Slider. –– Eigenschaften sind Attribute, die sich auf eine Rolle beziehen und eine dauerhafte Gültigkeit besitzen. Beispiele sind die Eigenschaften aria-labelledby (Identifiziert den Bezeichner eines Elementes) oder aria‑autocomplete (zeigt an, ob für das Element Eingabevorschläge vorhanden sind). –– Für die Beschreibung von Attributen, die eine eher kurzfristige Gültigkeit haben, werden Zustände verwendet.

Bisher wurden solche nicht vorhandenen Controls in den Markup-Sprachen durch Kombination vorhandener Gestaltungselemente und den massiven Einsatz von Scripting nachgebaut. Für blinde Nutzer ist eine solche Vorgehensweise sehr kritisch, da hier eine Menge von Controls ineinander geschachtelt wird und dabei ihre eigentliche Semantik verloren geht. Ein Screen Reader wird einem blinden Anwender einfach all diese geschachtelten Elemente nacheinander vorlesen, was in diesem Fall nicht sinnvoll ist. Einem solchen „nachgebauten“ Control kann mit Hilfe des ARIA Standards seine korrekte Rolle zugewiesen werden. Ein Screen Reader ist

damit in der Lage das semantisch richtige Control zu erkennen und dem Benutzer dessen Bezeichnung mitzuteilen. Hilfselemente, die nur für die visuelle Darstellung benötigt werden, können mit Hilfe der Rolle Presentation als semantisch unwichtig deklariert werden. Solche Elemente werden dann bei der Ausgabe über einen Screen Reader nicht vorgelesen. Ein weiteres Problem war bisher, dass einige vorhandene Controls in HTML nur bedingt visuell veränderbar sind. Dadurch ist es unter Verwendung der Standard-Controls oft nur schwer möglich, ein in sich stimmiges visuelles Design zu erhalten. Daher werden in HTML vorhandene Controls manchmal aus Gründen der visuellen Gestaltung durch eine Kombination anderer HTML Elemente simuliert. Dies zieht aber unmittelbar Probleme für Nutzer assistiver Technologien nach sich, da die assistive Technologie in solchen Fällen nicht in der Lage ist, dem Benutzer die korrekte Semantik mitzuteilen. Betrachten wir dies an einem Beispiel. Der HTML Button besitzt gewisse Einschränkungen in Bezug auf die visuelle Gestaltung. Daher wird ein Button auf der Nutzungsoberfläche oft technisch als speziell gestylter HTML Link realisiert. Ein sehender Anwender wird dies bei geeigneter visueller Gestaltung nicht bemerken, da der Link auf der Oberfläche für ihn wie ein Button aussieht. Blinde Anwender, die auf die Verwendung eines Screen Readers angewiesen sind, können hier aber Probleme bekommen, da der Screen Reader korrekt einen Link erkennt und dies dem Benutzer auch so vorliest. Mit Hilfe von ARIA kann dieses Problem sehr elegant gelöst werden. Man ergänzt einfach das Markup des Links mit der ARIA Rolle Button. Wenn ein Screen Reader die entsprechende Markup-Information ausliest, bekommt die ARIA Rolle eine höhere Priorität als die technische Information in HTML und somit wird dem blinden Anwender nun semantisch korrekt mitgeteilt, dass es sich hier um einen Button handelt. Die rein technische Markup-Information wird vom Screen Reader komplett ignoriert.

155


Code für einen über einen Link simulierten Button: <a id=“B1“ title=”Button” href=”…”> … </a> Code mit Verwendung des ARIA Standards: <a role=”button” id=”B1” title=”Button” href=”…”> … </a> Ein weiteres Beispiel, bei dem Einschränkungen bzgl. der visuellen Gestaltungsmöglichkeiten häufig zum Nachbau des vorhandenen HTML Controls führen, sind Checkboxen. Um ein ansprechendes oder originelles Layout zu erzielen, wird eine Checkbox häufig durch die Kombination eines Links mit zwei Grafiken (diese visualisieren die Zustände Markiert und Nicht markiert) realisiert, z. B. wenn die Checkbox abgerundete Ecken haben soll.

Abb. 1. Checkbox mit runden Ecken als Grafik

Klickt der Nutzer auf die Checkbox, so werden diese Grafiken über Java-Script ausgetauscht. Ein Screen Reader wird dem Anwender mitteilen, dass es sich bei dem Control um einen Link mit Bild handelt. In diesem Beispiel kann ein blinder Anwender nicht erkennen, dass hier eigentlich eine Checkbox realisiert ist. Bisher konnte man solche Probleme nur über zusätzliche Textinformationen lösen, z. B. indem man über den Tooltip mitgeteilt hat, dass es sich um eine Checkbox handelt. Eine alternative Lösungsmöglichkeit bestand darin, einen speziellen Modus für blinde Nutzer anzubieten, in dem ausschließlich die nativen HTML Controls verwendet werden. Mit dem ARIA Standard kann dies nun über die entsprechende Rolle korrigiert werden. Der Link muss dazu die Rolle Checkbox erhalten, das Bild erhält die Rolle Presentation (wodurch es vom Screen Reader ignoriert wird). Das vorhandene Java-Script zum Tauschen der Bilder muss zusätzlich den

156

Zustand zwischen aria-checked = true und aria-checked = false hin und herschalten.

4. Noch bestehende Probleme

Code für eine über zwei Bilder simulierte Checkbox: <a id=“CB1“ title=”Checkbox” onclick=“Java-Script zum Austauschen des Bildes“> <img src=“uncheckedcb.jpg“ /> </a>

Trotz der vielen Verbesserungen und Erleichterungen, die der ARIA Standard mit sich bringt, gibt es noch einige Bereiche, die noch nicht völlig befriedigend abgedeckt sind.

Code mit Verwendung des ARIA Standards: <a role=“checkbox“ aria-checked=“false“ id=“CB2“ onclick=“ JavaScript zum Austauschen des Bildes und Umschalten des Zustandes“> <img role=”presentation” src=”uncheckedcb.jpg” /> </a> Bisher war es in komplexen und stark interaktiven Web-Anwendungen immer kritisch, Fehlermeldungen für einen blinden Anwender zugänglich zu machen. In der Regel wird hierfür ein fester Bereich auf dem Bildschirm definiert, der alle Fehler, Warnungen und Erfolgsmeldungen anzeigt. Selbst wenn ein blinder Anwender weiß, dass ein solcher Bereich existiert, muss er ständig prüfen, ob dort gerade Fehlermeldungen angezeigt werden. Auch hierfür bietet der ARIA Standard eine elegante Lösung an. Mit ARIA ist es möglich eine sogenannte Live-Region zu definieren. Eine Live-Region ist ein Bereich, dessen Inhalt sich häufig ändert und bei dem die Veränderungen dem Benutzer mitgeteilt werden sollen. Ein Screen Reader kann damit automatisch Änderungen in dieser Region verfolgen und diese dem Anwender vorlesen. Für eine solche Live-Region kann man definieren, ob neue Inhalte immer sofort oder erst zu einem sinnvollen Zeitpunkt (z. B. am Ende eines Satzes) vorgelesen werden sollen und ob immer der komplette Inhalt oder nur der neue bzw. veränderte Inhalt vorgelesen werden soll.

Zum Beispiel bietet der ARIA Standard keine Schnittstelle, um eigene Rollen definieren zu können. Dies ist für einfachere Web-Anwendungen sicher kein grosses Problem, da der Standard schon einen ausreichend grossen Umfang an Rollen definiert. Schwierig kann dieser Punkt insbesondere bei komplexeren betriebswirtschaftlichen Web-Anwendungen werden (siehe z. B. Jani & Schrepp, 2005 oder Hardt & Schrepp, 2007). Hier werden oft auf spezielle Nutzungsszenarien zugeschnittene komplexe Controls definiert, die dann an vielen Stellen einer Anwendung verwendet werden (z. B. Gantt-Charts zur Darstellung von geplanten Zeiträumen oder graphische Editoren zur Darstellung und Veränderung von Objektbeziehungen). Der Bedarf geht hier deutlich über die im Standard vorhandenen Controls hinaus. Für solche Szenarien wäre es wichtig, eigene Rollen definieren zu können, um die Barrierefreiheit dieser Controls dann ebenfalls mit Hilfe des ARIA Standards sicherstellen zu können. Ein weiteres potentielles Problem kann durch die schnelle Entwicklung neuer Controls entstehen, die dann oft sehr schnell Verbreitung finden. Da sich ein internationaler Standard wegen des hohen Abstimmungsbedarfs natürlich nur langsam weiter entwickeln kann, besteht die Gefahr, dass neue populäre Controls erst mit großer Verzögerung in eine neue Versionen des ARIA Standards aufgenommen werden können. Ein weiteres Problem ist es, dass Textformatierungen nicht ausgedrückt werden können. Beispiele sind rote (z. B. um einen negativen Betrag hervorzuheben) und grüne (um einen positiven Betrag


Usability Professionals 2011 Geschäftssoftware

hervorzuheben) Zahlen in einer Tabelle oder durchgestrichene Beträge in einem Web-Shop (die den alten nicht mehr gültigen Preis ausdrücken). Solche Formatierungen haben im Kontext einer Seite oft eine eindeutige Bedeutung und helfen einem sehenden Anwender sich zu orientieren. Die meisten assistiven Technologien unterstützen die Bekanntgabe dieser Formate nicht, somit kann diese Information einem blinden Anwender nicht mitgeteilt werden. Hier ist es auch zukünftig notwendig, dass solche Formatierungen dem blinden Anwender über textuelle Zusatzinformationen, wie z. B. einem Tooltip zur Kenntnis gebracht werden. Ein weiteres offenes Thema ist die Verwendung von mehreren Rollen gleichzeitig. Stand heute ist es immer nur möglich genau eine Rolle für ein Control zu definieren. In Web-Anwendung gibt es aber zum Beispiel häufig den Fall, dass eine Überschrift gleichzeitig ein klickbarer Link ist. In diesem Fall muss sich ein Entwickler entscheiden, welche Rolle (die Überschrift für die Orientierung oder der Link für die Interaktion) für den blinden Anwender wichtiger ist. Dieser Punkt ist allerdings nur dann kritisch, wenn dieses Element nicht mit dem dafür vorgesehen HTML Standardelementen (z. B. <h1><a ....></a></h1>) gebaut wurde. 5. Erfahrungen im Projekt Im SAP Web Channel Experience Management wurde bereits in der frühen Designphase entschieden, dass man die Barrierefreiheit über eine Umsetzung des ARIA Standards erreichen will, auch wenn dieser zu diesem Zeitpunkt noch kein endgültig verabschiedeter W3C Standard war. Der Hauptgrund für diese Entscheidung war, dass man die Barrierefreiheit der Anwendung relativ einfach (durch die Ergänzung des bestehenden Markups um Rollen und Attribute) erreichen kann. Dies war für dieses Projekt insbesondere wichtig, da hier eine Vielzahl von nicht im HTML Standard enthaltenen Controls benötigt wurde (z. B. Slider, Spin-Button oder Live Regions für Nachrichten).

Allerdings war diese Entscheidung auch mit einem Risiko behaftet. Die Barrierefreiheit der Implementierung über den ARIA Standard ist abhängig von dem jeweiligen Umsetzungsstatus der Betriebssysteme, Browser und der assistiven Technologien. Barrierefreiheit kann nur dann über den ARIA Standard erreicht werden, wenn die entsprechenden Systemumgebungen die Basis dafür bereitstellen. Dies führte dazu, dass die ersten Barrierefreiheitstests der Anwendung ein eher schlechtes Ergebnis aufzeigten. Diese internen Tests einiger Szenarien mit einem Screen Reader wurden Anfang 2010 durchgeführt. Die schlechten Ergebnisse des Tests führten sogar zu Überlegungen, die ARIA Entwicklung rückgängig zu machen, da die technischen Voraussetzungen noch nicht gegeben schienen. Ein erneuter Test Anfang 2011, in der zweiten Phase des Projekts, zeigte dann allerdings, dass die ARIA Unterstützung von Screen Readern und Browsern mittlerweile so gut war, dass die Ziele bzgl. der Barrierefreiheit der Anwendungen erreicht werden konnten.

verwendet. Verglichen mit Versuchen Barrierefreiheit ohne den ARIA Standard über Alternativtexte oder alternative Oberflächen herzustellen, war das Resultat sehr zufriedenstellend. Für behinderte Nutzer bringt ein Einsatz des ARIA Standards erhebliche Verbesserungen der Bedienbarkeit mit sich. Statt vieler proprietärer Einzellösungen, an die sich der Nutzer wieder auf jeder Web-Seite oder Web-Anwendung neu gewöhnen muss, sind jetzt standardisierte Lösungen möglich, die sich wie die eigentlichen Controls verhalten. D.h. hier wird die Konsistenz der Benutzerinteraktion über verschiedene Lösungen hinweg deutlich erhöht. Literatur 1. Craig, J. & Cooper, M. (2011). Accessible Rich Internet Applications (WAI-ARIA) 1.0. Online verfügbar unter: http://www.w3.org/TR/waiaria/ (letzter Zugriff 26.5.2011). 2. Stephanidis, C. & Salvendy, G. (1999). Towards an information society for all: HCI challenges and R&D recommendations.

Zusammenfassend lässt sich feststellen, dass die Anwendung des ARIA Standards im Projekt keine größeren Schwierigkeiten verursachte. Es war mit sehr wenig Aufwand verbunden, die im Rahmen des Projekts entwickelten Controls mit den korrekten ARIA Rollen zu versehen. Auch die Nachrüstung einiger Controls, die zum Zeitpunkt der Entscheidung für den Einsatz des ARIA Standards, schon fertiggestellt waren, erforderte keine tiefergehenden Änderungen an der bestehenden Implementierung .

International Journal of Human-Computer Interaction, 11(1), 1-28. 3. Bühler, C. & Stephanidis, C. (2004). European Co-operation Activities Promoting Design for All in information Society Technologies. In: Miesenberger, K., Klaus, J., Zagler, W. & Burger, D. (Hrsg.), ICCHP – Computer Helping People with Special Needs. Volume 3118, 80-87. 4. Jani, R. & Schrepp, M. (2005). Are the Web Accessibility Guidelines applicable and sufficient for Web Applications. In Pruski, A. & Knops, H. (Hrsg.): Assistive Technology: From Virtuality to Reality. IOS Press, 499

Für die Anforderungen dieses Projekts war der im ARIA Standard definierte Umfang von Rollen völlig ausreichend. Ein Test der Benutzeroberflächen zeigte, dass der im Moment schon vorhandene Support des ARIA Standards durch die Hersteller von Browsern und Screen Readern schon sehr gut ist. Als Screen Reader wurden in diesem Test JAWS (siehe www.freedomsci. de/serv01.htm, letzter Zugriff 26.5.2011) und NVDA (http://www.nvda.project.org/, letzter Zugriff 26.5.2011) im Zusammenspiel mit dem Internet Explorer und Firefox

– 503. 5. Hardt, A. & Schrepp, M. (2007). Accessibility of Business Web Applications. In: Eizmendi, G., Azkoita, J.M. & Craddock, G.M. (Hrsg.), Challenges for Assistive Technology, 922-927.

157


Benutzererlebnis bei Unternehmenssoftware Ein Praxisbericht über die Umsetzung attraktiver Unternehmenssoftware Maria Rauschenberger MSP Medien Systempartner GmbH & Co. KG Peterstraße 28-34 26121 Oldenburg maria.rauschenberger@gmx.de

Andreas Hinderks RMT Soft Retail Management Technology GmbH & Co. KG Carl-Zeiss-Str. 14 28816 Stuhr andreas@hinderks.org

Abstract Unternehmen können heute nicht mehr ohne speziell entwickelte Unternehmenssoftware arbeiten. Obwohl eine sehr hohe Anzahl derartiger Softwareprodukte am Markt vorhanden ist, sind die Erfahrungen der Benutzer meist nicht positiv, da zum Beispiel die Gebrauchstauglichkeit nicht optimal erfüllt wird. Der Benutzer kann das Softwareprodukt nicht optimal nutzen und die Gesamtattraktivität der Software sinkt. Aber wie lässt sich die Attraktivität von Unternehmenssoftware steigern, ohne hohe Kosten zu produzieren? In diesem Artikel wird gezeigt, wie das Unternehmen MSP Medien Systempartner die Attraktivität von Tempestiva, eines seiner Softwareprodukte, mittels Zukunftswerkstatt, Prototyping und Benutzertest kosteneffizient in einem kleinen Softwareentwicklungsteam gesteigert hat.

1. Einleitung Die Entwicklung von Unternehmenssoftware in kleineren Softwarehäusern ist geprägt durch Zeit- und Kostendruck. Oftmals wird in diesen Unternehmen eine Softwarelösung für ein sehr spezielles Marktsegment entwickelt und nur in geringen Stückzahlen verkauft. Anders als beim Consumer-Produkt von international tätigen Unternehmen, ist kaum Know-how und Kapazität für Usability und User Experience Design vorhanden. Als Ergebnis entstehen Softwareprodukte, die nicht den allgemeinen Ansprüchen der Benutzer entsprechen und zusätzlich steigt die Erwartungshaltung der Benutzer an die Softwarequalität. Fehler oder falsche Bedienung der Unternehmenssoftware durch Benutzer kann Mehrkosten verursachen. Usability Engineering und die Verbesserung der User Experience helfen, die Fehler der Softwarebedienung zu reduzieren. Denn in den letzten Jahren konnte beobachtet werden, dass die ConsumerProdukte an Attraktivität gewonnen haben,

158

wohingegen Unternehmenssoftware weiter überwiegend funktionsgetrieben entwickelt wird. Eine positive User Experience beruht dabei immer auf eine schon bestehende Umsetzung der Gebrauchstauglichkeit, wie Schubert et. al 2010 treffend formulieren: „Konsistenz und eine gleichbleibend hohe ergonomische Qualität der Bedienoberfläche sind wichtige Erfolgsfaktoren für komplexe und umfangreiche Unternehmenssoftwareprodukte. Diese Eigenschaften bilden u.a. die Grundlage für eine gute User Experience und einen möglichst geringen Lernaufwand.“ Reduzierter Lernaufwand kann gerade für Unternehmen mit flexibler Personaleinsatzplanung als Verkaufsargument genannt werden, da die Einarbeitungszeit geringer und damit kostengünstiger wird. Geringer Lernaufwand stellt dabei einen Mehrwert dar, der bei gleichem Funktionsumfang den Ausschlag für einen Kauf geben kann, gerade weil die Komplexität der Produkte tendenziell steigt. Aber welche Vorgehensweise ist nötig, um eine Unternehmenssoftware zu entwickeln, die den Anwender motiviert und Faszination weckt, gleichzeitig aber gebrauchstauglich und effizient ist?

Jörg Thomaschewski Hochschule Emden/Leer Constantiaplatz 4 26723 Emden joerg.thomaschewski@hs-emden-leer.de

Keywords: /// Software-Entwicklungsprozess /// Unternehmenssoftware /// User Experience /// Paper-Prototyping /// User-Experience Questionnaire

1.1. Softwareentwicklung in kleinen Softwarehäusern Ein Vorteil von kleinen Softwarehäusern mit entsprechend kleinem Entwicklungsteam besteht im geringeren Koordinations- und Kommunikationsaufwand gegenüber großen Teams und Organisationen. Innerhalb dieser kleineren Strukturen finden sich meistens ein Projektleiter mit einigen Entwicklern und ein UI-Designer. Aufgrund der Tatsache, dass die Anzahl der Benutzer von Unternehmenssoftware deutlich kleiner ist als die von ConsumerProdukten, besteht von den Entwicklern direkter Kontakt bzw. Kommunikation zu den Benutzern. Verbesserungsvorschläge der Benutzer führen häufiger zu einer stark funktionsgetriebenen Entwicklungsweise des Produktes, da sie ungefiltert und ohne Entwicklungsmanagement umgesetzt werden. Die Problematik liegt aber nicht beim Kunden, sondern bei der Umsetzung seiner Forderungen. Die stark funktionsgetriebene Entwicklung ist den SoftwareProdukten nach einigen Versionen deutlich anzusehen. Historisch gewachsene Navigation und komplizierte Abläufe für

154


Usability Professionals 2011 Geschäftssoftware

den Benutzer können Folgen dieser Vorgehensweise sein. Bei Unternehmenssoftware handelt es sich normalerweise um die Abbildung sehr spezieller Prozesse und komplexer Anforderungen. Das bedeutet für Außenstehende einen hohen Einarbeitungsaufwand. Damit ist eine strukturierte Analyse und Konzeption durch externe Usability-Professionals mit einem hohen Zeitaufwand und entsprechenden Kosten verbunden. Diese Vorgehensweise ist für kleine Systemhäuser meist nicht rentabel. Die DIN EN ISO 9241-210:2010 gibt zwar einen theoretischen Ansatz zur unternehmensinternen Durchführung, aber die akkurate praktische Umsetzung eines solchen Ansatzes ist mit hohen Kosten verbunden und deswegen für kleinere Softwarehäuser ebenfalls nicht wirtschaftlich. Der in der DIN beschriebene HumanCentred-Design Prozess kann jedoch als Orientierungshilfe verwendet werden. 1.2 Pragmatische und hedonische Qualität In der DIN EN ISO 9241-11 wird die Gebrauchstauglichkeit (engl. Usability) wie folgt beschrieben: Die „Usability eines Produktes ist das Ausmaß, in dem ein Produkt […] genutzt werden kann, um bestimmte Ziele effektiv, effizient und zufriedenstellend zu erreichen“. Hassenzahl (2004) nennt als Beispiel für den Begriff der Gebrauchstauglichkeit den Ausdruck der „pragmatischen Qualität“. Dieser beschreibt die Nützlichkeit und Gebrauchstauglichkeit eines Produktes. Im Jahr 2004 elaborierten Forlizzi und Battarbee (in (Hassenzahl, 2010)) User Experience mit den Begriffen „Experiencing“ und „An Experience“.

da ein Testergebnis vom Zeitpunkt der Benutzung abhängig sein kann. „An Experience“ besitzt einen Anfangs- und einen Endpunkt, während das „Experiencing“ ein kontinuierlicher Fluss an Gedanken ist. Diese Erkenntnis hat Hassenzahl (2010) zur hedonischen Qualität zusammengefasst, welche die pragmatische Qualität um die Stimulation der Benutzer und die Benutzermotivation erweitert. Die DIN ISO 9241-210 (2010) beschreibt die User Experience wie folgt: „Wahrnehmungen und Reaktionen einer Person, die aus der tatsächlichen und/oder der erwarteten Benutzung eines Produktes, eines Systems oder einer Dienstleistung resultiert“. Die User Experience ist laut Hassenzahl und Roto (2007) ein Zusammenspiel aus pragmatischer und hedonischer Qualität. Dabei sollte die pragmatische Qualität stets erhalten bleiben und im Einklang mit der hedonischen Qualität in einem Produkt vereint werden. 2. Entwicklung von Tempestiva Tempestiva ist ein Softwareprodukt der Firma MSP Medien Systempartner. Es ist eine Web-Anwendung, für die Erfassung und Verwaltung von Massenterminen, die vorwiegend bei Zeitungverlagen eingesetzt wird. Aus unterschiedlichen Quellen werden Termine, wie zum Beispiel Konzerte, Notdienste oder Öffnungszeiten, von Veranstaltern und Informanten der Redaktion per E-Mail gemeldet. Diese unstrukturierten Daten werden über eine Erfassungsmaske systematisch in eine Datenbank gespeichert und mit weiteren Termindetails durch die Termin-Redaktion angereichert, um diese in Print- und Online-Medien zu präsentieren.

–– Experiencing: Das Erlebnis, welches gerade gemacht wird. –– An Experience: Das Erlebnis in der Retroperspektive

Seit der ersten Version im Jahr 2002 wurde Tempestiva entsprechend der Kundenwünsche erweitert. Die stetigen Erweiterungen führten seitdem zu einer Erhöhung der Komplexität, so dass intensive Schulungen für die Benutzer notwendig geworden sind.

Diese Unterscheidung ist besonders wichtig für die Analyse bestehender Produkte,

Erstmals wurde 2009 von Himburg eine heuristische Evaluation durchgeführt und

der ermittelte Maßnahmenkatalog zur Verbesserung der Usability in der alten Version umgesetzt. Hierdurch konnte eine Steigerung der Usability erzielt werden. In Kundengesprächen wurde erkannt, dass der Funktionsumfang und die pragmatische Qualität von Tempestiva oftmals ausreichten, aber die hedonische Qualität nur in Ansätzen vorhanden war. 2.1. Vorgehensweise Um die hedonische Qualität zu verbessern, wurde wegen des Zeit- und Kostendrucks, ein schlanker Entwicklungsprozess gewählt, welcher in vier kurze Phasen von je 2-4 Personentagen unterteilt wurde. –– Analysephase –– Zukunftswerkstatt –– Prototyp –– Benutzertests Dabei wurde die damals noch aktuelle DIN EN ISO 13407 (1999) , welche heute durch die DIN EN ISO 9421-210 (2010) abgelöst wurde, als Leitfaden für die Spezifizierung des schlanken Entwicklungsprozesses herangezogen. 2.2 Analysephase Aufgrund des Verständnisses für die Problemstellung des Kunden und die langjährige Erfahrung der einzelnen Projektmitglieder konnte die Analysephase stark verkürzt werden. Die Kundenwünsche, überwiegend funktionale Erweiterungen und Fehlermeldungen, wurden bisher direkt an den Entwickler weitergegeben und in eine Excel-Liste priorisiert eingetragen. Ein direkter Kontakt zum Endbenutzer bestand jedoch nicht, so dass die tatsächliche Arbeitsweise der Endbenutzer den Entwicklern unbekannt blieb. Aufgrund der geringen Endbenutzeranzahl wurde entschieden ein Interview mit den Endbenutzern eines ausgewählten Kunden durchzuführen, um deren Arbeitsweise im Detail kennenzulernen. Eine anschließende partizipative Beobachtung

159


2.3.1. Brainstorming

sollte sicherstellen, dass die Ergebnisse des Interviews die wirkliche Arbeitsweise widerspiegelten (vgl. Nielsen, 2010). 2.2.1 Beobachtung mit Interview Der Eingabeprozess wurde aufgrund von zwei Interviews und Beobachtungen ermittelt, wie in Abbildung 1 „Eingabeprozess“ dargestellt. Auffällig ist, dass die Probanden (die Termin-Redakteure) eine hohe Anzahl wiederkehrender Aufgaben an einem Tag erledigen. Vor allem das Öffnen von E-Mails, die Suche nach einem Termin und die spätere Eingabe des Termins sind Hauptaufgaben, die bis zu 300-mal (Tendenz steigend) am Tag durchgeführt werden. [Abb. 1] Die Probanden sind ca. 30 Stunden pro Woche mit der Termineingabe beschäftigt. Sie arbeiten dafür parallel mit einem E-Mail Programm und Tempestiva, um Termindaten aus der E-Mail in Tempestiva zu übertragen. Für die Eingabe innerhalb von Tempestiva werden bis zu 20 Klicks benötigt (Doppel-Klicks wurden als Einfach-Klicks bewertet). Danach folgte eine Bestandsaufnahme der Problemstellungen. Als Probleme wurden u.a. die überfüllte Eingabemaske, die aufwendige Doubletten-Prüfung und umständliche Benutzung des E-Mail Programms parallel zu Tempestiva genannt. Während der Durchführung wurden weitere Änderungsvorschläge erfasst, welche in die anschließende Zukunftswerkstatt eingebracht wurden. 2.3. Zukunftswerkstatt „Unter der Zukunftswerkstatt versteht man eine Methode, […] die Selbstorganisation, Wahrnehmungsfähigkeit, Fantasie und Handlungskompetenz der Teilnehmenden fördert und Möglichkeiten zur Realisierung gemeinsamer Ideen entwickeln hilft und in der Umsetzung beratend begleitet“ (Apel et al., 1998).

160

Abb. 1. Eingabeprozess

Für eine Ideenfindung wird eine längere Konzentrationsphase benötigt, die durch den Berufsalltag leicht unterbrochen werden kann. Deshalb wurde für die Brainstorming-Phase ein Workshop von ca. 6 Stunden mit allen Teilnehmern durchgeführt. Die Teilnehmer waren in der Zeit von Einflüssen des Arbeitsalltags freigestellt und wurden aus allen Bereichen ausgewählt, die einen direkten oder indirekten Einfluss auf Tempestiva hatten. Diese waren: –– Marketing–– Softwareentwicklung –– Kundenvertretung –– Usability Engineering und User Experience –– Produktleitung Der Usability / UX-Erfahrene wurde durch eine externe Beratung hinzugezogen, da das Know-how im Unternehmen nicht ausreichend vorhanden war und gleichzeitig keine Alternative zur Integration des Knowhows im Unternehmen bestand. Insgesamt waren 6 Personen an der Zukunftswerkstatt beteiligt, wobei nicht jeder der aufgeführten Bereich durch eine einzelne Person repräsentiert, sondern Personen oftmals auch mehreren Bereichen zugeordnet wurden. Aufgrund mangelnder Ressourcen wurde anstatt eines ausschließlichen Moderators wie zunächst geplant, ein Moderator aus dem bestehenden Team benannt. Die Zukunftswerkstatt unterteilt sich in die folgenden zwei Schritte: Brainstorming und Prototypenerstellung.

In der Brainstorming-Phase wurde eine Auflockerungsübung (Antz und Rüttgers, 2010) und die Methode 3-6-5 (Rohrbach, 1969) angewendet. So war es in kurzer Zeit möglich, eine lockere und kreative Umgebung zu schaffen. Als erstes wurden alle Ideen gesammelt und an einer Stellwand für jeden sichtbar festgehalten. Hier wurde darauf geachtet, mit möglichst einfachen Mitteln zu arbeiten, damit der eigentliche Fokus, die Entwicklung von Ideen, nicht verloren ging. Anschließend wurden die Ideen nach Bereichen geordnet, präsentiert und vom Produktleiter mit Prioritäten versehen. Dadurch entstand eine gewünschte Diskussion über Unstimmigkeiten in der Priorisierung. Die Diskussion gewährleistete, dass alle relevanten Faktoren im richtigen Maß für ein erfolgreiches Produkt integriert wurden: Von der Idee über die Konzeption und Implementierung bis hin zur Vermarktung. Diejenigen Ideen, welche in einem Papier-Prototyp mit Hilfe von UI-Pattern umgesetzt werden sollten, wurden weiter vertieft. Die besten UI-Pattern wurden von den Teilnehmern ausgefiltert. 2.3.2. Prototyp Um den Personalaufwand möglichst gering zu halten, wurde das Entwicklungsteam, bestehend aus zwei Entwicklern, mit der Umsetzung eines Papier-Prototypen (Snyder, 2003) beauftragt. Während der Erstellung des Prototyps und der Teilnahme am Workshop wurde das Problemverständnis der Entwickler erhöht. Durch das Verständnis der Entwickler konnte die Implementierungszeit um ca. 20% reduziert werden, da keine Erklärung der Problematiken in der Implementierungsphase erforderlich war. Die Basis für den Prototyp waren ausschließlich die ausgewählten Ideen und UI-Patterns. Das war möglich, weil sich der Prototyp vom Design und der Bedienung von der aktuellen Version drastisch unterscheiden durfte. Nach Erstellung des


Usability Professionals 2011 Geschäftssoftware

Prototyps wurde dieser dem Team vorgestellt (siehe Abbildung 2), Änderungen diskutiert und iterativ ein weiterer Prototyp entwickelt, der für die anschließenden Benutzertests eingesetzt wurde. 2.4. Benutzertests Die Überprüfung fand zum einen mittels Papier-Prototyping und zum anderen mittels User-Experience-Questionnaire (UEQ) Fragebogen (Laugwitz et. al, 2006) statt. Durchgeführt wurde diese an der erwähnten Benutzergruppe (Termin-Redakteure) des Beispiel Unternehmens. 2.4.1. Paper-Prototyping Grundsätzlich bestand die Problematik darin, eine Vertrauensbasis zu den Probanden aufzubauen, um das Testergebnis so wenig wie möglich zu verfälschen. Der Papier-Prototyp wurde aus der Annahme, die Benutzer kämen mit der Papier-Darstellung nicht zurecht, mit dem Visualisierungsprogramm Photoshop CS5 grafisch aufbereitet, um eine höhere Akzeptanz bei den Probanden zu erreichen. Die Vorbereitung, Durchführung und Nachbereitung der Beobachtung dauerte ca. fünf Personentage. Der Test selbst wurde in zweieinhalb Stunden durchgeführt und

mittels Videokamera und Protokollführer dokumentiert. [Abb. 2] Grundsätzlich wurde der Prototyp (siehe Abbildung 2) sehr gut aufgenommen und die Probanden waren begeistert darüber, dass zur Terminerfassung nur noch eine Software benutzen werden muss, statt ein E-Mail Programm und Tempestiva. Die Prozessinnovation wurde positiv in der Neugestaltung der Erfassungsmaske gesehen. Die Benutzer empfanden die neuen Funktionen als verbesserte Unterstützung im Arbeitsalltag, die sie effizienter und angenehmer Arbeiten lässt. Es konnte in der Beobachtung festgestellt werden, dass eine Gruppierung und Reihenfolge der Eingabefelder für die Termineingabe hilfreich ist. Zum Beispiel sollten Apothekentermine immer die Öffnungszeiten und Telefonnummer enthalten. Die Theatertermine dagegen sollten eine Zusammenfassung und eine Eingabe der Künstler für die jeweilige Abendveranstaltung enthalten. Dies sei nur ein Beispiel für die ca. 90 ermittelten Verbesserungen, die in der neuen Version umgesetzt werden konnten. 2.4.2. Fragebogen – UEQ Die neue Version von Tempestiva wurde zeitlich versetzt zur Beobachtung der alten

Tempestiva Version durchgeführt, was an der Priorisierung des Kunden lag. Um die User Experience von Tempestiva sowohl in der alten Version als auch in der neuen Version festzustellen, wurde der Fragebogen User Experience Questionnaire (UEQ) eingesetzt. Dieser wurde mit vier Benutzern bei dem vorher benannten Kundenunternehmen durchgeführt, die die alte Version bereits aktiv seit ca. einem halben Jahr einsetzten und die neue Version anhand eines Papier-Prototyps kennengelernt haben. Die Durchführung des UEQ wurde nach dem Papier-Prototyping umgesetzt und sollte eine positive Veränderung der User Experience bestätigen. [Tab. 1] Tabelle 1 - UEQ Ergebnis Die alte Version wurde im Resultat in allen Bereichen überwiegend zwischen 0,3 und 1,2 (siehe Tabelle 1), also neutral bewertet. Hingegen waren fast alle Werte für die neue Version tendenziell besser. Die Werte der Stimulation wurden mehr als verdoppelt und die der Originalität mehr als vervierfacht. Lediglich die Werte der Durchschaubarkeit reduzierten sich auf die Hälfte. Die anhand des UEQ erhaltenen Ergebnisse bestätigten die Annahme, dass die User Experience, die hedonische Qualität, in der neuen Version gesteigert werden konnte. Dies zeigt sich in den Werten der Stimulation und Originalität. Eine Problematik ergab sich durch die Verwendung des Prototyps, bzw. der daraus resultierenden Ergebnisse aus dem Fragebogen. Die Benutzer hatten mit dem Paper-Prototyp eine zu abstrakte Vorstellung vom Produkt und folglich konnten sie sich eine reale Benutzung des Systems nicht vorstellen, welches sich in der Halbierung des Wertes manifestierte, der die Durchschaubarkeit (Selbstbeschreibungsfähigkeit) repräsentiert. 3. Ergebnisse Aus Sicht des Projektteams ist das Projektziel erreicht worden, mit möglichst geringem Aufwand und einem kleinen Projektteam in einer bestehenden Anwendung die hedonische Qualität zu steigern.

Abb. 2. Prototyp Eingabemaske

161


Attraktivität

Durchschaubarkeit

Effizienz

Stimulation

Originalität

Alte Version

0,875

1,125

0,625

0,500

0,375

Neue Version

1,250

0,625

1,000

1,313

1,750

Tab. 1. Prototyp Eingabemaske

Mit dem interdisziplinären Team konnten in der Brainstorming-Phase gute Lösungen erarbeitet werden, was nicht zuletzt daran lag, dass bereits einen Monat vorher eine genaue und exakte Beschreibung der Benutzeranforderungen vorlag. Da das Ziel war, die hedonische Qualität zu verbessern, wurden konsequent alle Ideen in pragmatische und hedonische Qualität unterteilt und letztere höher priorisiert. Nach der Ausarbeitung des Prototyps, wurde unter Zuhilfenahme des UEQ eine Vorher-Nachher-Analyse des Produktes vorgenommen und damit die Veränderung der hedonischen Qualität gemessen. Es konnten folgende Mehrwerte für den Endbenutzer erarbeitet werden: –– Funktionen sind an die Bedürfnisse der Benutzer entwickelt. Durch die Interviews und die Überprüfung des Prototyps ist der Kunde in den Entwicklungsprozess integriert worden, was die Identifikation mit dem Produkt erhöhte. –– Ermüdende Routinearbeiten wurden größten Teils automatisiert, so dass die Benutzer sich mit komplexeren Aufgaben beschäftigen können. Die Kompetenz und die Stimulation des Benutzers wurden durch die neuen Funktionen gefördert. –– Die Prozesse sind an die Arbeitsabläufe der Benutzer angepasst und führen nicht mehr zur Fehlbedienung, welches sich positiv auf den Gemütszustand der Benutzer auswirkt und eine konzentriertere Arbeitsweise zulässt.

Softwareentwicklung integriert worden und hatten dadurch ein höheres Verständnis für die Problematiken der Benutzer, was sich positiv auf die spätere Realisierung auswirkt. –– Die Zukunftswerkstatt und das Brainstorming erzielen in dem interdisziplinären Team sehr gute Lösungen. –– Eine kostengünstige, effektive und zielorientierte Arbeitsweise ist im gesamten Projektverlauf umgesetzt worden. Bei der Durchführung des Workshops hat sich gezeigt, dass es sinnvoller gewesen wäre einen Moderator nicht aus dem selben Projekt zu bestimmen. Ein externer Moderator kann erstens viel objektiver moderieren und zweitens mehr für die Aufgabe freigestellt werden, als Projektmitglieder. Auch eine bessere Dokumentation der einzeln durchgeführten Schritte müsste beim nächsten Entwicklungsprojekt erfolgen. Es wurde wenig dokumentiert, so dass erarbeitetes Wissen des Projektteams von Kollegen nicht nachvollzogen werden kann.

eine erfolgreiche Vermarktung. Der Markt von Unternehmenssoftware ist ungleich kleiner und spezieller als der von Consumer-Produkten, so dass eine positive Reputation des Produktes, die durch eine höhere Akzeptanz gewährleistet wird, im Markt erfolgreicher sein kann. Dass die pragmatische Qualität die Grundlage einer jeden Unternehmenssoftware ist, kann als Voraussetzung angenommen werden, da der Benutzer effektiv und effizient seine Aufgaben bewältigen muss. Die hedonische Qualität kann darüber hinaus die Produktivität steigern und am Markt ein Alleinstellungsmerkmal darstellen, was nicht zuletzt für zufriedene Kunden sorgt, sondern auch die Position des Herstellers im Wettbewerb stärkt. Literatur 1. Antz, E., Rüttgers, U. (2010): Aufwärm- und Lockerungsübungen. Wegweiser Bürgergesellschaft. http://www.buergergesellschaft.de/ praxishilfen/kreativitaetstechniken/ die-techniken/fantasiephase/aufwaermlockerungsuebungen/aufwaerm-undlockerungsuebungen/105310/ (abgerufen am 04.08.2010).

Um das zu vermeiden, sollten die wichtigsten Erkenntnisse so dokumentiert werden, dass diese zur Einarbeitung von nicht beteiligten Mitarbeitern ausreichen. Auch ist zu überlegen, inwieweit die grundsätzlichen Erfahrungen auf andere Projekte übertragen werden können.

2. Apel, H., Dernbach, D., Ködelpeter, T., Weinbrenner, P. (1998): Wege zur Zukunftsfähigkeit – ein Methodenbuch. In: Apel, H., Lokale Agenda 21 in Deutschland – worum geht es?, S. 7-12. Bonn: Stiftung Mitarbeit. 3. Beck, A. ,Eichstädt, H., Gaiser, B., von Savigny, P., Schubert, U., Schweibenz, W. (2005):

4. Fazit

Personas in der Praxis. in Hassenzahl, M. / Peissner, M. (Hrsg.): Usability Professionals 2005, Berichtband des 3. GC-UPA Tracks, S.

Für das Management und das Entwicklungsteam ergeben sich die nachstehenden Vorteile: –– Die Entwickler sind in der Definitionsphase der

162

Schlussendlich ist die Durchführung einer nutzerorientierten Gestaltung von Unternehmenssoftware mit ein Grund für die verbesserte Akzeptanz der Software durch die Benutzer und unterstützt somit

95-98. Linz: German Chapters der Usability professionals Association.


Usability Professionals 2011 Geschäftssoftware

4. Hassenzahl, M., (2004): The Interplay of Beauty, Goodness, and Usability in Interactive Products. http://www.uni-landau.de/ hassenzahl/pdfs/HCI04_1.pdf (abgerufen am 23.04.2010). 5. Hassenzahl, M. (2010): Experience design. Technology for all the right reasons. San Rafael: Morgan & Claypool. 6. Himburg, O. (2009): Neuprogrammierung der Terminerfassung im Produkt Tempestiva unter Berücksichtigung von Usability-Aspekten und Verwendung aktueller Programmiertechniken. Diplomarbeit, Emden: unpublished. 7. Hassenzahl, M., Roto, V. (2007): Being and Doing. A perspective on User Experience and its measurement. http://www.marchassenzahl.de/pdfs/hassenzahl_Interfaces72. pdf (abgerufen am 23.04.2010). 8. DIN EN ISO 9241-11 (1998): Ergonomische Anforderungen für Bürotätigkeiten mit Bildschirmgeräten – Teil 11: Berlin: Beuth. 9. DIN EN ISO 13407 (1999): Benutzerorientierte Gestaltung interaktiver Systeme. Berlin: Beuth. 10. DIN EN ISO 9241-210 (2010): Ergonomie der Mensch-System-Interaktion - Teil 210: Prozess zur Gestaltung gebrauchstauglicher interaktiver Systeme. Berlin: Beuth. 11. Laugwitz,B., Schrepp, M., Held,T. (2006): Konstruktion eines Fragebogens zur Messung der User Experience von Softwareprodukten, S. 125–134. http://mc.informatik.unihamburg.de/konferenzbaende/mc2006/ konferenzband/muc2006_12_laugwitz_etal. pdf (abgerufen am 14.06.2011). 12. Nielsen, J. (2010): Definition and Fundamentals - What, Why, How. http://www. useit.com/alertbox/20030825.html (abgerufen am 14.06.2011). 13. Snyder, C. (2003): Paper prototyping. The fast and easy way to design and refine user interfaces. San Diego: Morgan Kaufmann Pub. 14. Schubert, U., Bonhag, W., Groß, M., (2010): Einsatz von User Interface Patterns bei der Entwicklung von Buiness-Software . In Brau, H., Diefenbach, S., Göring, K., Peissner, M., Petrovic, K. (Hrsg.) (2010): Usability Professionals 2010. Jahresband 2010 S.151156 Stuttgart: Fraunhofer Verlag. 15. Rohrbach, B. (1969): Kreativ nach Regeln – Methode 635, eine neue Technik zum Lösen von Problemen. Absatzwirtschaft 12 (1969) 73-76, Heft 19, 1. Oktober 1969. (Erstveröffentlichung des Erfinders)

163


114

„Tipp‘ die Opportunity“ – sollte Geschäftssoftware Spaß machen? Svenja Schiffler Richardisweg 16 79341 Kenzingen s.schiffler@gmx.de

Theo Held SAP AG – User Experience Dietmar-Hopp-Allee 16 69190 Walldorf theo.held@sap.com

Abstract Können spielorientierte Benutzeroberflächen für Customer Relationship Management (CRM) Anwendungen einen Mehrwert darstellen? Dieser Beitrag verfolgt den Ansatz, neue Gestaltungsmöglichkeiten für Geschäftsanwendungen im Kontext freudvoller Benutzung anzuregen. Mit dem Ziel die Qualität komplexer Abschätzungen durch Motivation und spielerischen Ehrgeiz zu verbessern, wurde ein Prototyp in Form des Tippspiels “Tipp’ die Opportunity” entworfen. In einer Studie mit 22 Teilnehmern in zwei unabhängigen Stichproben wurde die entsprechend gestaltete Oberfläche einer vereinfachten Oberfläche eines existierenden CRM-Systems gegenüber gestellt. Dabei zeigte sich eine Tendenz, dass die umgestaltete Oberfläche als attraktiver bewertet wird als das herkömmliche CRM-System und die Nutzer zu mehr Aufwand motiviert, als das herkömmliche System. Zudem zeigte sich ein Hinweis auf einen Einfluss der Expertise der Nutzer.

1. Motivation Computerspiele erreichen es, uns vollständig in ihren Bann zu ziehen. Die Zeit vergeht wie im Flug. Wir haben Spaß und streben danach, unsere Lösungswege ständig zu verbessern und unsere Leistungen zu steigern. Sitzen wir dagegen am Computer und arbeiten, fällt es oft schwer, die Aufmerksamkeit auf dem Bildschirm zu halten. Wir müssen uns konzentrieren, uns selbst motivieren und Pausen machen. Arbeit und Spiel sind nicht vergleichbar, oder etwa doch? Einige Autoren wie Hassenzahl (2003b) oder Vorderer (2005) weisen ausdrücklich auf Analogien zwischen Spiel und Arbeitstätigkeiten hin. Beim Spielen sowie bei Routinetätigkeiten am Arbeitsplatz müssen wiederkehrende Aufgaben bewältigt werden, für die wiederum unterschiedliche Teilziele erfüllt werden wollen. Widerstände müssen überwunden und Fähigkeiten erlangt werden (vgl. Harbich, Hassenzahl & Kinzel, 2007). Wenn Technologie motivieren kann, komplexe Aufgaben zu lösen und tiefgehend in

164

ein Thema einzusteigen, warum ermöglicht uns dann unsere Arbeitssoftware nicht, mit ähnlicher Freude, Motivation und Kampfeslust unsere Ziele anzugehen? Mit der Omnipräsenz der Informationstechnologie und der weltweiten Vernetzung verändern sich die Gewohnheiten und damit auch die Anforderungen der Nutzer. Hedonische Elemente haben neben Spielen auch bei den unterschiedlichen Arten von sozialen Netzwerken längst den Rang eines elementaren Grundbestandteils eingenommen. Ist es vielleicht nur noch eine Frage der Zeit ist, bis diese Eigenschaften von jeder interaktiven Anwendung verlangt werden und wie lassen sich „ernsthafte“ Anwendungen und spielerische Elemente überhaupt vereinen? Aus der Beschäftigung mit den Fragen, ob Geschäftssoftware Spaß machen darf, kann oder sogar muss, wurden im Vorfeld Heuristiken für die spielorientierte Gestaltung von Geschäftssoftware identifiziert und unterschiedliche konkrete Umsetzungsmöglichkeiten ermittelt (s. Schiffler, 2010). Viele Anregungen ergeben sich aus den

Martin Schrepp SAP AG – User Experience Raiffeisenring 45 68789 St. Leon-Rot martin.schrepp@sap.com

Keywords: /// Joy of Use /// Geschäftssoftware /// Gamification /// Spaß /// Hedonische Qualität

Arbeiten von Hassenzahl und Kollegen (u. a. Hassenzahl, 2003a; Hassenzahl, & Hofvenschiöld, 2003), in denen Computerspiele als geeignete Modelle für attraktive Software herangezogen werden. Formale Umsetzungsmöglichkeiten zeigt unter anderem das Projekt „Fun of Use für Geschäftsanwendungen“ des Fraunhofer Institut für Experimentelles Software Engineering (Kerkow & Graf, 2007; Klöckner, Schmitt, Klein & Garst, 2009; Kohler, 2006). Um eine konkrete Gestaltungsmöglichkeit aufzuzeigen, wird in diesem Beitrag ein exemplarischer Prototyp vorgestellt, der in einer Studie mit dem bestehenden System verglichen wird. Abschließend werden die Ergebnisse diskutiert und Implikationen für zukünftige Forschung in den Blick genommen. 2. Joy of Use und CRM CRM-Software ist ein Arbeitsmittel. Somit muss sie nützlich und gebrauchstauglich sein, d. h. sie sollte gewährleisten, dass Benutzer ihre Arbeitsaufgabe „effektiv,


Usability Professionals 2011 Geschäftssoftware

effizient und zufrieden stellend erledigen können“ (DIN EN ISO 9241-11, 1999). Auch bei Geschäftssoftware hat der Nutzer meist die Wahl, ob und wie häufig er diese nutzt. Die Akzeptanz der Anwendung kann wesentlich sein, um durch eine Anwendung einen Mehrwert für den Kunden zu erreichen. Nach Hassenzahl, Burmester und Koller (2003) werden die Produktqualitäten in zwei Komponenten zerlegt an Hand derer wir Produkte beurteilen: Die wahrgenommene pragmatische Qualität (d.h. Nutzen und Gebrauchstauglichkeit) und die wahrgenommene hedonistische Qualität, die dem Nutzer Freude und Spaß bereiten soll. Nach Graf, Niebuhr und Kohler (2006) unterscheiden sich besonders Geschäftsanwendungen nur gering in ihrer Funktionalität. Daher könne Joy of Use auch für „ernsthafte“ Anwendungen ein Differenzierungsmerkmal zu Konkurrenzprodukten darstellen (vgl. Hassenzahl, Beu & Burmester, 2001). Kerkow und Graf (2007) definieren über die angestrebte Wirkung auf den Nutzer: “How to turn boring tasks into enjoyable challenges, giving users the possibility to grow or compete, or empowering users to perform sophisticated tasks and as a consequence gain social appreciation” (S. 1). Software für das Kundenbeziehungsmanagement einzuführen, kostet ein Unternehmen viel Geld. Zudem haben die entsprechenden Anwendungen in vielen Unternehmen immer noch große Akzeptanzprobleme (Schwetz, 2008). Als Folge werden kostenintensiv implementierte CRM-Lösungen mitunter wenig genutzt und nicht auf aktuellem Stand gehalten (vgl. Alt, Puschmann & Österle, 2005; Müller, 2009). In diesem Zusammenhang ist beispielsweise die Vorhersage von Kennzahlen im Unternehmen zu nennen. Aus betriebswirtschaftlicher Sicht ist hier eine möglichst genaue Schätzung von zentraler Bedeutung. Für den einzelnen Mitarbeiter ist eine gute Schätzung dagegen zunächst ohne klaren Mehrwert. Hier setzt das Tippspiel „Tipp’ die Opportunity“ an, das im Folgenden vorgestellt wird.

3. Gestaltung des Prototypen „Tipp die Opportunity“ Mit dem Ziel, die Qualität komplexer Vorhersagen von Kennzahlen im Unternehmen zu verbessern, wurde ein Prototyp in Form eines Tippspiels entworfen. Als zu schätzende Kennzahl wurde die Erfolgswahrscheinlichkeit von „Opportunities“ gewählt. Eine Opportunity ist eine qualifizierte Verkaufschance. Deren Auftragswahrscheinlichkeit wird dabei durch den Vertriebsmitarbeiter geschätzt. Auf diesen Einschätzungen basieren die Prognosen über zukünftige Einnahmen und Umsätze, die die Basis für viele interne Planungsprozesse sind. Für den Mitarbeiter besteht nur wenig Anreiz, Zeit in genaue Schätzungen zu investieren. Eine Opportunity durchläuft verschiedene Phasen, während der sich ihre Erfolgschancen verändern. Für den Prototypen wurde die Schätzung der Erfolgswahrscheinlichkeit als Tipp in einem Tippspiel aufgefasst. Wie gut dieser Tipp ist, kann entschieden werden, sobald die Opportunity abgeschlossen, d.h. „gewonnen“ oder „verloren“ wird. Schätzt ein Mitarbeiter z. B. die Erfolgswahrscheinlichkeit einer Opportunity als hoch ein und diese wird später gewonnen, so kann dieser gute Tipp entsprechend mit Pluspunkten belohnt werden. Wird die Opportunity dagegen verloren, so kann die Fehleinschätzung zu Minuspunkten führen. Hierdurch wird die eigentlich wenig relevante Aufgabe der Schätzung der Erfolgswahrscheinlichkeit zu einem spielerischen Wettkampf und die Motivation der Mitarbeiter gesteigert, möglichst gute Schätzungen abzugeben. Soll zusätzlich extrinische Motivation erzeugt werden, könnten analog zu einen Fußball-Tippspiel für den oder die besten Tipper in einem bestimmten Zeitraum Preise vergeben werden. Um eine konsistente Mikrowelt zu erschaffen, stand vor der Gestaltung des Prototypen die Suche nach einer adäquaten Metapher. In der Anwendung findet der Terminus „Opportunity Pipeline“ Verwendung. Diese gibt den Status aller

identifizierten Opportunities an. Darum lag es nahe, die Gestaltung am Spieleklassiker „Pipeline“ zu orientieren, in dem es darum geht, möglichst schnell Rohre zu verlegen, bevor sich ein Hahn öffnet, der Wasser durch die Rohre spült. Abbildungen 1 und 2 zeigen das Ergebnis des Gestaltungsprozesses für den Prototypen. Der Prototyp wurde für eine Opportunity mit drei Phasen entworfen (siehe Abbildung 1). In jeder Phase wird die geschätzte Erfolgswahrscheinlichkeit direkt durch rechten Mausklick auf das jeweilige Feld gewählt. Die Auswahl erscheint danach farbig markiert (bei unter 50% in Orange, bei über 50% in Gelb). Wurde für eine Phase ein Tipp abgegeben, dreht sich in der Darstellung ein Rohrsegment und lässt das „Wasser“ ein Stück weiter. Sind für alle Phasen Schätzungen abgegeben worden, erreicht dieses ein geschlossenes Ventil. Mit Abschluss der Opportunity als „gewonnen“ oder „verloren“ öffnet sich in der Darstellung das Ventil. Der Nutzer erhält je nach seinem durchschnittlichen Schätzwert Plus- oder Minuspunkte. Abbildung 2 zeigt eine „gewonnene“ Opportunity, bei der im Schnitt zu 57 Prozent auf Erfolg geschätzt wurde. Der Nutzer erhält 57 Pluspunkte. [Abb. 1], [Abb. 2] 4. Studie Der Studie lag ein 2x2-Design zu Grunde. Als unabhängige Variablen dienten die User Experience Expertise der Versuchspersonen als Between-Subjects Faktor und die Gestaltung der Anwendung als Within-Subjects Faktor. Abhängige Variablen waren die wahrgenommene Attraktivität der Oberflächen, sowie die Zeit, die die Probanden für die Informationssuche vor ihren Schätzungen aufwendeten. Als Grundlage für die Studie wurden die in Abbildungen 1 und 2 gezeigten Oberflächen erstellt. Experimentalbedingung (A): Bedingung A bestand aus der bestehenden Oberfläche für die betreffende Funktion, die zur besseren Übersichtlichkeit auf

165


Abb. 1. Screenshot: Entwurf „Tipp´ die Opportunity“ nach Bewertung der ersten Phase.

Kernelemente reduziert wurde. In diese Oberfläche wurde das Tippspiel eingefügt, das aus technischen Gründen auf eine Phase reduziert wurde. [Abb. 3] Kontrollbedingung (B): Für Bedingung B wurde ebenfalls das bestehende, vereinfachte System übernommen. Die Auswahlmöglichkeiten für die Schätzung der Erfolgswahrscheinlichkeit erschienen in Zehnerschritten in einem schlichten Dropdown-Menü. [Abb. 4] Die Probanden konnten Informationen zu Produkten und Kunden abrufen und mussten die Wahrscheinlichkeit, dass es zu einem Verkaufsabschluss kommen wird, einschätzen. Als Produkt wurden Yachten gewählt, da hier wenig Vorwissen bei den Teilnehmern erwartet wurde. Die Informationen zu den Yachten und zugehörigen Kunden waren unterschiedlich umfangreich. Der Proband muss sich bei jedem neuen Produkt erst zurechtfinden und entscheiden, wie viel Zeit er jeweils für die Informationssuche aufwendet. Nachdem der Proband seine Schätzung abgegeben und bestätigt hatte, bekam er eine Rückmeldung über den Ausgang der Opportunity („gewonnen“ oder „verloren“). In der

166

Abb. 1. Screenshot: Entwurf „Tipp´ die Opportunity“ mit Pluspunkten als Resultat.

Experimentalbedingung (A) gab es zusätzlich eine Rückmeldung über die erhaltenen Plus- oder Minuspunkte. 4.1. Versuchspersonen Die Stichprobe bestand aus 22 Probanden. Zehn davon wurden über einen E-Mail-Verteiler einer innerbetrieblichen User Experience Gruppe rekrutiert (Gruppe: „UX“). Da erwartet wurde, dass das Vorwissen dieser Gruppe die Ergebnisse beeinflusst, wurden zudem über einen anderen E-Mail-Verteiler Probanden gesucht, die nicht in den Bereichen User Experience, Visual Design oder allgemein in der Entwicklung tätig sind (Gruppe: „Nicht-UX“). 4.2. Hypothesen Hypothese 1: Die Oberfläche in Bedingung A wird als attraktiver bewertet, als die Oberfläche in Bedingung B. Nutzer haben nach Hassenzahl (2001) oder Hassenzahl, Burmester und Koller (2003) Bedürfnisse, die über rein aufgabenbezogene Qualitäten hinausgehen.

Pragmatische und hedonische Eigenschaften tragen danach zu gleichen Teilen zur wahrgenommenen Attraktivität eines Produktes bei. Darum wurde davon ausgegangen, dass Bedingung A durch die spielorientierte Gestaltung als attraktiver wahrgenommen wird, als Bedingung B. Hypothese 2: In Gruppe A wird mehr Zeit für die Informationssuche aufgewendet. Harbich und Hassenzahl (2007, 2008) nahmen an, dass Nutzer durch hedonische Gestaltung dazu gebracht werden können, zusätzlichen Aufwand in Arbeitsaufgaben zu stecken. Ansätze zu den Erfolgsfaktoren von Computerspielen sehen unter anderem eine Geschichte (Hassenzahl, 2003a; Robinett, 2003) und ein quantifizierbares Ergebnis (Fritz, 1997; Malone, 1982) als motivierende Faktoren an. Darum wurde angenommen, dass die Probanden der Bedingung A motivierter sind, gute Schätzwerte abzugeben und darum mehr Zeit für die Lektüre der Informationen zu Produkt und Kunde aufwenden. Hypothese 3: Es zeigen sich Unterschiede zwischen den Gruppen UX und Nicht-UX.


Usability Professionals 2011 Geschäftssoftware

Die wahrgenommene Attraktivität hängt nicht nur von den Eigenschaften der Software ab. Hatscher (2001) betont den Einfluss der Erfahrung der Nutzer auf die Wahrnehmung hedonischer Eigenschaften. Hassenzahl (2005) sowie Hassenzahl, Burmester und Sandweg, (2000) sehen eine Abhängigkeit vom ausgeübten Beruf und der Expertise der Nutzer. Auf dieser Basis werden Unterschiede zwischen den Gruppen UX und Nicht-UX erwartet. 4.3. Versuchsablauf Nachdem die Teilnehmer eine Reihe von Opportunities mit den jeweiligen Oberflächen beurteilt hatten, bewerteten sie die User Experience der jeweiligen Oberfläche mit dem User Experience Questionnaire UEQ (Laugwitz, Held & Schrepp, 2008). Dieser Fragebogen (verwendet wurde die Kurzversion SUEQ) misst die User Experience auf den Dimensionen Attraktivität, Effizienz, Durchschaubarkeit, Stimulation und Originalität. Dies wurde durch zwei offene Fragen ergänzt („Was hat Ihnen an der Anwendung gefallen? Was hat Ihnen nicht gefallen?“). Zudem wurde die Zeit gemessen, die jeweils für die Informationssuche aufgewendet wurde. 4.3.

Abb. 3. Screenshot Bedingung A. Anmerkung: Die Kleinbuchstaben zeigen die Verlinkungen der Informationen zu Produkt (a) und Kunde (b).

Ergebnisse und Diskussion Die meisten Versuchspersonen äußerten Überraschung, als Sie im Anschluss aufgeklärt wurden, dass nicht die Güte ihrer Schätzung Gegenstand der Studie war. Dies könnte darauf hinweisen, dass die Ergebnisse nicht durch die Erwartungen der Probanden beeinflusst wurden. Über alle Hypothesen zeigte sich eine Tendenz, die der postulierten Annahme entspricht. Die Interpretation der Ergebnisse erfolgt unter Berücksichtigung der geringen Stichprobe. Die Studie hatte den Anspruch, explorativ Tendenzen aufzuzeigen und nicht verallgemeinerbare Ergebnisse zu liefern. Darum wurde auf inferenzstatistische Auswertungen verzichtet. Hypothese 1: Die Oberfläche in Bedingung A wird als attraktiver bewertet, als die Oberfläche in Bedingung B. Beim Semantischen Differential des UEQ waren Wertungen zwischen „-3“ und „+3“ möglich. In Bedingung A wurde auf allen fünf Skalen höher gewertet als in Bedingung B. Die durchschnittliche Differenz beträgt 0,87 Punkte. Dies entspricht auch der These von Hassenzahl, Burmester und Koller (2003), dass hedonische Eigenschaften zu einer höheren wahrgenommenen

Produktattraktivität führen. Der größte Unterschied ergab sich bei der Einschätzung der Originalität mit 1,49 Punkten, gefolgt von der Attraktivität. Bei der pragmatischen Eigenschaft Effizienz war dieser Abstand mit 0,44 Punkten am geringsten. [Abb. 5] Betrachtet man nur Gruppe UX, wie in Abbildung 6 zu sehen, wurde in Bedingung A ebenfalls auf allen Skalen höher gewertet, als in Bedingung B. Die durchschnittliche Differenz beträgt hier 1,44 Punkte. Bei Gruppe Nicht-UX zeigt sich ein anderes Bild (siehe Abbildung 7). Abweichungen zwischen den Bedingungen zeigten sich hier lediglich bei der Originalität (1,21 Punkte), der Attraktivität (0,79 Punkte) und der Stimulation (0,25 Punkte). Die durchschnittliche Differenz beträgt 0,45 Punkte. [Abb. 6], [Abb. 7] Dass in Bedingung A auf allen fünf Skalen höher gewertet als in Bedingung B entspricht auch der These von Hassenzahl (2001) oder Hassenzahl, Burmester und Koller (2003), dass hedonische Eigenschaften zu einer höheren wahrgenommenen Produktattraktivität führen. In Gruppe Nicht-UX zeigten sich keine Abweichungen bei den Skalen Durchschaubarkeit und Effizienz. Somit wurde hier nur bei Eigenschaften höher gewertet, die der hedonischen

Abb. 4. Screenshot Bedingung B. Anmerkung: Die Kleinbuchstaben zeigen die Verlinkungen der Informationen zu Produkt (a) und Kunde (b) sowie das Auswahlmenü für die Schätzung der Erfolgswahrscheinlichkeit (c).

167


Abb. 5. Darstellung der UEQ Mittelwerte insgesamt, sowie nach Bedingung (A, B) getrennt.

Abb. 7. Darstellung der UEQ Mittelwerte insgesamt, sowie die Ergebnisse der Gruppe Nicht-UX nach Bedingung (A, B) getrennt.

Qualität zugeordnet werden könnten. Das Gesamtergebnis der höheren Einschätzung über alle Skalen ist somit auf die Gruppe UX zurückzuführen. Dies könnte darauf hinweisen, dass die UX-Experten auf Basis von Vorwissen gewertet haben bzw. diese durch ihre Erfahrung bereits eigene Standards verinnerlicht haben. Hypothese 2: In der Experimentalgruppe (A) wird mehr Zeit für die Informationssuche aufgewendet.

168

Abb. 6. Darstellung der UEQ Mittelwerte insgesamt, sowie die Ergebnisse der Gruppe UX nach Bedingung (A, B) getrennt.

Abb. 8. Boxplots mit Median, Spannweite und oberem wie unterem Quartil beider Bedingungen (in Sekunden). Links: Ergebnisse insgesamt. Mitte: Ergebnisse Gruppe UX. Rechts: Ergebnisse Gruppe Nicht-UX.

Wie erwartet, wendete die Experimentalgruppe A mehr Zeit für die Informationssuche auf. Die Teilnehmer benötigten für die Informationssuche über alle drei Opportunities zwischen 1:59 Minuten und 5:30 Minuten (M = 3:19 min, SD = 1:01 min). In Bedingung A (M = 3:30 min, SD = 50 s) wurde länger nach Informationen gesucht, als in der Kontrollgruppe B (M = 3:04 min, SD = 1:14 min). Wie Abbildung 8 veranschaulicht, zeigten sich dabei wiederum Unterschiede zwischen den Gruppen. Während Gruppe UX sogar in Bedingung B durchschnittlich sechs Sekunden

länger nach Informationen suchte, wurde in Gruppe Nicht-UX durchschnittlich in Bedingung A 1:07 Minuten länger gesucht, als in Bedingung B. Bei Gruppe UX betrug der Abstand zwischen oberem und unterem Quartil in Bedingung A 25 Sekunden und in Bedingung B 1:15 Minuten. Bei Gruppe NichtUX war diese Tendenz entgegen gesetzt, mit einem Interquartilsabstand von 1:20 Minuten bei Gruppe A und 27 Sekunden bei Gruppe B. [Abb. 8]


Usability Professionals 2011 Geschäftssoftware

Die Ergebnisse könnten darauf hinweisen, dass die Experimentalgruppe motivierter war, gute Schätzungen abgeben zu können (vgl. Fritz, 1997; Hassenzahl, 2003b; Harbich & Hassenzahl, 2007, 2008; Malone, 1982; Robinett, 2003). Dazu wird davon ausgegangen, dass die Probanden in dieser Zeit ohne Ablenkungen auf die Informationen konzentriert waren. Dies entspricht den Beobachtungen während der Durchführung. Die UX-Experten benötigten auch für die Studienteilnahme insgesamt weniger Zeit. Sie kennen die CRM-Oberfläche bereits und sind routinierte Probanden. Zudem könnte Zeitdruck bei den Experten eine größere Rolle spielen, als bei den Studenten. Hypothese 3: Wie in den vorherigen Abschnitten erläutert, ergaben sich Unterschiede zwischen den Gruppen UX und Nicht-UX. Interessant dabei ist, dass der erwartete Unterschied (Hypothese 1) beim UEQ stärker bei Gruppe UX zu finden war, während bei der nonreaktiven Messung der Zeit die postulierte Tendenz bei der Nicht-UX Gruppe zu finden war. Eine Erklärung könnte sein, dass die Experten-Gruppe bei der Beantwortung des UEQ durch Vorerfahrung beeinflusst war. Basieren die Unterschiede zwischen den Gruppen nicht auf Zufall, ist entweder anzunehmen, dass die Ergebnisse stark von der Stichprobe abhängen, oder, dass UX-Experten hier durch ihre Vorerfahrung nur unter Einschränkungen als Stichprobe geeignet sind. Offene Fragen: Bei den offenen Fragen wurden insgesamt ungefähr viermal so viele pragmatische wie hedonische Aspekte genannt. Die hedonischen Kommentare bezogen sich vor allem auf die Wirkung von Farben und Grafiken sowie die Anschaulichkeit und die Angenehmheit der Gestaltung. In Bedingung A konnten 40% und in Bedingung B nur knapp 15% der genannten Aspekte der hedonischen Qualität zugeordnet werden. Trotz der geringen Stichprobengröße, könnte hierin ein Hinweis darauf gesehen werden, dass die gestaltete gegenüber

der konventionellen Oberfläche als stärker hedonisch wahrgenommen wurde. 5. Diskussion der Gestaltung und Durchführung Die methodische Umsetzung der Fragestellungen unterlag einigen Einschränkungen, die Auswirkungen auf die Qualität der Ergebnisse gehabt haben könnten. Zu nennen sind die geringe Stichprobengröße, die kaum vermeidbare Künstlichkeit der Laboruntersuchung, sowie die Zusammensetzung der Stichprobe aus SAP-Mitarbeitern. Ferner unterschied sich das Durchschnittsalter beider Gruppen um 14 Jahre. Es wurden keine Probanden aus dem Vertriebsbereich rekrutiert, obwohl die Anwendung für diesen Bereich gestaltet worden war. Dies war eine bewusste Entscheidung, da die Vertriebsanwendung nur exemplarisch gewählt wurde. Dabei sollte vermieden werden, dass das Vorwissen der Vertriebsmitarbeiter die Ergebnisse beeinflusst. 6. Fazit und Ausblick Zusammengefasst gibt die durchgeführte Studie Hinweise darauf, dass sich die spielmäßige Gestaltung positiv auf die wahrgenommene Attraktivität und die Arbeit der Nutzer auswirken kann und die Ergebnisse von den Eigenschaften der Nutzer abhängen können. Hier wäre ein Ansatzpunkt für weiterführende Studien, die Aussagen bezüglich der statistischen Signifikanz der Ergebnisse zulassen. Zudem könnten Feldtests zeigen, ob sich Ergebnisse auf den realen Nutzungskontext übertragen lassen. In Zeiten, in denen sich traditionelle Arbeitsstrukturen auflösen und interaktive Systeme zunehmend mehr Aufgaben übernehmen, als die Erstellung von Dokumenten, können Spiele zeigen, wie Bedürfnisse nach Feedback, Struktur, Vergleich, Kooperation oder sozialer Unterstützung angesprochen und erfüllt werden können. Solange die Gestaltung einer Geschäftssoftware ein konsistentes Interaktionskonzept und Regelwerk beibehält, erscheint

es legitim, mit der Erwartungskonformität zu brechen und ihr einen eigenständigen Charakter zu verleihen. Um die Grenze zwischen Spiel und Arbeit durchlässiger zu machen, müsste die Abwertung spielerischer Tätigkeiten überwunden werden. Es ergeben sich vielfältige Ansätze für zukünftige Projekte. Im Bereich der Evaluation und Gestaltung von technischen Systemen stellt sich auch weiterhin die Frage, welchen Einfluss einzelne Systemeigenschaften auf spezifische emotionale Nutzerreaktionen haben. Eine praktische Umsetzung ist davon beeinträchtigt, dass über Bewertungsprozesse in computerisierten Umgebungen derzeit wenig bekannt ist. Es mangelt noch an einer klaren theoretischen Basis, geeigneten Evaluationsmethoden und gesicherten Gestaltungsprinzipien für hedonische Qualität. Emotionale Wirkungen sind schwer vorherzusagen, abhängig von den Eigenschaften des Nutzers und des Kontexts und verändern sich über die Zeit. Es erscheint dennoch möglich und sinnvoll, die Auftretenswahrscheinlichkeit einer Emotion durch eine gezielte Gestaltung zu erhöhen. Neben einfachen Computerspielen könnten die erfolgreichen Online-Rollenspiele viel versprechende Quellen für Gestaltungsideensein sein, da sie mit ihren sozialen Strukturen oder auch Simulationen oft eine Komplexität bieten, die mit Arbeitstätigkeiten vergleichbar ist. Zudem wäre zu untersuchen, wie der spielerische Charakter trotz Arbeitssituation erhalten bleiben kann, inwiefern sich ein messbarer Vorteil ergibt und wann Zweck und Aufwand für die freudvolle Gestaltung angemessen sind. Es fehlt darüber hinaus an Wissen, inwieweit sich hedonische Qualitäten spezifisch auf Wahl, Wertschätzung und Akzeptanz eines Systems auswirken. Um derartige Qualitäten auch in der Entwicklung durchzusetzen, besonders bei größeren Softwareherstellern, wäre es von Vorteil, Studien durchzuführen, die wirtschaftliche Effekte betonen.

169


Literatur 1. Alt, R., Puschmann, T. & Österle, H.

13. Hassenzahl, M., Burmester, M. & Koller,

23. Schiffler. S. (2010). Darf, kann oder muss

F. (2003). AttrakDiff: Ein Fragebogen zur

Geschäftssoftware Spaß machen? Über

(2005). Erfolgsfaktoren im Customer

Messung wahrgenommener hedonischer und

die Integration von Joy of Use Aspekten in

Relationship Management. Zeitschrift für

pragmatischer Qualität. In J. Ziegler & G.

CRM-Anwendungen und Computerspiele

Betriebswirtschaft, 75 (2), 185-208.

Szwillus (Hrsg.), Mensch & Computer 2003 (S.

als Gestaltungsvorbilder. Unveröffentlichte

187-196). Stuttgart, Leipzig: B.G. Teubner.

Diplomarbeit. Leuphana Universität

2. DIN EN ISO 9241-11 (1999). Ergonomie der Mensch-System-Interaktion. Teil 11: Anforderungen an die Gebrauchstauglichkeit. Genf: ISO. 3. Fritz, J. (1997). Macht, Herrschaft und

14. Hassenzahl, M., Burmester, M. & Sandweg,

24. Schwetz, W. (2008). Marktübersicht Kunden-

source of hedonic quality. Interfaces, 42, 11.

Management-Software. CRM-Auswahltipps

15. Hassenzahl, M. & Hofvenschiöld, E.

Kontrolle im Computerspiel. In J. Fritz & W.

(2003). If it doesn’t feel right, who cares

Fehr

if it works? Muss Software mehr als nur

4. (Hrsg.), Handbuch Medien: Computerspiele

gebrauchstauglich sein? In M. Peissner &

(S. 183-196). Bonn: Bundeszentrale für

K. Röse (Hrsg.), Usability Professionals 2003

Polische Bildung.

(S. 135-138). Stuttgart: German Chapter der

5. Graf, C. Niebuhr, S. & Kohler, K. (2006). Enhancing Business Software through Fun-

Usability Professionals‘ Association. 16. Hatscher, M. (2001). Joy of Use –

of-Use: A Pattern-based Approach. Retrieved

Determinanten der Freude bei der Software-

December 06, 2010, from http://www.fun-

Nutzung. In H. Oberquelle, R. Oppermann

ofuse.org/papers/3408_GrafNiebuhrKohler_

& J. Krause (Hrsg.), Mensch und Computer

FunOfUse_Final.pdf 6. Harbich, S., Hassenzahl, M. & Kinzel, K.

2001(S. 343-352). Stuttgart: B. G. Teubner. 17. Kerkow, D. & Graf, C. (2007). KREA-FUN:

(2007). e4 - Ein neuer Ansatz zur Messung

Systematic Creativity for Enjoyable Software

der Qualität interaktiver Produkte für den

Applications. Retrieved December 06, 2010,

Arbeitskontext. In T. Gross (Hrsg.), Mensch

from http://www.fun-ofuse.org/interact2007/

& Computer 2007. Interaktion im Plural (S. 39-48). München, Wien: Oldenbourg.

papers/KreaFun.pdf 18. Klöckner, K., Schmitt, H., Klein, R. & Garst,

7. Harbich, S. & Hassenzahl, M. (2008). Beyond

M. (2009). Schlussbericht – (F)un of (U)se

Task Completion in the Workplace: Execute,

für Geschäftsa(n)wendungen. Zugriff am

8. Engage, Evolve, Expand. In C. Peter & R. Beale (eds.), Affect and Emotion in HumanComputer Interaction (pp. 154-162). Berlin, Heidelberg: Springer. 9. Hassenzahl, M. (2003a). Spielend arbeiten? Computerspiele und ‘ernsthafte’ Software. Zugriff am 06.12.2010. Von http://www. playability.de/1/hassenzahl_p.html 10. Hassenzahl, M. (2003b). Attraktive Software - Was Gestalter von Computerspielen lernen können. In J. Machate & M. Burmester (Hrsg.), User Interface Tuning. 11. Hassenzahl, M. (2005). Interaktive Produkte

06.12.2010. Von www.a3systems.com/repo /5409_FUNSchlussbericht.pdf 19. Kohler, K. (2006). Ungenutztes Potenzial: Die Bedeutung positiver Emotionen für Geschäftsanwendungen. Zugriff am 06.12.2010. Von http://www.fun-of-use.org/ publications.html 20. Laugwitz, B.; Held, T. & Schrepp, M. (2008). Construction and evaluation of a user experience questionnaire. In: Holzinger, A. (Ed.): USAB 2008, LNCS 5298, pp. 63-76. 21. Malone, T. W. (1982). Heuristics for Designing Enjoyable User Interfaces: Lessons from

wahrnehmen, erleben, bewerten und

Computer Games. Proceedings of the

gestalten. In M. Eibl, H. Reiterer, P. F. Stephan

Conference on Human Factors in Computing

& F. Thissen (Hrsg.), Knowledge Media

Systems (SIGCHI 82) (pp.63-68). New York:

Design – Grundlagen und Perspektiven einer neuen Gestaltungsdisziplin (S. 151-171). München: Oldenbourg. 12. Hassenzahl, M., Beu, A. & Burmester, M. (2001). Engineering Joy. Retrieved December 06, 2010, from www.marc-hassenzahl.de/ pdfs/Engineering_Joy.pdf

170

Lüneburg.

N. (2000). Perceived novelty of functions – a

ACM Press. 22. Müller, M. (2009). Kunden-Management Zehn Tipps für die CRM-Implementierung. Zugriff am 06.12.2010. Von http://www. computerwoche.de/mittelstand/1887842/

für mittelständische Unternehmen. Zugriff am 06.12.2010. Von http://www.computerwoche. de/mittelstand/1868145/index3.html 25. Robinett, W. (2003). Foreword. In M. J. P. Wolf & B. Perron (eds.), The Video Game Theory Reader (pp. vii-xix), London:. 26. Vorderer, P. (2005). Fünf Fragen an ... - Ernste Spiele, Zugriff am 06.12.2010. Von http:// www.bpb.de/themen/8GJ1M3.htm


Methoden

171


„Don’t make me think aloud!“ – Lautes Denken mit Eye Tracking auf dem Prüfstand Was wir von der Methode des retrospektiven Lauten Denkens lernen können Yong-Min Markus Jo Immobilien Scout GmbH Andreasstraße 10, 10243 Berlin markus.jo@immobilienscout24.de

Anke Stautmeister Immobilien Scout GmbH Andreasstraße 10, 10243 Berlin anke.stautmeister@immobilienscout24.de

Abstract Das Laute Denken während der Aufgabendurchführung in Usability-Tests (Concurrent Think Aloud, kurz: CTA) ist reaktiv. Die Erfassung des natürlichen Nutzerverhaltens ist nicht möglich. Nachgelagertes Lautes Denken (Retrospective Think Aloud, kurz: RTA) hingegen sollte den gleichen Erkenntnisgewinn bei geringerer Beeinflussung hervorrufen. 40 Probanden absolvierten in vorliegender Studie dieselbe Such-Aufgabe auf einem Immobilienportal, die eine Hälfte mit CTA, die andere mit RTA. Die Ergebnisse wurden mittels acht Hypothesen verglichen. Beim CTA verlängert sich die Aufgabendurchführung signifikant, die Anzahl der Fixationen erhöht sich. Leichte Trends in erwarteter Richtung ergeben sich für die Anzahl betrachteter Bereiche und die Interaktion mit dem Stimulus. Mit CTA werden deutlich mehr pro-aktive Verbesserungsvorschläge geäußert und mehr Usability-Probleme im Bereich „Layout“ identifiziert. RTA gewährleistet eine natürlichere Nutzungssituation, CTA bietet eine tiefergehende Untersuchung (z. B. Generierung neuer Features und Konzepte). Je freier die Usability-Aufgabe gestellt wird, desto stärker ist ein Anstieg an Reaktivität des CTA zu erwarten.

1. Einleitung Das Laute Denken während einer Aufgabendurchführung (Concurrent Think Aloud, kurz: CTA) in Usability-Tests ist eine Standard-Erhebungsmethode, die nur selten hinterfragt wird. Dabei wurde bereits 1977 vor deren Reaktivität gewarnt: Die Anwendung von CTA kann das Verhalten des Probanden in der Testsituation beeinflussen und so die Ergebnisse verzerren (Nisbett & Wilson 1977). Die Praxis zeigt zudem, dass einige Probanden durch den Moderator fortwährend zum Lauten Denken animiert werden müssen, da dies eine ungewöhnliche Aufgabe darstellt. Jeder Animationsversuch wiederum erhöht die Gefahr der Reaktivität des Lauten Denkens (Ericsson & Simon 1984). Erschwerend kommt hinzu, dass aus ökonomischen Gründen Usability-Tests nicht selten parallel sowohl mit CTA als auch mit Blickbewegungsmessung (Eye Tracking) durchgeführt werden. Hier ist

172

die Reaktivität offensichtlich, nämlich die Beeinflussung des Blickverhaltens durch das Laute Denken selbst: Wer kommentiert, schaut dabei wahrscheinlich länger auf Bereiche des Stimulus, denn die Aussprache eines Gedankens dauert länger als der Gedanke selbst. Ein möglicher Lösungsweg für dieses methodologische Problem des CTA, ob mit oder ohne Eye Tracking, ist das nachgelagerte Laute Denken (Retrospective Think Aloud, kurz; RTA): Den Probanden wird direkt im Anschluss an die Aufgabendurchführung ein Video gezeigt, welches die Verhaltensweisen der Person sowie den Stimulus wiedergibt. Bei Web-Usability-Studien kann das z. B. eine Bildschirmaufzeichnung mit der Anzeige der Mausbewegungen und -klicks sein. Der Proband wird also im Nachgang gebeten, laut zu kommentieren, was ihm bei der Aufgabendurchführung durch den Kopf gegangen ist.

Keywords: /// Usability-Test /// Methoden-Evaluation /// Retrospektives Lautes Denken /// Eye Tracking /// Gaze Replay

Weitere Bedenken werden in der Literatur zur Validität der Methode des Lauten Denkens geäußert, die durch Fabrikation zusätzlicher (Gedanken-)Inhalte oder durch Auslassung existierender Inhalte reduziert wird (Ericsson & Simon 1984). Um diesen Fallstricken zu begegnen hat sich der sogenannte Gaze Replay beim RTA als hilfreich erwiesen: Probanden wird zusätzlich zu den Mausbewegungen und -klicks der eigene Blickverlauf angezeigt, der als zusätzliche Gedächtnisstütze (sog. cue) dienen soll. Der Blickverlauf wird dafür während der Aufgabendurchführung mittels Eye Tracking erfasst und danach ebenfalls im Video abgespielt. Dieses Versuchsdesign, RTA mit Gaze Replay, erschien den Autoren bisher eine valide Methode zur Untersuchung objektiver und subjektiver Variablen eines Web-UsabilityTests zu sein. Da der Aufwand für die Vorbereitung einer Studie mit Eye Tracking (z. B. umfangreiches Hardware- und Software-Setup) und RTA (z. B. längere Versuchsdauer pro

156


Usability Professionals 2011 Methoden

Proband im Vergleich zu einem UsabilityTest mit CTA) wesentlich höher ist, stellte sich jedoch die Frage, ob in der Berufspraxis die Vorteile des RTA mit Gaze Replay so deutlich sind, dass der zusätzliche Aufwand in Kauf genommen und der klassische Usability-Test mit CTA abgelöst werden sollte. Ziel dieser Studie ist es daher, den möglichen Mehrwert von RTA durch einen systematischen Vergleich von CTA und RTA über verschiedene Faktoren zu untersuchen. 2. Hypothesen Die Autoren erwarteten Auswirkungen auf die Blickbewegungen der Probanden wie auch Auswirkungen auf das Verhalten der Person in der Testsituation. Im Weiteren wird näher auf die einzelnen Hypothesen und deren Grundlagen eingegangen. 2.1. Blickbewegung (Eye Tracking) Die Blickbewegungsmessung erlaubt die Erhebung von objektiven Verhaltensdaten. Sakkaden („Blicksprünge“) und Fixationen („Blickpunkte“) der Personen werden nach ihrer Lage und Länge erfasst und können anschließend ausgewertet werden. Einige der Auswertungs-Parameter fließen in die folgenden Hypothesen mit ein.

2.1.2. Hypothese 2: „Total Fixation Duration“ Die Gesamtfixationsdauer (Total Fixation Duration) ist unter Anwendung des CTA länger als unter Anwendung des RTA. Begründung: Da Probanden während des CTA laut aussprechen sollen, was ihnen durch den Kopf geht und das Aussprechen eines Gedankens länger dauert als der Gedanke selbst, wird eine längere Gesamtfixationsdauer erwartet; allgemein gesprochen schauen sich Probanden den Stimulus also länger an, während sie erläutern. 2.1.3. Hypothese 3: „Fixationen“ Die Anzahl der erfassten Fixationen („Blickpunkte“) innerhalb des Stimulus ist beim CTA höher als beim RTA. Begründung: Basierend auf der vorherigen Hypothese sollte sich neben der Gesamtfixationsdauer auch die Anzahl der Einzelfixationen aufgrund einer längeren Betrachtung des Stimulus während des CTA erhöhen. Dies hängt mit einer längeren Gesamtbetrachtungsdauer zusammen, in der sich mehr Möglichkeiten für Fixationen ergeben.

diskutierten reaktiv verlängerten Betrachtungsdauer neben den weiteren Fixationen auch mehr Bereiche des Stimulus exploriert werden. Bei der verbalen Erläuterung der Gedanken sollte der Blick also weiter „umherschweifen“. 2.2. Verhalten in der Testsituation Auswirkungen auf das Verhalten einer Person durch CTA, welches sich wiederum auf die Testsituation selbst auswirkt, wird in der Literatur umfassend diskutiert (z. B. Russo, Johnson & Stephens 1989). Im Folgenden werden weitere Hypothesen vorgestellt, welche die Reaktivität des CTA betreffen. 2.2.1. Hypothese 5: „Verweildauer“ Die Verweildauer auf einem Stimulus ist unter Anwendung des CTA länger als unter Anwendung des RTA. Begründung: Da Probanden während des CTA laut aussprechen, was ihnen durch den Kopf geht, und der ausgesprochene Gedanke mehr Zeit benötigt als der Gedanke selbst, wird unter dieser Bedingung eine längere Verweildauer auf dem Stimulus erwartet.

2.1.4. Hypothese 4: „Areas of Interest“

2.2.2. Hypothese 6: „Verhalten“

Der Erfassungsgrad der Blicke eines Probanden in % (Sample Rate) fällt bei Anwendung des CTA niedriger aus als bei Anwendung des RTA.

Die Anzahl unterschiedlicher betrachteter Bereiche (Areas of Interest, kurz: AOI) innerhalb des Stimulus (z. B. einer Webseite) ist unter Anwendung des CTA höher als unter Anwendung des RTA.

Die zu beobachtenden Interaktionen der Probanden mit dem Stimulus unterscheiden sich abhängig von der Anwendung des CTA oder des RTA.

Begründung: Der Proband neigt beim Lauten Denken während einer Aufgabendurchführung (CTA) dazu, mit dem Moderator zu kommunizieren und ihn dabei anzuschauen. Durch das Anschauen des Moderators gelangen die Pupillen der Probanden aus dem Erfassungsraum des Blickbewegungsmessgerätes. Dadurch werden weniger Blickbewegungsdaten aufgezeichnet; die Sample Rate sinkt.

Begründung: Der Stimulus kann je nach Interesse der Untersuchung in verschiedene „Areas of Interest“ (AOI) unterteilt werden. Diese dienen der Blickerfassungssoftware daraufhin als Auswertungsgrundlage für verschiedene Parameter wie die Anzahl der betrachteten AOI durch einen Probanden. Über die Hypothesen „Total Fixation Duration“ und „Fixations“ hinaus ist zu erwarten, dass während der bereits

2.1.1. Hypothese 1: „Sample Rate“

Begründung: CTA beeinflusst das Verhalten der Probanden, da eine zusätzliche, kognitiv aufwendige Aufgabe neben der primären Usability-Test-Aufgabe gestellt wird, nämlich die Verbalisierung der Gedanken (Russo, Johnson & Stephens 1989). Die Hypothese macht keine Aussage über die Richtung der Unterschiedlichkeit.

173


2.2.3. Hypothese 7: „Usability-Probleme“

Gruppe A (CTA): Lautes Denken während der Aufgabendurchführung

Bei der Anwendung von CTA werden mehr Usability-Probleme identifiziert als bei der Anwendung von RTA.

Gruppe B (RTA): Nachgelagertes Lautes Denken während des Vorspielens des Gaze Replays (Video mit Eye Tracking)

Begründung: Da sich die Probanden aus der Gruppe „CTA“ bereits während der Interaktion intensiver mit dem Stimulus auseinandersetzen (z. B. längere Verweildauer, vgl. oben), haben sie somit auch länger die Möglichkeit, auf Usability-Probleme zu stoßen. Zudem argumentierten Russo, Johnson und Stephens (1989), dass das Multi-Tasking von Lautem Denken und Aufgabendurchführung zu einer höheren kognitiven Belastung führt, welche häufigere Bedienungsfehler (UsabilityProbleme) zur Folge hat.

Alle Probanden waren MietwohnungSuchende aus Berlin, die das zu testende Immobilien-Portal www.immobilienscout24. de kannten. Gruppe A (CTA) bestand aus 20 Personen mit einem Altersdurchschnitt von 31 Jahren, davon waren 9 Teilnehmer weiblich und 11 männlich. Gruppe B (RTA) bestand ebenfalls aus 20 Personen, der Altersdurchschnitt betrug hier 33 Jahre, 13 Teilnehmer waren weiblich, 7 männlich.

2.2.4. Hypothese 8 „Verbale Äußerungen“

Gruppe B (RTA) kann als Kontrollgruppe (Silent Condition) für die Bedingung CTA angesehen werden, da sie das „natürlichere Verhalten“ ohne die Beeinflussung durch die Aufforderung zum Lauten Denken darstellt.

Es werden mehr spontane Äußerungen getätigt, wenn CTA angewendet wird.

3.2. Untersuchungsbedingungen

Begründung: Durch das Laute Denken während einer Aufgabendurchführung (CTA) entstehen ggf. weiterführende Gedanken wie z. B. spontane Verbesserungsvorschläge, die ebenfalls ausgesprochen werden. Beim RTA dagegen wird sich der Proband eher an die Prozessdauer der Aufgabendurchführung halten, d.h. beim nachträglichen Vorspielen des Videos wird sich der Proband in den Verbalisierungen seiner Gedanken strikter an den ihm gezeigten Verhaltensweisen orientieren. Dadurch gehen beim RTA spontane Äußerungen verloren, die ggf. geholfen hätten, die Usability-Probleme genauer zu umreißen.

Die Studie wurde innerhalb eines Zeitraums von 3 Wochen im November und Dezember 2010 durchgeführt. In einem separaten Raum des Bürogebäudes der Firma Immobilien Scout GmbH in Berlin wurde ein Dell-Notebook (Latitude E6400) und der Eye Tracker T120 der Firma Tobii Technology installiert. Mit der zugehörigen Aufnahme- und Auswertungssoftware Tobii Studio 2.1 konnten die Probanden und ihr Verhalten in Form von Mausklicks, Mausbewegungen, Blicken und Kommentaren aufgezeichnet werden. Testobjekt war die Webseite www.immobilienscout24.de. „Areas of Interest“ wurden nach gängigen Webseiten-Elementen wie z. B. Logo, Navigation, Menü, Suchfeld usw. definiert.

3. Methode 3.1. Studiendesign

3.3. Durchführung

Um die Auswirkungen von CTA und RTA vergleichen zu können wurden zwei Versuchsgruppen erstellt:

Alle Probanden aus beiden Versuchsgruppen wurden gebeten, nach einer Wohnung zur Miete zu suchen, und zwar in einem von ihnen selbst ausgewählten Stadtteil mit Angabe der monatlichen

174

Netto-Kaltmiete, der Wohnfläche sowie der Anzahl der Zimmer. Neu für alle Probanden war der Sucheinstieg auf der Startseite von ImmobilienScout24, der erstmalig eine Suchmaske darbot, in die alle oben genannten Kriterien sofort eingegeben werden konnten, woraufhin nach Klick auf den Suchen-Button die Treffer direkt erscheinen (bis dato verlief die Eingabe der Suchkriterien über mehrere Seiten). Im Vorfeld wurden alle Probanden über die Video-Aufnahme sowie über die Aufzeichnung der Blickbewegung aufgeklärt. Folgende Instruktion erhielten alle Probanden aus der Gruppe A (CTA) vor Beginn der Suche: „Bitte äußern Sie alles, was Ihnen durch den Kopf geht, selbst wenn es Ihnen abwegig erscheint. Uns hilft es, wenn Sie viel erzählen.“ Da bekannt ist, dass nicht alle Probanden durchgehend das Laute Denken berücksichtigen, wurde nach jeweils 5 Sekunden des Schweigens jeder Proband mit folgender Frage zum Lauten Denken animiert: „Was geht Ihnen gerade durch den Kopf?“ Hingegen wurde keiner der Probanden aus Gruppe B (RTA) gebeten, während der Aufgabendurchführung laut zu denken. Direkt im Anschluss wurde ihnen das Video (Screen Recording ohne Ton- und Portrait-Aufnahme des Probanden, dafür mit Mausbewegungen und -klicks sowie Blickbewegungen) gezeigt und die Probanden wurden folgendermaßen instruiert: „Bitte äußern Sie alles, was Ihnen vorhin durch den Kopf gegangen ist, selbst wenn es Ihnen abwegig erscheint. Uns hilft es, wenn Sie viel erzählen.“ Ein Pretest und die Erfahrung mit vorausgegangenen RTA-Studien hatte dabei gezeigt, dass es sinnvoll ist, vor Abspielen des Gaze Replays eine kurze Erläuterung über den sichtbaren Blickpunkt (= Fixation) zu liefern, der größer wird, je länger man eine Stelle betrachtet, und dass die schnelle, sprunghafte Bewegung der Augen ein normales Blickverhalten darstellt. Damit die Probanden genügend Zeit für das retrospektive Laute Denken hatten, wurde die Abspielgeschwindigkeit des Gaze Replays um die Hälfte reduziert,


Usability Professionals 2011 Methoden

H1 „Sample Rate“ H2 „Total Fixation Duration“ (innerhalb der ersten 45 Sek.) H3 „Fixations“ (innerhalb der ersten 45 Sek.) H4 „Areas of Interest“ (max. Anzahl: 10)

Mittelwert Gruppe A (CTA) N=20 77,85 % (Range von 21 bis 92 %) 26,12 Sek.* (Range von 5,23 bis 39,86 Sek.)

Mittelwert Gruppe B (RTA) N=20 79,85 % (Range von 42 bis 96 %) 20,02 Sek.* (Range von 2,89 bis 38,64 Sek.)

62,65 * (Range von 9 bis 117) 2,85 AOI (Range von 1 bis 5)

46,45 * (Range von 2 bis 89) 2,35 AOI (Range von 1 bis 4)

Tab. 1. Ergebnisse der Eye-Tracking-Daten getrennt nach Versuchsbedingungen *signifikant auf dem 5%-Niveau

H5 „Verweildauer“ (auf der Startseite, Mittelwert) H6 „Verhalten“ (alternativer Sucheinstieg gewählt) H7 „Usability-Probleme“ (inkl. Dopplungen) H7 „Usability-Probleme“ (ohne Dopplungen) H8 „Äußerungen“ (Anzahl pro-aktiver Verbesserungsvorschläge, inkl. Dopplungen) H8 „Äußerungen“ (Anzahl pro-aktiver Verbesserungsvorschläge, ohne Dopplungen)

Gruppe A (CTA) N=20 42,63 Sek.* (Range von 5,23 bis 82,57 Sek.) 3

Gruppe B (RTA) N=20 27,08 Sek.* (Range von 3,73 bis 39,1 Sek.) 6

41 24

48 20

13

1

11

1

Tab. 2. Ergebnisse der Reaktivität getrennt nach Versuchsbedingungen *signifikant auf dem 5%-Niveau

4. Ergebnisse

Aufnahme) nicht laut denken. [Tab. 1] In der Tat haben 3 Personen aus Gruppe A (CTA) sich während der Durchführung dem Moderator zugewandt und ihm spontan Verbesserungsvorschläge vorgetragen oder Fragen gestellt, wozu sie nicht aufgefordert wurden. In dieser Zeit konnte der Eye Tracker keine Blickbewegung aufzeichnen, so dass die Sample Rate sank. Der Unterschied ist statistisch nicht signifikant.

Hypothese 1 besagte, dass der Erfassungsgrad (Sample Rate) der Blickbewegungen in Prozent bei Anwendung des CTA niedriger ausfällt als bei Anwendung des RTA. Die Auswertung zeigt einen leichten Trend zu einer höheren Sample Rate, wenn Probanden während der Aufgabendurchführung (und damit der Eye Tracking-

Hypothese 4 (Probanden betrachten beim CTA mehr Bereiche (Areas of Interest)), kann anhand der hier vorliegenden Studie auch nicht eindeutig bestätigt werden, es lässt sich ebenfalls nur ein leichter Trend verzeichnen. Tatsächlich zeigen auch die Gaze Plots (Visualisierung aller Blickpunkte und Blicksprünge) aller Probanden

damit sie bei den Verbalisierungen nicht unter Zeitdruck gerieten. Wie in Gruppe A (CTA) wurden auch die Probanden der Gruppe B (RTA) nach 5 Sekunden Schweigen zum Lauten Denken aufgefordert: „Was ist Ihnen hier durch den Kopf gegangen?“

aus Gruppe A (CTA), dass ihre Blicke nicht wie von den Autoren erwartet weit umherschweiften; diese konzentrierten sich vielmehr wie bei Gruppe B (RTA) auf den aufgabenrelevanten Bereich, d.h. der Suchmaske auf der Startseite. Der gefundene Unterschied muss als „zufällig entstanden“ betrachtet werden. Eine statistisch bedeutsame Bestätigung konnte hingegen für die Hypothesen 2 und 3 gefunden werden: Probanden aus Gruppe A (CTA) haben innerhalb der ersten 45 Sekunden (= relevante Betrachtungszeit) deutlich mehr Fixationen produziert und ihre Gesamtfixationsdauer war wesentlich länger (p= .05). Bis hierhin lässt sich feststellen, dass die Anwendung von CTA die Gesamtfixationsdauer und die Anzahl der Fixationen beeinflusst. Die Sample Rate und die Anzahl der betrachteten Bereiche (AOI) scheinen davon nicht betroffen zu sein. Die letzen vier Hypothesen befassten sich mit dem Verhalten der Probanden in der Testsituation. Hypothese 5 besagte, dass sich die Aufgabendurchführung unter Anwendung des CTA verlängern würde. Aus Tabelle 2 wird ersichtlich, dass die Probanden beim CTA im Durchschnitt signifikant länger auf der Startseite verweilten (p= .05). Dies ist vermutlich den Verbalisierungen ihrer Handlungen, Gedanken und Eindrücke zuzuschreiben (Lautes Denken), die Zeit kosten. Hinzu kommt, dass 7 von 20 Probanden das Laute Denken während der Aufgabendurchführung z. T. sehr schwer fiel (im Gegensatz zu 4 von 20 Probanden in der Gruppe B (RTA)): Sie mussten während der Aufgabendurchführung bis zu 5 Mal vom Moderator zum Lauten Denken animiert werden („Was geht Ihnen gerade durch den Kopf?“), wobei die Probanden ihre Handlungen dann verlangsamt fortführten oder kurzzeitig stoppten, um etwas zu verbalisieren. Im Durchschnitt musste in beiden Gruppen jeder Proband einmal zum Lauten Denken aufgefordert werden. [Tab. 2] Hypothese 6 behauptete, dass sich die Interaktion mit der Webseite zwischen

175


den Gruppen unterscheidet. In Gruppe A (CTA) wählten Probanden seltener einen alternativen Sucheinstieg, der sich als Link unterhalb der Suchmaske anbot: Nur 3 in Gruppe A (CTA) wählten diesen Link, während doppelt so viele aus Gruppe B (RTA) diesen Link klickten und sie somit auf die alten Suchprozessseiten führte. Dieses Ergebnis unterstützt das Phänomen der Reaktivität (Russo, Johnson & Stephens 1989), wonach CTA das Verhalten der Probanden beeinflussen kann. Russo, Johnson und Stephens (1989) argumentierten auch, das Multi-Tasking von Lautem Denken und Aufgabendurchführung führe zu einer höheren kognitiven Belastung, die letztendlich zu häufigeren Bedienungs- und somit Usability-Fehlern führt. In der vorliegenden Studie wurden jedoch im RTA-Modus mehr Probleme gezählt. Dies gilt jedoch nur, wenn doppelt erfasste Probleme (über mehrere Probanden) berücksichtigt werden. Die Richtung ändert sich, wenn diese Doppelungen ignoriert werden. Hypothese 7 kann damit aufgrund fehlender Signifikanz nicht bestätigt werden und es kann auch kein genereller Trend in eine Richtung erkannt werden, da dieser je nach Auswertungsmodus umschlägt. In Anlehnung an vergleichbare Studien (z. B. van den Haak 2003) wurden die identifizierten Usability-Probleme in einem nächsten Schritt klassifiziert. [Tab. 3] Die Klassifizierung der aufgetretenen Usability-Probleme zeigt vor allem den Zusammenhang zwischen einer längeren und intensiveren Betrachtung von

relevanten Bereichen des Stimulus bei Anwendung des CTA (s. Ergebnisse zum Blickverhalten) und der Auffindbarkeit von Elementen: Die Probanden in Gruppe B (RTA) hatten häufiger das Problem, dass sie bestimmte Elemente auf der Webseite nicht finden konnten. 8 von 20 Probanden hatten mindestens ein Problem in der Kategorie „Layout“, insgesamt wurden dazu 12 Probleme festgestellt (vgl. Tabelle 3). Die letzte Hypothese lautete zugunsten des CTA: Es werden mehr spontane Vorschläge unter Anwendung des CTA geäußert. Während von allen 20 Probanden aus Gruppe B (RTA) nur eine einzige Person während des Gaze Replays einen Verbesserungsvorschlag äußerte („Es wäre zu überlegen, nach Warmmiete zu suchen, das wäre wesentlich einfacher, von der Suche her auch…“), so entstanden in der Gruppe A (CTA) 13 verschiedenste Verbesserungsideen (davon 11 ohne Doppelungen, vgl. Tabelle 2), die während der Aufgabendurchführung an den entsprechenden Stellen des Suchprozesses geäußert wurden. Diese reichten von einer neuen Sortierungsmöglichkeit der Suchergebnisse nach „Neueste Angebote zuerst“ über „Darstellung der Suchergebnisse auf einer Karte“ bis hin zum „Suchkriterium Warmmiete“. 5. Diskussion Signifikante Ergebnisse wurden für 3 von 8 Hypothesen gefunden: Bei Anwendung von CTA verlängert sich die Verweildauer und die Gesamtbetrachtungsdauer des

Stimulus. Außerdem erhöht sich die Anzahl der erfassten Fixationen auf dem Stimulus. Das spricht dafür, dass die Methode des parallelen Lauten Denkens reaktiv ist, d. h. sich auf die genannten Parameter auswirkt. Aus diesem Grunde sollten Eye TrackingDaten nur dann ausgewertet werden, wenn während der Aufgabendurchführung nicht laut gedacht wurde. Gerade bei der Feinanalyse (z. B.: „Wie viele Fixationen werden benötigt, bis der relevante Callto-Action-Button gefunden und geklickt wird?“) wären die mit Lautem Denken entstandenen Eye Tracking-Daten weder reliabel noch valide. Die Sample Rate und die Anzahl der betrachteten Stimulus-Bereiche scheinen von der Reaktivität nicht beeinflusst zu sein. Ebenfalls nicht bedeutsam betroffen scheint die Interaktion mit dem Stimulus zu sein. Hier bleibt die ursprüngliche Aussagekraft der Daten auch unter Verwendung des parallelen Lauten Denkens erhalten. Ebenso verhält es sich bei der Anzahl der identifizierten Probleme. Durch die Differenzierung dieser Probleme zeigt sich der Zusammenhang zwischen Anwendung des RTA und Problemen mit der Auffindbarkeit bestimmter Elemente, da hierbei besonders viele Layout-Probleme aufgedeckt werden. Dagegen wurden während des CTA deutlich mehr pro-aktive Verbesserungsvorschläge geäußert. Aus spontan vorgetragenen Verbesserungsvorschlägen lassen sich Schlüsse über das mentale Modell der Nutzer, fehlende Begeisterungs-Features, „missing links“ u. Ä. ziehen. Auch können sie helfen,

Gruppe A (CTA) N=20

Gruppe B (RTA) N=20

Terminologie (Begriffe auf der Webseite wurden nicht verstanden)

9

5

Dateneingabe (Probleme z. B. bei der Eingabe von Suchkriterien)

8

13

Feedback (nicht ausreichend oder erwartungskonform)

6

3

Navigation (Probleme z. B. mit dem Navigieren auf dem Immobilien-Portal)

3

4

Layout (gesuchte Elemente werden nicht gefunden)

1

12

Tab. 3. Klassifizierung der aufgetretenen UsabilityProbleme

176


Usability Professionals 2011 Methoden

grundlegende Nutzungsprobleme genauer zu identifizieren.

3. Nisbett, R. E. & Wilson, T. D. (1977). Telling more than we can know: Verbal reports on mental processes. Psychological Review, 84,

Durch Anwendung des CTA wird der Nutzer jedoch in eine unnatürlichere Nutzungssituation gebracht. Obwohl RTA mit Blickbewegungsmessung als Gedächtnisstütze und zur Aufmerksamkeitsmessung einen höheren technischen und zeitlichen Aufwand verursacht, ist dieser berechtigt, wenn ein natürlicheres Nutzerverhalten von Bedeutung ist.

231-259. 4. Russo, J. E., Johnson, E. J. & Stephens, D. L. (1989). The validity of verbal protocols. Memory & Cognition, 17 (6), 759-769. 5. Hyrskykari, A., Ovaska, S., Majaranta, P., Räihä, K.-J. & Lehtinen, M. (2008). Gaze Path Stimulation in Retrospective Think-Aloud. Journal of Eye Movement Research, 2 (4), 1-18. 6. Van den Haak, M. J., De Jong, M. D. T. &

Die vorliegende Studie zeigt, dass Probanden bei Anwendung des CTA weniger Probleme bei der Aufgabenbewältigung hatten, da sie mehr Zeit für das Explorieren und Auffinden von relevanten Elementen hatten. Hingegen können unter Verwendung des CTA wertvolle Hinweise von den Nutzern generiert werden. Es kann daraus geschlossen werden, dass RTA die natürlichere Nutzungssituation abbildet, CTA aber die „gründlichere StimulusUntersuchung“ darstellt. Welche Methode vorteilhafter ist, hängt demnach davon ab, mit welchem Ziel eine Untersuchung durchgeführt wird (klassische Evaluation eines interaktiven Systems oder Generierung von neuen Features und Konzepten). Wenn dies feststeht, kann zwischen der Anwendung von RTA und CTA entschieden werden.

Schellens, P. J. (2003). Retrospective vs. Concurrent think-aloud protocols: Testing the usability of an online library catalogue. Behaviour & Information Technology, 22 (5), 339-351.

Die Reaktivität der CTA-Methode sollte weiter ansteigen, je freier eine Aufgabe im Usability-Test gestellt wird. Wenn Probanden z. B. gebeten werden, eine ihnen vollkommen neue Webseite zu explorieren und dorthin zu navigieren, wo sie möchten, so ist es wahrscheinlich, dass die Probanden mit CTA mehr Bereiche explorieren als diejenigen ohne. Diese Überprüfung wäre der nächste Schritt, um den genaueren Einfluss von CTA – auch auf das Blickverhalten bezogen – weiter zu erforschen. Literatur 1. Ericsson, K. A. & Simon, H. A. (1984). Protocol analysis: Verbal reports as data. Cambridge, MA: MIT Press. 2. Nielsen, J. & Pernice, K. (2010). Eyetracking Web Usability. Amsterdam: Addison-Wesley Longman.

177


138

Ich sehe, was Du fühlst Erfahrungsbericht zum Emotion-Tracking in der UX Evaluation

Kathrin Kim User Interface Design GmbH Claudius-Keller Straße 3c 81669 München kathrin.kim@uid.com www.uid.com

Simon Eisele Hochschule der Medien Studiengang Informationsdesign Wolframstraße 32 70191 Stuttgart eisele@hdm-stuttgart.de www.hdm-stuttgart.de

Abstract Nachdem Eye Tracking-Technologien mittlerweile in der Usability-Evaluation etabliert sind, verspricht die Aufzeichnung und Analyse von Emotionen einen neuen Durchbruch für den auf physiologischen Daten basierenden User Research. Dabei zeichnen Kamerasysteme spontane mimische Reaktionen auf, die sich während eines User-ExperienceTests im Gesicht eines Nutzers widerspiegeln. Eine Analysesoftware erkennt die den jeweiligen Mimiken zugrundeliegenden Emotionen und macht sie so für eine Auswertung zugänglich. Die Methode soll einen quantitativen Zugang zur User Experience ermöglichen und konkrete Nutzungssituationen hinsichtlich ihrer Bedeutung für das Nutzungserleben bewertbar machen. Dieser Beitrag schildert aus Sicht der Berufspraxis die Erfahrungen mit einem System zum Emotion-Tracking und zieht eine erste Bilanz über die praktische Verwendbarkeit sowie über das Aufwand-Nutzen-Verhältnis.

1. Einleitung Die Absicherung einer nutzerzentrierten Gestaltung von interaktiven Systemen ist eine der Grundaufgaben von Usability und User Experience (UX) Professionals (German UPA, 2011). Während die Evaluation der Usability Auskunft über das Ausmaß der effektiven, effizienten und zufriedenstellenden Zielerreichung mit dem System gibt (DIN EN ISO 9241-11, 1999), ist der Begriff der UX deutlich weiter gefasst. Laut der DIN EN ISO 9241-210 (2010) umfasst die UX alle Effekte, die ein interaktives Produkt sowohl bereits vor (antizipierte Nutzung), als auch während beziehungsweise nach der Nutzung (Identifikation mit dem Produkt oder Distanzierung) auf den Nutzer hat. Abbildung 1 stellt den Zusammenhang grafisch dar. [Abb. 1]

Ganzes herrührt (Hassenzahl, 2011). Nutzer erfahren mit interaktiven Systemen also Nutzungserlebnisse, die bedeutungsvoll in einem Gesamtkontext eingebettet sind. Sie rezipieren die Systeminteraktion nicht passiv, sondern gestalten und erleben diese aktiv. Bei der Bewertung von UX sind Gefühlsäußerungen also von zentraler Bedeutung. „Den direktesten Zugang zur User Experience bieten daher weniger Nutzungshandlungen, als vielmehr verbale wie non-verbale Reaktionen während des Nutzungserlebnisses. Hier sind vor allen emotive Reaktionen zu nennen, also nicht unbedingt Emotionen im Sinne einer tieferen Gefühlslage, sondern sakkadische emotionale Äußerungen in Bezug auf ein

Begrifflich lässt sich UX am treffendsten mit „Nutzungserlebnis“ übersetzen (vgl. Hassenzahl, 2011; Brau, 2011). Aus psychologischer Sicht ist ein Erlebnis etwas, das aus der Integration von Wahrnehmungen, Handlungen, Motivationen und Kognitionen in ein unzertrennbares, bedeutsames Abb. 1. Zusammenhang Usability und UX (Brau, 2011)

178

Kristin Kolbe User Interface Design GmbH Claudius-Keller Straße 3c 81669 München kristin.kolbe@uid.com www.uid.com

Keywords: /// Emotion Tracking /// FaceReader /// UX Evaluation /// Mimik

aktuelles Passieren, beispielsweise verächtliche Laute, ein spontanes Lächeln oder ein ablehnendes Naserümpfen“ (Brau, 2011). Eben jenen emotionalen Reaktionen auf das Nutzungserlebnis auf die Spur zu kommen, sollte also eines der Anliegen der UX Evaluation sein. Bislang überwiegen hierfür qualitative Bewertungsverfahren. Dazu gehören Beobachtungen von Testleitern während der Nutzungssituation sowie Befragungsergebnisse aus Interviews, die zu Berichten über die UX gebündelt werden. Für quantitative Bewertungen stehen derzeit allerdings nur wenige Verfahren zur Verfügung. Etabliert sind lediglich einige


Usability Professionals 2011 Methoden

Fragebogen wie beispielsweise der User Experience Questionnaire (UEQ; Laugwitz, Held & Schrepp, 2008). Fragebogen-Verfahren haben aber die Einschränkung, dass sie nicht unmittelbar, sondern erst nach Abschluss des Erlebnisses durch Introspektion reflektierend eingesetzt werden können. Dies kann mitunter zu starken Verzerrungen der Ergebnisse führen (z. B. Nisbett & Wilson, 1977). Auch die retrospektive Analyse von Videos, bei denen die Testteilnehmer sagen sollen, was sie in einer bestimmten Situation wie stark gefühlt haben, ist damit nicht ausreichend verlässlich. Ein unmittelbares quantitatives Verfahren zur Erhebung von emotiven Reaktionen zur Bewertung der UX wurde nach Kenntnisstand der Autoren bislang nicht publiziert. Für die Bewertung der Usability liegen allerdings bereits etablierte Ansätze vor, die sich der Erfassung physiologischer Prozesse zuwenden. Hierzu zählen beispielsweise die Blickregistrierung (Eye Tracking) oder physiologische Aktivierungsmessungen, welche Hautwiderstand oder Pulsschlag erfassen. Ansätze wie das Eye Tracking messen das Blickverhalten der Testpersonen und protokollieren Blickdauer, Blickwechsel und Wege des Blickverhaltens. Einen fragenden, freundlichen oder verärgerten Blick können diese Systeme aber (noch) nicht erkennen. Ähnlich verhält es sich mit physiologischen Aktivierungsmessungen: Sie können Erregungszustände quantifizieren, allerdings nicht zweifelsfrei qualitativ bezüglich emotionaler Reaktionen einordnen (z. B. Meyer, Schützwohl & Reisenzein, 1993). Ein möglicher Zugang zu deren Erfassung könnten aber die physiologischen Prozesse der Mimik sein, da sich in dieser ein nicht geringer Anteil der emotiven Reaktionen widerspiegelt. 2. Mimikerkennung und -bewertung In Gesichtern zu lesen und die feinen Zwischentöne der menschlichen Mimik zu interpretieren, wird gemeinhin vereinfacht als „Menschenkenntnis“ bezeichnet. Es handelt sich dabei um eine intuitive

menschliche Fähigkeit, welche ein soziales Zusammenleben grundlegend ermöglicht (z. B. Marsh & Morris, 1989). Das Fehlen dieser empathischen Fähigkeit ist einer der Hauptgründe, warum Menschen mit dem sogenannten Asperger-Syndrom ihre eigene Behinderung selber mitunter als „Wrong Planet Syndrome“, bezeichnen (Craig & Baron-Cohen, 1999). Bei dieser Störung innerhalb des Autismusspektrums fehlt bei in der Regel gut ausgeprägter Intelligenz die Begabung, nonverbale und parasprachliche Signale bei anderen Personen intuitiv zu erkennen und selbst auszusenden. Dadurch sind Betroffene nicht selten sozial isoliert und ecken aufgrund daraus entstehender Verhaltensauffälligkeiten häufig an. Auch in dem als gesund geltenden Spektrum gibt es große Unterschiede in der Befähigung zur Mimikerkennung und -bewertung. Doch spätestens seit der US-amerikanischen Serie „Lie To Me“ (Fox Broadcasting Company, 2009) ist bekannt, dass man das „Face Reading“ systematisch erlernen kann. Hier legt ein Dr. Cal Lightman Serienmördern, korrupten Politikern und Attentätern gleich reihenweise das Handwerk. Lebendes Vorbild für den Serienhelden und fachlicher Berater der Produzenten ist Paul Ekman, mittlerweile emeritierter Professor für Psychologie an der Universität von Kalifornien in San Francisco. 3. Facial Action Coding System Auf Ekmans Forschungen basiert das „Facial Action Coding System“ (FACS; Ekman & Friesen, 1978; Ekman, Friesen & Hager, 2002). Das FACS ist ein an der menschlichen Anatomie der Gesichtsmuskulatur ausgerichtetes Kodierverfahren sämtlicher dem menschlichen Gesicht möglichen mimischen Veränderungen. Insgesamt werden 44 einzelne Aktionseinheiten als kleinstmögliche und erkennbare Einzelaktionen der mimischen Muskulatur unterschieden, beispielsweise „Heben der Augenbrauen innen“, „Heben der Augenbrauen außen“, „Zusammenziehen der Augenbrauen“, „Heben des oberen

Augenlides“. Neben der reinen Häufigkeit der Aktionseinheiten und deren Kombinationen können auch Intensität sowie Timing, Dauer und weitere Parameter kodiert werden. Durch das FACS können verschiedene Arten des Lächelns sowie sieben Grundemotionen diagnostiziert werden – auch in Hinsicht auf ihre Echtheit, also ob eine Emotion oder ein Lächeln lediglich vorgetäuscht werden. Studien zeigten, dass FACS sowohl valide (Ekman, 1982a, 1982b) als auch reliable (Ekman, 1988) Ergebnisse hinsichtlich der Einschätzung von Emotionen durch Beobachter liefert. Kritiker halten dem entgegen, dass eine Mimik keinen kausalen Schluss auf das tatsächliche Vorliegen einer bestimmten Emotion ermöglicht. Lediglich spontane emotionale Reaktionen seien diagnostizierbar. Für eine Bewertung von UX wäre dies allerdings vollkommen hinreichend, geht es doch um genau diese spontanen emotionalen Reaktionen auf einen Stimulus und nicht um tiefgreifende und langanhaltende emotionale Zustände. Die systematische Analyse der Mimik auf Basis des FACS hat in Sicherheitstechnologien bereits Eingang gefunden. Kameras sollen öffentliche Einrichtungen überwachen und mit Hilfe von FACS-geschulten Algorithmen Terroristen an ihren Gesichtszügen erkennen – noch bevor sie zum Attentäter werden (Haas, 2009). Aber auch außerhalb von Sicherheits- und Überwachungstechnik existieren Anwendungsfelder in Wirtschaft und Forschung. Für die Aufzeichnung von emotionalen Reaktionen zur Bewertung der UX eines interaktiven Software-Systems existiert mittlerweile mit dem FaceReader 3.0 von Noldus Information Technology (s. Abbildung 2) ein frei erwerbliches Programm zur automatisierten Erkennung der menschlichen Mimik (Noldus, 2011). Das Versprechen ist verlockend: die Software erlaubt laut Angaben des Herstellers die automatische Klassifizierung und Speicherung von Gesichtsausdrücken mit einer Genauigkeit von 89 Prozent. [Abb. 2]

179


Es stellt sich also die Frage, ob der FaceReader tatsächlich einen praxisrelevanten Zugang zur quantitativen Erhebung der UX sein kann. Um sich ein Bild vom Potenzial des FaceReaders für Usability Tests zu machen, nahmen die Stuttgarter Hochschule der Medien (HdM) und die User Interface Design GmbH (UID) einige erste Versuche vor. 4. Der FaceReader 3.0 Der FaceReader klassifiziert Gesichtsausdrücke nach sieben Kategorien. Neben „Neutral“ nutzt der FaceReader folgende sechs Basisemotionen (Noldus, 2011): –– happy –– sad –– angry –– surprised –– scared –– disgusted

erfolgt automatisiert. Der FaceReader passt sich während der Analyse kontinuierlich den Eigenschaften der Person an. Für ein optimales Interpretationsergebnis empfiehlt der Hersteller allerdings die „Individual Calibration“. Dazu muss Videooder Bildmaterial von allen Emotionen/ Gesichtsausdrücken in mehrfacher Form vorhanden sein. Als Kalibrierungsmaterial benötigt man mindestens 100 erfolgreiche Emotion-Trackings. 5. Schritte des Emotion-Trackings Der FaceReader klassifiziert ein Gesicht in drei aufeinanderfolgenden Schritten. Dieser Vorgang dauert wenige Augenblicke und läuft für den Nutzer unbemerkt ab.

Er ist in der Lage, die Mimik von Personen ab drei Jahren zu analysieren. Dies kann mit gespeichertem Video- bzw. Bild-Material, oder live über die Anbindung einer USB- oder IP-Kamera durchgeführt werden. Die analysierten Gesichtsausdrücke werden in Form eines „Expression Intensity Charts“ dargestellt. Zudem erstellt der FaceReader zwei Logfiles dieser Ausgabe. Einen „State Log“ und einen „Detailed Log“. Damit liegen auf die hundertstel Sekunde genaue Daten über den jeweils dominanten Gesichtsausdruck vor. Neben den „Expression Intensity“ (Abb. 3) und „Expression Summary“ (Abb. 4) Charts, kann sich der Benutzer auf Wunsch die Charakterisierung der Gesichtszüge anzeigen lassen. Hier wird das Bildmaterial nach Ethnizität, Geschlecht, Alter und Gesichtsbehaarung (z. B. Vollbart, Schnauzer) der Versuchsperson analysiert. Diese Charakterisierung dient somit auch einer ersten grundsätzlichen Überprüfung der FaceReader-Analyse. [Abb. 3], [Abb. 4] Sollten die Ergebnisse der FaceReaderAnalyse nicht zufriedenstellend sein, so kann eine Kalibrierung vorgenommen werden. Die „Continuous Calibration“

180

Abb. 2. FaceReader 3.0 – Übersicht über den zentralen Screen

Zunächst sucht das Programm mittels eines Algorithmus‘ im geladenen Bildoder Filmmaterial nach einem Gesicht. Auf diese Weise werden die grobe Gesichtsfeld-Begrenzung und die Gesichtsform ermittelt. [Abb. 5] Mit Hilfe des sogenannten Active Appearance Models (AAM) wird das erfasste Eingangsbild nach 55 Schlüsselmerkmalen wie Augenhöhlenlinien, WangenknochenVerläufe, Lippen, Kinn und Augenbrauen abgesucht. Die 55 Referenzpunkte werden in Form eines neuronalen Netzes dargestellt, welches über das Gesicht der abgebildeten Person gelegt wird (Abbildung 6). Dadurch ergeben sich auch Informationen über die Textur des Gesichts. Um Gesichtszüge zu interpretieren, sind Angaben über die Form der Augenbrauen oder das Vorhandensein von Falten essentiell. Erst


Usability Professionals 2011 Methoden

Abb. 3. Expression Intensity Chart – Ausgabe von Ausdrucksstärken der identifizierten Mimiken

Abb. 4. Expression Summary Chart – Prozentuale Häufigkeit identifizierter Mimiken

UX-Evaluatoren. Hierzu wurde ein explorativer Direktvergleich konzipiert (Versuchsaufbau I). Daneben stand die Frage der Validität der automatisierten FACSAnalyse im Zentrum. Trotz der genannten Erschwernis der retrospektiven Emotionsbewertung wurden daher in Versuchsaufbau II explorativ die Analyseergebnisse des FaceReaders mit der Eigenbewertung von Versuchspersonen verglichen. 6.1. Versuchsaufbau I Die HdM nahm im Wintersemester 2010/11 erste systematische Versuche mit dem FaceReader vor. Dazu wurden 30 Studierenden jeweils kurze Werbeclips als Stimuli vorgelegt (vgl. Abbildung 7). Jedoch waren nur fünf der 30 Filmaufnahmen von der Bildqualität gut genug, um mit dem FaceReader Programm ausgewertet zu werden. Diese fünf Aufnahmen ergaben 132 Messzeitpunkte in der „State Log“-Ausgabe. Die Filmaufnahmen wurden zu denselben Messzeitpunkten von einem Experten ebenfalls anhand der sechs Basisemotionen klassifiziert. So lag ein Direktvergleich der FaceReader- und Expertendaten vor. [Abb. 7] 6.2. Versuchsaufbau II

diese Merkmale geben Aufschluss über Art und Intensität mimischer Ausdrücke. [Abb. 6] Die wichtigste Basis zur Klassifizierung der Gesichtsausdrücke ist jedoch eine Datenbank mit 2000 Bildern von verschiedensten Gesichtern. Der FaceReader gleicht das Eingangsbild mit dieser Datenbank ab und wählt das ähnlichste Bild als Referenzbild aus, um die Mimik zu interpretieren.

Am UID-Standort in München wurden im Frühjahr 2011 acht Versuchspersonen jeweils zehn Bildplakate bekannter Filme als Stimuli präsentiert. Darunter waren Filmplakate von Science-FictionProduktionen ebenso wie Komödien und Dramen. Der FaceReader registrierte die Mimik und die Versuchspersonen sollten

ihre eigenen Gefühle ebenfalls einer der sieben Kategorien zuordnen. Die Versuchsteilnehmer waren angehalten möglichst spontan, also innerhalb von maximal 3 Sekunden, eine Emotion auszuwählen. Diese Forderung nach Spontaneität stellte eine nicht zu unterschätzende Herausforderung an die Versuchspersonen dar und machte zunächst einige Eingewöhnungsdurchgänge notwendig, Die Versuchsleiter konnten trotzdem hinreichend Daten sammeln. Diese Annäherungen an eine Untersuchung der Möglichkeiten zur UX-Evaluation mit Hilfe des FaceReaders sind rein explorativer Natur. Für Aussagen, die wissenschaftlichen Gütekriterien genügen, bedarf es wesentlich weitreichender Forschungen. Nichtsdestotrotz können die Erfahrungen und tendenziellen Erkenntnisse einen ersten Eindruck vermitteln. 7. Erkenntnisse der Praxistests 7.1. Handhabung Das System selber ist ohne Erschwernisse effektiv und effizient anwendbar. Auch ohne dass der Nutzer im Detail mit dem FaceReader vertraut ist, kann er mit ihm direkt erste Explorationen mit Bild- oder Videomaterial eines Gesichts vornehmen. Die Voreinstellungen sind ohne weitere Anpassungen grundsätzlich anwendbar. Im weiteren Verlauf ist aber erkennbar, dass unter realen Versuchsbedingungen eine Optimierung sinnvoll ist, um die Analyseergebnisse hinsichtlich der vorliegenden Bedingungen zu verbessern. Wird ein statisches Bild oder eine Videoaufnahme

6. Der FaceReader im Praxistest Um die Leistungsfähigkeit des FaceReaders als Instrument für UX-Evaluationen zu erkunden, ist vor allem die Frage von Interesse, ob ein Software-System wirklich annähernd zu den gleichen Ergebnissen kommt wie erfahrene menschliche Abb. 5. Analysis Visualization I – Identifikation eines Gesichts

Abb. 6. Analysis Visualization II – Anlegen eines neuronalen Netzes aus den Referenzpunkten

181


7.3. Experte versus FaceReader Von den insgesamt 132 Messzeitpunkten der „State Log“-Ausgabe gab es 33 Übereinstimmungen zwischen der Expertenmeinung und dem Urteil des FaceReaders. Damit stimmten beide lediglich in einem Viertel aller Fälle überein. Dabei ist jedoch anzumerken, dass die Übereinstimmungsquote zwischen den Versuchspersonen sehr stark schwankte. Bei einer Analyse stimmten die Schlussfolgerungen von FaceReader und Experten zu nahezu zwei Dritteln überein. In einem anderen Fall gab es nur bei einem von insgesamt 34 Messzeitpunkten eine Deckungsgleichheit der Bewertung. Dementsprechend ließ sich ableiten, dass es an den Gesichtszügen der Person selbst lag, wie gut die Mimikerkennung des FaceReaders funktionierte. Dieser Befund gibt eindeutige Hinweise auf die Notwendigkeit einer Kalibrierung für Versuche unter Echtzeitbedingungen. Abb. 7. Versuchsaufbau I (HdM)

eines Gesichts geladen, so erkennt der FaceReader den Gesichtsausschnitt automatisch – sofern Bild- und Lichtqualität der Aufnahme hinreichend sind. Auch die Ausgabe der Mimik-Interpretation in Form der „Live-Charts“ ist nicht weiter erklärungsbedürftig (vgl. Abbildung 1). Einziger Wermutstropfen ist die nicht vorgesehene Speicherung der Live-Charts. Das Programm speichert lediglich die Log-Files (vgl. Abbildung 8). Möchte man beispielsweise einem Kunden die Live-Interpretationsdaten zeigen, so ist ein Mitschnitt des Desktop-Bildes per Capturing-Video notwendig. [Abb. 8] 7.2. Lichtverhältnisse Der FaceReader ist äußerst anspruchsvoll was die Lichtverhältnisse betrifft. Nach Einsatz zahlreicher Leuchtmittel und Beleuchtungspositionen setzte sich die Erkenntnis durch, dass die beste Bildqualität durch direktes Tageslicht erreicht

182

7.4. Jedes Gesicht hat einen dominanten Ausdruck wird. Daher wurden die Versuche gegenüber von einem Fenster vorgenommen. Dieses Vorgehen verursachte jedoch einige methodische Probleme: Allein die Veränderung des Sonnenstands während des Tagesverlaufs oder das Wetter beeinflussten die Bildqualität und damit die Ergebnisse enorm. Jegliche Wetteränderung war den Studienleitern in der Zeit der Versuche zunehmend ein Greul. Vor allem strahlender Sonnenschein stellte ein Problem dar: Schloss eine Versuchsperson beispielsweise aufgrund der indirekten Blendung die Augen stärker als zuvor, so verfälschte dies die Ergebnisse des FaceReaders in solchem Ausmaß, dass die Resultate unbrauchbar waren.

Die ersten Experimente zeigten bereits dass die spezifischen Gesichtszüge einer Person die Ergebnisse des FaceReaders beeinflussten. In den meisten Fällen war ein bestimmter Grundausdruck dominant – dieser ist den Gesichtszügen augenscheinlich immanent. Der „Typ“ eines Gesichts bestimmte somit maßgeblich mit, wie der FaceReader einen Gesichtsausdruck bewertete. Mehrfach wurde einer neutralen, konzentrierten Betrachtung eines Gegenstandes das Attribut „angry“ zugeordnet. Aber auch „disgusted“ und „happy“ wurden bei einzelnen Personen in neutralen Ausdruckssituationen angezeigt. Der Hersteller kennt diese Problematik und weist in seinen Unterlagen sowie auf der Homepage darauf hin: „Some people look, for example, surprised or sad by nature. You can calibrate FaceReader to correct for these person-specific biases towards a certain emotion.” (Noldus, 2011). Um die Erkennung der Mimik einer einzelnen Person zu verbessern wird daher


Usability Professionals 2011 Methoden

die „Individual Calibration“ empfohlen. Dies bedeutet jedoch, dass die FaceReader-Interpretation durch die Bereitstellung von weiterem Bildmaterial korrigiert werden muss. 7.5. Individual Calibration Um die Interpretationsergebnisse der Mimik zu verbessern, muss der FaceReader mit den entsprechenden Daten versorgt werden. Das System benötigt laut Angaben des Herstellers dazu Bilder mit eindeutigen Ausprägungen aller 6 Emotionen in hinreichender Qualität und Anzahl (mindestens 100 Stück). Ein solches Training des FaceReaders würde also in der Praxis bedeuten, dass Bilder (oder Videos) aller Basisemotionen der Versuchsperson bereits vorliegen müssten. Alternativ könnte während der Kalibrierung ein Stimulus gegeben werden, das alle Emotionen hervorruft. So kann ein natürliches Mimikvideo der Person zustande kommen. Schon aus ethischen Gründen empfiehlt es sich aber nicht, einen Weg einzuschlagen, der willentlich wiederholt starke Empfindungen von Angst, Wut oder Ekel hervorruft. Ein wesentlich wahrscheinlicheres Kalibrierungsszenario wäre, dass die Versuchsperson diese Gefühle mimisch simuliert. Damit wird der FaceReader jedoch auf willentlich dargestellte Emotionen hin geschult. Eine solche Optimierung auf geschauspielerte Gefühlsäußerungen ist methodisch fragwürdig. Zumal ist unklar, ob die Versuchspersonen die Mimiken ihrer eigenen Emotionen naturgetreu vorspielen können. Ob und inwiefern eines dieser Vorgehen grundsätzlich überhaupt effektiv wäre, bedarf weiterer praktischer Untersuchungen. 7.6. Verbalisierung von Emotionen Es zeigte sich ein mimischer Effekt bei der spontanen Verbalisierung eigener

Emotionen während der Echtzeit der Durchführung. Dieser verurteilte den zweiten Versuchsaufbau zum Scheitern. Hatte die Person bei sich eine der sechs Emotionen als zutreffend festgestellt und formulierte diese laut, so spiegelte ihr Gesicht dieses Gefühl deutlich wider. Dieser Emphase-Effekt der Mimik zum Gesagten führte zu einer Verzerrung des Versuchsaufbaus. Vielfach kam es zu einer extremen Deckungsgleichheit zwischen der FaceReader-Anzeige und der Wahl der Versuchsteilnehmer – jedoch erst bei der lauten Äußerung der gewählten Emotion. So wurde das explorative Untersuchungsziel bei diesem Setting nicht zufriedenstellend erfüllt. 7.7. Gefühle versus Mimik Der FaceReader erkennt keine Emotionen, sondern Gesichtsausdrücke, die emotionale Reaktionen auf Stimuli darstellen – seien sie nun echt oder nur gespielt. Auch der Hersteller weist in seinen Unterlagen explizit darauf hin, dass der FaceReader noch nicht dahingehend optimiert wurde, ein echtes Lächeln von einem „social smile“ zu unterscheiden (Noldus, 2011). Weniger relevant als das Spielen von Emotionen ist das Nicht-Zeigen, also das willentliche oder unwillentliche Unterdrücken von emotionalen Reaktionen. Das offene zur Schau Tragen von Emotionen in nicht durch Spontaneität geprägten sozialen Situationen ist nur bedingt kulturell angemessen. In Deutschland lässt sich beispielsweise in professionellen Kontexten ein Verflachen der Emotionalität beobachten (z. B. Thomas, 2003). Ein anschauliches Beispiel, wie sich soziale Erwünschtheit und Höflichkeit auf die Mimik auswirken, ist der Erhalt eines unerfreulichen Geschenks: Im Allgemeinen wird der Beschenkte den gut meinenden Schenkenden nicht erkennen lassen, dass er das Präsent grauenhaft findet. Er wird dazu ein leichtes Lächeln aufsetzen und sich bedanken. Kinder sind hier viel ehrlicher – auch in ihrer Mimik.

Abb. 8. Logfile „State Log“

7.8. Happy Ein Lachen erkannte der FaceReader äußerst zuverlässig. Bei dieser emotionalen Reaktion fanden sich weiterhin hohe Übereinstimmungen mit der Bildanalyse der Experten aus Versuchsaufbau I. Auch die Selbstzuordnungen der Gefühle stimmten mit der FaceReader-Analyse (noch vor der Verbalisierung) in fast allen Fällen überein. Lachen – sofern es echt ist – ist ein positives Gefühl, dass sozial positiv verstärkt wird, wenn der Anlass adäquat ist. Das führt wiederum dazu, dass Personen es potenziell auch offener zeigen mögen als alle anderen Gefühlsregungen. So hat wiederum der FaceReader eine höhere Erkennenswahrscheinlichkeit. 7.9. Quantitative Daten versus qualitative Kategorien Hierin liegt das zentrale Problem des FaceReaders im Zusammenhang mit UX-Untersuchungen: Es handelt sich um

183


ein System, das rein quantitative Daten in Log Files liefert, nicht aber deren Interpretation. Der UX-Experte interessiert sich jedoch für das Wieso, Weshalb und Warum der Ergebnisse. Auch wenn der FaceReader ein 5 Sekunden langes Lachen erkennt, so werden für die Interpretation dieses Lachens eine Reihe weiterer Informationen benötigt. Doch die Kategorisierung der Emotionen täuscht tendenziell darüber hinweg, dass es sich um eine Deskription von Rohdaten handelt, die keine inhaltlichen Auskünfte gibt. Aus dieser Perspektive eröffnen Methoden wie das Eye Tracking weniger die Gefahr, Daten mit Interpretationen zu verwechseln, da sie (egal in welcher Form) zu keinen als qualitativ interpretierbaren Aussagen kommen können: Obwohl beide Methoden lediglich Häufigkeitsverteilungen und Zeitintervalle abbilden, scheint der FaceReader dennoch eindeutig qualitative Urteile („Der Nutzer ist wütend über diese Funktion, sie muss verändert werden“) zu formulieren – obwohl eine solche Fehlinterpretation sicherlich nicht in der Absicht der Hersteller liegt. 8. Fazit Mit dem FaceReader steht eine Technologie des Emotion-Trackings für die Anwendung in der UX-Evaluation zur Verfügung, die nicht nur auf die Autoren eine Faszination ausübte, sondern auch auf alle Versuchspersonen, die mit dem System konfrontiert wurden. Die Anwendung des Systems selber ist definitiv gebrauchstauglich. Solange keine Kalibrationen notwendig sind ist eine effektive, effiziente und zufriedenstellende Nutzung gegeben. Mit seiner strikt quantitativen Auswertung von intuitiv begreifbaren Vorgängen verfügt er auch über eine hohe gefühlte Plausibilität und somit Überzeugungskraft. Es ist daher unbedingt vorstellbar, dass er beziehungsweise Systeme anderer Anbieter von Technologien des Emotion-Trackings eine relevante Position auf dem Markt der physiologischen Methodiken erreichen könnten.

Demgegenüber stehen die Erkenntnisse aus den explorativen Versuchen. Auch wenn diese ersten Ansätze zur Auslotung des Potenzials keinerlei statistische Gültigkeit besitzen, können sie dennoch Hinweise für die Anwendbarkeit in der Berufspraxis liefern. Diese ist derzeit noch nicht uneingeschränkt zu bejahen. Der FaceReader verlangt durch seine Anfälligkeit für die äußeren Bedingungen ein hoch standardisiertes Setting. Sämtliche Rahmenbedingungen müssen kontrolliert werden und alle Testsessions exakt die gleiche Dauer haben, um eine Vergleichbarkeit der Log Files zu ermöglichen. Der Ablauf von UX-Testsituationen sollte allerdings per Definition nicht standardisiert sein. Es geht ja gerade um persönliche Nutzungserlebnisse, die keinem festen Drehbuch folgen können, wenn sie für das Individuum bedeutsam sein sollen.

der anderen Seite ist dies eine Momentaufnahme. Der rasante Fortschritt in der Eye Tracking-Technik der letzten 20 Jahre verdeutlicht, wie viel Potenzial im EmotionTracking noch stecken könnte. Die Autoren werden die Entwicklung der Methodik mit Interesse und eigenen Studien weiterbegleiten und zu gegebenem Zeitpunkt hierzu publizieren. Literatur 1. Brau, H. (2011). Acceptance Engineering – Menschzentrierte Gestaltung von Arbeitssystemen. In: Brandenburg, T. & Thielsch, M. T. (Hrsg.). Praxis der Wirtschaftspsychologie II. Münster: MV Wissenschaft. 2. Craig, J. & Baron-Cohen, S. (1999). Creativity and Imagination in Autism & Asperger Syndrome. Journal of Autism and Developmental Disorders. 29,4, pp. 319-326. 3. DIN EN ISO 9241-11 (1999). Ergonomische Anforderungen für Bürotätigkeiten mit

Wie bereits eingangs beschrieben verheißt eine Messung physiologischer Veränderungen eine objektivere Datenbasis als die Selbstauskunft über Gefühlslagen mittels Fragebögen. Dieses Versprechen kann der FaceReader jedoch (noch) nicht einhalten. Da die Mimik gespielt oder zumindest in dem Maße beherrscht werden kann, dass der FaceReader getäuscht wird, sind auch seine Daten nicht wesentlich zuverlässiger. Um dieser Problematik beizukommen, müsste der FaceReader gerade jene Emotionen erkennen, welche die Versuchspersonen zu verstecken versuchen.

Bildschirmgeräten Teil 11: Anforderungen an die Gebrauchstauglichkeit; Leitsätze. Berlin: Beuth Verlag. 4. DIN EN ISO 9241-210 (2010). Ergonomische Anforderungen der Mensch-SystemInteraktion Teil 210: Prozess zur Gestaltung gebrauchstauglicher Systeme. Berlin: Beuth Verlag. 5. Ekman, P. (1982a). Emotion in the human face. Cambridge: Cambridge University Press. 6. Ekman, P. (1982b). Methods for measuring facial action. In K.R. Scherer & P. Ekman (Eds.), Handbook of methods in nonverbal behavior research. Cambridge and New York: Cambridge University Press.

Der Anspruch an eine hohe Objektivität durch quantitative Daten verliert sich ebenfalls dadurch, dass diese Daten aus den Log Files in hohem Maße interpretationsbedürftig sind. Dies trifft zwar auch für andere physiologische Daten zu, doch das Versprechen des direkten und durch den Beobachter unverfremdeten Blicks auf die UX kann nicht gehalten werden.

7. Ekman, P. (1988). Gesichtsausdruck und Gefühl: 20 Jahre Forschung von Paul Ekman. Hrsg. und übers. von Maria von Salisch. Paderborn: Junfermann. 8. Ekman, P. & Friesen, W. V. (1978). Facial Action Coding System – the Manual. 9. Ekman, P., Friesen, W. V. & Hager (2002). Facial Action Coding System – the Manual. 10. German UPA (2011). The Usability / UX Profession – Berufsfeld Usability. Stuttgart:

Insgesamt scheint der derzeitige Entwicklungsstand noch nicht in dem Maße ausgereift, als dass man den praktischen Einsatz des Systems mit der Selbstverständlichkeit wie bei einem aktuellen Eye Tracking-System empfehlen könnte. Auf

German UPA e.V. 11. Haas, M. (2009). Ein Lügenexperte im Interview: Mir entgeht kein Gesichtsausdruck. Süddeutsche Zeitung. http://www.sueddeutsche.de/wissen/einluegenexperte-im-interview-mir-entgeht-keingesichtsausdruck-1.471158 [27.06.2011].

184


Usability Professionals 2011 Methoden

12. Hassenzahl, M. (2011). Encyclopedia entry on User Experience and Experience Design. Retrieved 26 February 2011 from InteractionDesign.org: http://www.interaction-design. org/encyclopedia/user_experience_and_ experience_design.html 13. Marsh, P. & Morris, D. (1989). Die Horde Mensch. München: Heyne. 14. Meyer, W.-U., Schützwohl, A. & Reisenzein, R. (1993). Einführung in die Emotionspsychologie. Band I. Bern: Hans Huber. 15. Nisbett, Richard, & Wilson, Timothy. (1977). Telling more than we can know: Verbal reports on mental processes. Psychological Review, 84, 231-259. 16. Noldus Information Technology (2011). FaceReader methodology. http://www. noldus.com/documentation/facereadermethodology [27.06.2011]. 17. Roy, M., Dillo, W., Emrich, H. M. & Ohlmeier, M.D.(2009). Das Asperger-Syndrom im Erwachsenenalter. In: Deutsches Ärzteblatt International. Nr. 106(5), S. 59–64. 18. Thomas, A. (2003). Interkulturelle Wahrnehmung, Kommunikation und Kooperation. In A. Thomas, E.-U. Kinast & S. Schroll-Machl (Eds.), Handbuch Interkulturelle Kommunikation und Kooperation: Vol. 1. Grundlagen und Praxisfelder. Göttingen: Vandenhoeck & Ruprecht.

185


115

Weiter – Weiter – Fertig Prozessoptimierung mit Usability-Methoden

Roman Reindler Fiducia IT AG Fiduciastr. 20 76227 Karlsruhe roman.reindler@fiducia.de

Abstract Der Praxisbericht stellt die Vorgehensweise der Fiducia IT AG zur Vereinfachung und Prozessorientierung ihrer Anwendung agree® Bankarbeitsplatz dar. Sowohl die eingesetzten Usability-Engineering-Methoden, als auch die begleitenden organisatorischen Maßnahmen werden betrachtet. Dabei werden die Erfahrungen und Erkenntnisse aus Konzeption, Umsetzung und Einsatz der entworfenen Lösungen aufgezeigt.

1. Einführung Die Fiducia IT AG hatte durch Fusionen bedingt, vier Bankverfahren (Anwendungen zur Unterstützung des Bankgeschäfts) im Einsatz, die alle mehr oder weniger das gleiche leisteten. Diese Verfahren wurden durch ein einziges neues Verfahren „agree®“ abgelöst, welches dann nach mehreren Versionen den Leistungsumfang der abgelösten Verfahren erreicht hatte und mittlerweile auch weit übertrifft. Zentrale Anwendung ist hierbei der „agree Bankarbeitsplatz“, der von allen Mitarbeitern der Bank bedient wird. In den Bankarbeitsplatz wurde ein Workflowmanagement-System «Vorgang» integriert mit dem sich die Banken individuell ihre Prozesse auf Basis von Einzelfunktionen zusammenstellen können. Mit manuellen und systemgestützten Verzweigungen können verschiedene Prozesswege mit einem einzigen Vorgang durchlaufen werden. Durch den sehr großen Leistungsumfang stieg leider auch die Komplexität, denn es wurden alle Features aller Anwendungen aufgenommen, da die Anwender der jeweiligen Verfahren durch eine neue Anwendung nicht auf bisheriges verzichten wollten und konnten. So ist über die Jahre eine mächtige, integrierte Anwendung

186

entstanden, die zwar alles leistete, was die jeweiligen Einzelverfahren konnten. Die Usability war jedoch eingeschränkt. Deshalb war der Ruf aus den Banken laut geworden, dass die Bedienbarkeit der Anwendung verbessert werden soll und auch der Bundesverband der Banken hatte als strategisches Ziel eine kostengünstige Produktion ausgegeben. Die Anwendung «agree Bankarbeitsplatz» musste einfacher und prozessorientierter werden. 2. Umsetzung Zur Umsetzung dieses Ziels wurde ein Projekt zur Vereinfachung gestartet. Ein Team das aus Produktmanagement (PMM/ Auftraggeber) und Anwendungsentwicklung (AEW/Auftragnehmer) bestand, koordinierte das Projekt. Aus diesem Projekt heraus wurde ein Kernteam gebildet, in dem jeweils 2 Personen aus PMM und AEW vertreten waren. Dieses Kernteam definierte eine Vorgehensweise, um die Nutzer noch stärker als bisher in die Anforderungsdefinition und Entwicklung mit einzubeziehen. Folgende Vorgehensweise wurde definiert, deren einzelne Schritte dann näher betrachtet werden.

Keywords: /// Usability-Methoden /// Prozessorientierung /// Vereinfachung /// Organisation

Nutzerzentrierter Prozess –– Bankenworkshop/Fokusgruppe zur Anforderungsermittlung (Requirement-Engineering) –– Dialoglandkarte –– Prototyp –– Zweiter Bankenworkshop zu Überprüfung der Idee Rahmenbedingungen –– Entwurf eines prozessorientierten Navigationskonzepts auf Basis bestehender Einzelfunktionen –– Etablierung eines bereichsübergreifenden Kernteam –– Rahmendokument (Styleguide) –– Technisches Template –– JourFixe (Projekt und Management)

Begonnen wurde mit der Entwicklung einer Idee, wie prozessorientierte Funktionen in der Bankanwendung zum tragen kommen können. Die Ideenentwicklung wurde noch ohne Nutzerbeteiligung durchgeführt. 3. Entwurf eines prozessorientierten Navigationskonzepts Das Center-of-Competence-Usability und UserInterface Design (CoC-UI) entwickelte ein Konzept für eine einfachere, prozessorientierte Bedienung auf Basis der bestehenden Funktionen. Es ging nicht um


Usability Professionals 2011 Methoden

ein komplettes Redesign der Anwendung, sondern darum, bestehende Funktionen zu vereinfachen. Ziel war, häufig vorkommende Geschäftsprozesse der Banken, mit denen sie ihr Geld verdienen (Butter&BrotGeschäft), so zu optimieren, dass die Berater entlastet werden und sich mehr um den Kunden als um die Anwendung kümmern können. Man spricht hier von der Erhöhung der Netto-Marktzeit. In einem ersten Workshop wurden zentrale Funktionen und deren Ist-Zustand betrachtet. Die Funktionen bestehen z.T. aus einer Vielzahl von Reitern und Unterreitern, Seiten und weiterführenden Dialogen. Die Attribute sind dabei in fachlich zusammengehörenden Gruppen angeordnet, was zur Folge hat, dass Pflichtfelder und weniger wichtige Felder in einer Gruppe zusammen dargestellt werden. Die Pflichtfelder sind demzufolge nicht auf einen Blick sichtbar. Die Funktionen sind eher als Objektbrowser zu sehen und für eine abstrakte Aufgabe wie ‹Kundendaten bearbeiten› gebaut. Sie sind nicht soweit aufgabenorientiert, dass man die Felder für z. B. die Aufgabe ‹Kunde zieht um› in einer Funktion dargestellt hat. [Abb. 1] Mit diesem Wissen und dem Wissen um die bestehende Technik wurden zwei Bedienkonzepte entwickelt. Entstanden sind dabei zwei Varianten: –– eine sehr günstige Variante, die aber hinsichtlich der Usability nur kleine Verbesserungen gebracht hätte –– eine aufwändigere Lösung, die zwar teurer und aufwändiger war, die aber wesentliche Verbesserungen in der Usability versprach. Das Projektteam versprach sich viel von den zugesicherten Effekten und entschied sich für die aufwändigere Variante. In einem zweiten Workshop wurde diese Variante verfeinert. Die Lösung lässt sich am Vortragstitel erkennen: Es wurde ein Assistent entwickelt, der sich an gängigen Softwareinstallations-Assistenten orientiert hat. Bei der Softwareinstallation gibt es einen Standardweg, der einfach mit „Weiter“ durchlaufen wird aber auch

Ausnahmen ermöglicht, die dann ggf. Zusatzeingaben erfordern. Mit dem Assistenten werden dem Bediener nur die Felder angeboten, die für den aktuellen Kontext notwendig sind. [Abb. 2] Beispielsweise kann bei der Neuanlage eines Kunden die Aufenthalts-/Arbeitserlaubnis nur dann erfasst werden, wenn es sich um einen Nicht-EU-Bürger handelt. Ein weiterer wesentlicher Aspekt war die Wiederverwendung. Werden gleiche fachliche Inhalte in unterschiedlichen Assistenten verwendet, so werden diese immer gleich dargestellt. Muss also innerhalb eines Beratungsassistenten ein Kunde angelegt werden, so ist der Ablauf in jedem Assistenten gleich. Diese Vorgehensweise wurde dann auf eine bankfachliche Funktion übertragen. Dabei wurde eine relativ aufwändige

Funktion gewählt, damit mögliche Anforderungen an den Assistenten überprüft werden konnte. Nachdem die Tragfähigkeit bewiesen wurde, ging es an die konkrete Umsetzung eines Assistenten, wobei der fachliche Inhalt noch genauer definiert werden musste. Erfahrung: –– Es wurde festgestellt, dass für das Grundkonzept der Assistenten alle Punkte der Norm DIN 9241-110 im Abschnitt 4 (Aufgabenangemessenheit) erfüllt waren. –– Wir glauben, dass der Auftraggeber die Lösung im Nachgang auch deshalb so stark unterstützte, weil er eine Entscheidung zwischen zwei Varianten hatte. –– Die Anwendung des Konzepts auf eine konkrete Funktion führte zu einem runden Konzept

Abb. 1. Maskenauschnitt aus der Personendaten-Pflege

Abb. 2. Grundkonzept der Assistenten

187


4. Nutzerzentrierter Prozess Nachdem das Navigationskonzept erarbeitet war, wurde durch das Kernteam der nachfolgende benutzerzentrierte Prozess entworfen. [Abb. 3] –– Im ersten Workshop wurden die Anforderungen für den Standardprozess erhoben –– Über eine Dialoglandkarte wurde der Prozess mit den jeweiligen Pfaden aufgezeigt –– Die Dialoglandkarte wurde mit einem klickbaren Powerpoint-Prototypen realisiert –– Im zweiten Bank-Workshop wurde dann der Prototyp vorgestellt und diskutiert –– Daran anschließend wurde das Pflichtenheft definiert –– Dieses wurde dann durch ein Projekt realisiert 5. Workshop/Fokusgruppe: Mit dem Konzept lag eine Idee vor, wie die Prozesse vereinfacht dargestellt werden können. Es fehlten aber detaillierte Informationen über die notwendigen Inhalte und Attribute. Damit hier nicht am Anwender vorbei etwas entsteht, wurden Workshops/Fokusgruppen mit Banken durchgeführt. Dabei wurden ganz unterschiedliche Banken berücksichtigt: Sehr große Banken, kleine Banken, Direktbanken und Banken die schon sehr stark prozessorientiert arbeiten.

Abb. 4. Dialoglandkarte für den Assistenten zur Anlage eines Kontokorrentkontos

188

Abb. 3. Vorgehensweise zur Umsetzung eines Assistenten

Eine Fokusgruppe beschäftigte sich mit dem Neukundenprozess, in dem der Kunde, ein Girokonto, eine Bankcard sowie der Online-Zugang für das eBanking erfasst wird. Entlang des vom Bundesverband (BVR) vordefinierten Prozesses wurde dieser an der bestehenden Anwendung nachvollzogen. Die jeweilige Funktion mit ihren alten Masken wurde aufgerufen und es wurde intensiv diskutiert, welche Attribute für den Standardprozess notwendig sind. Es zeigte sich, dass es eine hohe Überdeckung der Anforderungen gab. Jedoch gab es Besonderheiten pro Bank und damit Abweichungen, die entweder für die eine Bank einen unnötigen Schritt oder die

andere Bank zu einer fehlenden Funktionalität geführt hätten, wenn man die jeweiligen Anforderungen nicht berücksichtigt hätte. Gelöst wurde dies durch eine Einstellung, die die Bank für den Prozess vornehmen konnte. Somit können die Banken individuell Prozessschritte einbzw. ausschalten und damit Ihren „BankStandardprozess“ unterstützen. Erfahrung –– Von den Banken wurden deutlich weniger fachliche Inhalte gefordert, als das Produktmanagement vorgedacht hatte –– Trotzdem man den Prozess sorgfältig gewählt hatte, stellte man nach Markteinführung fest, dass der häufigste Neukundenprozess – der für Minderjährige – mit dem Assistenten nicht unterstützt wird. Nach der Kundenanlage wird als Prozessbestandteil ein Formular gedruckt, in welchem die Eltern aufgeführt sein müssen. Die konnten aber in der ersten Version des Assistenten nicht angegeben werden.


Usability Professionals 2011 Methoden

6. Dialoglandkarte Die Dialoglandkarte wurde entwickelt um einen Überblick über den Assistenten zu geben. Auf einem großen Bild werden alle möglichen Schritte des Assistenten abgebildet. Zuerst wurde die Dialoglandkarte mit Platzhaltern erstellt, damit auf hoher Ebene die Schritte und die Verzweigungen sichtbar wurden. Danach werden die Masken im Feindesign entworfen und ersetzen die Platzhalter in der Dialoglandkarte. Wird die Dialoglandkarte auf einem A1-Drucker ausgedruckt, sind alle Masken erkennbar. Der kürzeste Weg durch den Assistenten wurde durch Masken in einem eigenen Rahmen dargestellt. Auch Module, die in mehreren Assistenten verwendet werden, wurden in eigenen farblich abgesetzten Rahmen dargestellt. [Abb. 4] In der blauen Linie ist erkennbar, dass mit zwei Masken ein Konto angelegt werden kann. Wobei durch entsprechende Steuerungen die erste auch noch übersprungen werden kann. Erfahrungen –– Die Dialoglandkarte liefert einen sehr guten Überblick –– Sie macht deutlich, welche Komplexität vom Anwender weggenommen wird. –– Alle Beteiligten reden über dasselbe und haben das gleiche Verständnis –– Die Testfallerstellung und Wartung wird durch die Dialoglandkarte wesentlich vereinfacht, weil der Weg durch den Assistenten nicht über den Programmcode ermittelt werden muss

7. Powerpoint Prototyp Auf Basis der Dialoglandkarte wurde ein Powerpoint-Prototyp erstellt. Eine wesentliche Entscheidung war, dass der Prototyp sehr dem Aussehen der Echtanwendung entsprechen soll. Dies wurde dadurch erreicht, dass die Masken teilweise mit dem Werkzeug für die Oberflächenentwicklung erstellt wurden und mit einem Bildbearbeitungsprogramm nachbearbeitet wurden. Man versprach sich zum einen

Abb. 5. Screen aus dem Powerpoint-Prototyp

eine hohe Akzeptanz der Banken und zum anderen sollten sie sich auf den Inhalt und nicht auf das Aussehen fokussieren. [Abb. 5], [Abb. 6] Mit den jeweiligen Prototypen wurden verschiedene Wege durch den Assistenten simuliert. Es wurde nicht nur der Standardfall, sondern auch gängige Abzweigungen berücksichtigt. Bei Assistenten mit geringem Leistungsumfang konnten alle Ausnahmesituationen berücksichtigt werden. Erfahrungen –– Die Annahme, dass bei starker Orientierung am bestehenden Layout, sich die Anwender auf die Inhalte fokussieren, wurde bestätigt –– Allerdings wurden dadurch hohe Erwartungen an eine schnelle Realisierung gestellt: „ist ja schon fertig“ –– Die Berücksichtigung verschiedener Pfade durch den Assistenten erfordert einen hohen Aufwand und auch

Änderungen sind mit entsprechend hohem Aufwand verbunden –– Dieser hohe Aufwand ist auf alle Fälle gerechtfertigt, denn man kann Look und Feel der Anwendung sehr gut nachvollziehen. –– Im Wesentlichen wurden die Vorschläge für Screens inhaltlich verwendet, auch wenn die Masken, die mit dem Entwicklungswerkzeug erstellt wurden, für die Realisierung nur selten wiederverwendet wurden 8. Zweiter Workshop/Fokusgruppe Nachdem Dialoglandkarte und Powerpoint-Prototyp intern intensiv diskutiert und angepasst wurden, folgte ein zweiter Termin mit den Banken um die Ergebnisse zu diskutieren. Die Vorgehensweise wurde so gewählt, dass zuerst der Standardablauf durch den Assistenten gezeigt wurde und danach die

189


Dabei wurde ein Entwicklungsstand des jeweiligen Assistenten präsentiert und von Vertretern des Produktmanagements, der Entwicklung und Usability abgenommen. Erfahrung –– Das Pflichtenheft konnte sehr schnell erstellt werden, da mit den vorgehenden Workshops und mit Dialoglandkarte und Prototyp die Fachlichkeit schon klar umrissen war. –– Rückfragen aus dem Projekt waren sehr minimal und die Qualität der umgesetzten Assistenten war schon zu Beginn der Testphasen sehr hoch. –– Die Qualität wurde zusätzlich durch ein Review während der Entwicklungsphase (außerhalb der offiziellen Testphasen) unterstützt.

10. Organisatorische Rahmenbedingungen Damit die Assistenten zum Erfolg gelangten, wurden einige Rahmenbedingungen definiert.

Abb. 6. Screen aus der Anwendung

verschiedenen Varianten. Daraus ergaben sich wiederum fachliche Anforderungen, die in einem nochmaligen Anpassen von Dialoglandkarte und Prototyp mündeten. Ein Beispiel hierfür: Einige Banken definieren einen Standardberater bei der Kontoanlage, wohingegen andere Banken diesen Berater selbst definieren wollen. Die Bank kann nun für den Assistenten entscheiden, ob der Anwender den Berater erfassen kann, oder ob ein Berater implizit definiert wird. In der Dialoglandkarte bedeutet das, dass eine weitere Verzweigung aufgenommen wurde. Abhängig von der Bankeinstellung wird eine Maske für den Berater angezeigt oder nicht. Erfahrungen –– Durch den zweiten Workshop hatten die beteiligten Banken die Möglichkeit sich nochmals um ihren Prozess Gedanken zu machen und diesen mit Kollegen abzustimmen

190

–– Die weiteren Anforderungen waren eher gering –– Zitat: „Halten Sie die Assistenten sauber und nehmen Sie nicht jede fachliche Anforderung darin auf. Der Standard ist sehr gut abgedeckt.“ 9. Umsetzung Erst nach dem zweiten Workshop wurde das Pflichtenheft erstellt und bildeten zusammen mit Dialoglandkarte und Prototyp den Projektauftrag. Die Dialoglandkarte musste bei Erweiterungen bzw. Änderungen, die z.T. aufgrund der Technik notwendig waren, angepasst werden. Für den Prototyp wurde definiert, dass die Änderungen aufgrund des hohen Aufwands, nur bei wesentlichen Änderungen durchgeführt werden müssen. Ein wesentliches Element war ein – nicht im Vorgehensmodell definiertes – fachliches Review während der Entwicklungsphase.

11. Kernteam Das Kernteam für die Assistenten wurde bereichsübergreifend (PMM und AEW) besetzt, was zur Folge hatte, dass Entscheidungen von allen Parteien anerkannt waren. Dessen Aufgabe war z. B. die fachlichen Inhalte des Assistenten ‚sauber‘ zu halten. Mehrfach wurde versucht ohne Banken-Workshops weitere Fachlichkeit in die Assistenten aufzunehmen. Sofern dies durch technische oder gesetzliche Rahmenbedingungen nicht notwendig war, wurde dies abgelehnt. Das Kernteam fungiert auch als ‚Ausnahmeregelungsgremium‘, denn nicht alle Besonderheiten aller Assistenten konnten schon zu Beginn definiert werden. Erfahrung –– Die bereichsübergreifende Besetzung sorgte für eine hohe Akzeptanz. Nicht PMM oder AEW entscheidet, sondern das Team


Usability Professionals 2011 Methoden

12. Rahmendokument Das Rahmendokument für die Assistenten war zum einen der Styleguide und zum anderen das Pflichtenheft für ein technisches Template. Im Vordergrund stand die Einheitlichkeit. Die Assistenten sollten alle gleich funktionieren. Als Maßgabe war definiert, dass jedes Feld auf der Oberfläche durch den Standardfall belegt werden kann oder technisch bzw. gesetzlich erforderlich ist. Das Rahmendokument definiert z. B. –– Assistent im Assistent –– Unterbrechbarkeit von Assistenten –– Produktvorschläge –– Formularerstellung Erfahrung –– Wie jeder Styleguide ist auch das Rahmendokument ein lebendes Dokument. Jeder weitere Assistent brachte weitere Anforderungen, die allgemeingültig geregelt werden mussten. –– Die Schwierigkeit dabei ist, dass Erweiterungen, die bestehende Assistenten betreffen, entsprechend beauftragt werden müssen, z.T. aber kein laufendes Projekt mehr existierte.

13. Template Damit nicht jedes Projekt den Rahmen für einen Assistenten selbst implementieren musste und damit die Anforderungen aus dem Rahmendokument eingehalten werden, wurde ein Template erstellt, welches die Grundfunktionen eines jeden Assistenten unterstützt. Darin ist technisch u.a. geregelt, wie die Navigationsbuttons heißen und angeordnet sind, die Fokussteuerung, die Default-Button-Steuerung und Layout der Zusammenfassung. Erfahrung –– Die einheitliche Bedienung der Assistenten konnte unterstützt durch das Template gewährleistet werden.

–– Auch das Template musste – nahezu im Gleichschritt mit dem Rahmendokument – angepasst werden. Die Notwendigkeit zur Einbindung von fachlichen Modulen (Assistent im Assistent), die in mehreren Assistenten verwendet werden können, wurde erst während der Konzeption weiterer Assistenten erkannt. 14. Jourfixe Damit Erkenntnisse aus der Umsetzung der Assistenten in allen beteiligen Projekten bekannt werden, wurde ein wöchentliches Jourfixe vereinbart. Zusätzlich wurde ein monatliches Management-Jourfixe durchgeführt, das sich vor allem um die generelle Ausrichtung der Assistenten, Änderung von Terminen sowie die Beschaffung von Budget kümmerte. Erfahrung –– Generelle Regelungen, also z. B. Änderungen am Rahmendokument oder auch Fragen zur konkreten Umsetzung der Assistenten wurden zeitnah beantwortet und alle Projekte hatten den gleichen Kenntnisstand. –– Im Management-Jourfixe wurden ebenfalls zeitnah Entscheidungen z. B. über zusätzliches Budget getroffen, da bereichsübergreifend die notwendigen Entscheider am Tisch saßen.

Auch aus Usability-Sicht kann das Projekt als Erfolg gewertet werden. Schon häufig kamen Usability-Maßnahmen in den Projekten zum Einsatz. Allerdings wurden z. B. Usability-Tests und Expertenevaluationen nur punktuell eingesetzt. Mehrere Methoden innerhalb eines Projekts waren eher selten. Die erfolgreiche Vorgehensweise hat bewiesen, dass die richtigen UsabilityMaßnahmen zum richtigen Zeitpunkt weder zu einer Verzögerung noch Verteuerung von Projekten führt. Zusätzlich hat das Thema Usability noch stärkere Akzeptanz im Unternehmen gefunden. 16. Ausblick Mit den Assistenten wird die Bearbeitung von Einzelfunktionen sehr gut unterstützt. Damit werden die Bankmitarbeiter an prozessorientiertes Arbeiten herangeführt. Künftig soll die Anwendung noch viel stärker den Prozessfokus erhalten und mittels Business-Process-Management (BPM) und Business-Rule-Engine (BRE) den gesamten Prozess steuern und überwachen.

15. Zusammenfassung Die konsequente Umsetzung der Assistenten hat den Banken eine große Erleichterung und Vereinfachung von Standardfällen gebracht. Zum Teil entstehen große Zeiteinsparungen, was noch durch eine reduzierte Fehlerhäufigkeit unterstützt wird. Somit wird wesentlich der Nachbearbeitungsaufwand reduziert. Ein weiterer Nebenaspekt ist der, dass der Berater die Erfassung direkt im System vornehmen kann und bisherige Aufträge vom Berater in die Marktfolge wegfallen können. Das Ziel der Vereinfachung und Prozessoptimierung wurde erreicht.

191


108

Evangelisieren, Testen, Optimieren – Erfolgsmodell Usability Clinic Usability Optimierungen bei der comdirect bank AG Kilian Hughes comdirect bank AG Pascalkehre 15 25451 Quickborn kilian.hughes@comdirect.de

Karsten Skuppin GfK SirValUse Consulting GmbH Burchardstraße 19 20095 Hamburg skuppin@sirvaluse.de

Abstract Eine hervorragende Usability der Webseite ist für den Erfolg der comdirect bank AG als Direktbank maßgeblich. Klassische Nutzertests eignen sich als Werkzeug zur Qualitätssicherung, scheitern jedoch gerade bei kleinen Themen oft an dem hohen zeitlichen und finanziellen Aufwand. Als Lösung hat die comdirect Mitte 2010 die sogenannte „Usability Clinic“ ins Leben gerufen. Die Usability Clinic ist ein monatlich stattfindender 90-minütiger Usability Test. In jeder Clinic werden etwa 4 Themen á 20 Minuten aus den unterschiedlichen Fachbereichen getestet. Sie richtet sich explizit an kleine Themenbereiche. Durch die standardisierte Durchführung liegen der Fachabteilung sehr schnell Ergebnisse vor – nach Anmeldung i.d.R. innerhalb von zweieinhalb Wochen. Weitere Vorteile sind 1) Sensibilisierung der Fachabteilungen in Sachen UX, 2) die Möglichkeit eines iterativen Testens und 3) geringere Kosten pro getestetem Thema verglichen mit klassischen Tests. Die Usability Clinic hat sich im Praxisalltag der comdirect bank bestens bewährt und ist fester Bestandteil des Entwicklungsprozesses.

1. Einleitung Die Webseite stellt für die comdirect bank AG als Direktbank den direkten Kontakt mit dem Kunden dar. Eine hervorragende Usability der Webseite ist daher für den Erfolg der comdirect maßgeblich. Im Arbeitsalltag stehen die Fachabteilungen jedoch immer wieder vor der Herausforderung, die – teilweise komplexen – Finanzprodukte in einer nutzerfreundlichen Art und Weise zu präsentieren. Zur Sicherstellung der hohen Usability der online gestellten Inhalte haben sich klassische qualitative Usability Labortests bewährt. Nielsen schrieb schon 1993: “Any object, product, system or service that will be used by humans has the potential for usability problems and should be subjected to some form of usability engineering” (Nielsen 1993, S. xi). Daher kommen bei großen Projekten wie z. B. Einführung einer neuen Smartphone-App Usability Tests regelmäßig zur Anwendung und helfen dabei, ein Maximum an Nutzerfreundlichkeit

192

zu gewährleisten. Bei kleineren Themen haben diese Tests jedoch Nachteile, auf die im Folgenden näher eingegangen wird. 2. Nachteile des klassischen Usability Tests Ist das zu testende Thema von eher geringerem Umfang, ergeben sich durch den klassischen Usability Test drei Nachteile: a) Hohe Kosten eines Usability Tests Ein Usability Test mit einem externen Dienstleister verursacht nicht unerhebliche Kosten. Liegt ein größeres Projekt wie z. B. die Neuentwicklung einer SmartphoneApp vor, können Kosten für den Test im Vorfeld eingeplant und bei der Budgetierung des Projekts berücksichtigt werden. Kleinere Projekte hingegen verfügen meist nicht über das nötige Budget, um die Kosten für einen Usability Test tragen zu können. Somit können hier oftmals keine eigenständigen Tests durchgeführt werden.

Keywords: /// Usability Testing /// Evangelisieren /// Discount Usability /// Agile

b) Überdimensionierung Usability Tests sind für ein kurzes Thema zu groß dimensioniert – eine Kürzung der Interviewlänge führt nur zu einer verhältnismäßig geringen Kostenreduktion: Ist das zu testende Thema weniger aufwendig, wird kein Test von z. B. 90 Minuten benötigt – Interviews von max. 20 – 30 Minuten reichen hier meist völlig aus. Diese Verkürzung des Tests führt natürlich zu geringeren Testkosten, jedoch steht diese Kostenreduzierung nicht im linearen Verhältnis zur Testzeitreduzierung, da die Kosten für Projektorganisation, Rekrutierung, Incentivierung und Leitfadenerstellung nahezu konstant bleiben; lediglich für die Feldphase und die Auswertung verringern sich die Aufwände. Kürzere Tests sind also relativ teurer als längere Tests. c) Hoher Zeitbedarf Die Vorbereitungen für einen Usability Test – von Angebotseinholung über Entscheidung für einen Dienstleister, Rekrutierung der Probanden und Leitfadenabstimmung nehmen viel Zeit in Anspruch. Zusammen


Usability Professionals 2011 Methoden

mit der Feldphase, Auswertung der Ergebnisse und Aufbereitung in Berichtform vergehen etwa 5 – 6 Wochen, bis die Ergebnisse schließlich der Fachabteilung vorliegen. Dieser große zeitliche Mehrbedarf lässt sich meist nur schlecht mit dem Projektalltag vereinen, da alle Elemente, welche den Launch-Termin nach hinten schieben, per se kritisch gesehen werden. Dieser Nachteil kommt immer dann zum Tragen, wenn Tests nicht regelmäßig, sondern eher sporadisch stattfinden und sich daher keine fließenden Prozesse eingeschliffen haben. Diese Nachteile hatten zur Folge, dass in der Vergangenheit Webseiten-Inhalte oft ohne Usability-Optimierung online gestellt wurden. Dies birgt natürlich das Risiko, benutzerunfreundliche Prozesse online zu stellen. Werden diese Probleme des Interfaces dann im Nachgang erkannt, ist dies natürlich erst mal zu begrüßen – führt jedoch zwangsläufig zu einem Änderungsauftrag an die IT (Change Request), welcher grundsätzlich mit hohem Aufwand für Nacharbeiten verbunden ist. Frühzeitiges Kundenfeedback könnte hier die Ergebnisqualität nachhaltig erhöhen. 3. Lösungen Als mögliche Lösungen bieten sich klassischerweise die Einführung agiler Entwicklungsmethoden und/oder A/B-Tests an. 4. Agile Entwicklungsmethoden Agile Entwicklungsmethoden wurden in den 1990er Jahren entwickelt und deren Grundannahmen wurden 2001 im Agilen Manifest (Schwaber & Sutherland, 2001) niedergeschrieben. Eine dieser agilen Entwicklungsmethoden ist Scrum. Obwohl Scrum ursprünglich für die Produktentwicklung vorgesehen war (Takeuchi & Nonaka, 1986), wird es inzwischen hauptsächlich bei Web- und Softwareentwicklungsprojekten eingesetzt. Als iteratives Entwicklungsmodell eignet sich Scrum hervorragend für User Centered Desgin-Prozesse, die grundsätzlich

denselben Ansatz verfolgen. In der Praxis von insbesondere großen Unternehmen, in denen oft noch ein Wasserfall-Entwicklungsmodell zum Einsatz kommt, hat es sich allerdings als bestenfalls langwieriges Unterfangen erwiesen, agile Entwicklungsprozesse einzuführen. Für eine Änderung des Entwicklungsmodells bedarf es in der Regel einer Entscheidung des oberen Managements, die weder alleine von der UX-Abteilung noch ohne erhebliche Vorarbeit herbeizuführen ist. Sofern agile Entwicklungsmethoden wie Scrum also nicht bereits etabliert sind, scheiden sie für eine kurzfristige Beseitigung der oben beschriebenen Probleme aus. 5. A/B-Tests A/B-Tests wurden als Testmethode für die Maximierung des Erfolgs von OnlineWerbekampagnen entwickelt, bei der die Originalversion eines Werbemittels im laufenden Betrieb einer Website gegen eine veränderte Version getestet wird. Dadurch dass jeweils ein bestimmter Anteil der Besucher der Website eins der Werbemittel zu sehen bekommt, lässt sich direkt vergleichen, welche der Varianten die bessere Konversionsrate aufweist. Dieselbe Methode lässt sich auch für die Weiterentwicklung von anderen Seitenelementen bzw. des gesamten Seitenlayouts einsetzen und bietet sich daher gerade für die Untersuchung der hier diskutierten kleineren Usability-Fragestellungen an. Gleichwohl müssen auch für A/B-Tests bestimmte Voraussetzungen erfüllt sein, damit diese zum Einsatz kommen können, namentlich muss die IT in der Lage sein eine bzw. bei multivariaten Tests diverse Weichen in der Auslieferung von Webseitenelementen zu unterstützen sowie die Zugriffe zu loggen. In einigen Branchen – so auch im vorliegenden Bankenbereich – kommen hohe Anforderungen an die IT-Sicherheit hinzu, die im Zweifel gegen die Einführung eines A/B-Testsystems sprechen. A/B-Tests eignen sich daher auch nicht in allen Fällen zur Lösung des beschriebenen Problems.

6. Die Usability Clinic Als Lösung des Dilemmas hat die comdirect Mitte 2010 die sogenannte „Usability Clinic“ ins Leben gerufen. Die Usability Clinic ist ein monatlich stattfindender Usability Test, bestehend aus 10 Interviews à 90 Minuten. Jede Fachabteilung ist eingeladen, ein kurzes Briefing-Dokument auszufüllen und sich damit für die Clinic anzumelden. In jeder Clinic werden etwa 4 Themen à 20 Minuten getestet – sie richtet sich also explizit an kleine Themenbereiche. Durch die standardisierte Durchführung liegen der Fachabteilung sehr schnell Ergebnisse vor – nach Einreichung vergehen i.d.R. nur zweieinhalb Wochen, bis die Ergebnisse vorliegen – eine klare Beschleunigung des Prozesses im Vergleich zu herkömmlichen Tests. Dieses regelmäßige Testformat hat mehrere klare Vorteile: a) Evangelisierung in Sachen UX Den Kollegen in den einzelnen Fachabteilungen wird durch die Institution der Usability Clinic teilweise überhaupt erst bewusst, dass so etwas wie Usability Testing möglich ist. Was dem versierten Usability Experten völlig selbstverständlich ist – nämlich dass verschiedene Methoden zum Testen auf Nutzerfreundlichkeit existieren – ist für die Kollegen aus anderen Bereichen meist unbekannt. Die Begeisterung für die Methodik des Nutzertests wird durch die Teilnahme am Test als Beobachter noch verstärkt: Das Beobachten der Interviews durch den Einwegspiegel im Testlabor führt die oftmals vorliegende Fachblindheit eindrücklich vor Augen und wird durchweg als sehr lehrreich angesehen. Dem Phänomen, welches Uldall-Espersen (2007 S. 628) beschreibt, “it seems that feedback from industrial usability work lacks persuasiveness, i. e. it fails to convince the key stakeholders that actions need to be taken” kann durch Einbeziehen der Fachabteilung in den Test durch aktives Beobachten der Interviews begegnet werden. Die beobachteten Nutzer bleiben sehr plastisch in Erinnerung und der Nutzer wird als überzeugende

193


Instanz wahrgenommen. Die Vorzüge des Observierens der Interviews beschreibt auch Spool (2011) in seinem Artikel: “The teams with members who spent the minimum of two hours every six weeks saw far greater improvements to their design‘s user experience than teams who didn‘t meet the minimum. And teams with more frequent exposure, say two-hours every three weeks, saw even better results.” Ein regelmäßiges Beobachten von Usability Interviews scheint sich also tatsächlich in der Ergebnisqualität der aktuellen und zukünftigen Arbeit positiv niederzuschlagen. b) Möglichkeit, auch kleine Änderungen zu testen Die Usability Clinic richtet sich wie beschrieben explizit an Bereiche mit kleinen Fragestellungen und ermöglicht somit auch diesen Themen eine kritische Prüfung auf Nutzerfreundlichkeit nebst Usability-Optimierung. Da das Budget von einer zentralen Abteilung übernommen wird, müssen die einzelnen Fachabteilungen kein Budget beisteuern, wodurch die Hemmschwelle zur Teilnahme an der Usability Clinic stark gesenkt wird. c) Kosteneffizienz Die Kosten fallen pro Produkt geringer als bei einem klassischen Test aus, der ROI steigt. In jeder Usability Clinic werden mehrere Themen getestet, so dass im Endeffekt die volle Testzeit von 90 Minuten ausgeschöpft werden kann. Durch dieses Kumulieren von Themen entstehen für jedes Thema geringere Kosten, als wenn man die Fragestellungen jeweils in einem separaten Test untersuchen würde. d) Iteratives Testing Analog zu einem Rapid Prototyping (Boling & Frick, 1997) kann ein Produkt im Rahmen der Usability Clinic in mehreren, iterativen Entwicklungsstufen getestet werden. Die festen Termine wirken sich in der Gesamtbetrachtung positiv aus. Durch die relativ hohe Taktung vergehen in der Regel maximal vier Wochen bis zur nächsten Clinic. Auch zwingen diese festen Termine zu disziplinierter Entwicklung zwischen den Prototyp-Wellen.

194

e) Kosten- und Zeitersparnis durch relativ schlichtes Reporting Durch die prinzipielle Einbindung aller Produktbeteiligter während der Feldphase genügt ein relativ schlichtes Ergebnisreporting. Eine sogenannte Usability Liste, in welcher alle Usability Probleme nebst Optimierungsempfehlungen in Listenform aufgeführt werden und ein kurzer, grafisch aufbereiteter High-Level Report sind daher in der Regel ausreichend. Da das Erstellen dieser Dokumente durch den Usability Dienstleister in der Regel sehr schnell erfolgen kann, bedeutet dies, dass die Ergebnisse bereits ein bis zwei Tage nach Ende der Feldphase vorliegen und somit die Weiterentwicklung sehr zeitnah erfolgen kann. Durch diese schlanke Gestaltung lässt sich die Usability Clinic einfach in den Projektalltag integrieren und das im Arbeitsalltag oft gehörte Vorurteil “Usability Tests sind sehr zeitaufwendig” gehört in diesem Zusammenhang der Vergangenheit an. 7. Nachteile bzw. kritische Punkte Natürlich ergeben sich durch das Format der Usability Clinic auch Herausforderungen, die es zu bewältigen gilt. Einige werden im Folgenden näher beleuchtet a) Rekrutierung Es müssen einheitliche Rekrutierungskriterien für unterschiedliche Produkte gefunden werden. Der große Vorteil der Usability Clinic besteht darin, dass die unterschiedlichsten Themen in einem Test behandelt werden können. Dies führt aber dazu, dass Produktkombinationen denkbar sind, bei denen es zumindest fraglich scheint, ob es hinsichtlich der Zielgruppe eine ausreichend große Schnittmenge zwischen den einzelnen Themen gibt. Sollten sich die Zielgruppen als sehr inhomogen erweisen, muss ggf. ein Thema auf die nächste Clinic verschoben werden, um die erforderliche Mindest-Homogenität der Zielgruppe wieder herzustellen. In der Praxis sind bis zu diesem Zeitpunkt (9 abgeschlossene Wellen) aber nur verhältnismäßig geringe Unterschiede hinsichtlich der Quotenmerkmale aufgetaucht, die

jeweils zufriedenstellend gelöst werden konnten. Dieses Problem ist bis dato daher lediglich theoretischer Natur. b) Flexibilität Ein weiterer Vorteil der Usability Clinic ist die schnelle Durchführung der Tests. Diese straffe Taktung des Formats bedingt, dass das finale Testmaterial teilweise erst am Tag vor Beginn der Feldphase vorliegt, was eine hohe Flexibilität bei Leitfadenerstellung und Briefing erfordert. Der Leitfaden wird oftmals nur anhand von Screenshots erstellt und die Interviewer müssen in der Lage sein, sich schnell in teilweise komplexe Themen einarbeiten zu können. Weiterhin ist auch denkbar, dass sich nicht genügend Themen für einen angesetzten Termin finden. Eine spontane Verkürzung der Testdauer von 90 auf 60 Minuten bei entsprechender Reduzierung der in Rechnung gestellten Zeit sollte also jederzeit möglich sein nötig. c) Anforderungen an den UX-Dienstleister Die Regelmäßigkeit der Tests bedeutet einen großen Auftrag für den Usabilty Dienstleister, was natürlich auch mit hohem Ressourceneinsatz verbunden ist. Eine z. B. aus 8 Wellen pro Jahr bestehende Usability Clinic darf nicht alleine zu einer signifikanten Auslastung des Instituts führen, da sonst die beschriebene nötige Flexibilität (z. B. bei spontanen Absagen/Verschiebungen) verloren geht. Hieraus ist zu folgern, dass das durchführende UX-Institut eine gewisse Mindestgröße aufweisen muss. d) Lokalität Neben dem Testen und Optimieren des aktuellen Testgegenstands ist das Evangelisieren in UX-Themen ein weiteres Ziel der Clinic. Dies erfordert, dass möglichst viele Projektbeteiligte, Verantwortliche und Entscheider die Interviews beobachten können. Es muss daher möglich sein, schnell und kostengünstig zum Testort zu gelangen. Hohe Reisekosten stellen hier ein nicht zu vernachlässigendes Hindernis dar und senken die Bereitschaft der Kollegen, sich die Interviews vor Ort anzusehen. Alternativ kann in Erwägung gezogen werden die Interviews zu streamen, um auch


Usability Professionals 2011 Methoden

Beteiligten, die nicht persönlich anwesend sein können, das Beobachten der Interviews zu erlauben. Das Streaming stellt aus unserer Sicht aber keinen gleichwertigen Ersatz für das persönliche Beobachten der Interviews dar. Dies insbesondere, da bei Anwesenheit aller Beteiligten vor Ort bereits während bzw. zwischen Interviews gemeinsam über die Findings diskutiert werden kann. Auch hat es sich als für alle Seiten hilfreich erwiesen, am Ende eines Testtages noch einmal gemeinsam die Ergebnisse aller Interviews durchzugehen. So kann etwa beschlossen werden, dass einzelne Punkte eines Prozesses am nächsten Tag nicht weiter untersucht werden müssen, da die bis dahin erzielten Ergebnisse bereits eindeutig sind. Mithin wird Zeit gewonnen, um einen anderen Aspekt genauer untersuchen zu können. Aus all dem lässt sich folgern, dass idealerweise eine gewisse räumliche Nähe zwischen Auftraggeber, Design-Agentur und UX-Institut gegeben sein sollte. e) Grenzen der Usability Clinic Es können nur Fragestellungen bis zu einem gewissen Komplexitätsgrad abgetestet werden. Die Usability Clinic richtet sich explizit an Bereiche mit kleineren Fragestellungen – je Thema stehen etwa 20 Minuten Testzeit zur Verfügung. Sollten die anderen Themen weniger umfangreich sein oder weniger Themen als vorgesehen eingereicht werden, können für ein Thema auch einmal 30 Minuten Zeit bleiben. Bei umfangreichen Fragestellungen bietet es sich jedoch weiterhin an, einen eigenen klassischen 90-minütigen Usability Test oder ein normales Rapid Prototyping durchzuführen, um dem Anspruch des Themas gerecht zu werden.

8. Fazit und Ausblick Die Usability Clinic ist eine wertvolle Testmethode und hat sich im Praxisalltag der comdirect bank bestens bewährt. Der hohe Mehrwert dieses Formats ist ohne Zweifel die Schnelligkeit der Ergebnisfindung, die Möglichkeit, auch bei nicht hochkomplexen Fragestellungen auf Basis von Fakten und nicht nur von Meinungen argumentieren zu können und die Unkompliziertheit in der Anwendung. Die Kollegen konnten schnell von den Vorzügen der Usability Clinic überzeugt werden, so dass sie inzwischen zu einem festen Bestandteil des Entwicklungsprozesses bei der comdirect bank AG geworden ist. Durch die Clinic wurde ein Bewusstsein für die Möglichkeit des Usability-Testens geschaffen, sodass bis dato über 20 Themen in der Usability Clinic verprobt und die Optimierungen online gestellt werden konnten. Besonders schätzen die Kollegen, durch dieses Format handfeste Ergebnisse zu bekommen und die nachfolgenden Diskussionen basierend auf Wissen - statt persönlichen Meinungen - führen zu können. Auch führt die Sensibilisierung für Usability Themen zu einem generell gesteigerten Bewusstsein für nutzerzentrierte Gestaltung und eine stärkere Fokussierung auf die Bedürfnisse des Nutzers bei der Konzeption neuer Webseiteninhalte. Die Usability Clinic verfolgt daher erfolgreich die gesetzten Ziele: Evangelisieren, Testen, Optimieren.

Literatur 1. Boling, E. & Frick, T.W. (1997): Holistic

2. 3.

4.

5.

6.

Rapid Prototyping for Web Design: Early Usability Testing is essential. In B. Khan (Hrsg.): Web-based instruction. New Jersey: Educational Technology Publications, Inc. Nielsen, J. (1993). Usability Engineering. San Diego: Academic Press. Schwaber, K. & Sutherland, J. (2001): Manifesto for Agile Software Development. http://agilemanifesto.org [27.05.2011] Spool, J. (2011). Fast Path to a Great UX - Increased Exposure Hours. http:// www.uie.com/articles/user_exposure_ hours/ [27.04.2011] Takeuchi, H. & Nonaka, I. (1986): The New New Product Development Game. In: Harvard Business Review, JanuarFebruar 1986 Uldall-Espersen, T. (2007). Exploring Multiple Usability Perspektives. In C. Baranauskas et al. (Hrsg.): HumanComputer-Interaction - INTERACT 2007, 628-632.

195


149

Wie klicken frustrierte Nutzer? Neue Möglichkeiten der Website-Optimierung durch den Methoden-Mix von Mouse-Tracking und On-Site-Befragung. Maria Händler m-pathy (seto GmbH) Buchenstraße 12 01097 Dresden maria.haendler@m-pathy.com

Abstract Der Methoden-Mix aus serverseitigem Mouse-Tracking und On-Site-Befragung bietet neue Möglichkeiten bei der agilen Usability-Optimierung von Websites. Die Kombination einer nicht-reaktiven Methode mit Befragungsdaten ermöglicht es zum einen, das in Heatmaps und Mouse-Tracking-Filmen beobachtete Nutzerverhalten zum subjektiven Erleben einer Website (User Experience) in Beziehung zu setzen. Zum anderen lassen sich anhand der Befragungsdaten zu Intentionen und soziodemografischen Merkmalen Nutzergruppen bilden, deren unterschiedliches Interaktionsverhalten dann verglichen werden kann. Des weiteren erleichtert die Methodenkombination die Gewichtung identifizierter Usability-Probleme durch eine Einschätzung der Nutzer.

1. Mouse-Tracking 1.1 Definition Der Begriff Mouse-Tracking bezeichnet im Folgenden die Aufzeichnung sämtlicher Cursor-Bewegungen, Klicks, Scrollbewegungen sowie Tastatureingaben, die ein Nutzer bei der Interaktion mit einer Website ausführt. 1.2. Merkmale des Mouse-Trackings mit m-pathy m-pathy ist ein Mouse-Tracking-Tool das sämtliche Nutzerinteraktionen auf einer Website aufzeichnet und als Film wieder abspielt. Voraussetzung ist die Implementierung eines Javascript-Codes in den Quellcode der zu analysierenden Website. Dieser eingefügte Code zeichnet dann alle Nutzerinteraktionen auf den getrackten Seiten auf und sendet die Daten über eine verschlüsselte Verbindung an den m-pathy-Server. Es ist also auf Seiten der Website-Nutzer keine Installation einer Tracking-Software o. ä. erforderlich. Die Wiedergabe der Daten erfolgt webbasiert: Jeder einzelne Besuch kann direkt im

196

Browser als Film in Echtzeit abgespielt werden. Mausbewegungen erscheinen dabei als farbige Linien über der aufgezeichneten Website. Daneben können die gesammelten Daten auch in aggregierter Form (z. B. als Heatmaps von Mausbewegungen oder Klicks) dargestellt werden. [Abb. 1] Da Cursor-Bewegungen, Klicks und Scrollbewegungen keine personenbezogenen Daten darstellen und Tastatureingaben anonymisiert1 übertragen werden, muss lediglich innerhalb des Datenschutzbereiches einer Website auf ein laufendes Tracking hingewiesen werden. In der Regel weiß ein Nutzer, wenn er auf die zu analysierende Seite gelangt, demnach nicht, dass seine Interaktionsdaten aufgezeichnet werden, sodass er sich völlig natürlich bewegt (biotische Situation). Bei der Analyse von Mouse-Tracking-Daten findet sich der Analyst demnach in der besonderen Situation wieder, die Bewertung der Website-Usability auf der Grundlage nicht-reaktiver Daten vornehmen zu können (vgl. Erlbeck 2011). Ein weiterer Vorteil der Methode besteht darin, dass die beobachteten Nutzer die tatsächliche Zielgruppe der zu analysierenden Website darstellen, da es sich um authentische Besuche handelt (vgl. Broschart 2010).

Keywords: /// Mouse-Tracking /// On-Site-Befragung /// Methoden-Mix /// User Experience /// Website-Optimierung

Der Erkenntnisgewinn, den die Methode bietet, ist auch vom Einsatzgebiet abhängig. Mouse-Tracking eignet sich sehr gut für die Analyse definierter Prozesse. Hier können neben typischem Nutzerverhalten insbesondere Schwächen in der Nutzerführung und Gestaltung entdeckt werden. Dies umfasst ungünstige Platzierungen und Bezeichnungen von Buttons, Auswahloder Formularfeldern ebenso wie missverständliche Fehlermeldungen oder auch technische Probleme. Beim Einsatz der Methode innerhalb von informationsorientierten Angeboten liegt der Nutzen vor allem in der Identifikation des typischen Nutzerverhaltens. Es kann gezeigt werden, welche Navigationspunkte angeklickt und welche Features (wie oft und in welcher Reihenfolge) genutzt werden. Bei dieser Art von Fragestellungen ist auch der Einsatz von A/B-Tests sinnvoll. Für Besuche, bei denen die Intention des Nutzers nicht bekannt ist oder abgeleitet werden kann, muss jedoch davon ausgegangen werden, dass nicht alle tatsächlich vorhandenen Usability-Probleme in der Analyse gefunden werden können. Die Auswertung der gewonnenen MouseTracking-Daten allein bildet zudem nicht ab, wie die Nutzer die Interaktion mit der


Usability Professionals 2011 Methoden

2.2. Merkmale der m-pathy On-Site-Befragung

Abb. 1. Mausbewegung eines Besuchs auf einer Website

Website subjektiv erleben. Außerdem kann nur ungenügend geklärt werden, als wie schwerwiegend identifizierte Probleme von den Website-Besuchern empfunden werden. Im Gegensatz zum m-pathy Tracking bietet eine Befragung den Vorteil, dass sie subjektive Bewertungen der Nutzer erfassen kann. Die Methode ist hervorragend dazu geeignet, Erwartungen und Meinungen abzubilden, wozu natürlich auch Aussagen zum Joy of Use einer Website zählen. 2. On-Site-Befragung 2.1. Definition Bei einer On-Site-Befragung erfolgt die Einladung zur Beantwortung eines OnlineFragebogens direkt auf der Internetseite des Auftraggebers. Diese Einladung zur Umfrage wird für gewöhnlich mit einer definierten Wahrscheinlichkeit an die Website-Besucher ausgeliefert („n-thvisitor-Methode“, vgl. Berekoven et al. 2006, S. 115). Sie erfolgt meist in Form

eines Pop-Ups oder Layers (Intercept), der entweder beim Aufruf oder Verlassen der Website oder nach Ablauf einer definierten Besuchszeit angezeigt wird. Die eigentliche Umfrage wird dann zum Bearbeiten in einem neuen Fenster bzw. in einem neuen Tab geöffnet (vgl. Lütters 2004). Ein großer Vorteil der Methode liegt (wie beim Mouse-Tracking) darin, dass eine Befragung der tatsächlichen Website-Besucher (also der relevanten Zielgruppe) erfolgt (Knapp 2004). Weitere Vorteile im Vergleich zu anderen Befragungsverfahren bestehen bspw. in der hohen Anonymität und den niedrigen Kosten (vgl. Scholl 2009). Nachteilig an der On-Site-Befragung ist die erschwerte Projektsteuerung (Laufzeit der Befragung), die sich daraus ergibt, dass sie vom Teilnahmeinteresse der Nutzer abhängt. Die als gering einzuschätzende Verbindlichkeit der Situation führt dazu, dass die Ausschöpfungsquote eher gering ist.2

Die m-pathy On-Site-Befragung unterscheidet sich im Wesentlichen hinsichtlich der folgenden Punkte von den zuvor beschriebenen Merkmalen: [Abb. 2] –– Auslieferung der Fragebögen: Bei klassischen Intercept-Erhebungen besteht nach Lütters (2004) eine Timing-Problematik: Handelt es sich beim Besuch des Nutzers um den ersten Kontakt mit der Website, so ist eine Befragung direkt nach Seitenaufruf ungeeignet, da noch keine Erfahrungen mit der Seite gemacht wurden. Wird die Befragung beim Verlassen der Website ausgelöst, sind Nutzer meist nicht mehr bereit, daran teilzunehmen. Mit m-pathy kann das Auslösen einer Befragung an weitere exklusive Events gekoppelt werden. Einige der zur Verfügung stehenden Möglichkeiten um solche Events zu definieren, sind bspw. die Dauer (in-) aktiver Zeit, die Sichtbarkeit eines Elements auf dem Bildschirm des Nutzers oder Mouseover sowie weitere, beliebige, im Vorfeld definierte Nutzeraktionen. Somit kann die Umfrage je nach Fragestellung gezielt Nutzer ansprechen, die bestimmte Verhaltenskriterien erfüllen. –– Befragungsformat: Die Bearbeitung des Fragebogens erfolgt über alle Fragen hinweg innerhalb eines Layers auf der Website. Dabei ist die Gestaltung des Layers am Corporate Design der Website orientiert, sodass sich dieser nahtlos ins Gesamtbild einfügt und den Besuch so wenig wie möglich beeinträchtigt. Ein weiterer Vorteil dieser Lösung besteht darin, dass der Nutzer die gesamte Zeit auf der Website des Anbieters verbleibt. Inhaltlich sollte sich eine On-Site-Befragung natürlich auf das konkrete Webangebot beziehen, für das sie ausgeliefert wird. Welche Fragen im Speziellen gestellt werden und bei welchen Events der Fragebogen angezeigt werden sollte, ist projektspezifisch zu entscheiden. Generell

197


bestimmter Ereignisse (z. B. Fehlermeldungen) auf die Bewertung auswirken. Weiterhin kann eine Befragung an strategisch interessanten Punkten und/oder an Punkten, die sich bereits als Schwachstelle einer Website erwiesen hatten, platziert werden. Hierdurch kann zu einem besseren Verständnis des beobachteten Verhaltens beigetragen und eine Gewichtung der Schwere des Problems vorgenommen werden.

Abb. 2. Layout der On-Site-Befragung für den Cyberport Webshop

stellt die m-pathy On-Site-Befragung folgende Frageformate zur Verfügung: –– Einfachauswahl (mit Freitextoption) –– Mehrfachauswahl (mit Freitextoption) –– Matrix, unipolar und bipolar –– Offene Frage –– Grid-Format (gleichzeitige Abfrage von zwei Dimensionen, z. B. Einschätzung einer Eigenschaft und Bewertung der Wichtigkeit dieser) In den bisher durchgeführten Projekten zum kombinierten Einsatz von MouseTracking- und Befragungsdaten stand bei der Fragebogenkonzeption jeweils die Erhebung des subjektiven Nutzungserlebnisses (User Experience) im Vordergrund. Hierzu wurden Fragen zur Bewertung der Usability und insbesondere zur Bewertung des Joy of Use gestellt, welche sich an bestehenden Fragebögen wie dem IsoMetrics Questionnaire, dem ISONORM-Fragebogen, dem AttrakDiff2 oder dem User Experience Questionnaire orientierten. Ziel war es, die objektiven Bewegungsdaten des Mouse-Trackings um subjektive Einschätzungen der Nutzer ergänzen zu können.

198

3. Methoden-Mix 3.1. Einsatzszenarien und Stärken Durch die Kombination von Mouse-Tracking-Daten und Befragungsergebnissen kann die User Experience einer Website umfassend abgebildet werden. Die nichtreaktiven Daten aus der Verhaltensbeobachtung werden mit den subjektiven Einschätzungen aus der Befragung angereichert - oder andersherum, je nachdem, wo der Schwerpunkt gesetzt werden soll. Da eine eindeutige Zuordnung der Befragungsdaten zu den mit m-pathy aufgezeichneten Verhaltensdaten besteht, führt dies zu einer völlig neuen Qualität der Analyse. Zu jeder geäußerten Meinung existiert ein aufgezeichneter Besuch. Somit kann einerseits der Frage nachgegangen werden, welches Verhalten einer subjektiven Bewertung zugrunde liegt. Die Ergebnisse der Befragung werden in diesem Fall als Filter für die Mouse-TrackingDaten genutzt. So kann im Detail analysiert werden, wie sich die konkrete Interaktion mit der Seite oder das Eintreten

Durch den Einsatz des Methoden-Mix kann den Verhaltensdaten eine Intention zugeordnet werden. Dies ermöglicht eine zuverlässige Erkennung von UsabilityProblemen auch außerhalb von Prozessen. In Projekten mit einem nicht so klar abgesteckten Rahmen stand bisher das Aufzeigen typischen Nutzerverhaltens im Mittelpunkt (welche Navigationspunkte werden angeklickt, welche Features werden genutzt etc.). Daneben ist nun auch das Identifizieren von Problemen leichter und zuverlässiger möglich. Praxisnahe Fragestellungen für den Einsatz des Methoden-Mix sind beispielsweise: –– Vergleich der Gewohnheiten von Bestandskunden mit der Interaktion von Neukunden: Unterscheiden sich Mausbewegungen, Klicks und besuchte Seiten? –– Vergleich der unterschiedlichen Bewertungen von Produktdetailseiten: Werden bei schlechter Bewertung Seitenbereiche/Informationen übersehen (sichtbar in Heatmaps von Klicks und Mausbewegungen)? –– Vergleich der Gründe für den WebsiteBesuch: Wie surfen Nutzer mit verschiedenen Intentionen (Stöbern, Produktvergleich etc.)? Welche Website-Bereiche und Themen sind interessant? –– Die Website wird als unterschiedlich ansprechend (Joy of Use) empfunden: Welche Seiten bzw. Seitenbereiche werden von Nutzern besucht, die den Joy of Use als positiv bzw. negativ einschätzen? Mit welchen Elementen interagieren die jeweiligen Nutzergruppen?


Usability Professionals 2011 Methoden

–– Vergleich von unterschiedlichen Bewertungen zur Orientierung und zum Aufbau der Website: Werden bei schlechter Bewertung eher auf Orientierungslosigkeit hindeutende Mausbewegungsmuster gezeigt als bei besserer Bewertung? Wichtig ist auch die Frage, ob die Angabe von Bewertungen und Intentionen innerhalb einer On-Site-Befragung dazu führt, dass die aufgezeichneten Verhaltensdaten nicht als non-reaktiv angesehen werden können. In der Auseinandersetzung mit dieser Frage sollen zwei verschiedene Punkte betrachtet werden: (1) die biotische Erhebungssituation und (2) das nicht-reaktive Verhalten von Website-Besuchern. (1) Eine Erhebungssituation ist nach Berekoven et al (2006) dann als biotisch einzustufen, wenn die beobachtete Person nicht weiß, dass sie beobachtet wird, zu welchem Zweck sie beobachtet wird und was ihre eigentliche Aufgabe ist. Bereits der erste Punkt (und damit auch die beiden weiteren Punkte) ist mit hoher Wahrscheinlichkeit gewährleistet. Ein Besucher, der die On-Site-Befragung beantwortet hat, hat keinen Anlass, zu vermuten, dass auch Verhaltensdaten aufgezeichnet werden. Er wird sich nicht in höherem Maße beobachtet fühlen, als er es bspw. durch den ihm bewussten, gängigen Einsatz von Webanalysetools grundsätzlich schon tut. Zudem zeigt sich in keiner der analysierten Sessions, dass bezüglich dieses Themas im Datenschutzbereich der Website nachgeforscht würde. (2) Es besteht jedoch die Möglichkeit, dass bestimmte Fragestellungen das weitere Verhalten eines Nutzers beeinflussen könnten, z. B. Fragen danach, ob die Website eine gute Orientierung bietet oder wie häufig ein bestimmtes Feature genutzt wird. Dieser Problematik kann durch das Setzen von Segmenten auf Seitenebene begegnet werden. Eine inhaltliche Auswirkung der Befragung auf das Verhalten würde nur diejenigen Daten betreffen, die nach der Beantwortung aufgezeichnet werden. Die interessierende Interaktion des Nutzers liegt also vor dem Ereignis „Befragung beantwortet“. Für eben diesen

Zustand (Befragung beantwortet oder Befragung nicht beantwortet) wird bei jedem Seitenaufruf ein Segment gesetzt. So können in der Analyse Verhaltensdaten danach unterschieden werden, ob sie vor oder nach der Beantwortung der On-SiteBefragung stattgefunden haben. Alle Interaktionsdaten, die vor der Beantwortung aufgezeichnet wurden, sind nicht reaktiv.

Nutzergruppen. Schlechte Bewertungen können als Problem-Indikator dienen, da sie in Folge der vorangegangenen Nutzerinteraktion gegeben wurden.

3.2. Nachteile

4.1. Fallbeispiel Cyberport (cyberport.de)

Ein Nachteil des Methoden-Mix ergibt sich aus der erfahrungsgemäß geringen Rücklaufquote von On-Site-Befragungen in Kombination mit besonderen auslösenden Events. Sobald die auslösenden Events so definiert werden, dass nur ein geringer Teil der Nutzer den Fragebogen überhaupt angezeigt bekommt, wird es notwendig, insgesamt sehr viele Nutzersessions aufzuzeichnen.

Fragestellung: Der Webshop von Cyberport bietet seinen Nutzern die Funktionalität, Produkte per Drag & Drop in eine Shopping-Leiste zu ziehen. Von Interesse war zum einen, wie häufig dies von den Besuchern der Seite genutzt wurde. Weiterhin sollte überprüft werden, ob die interaktive Bedienung den Joy of Use der Website erhöht.

Für die Befragung des Cyberport-Webshops, siehe Fallbeispiel unten, wurden insgesamt knapp 360.000 Besuche aufgezeichnet. Unter diesen Besuchen wurde der Fragebogen knapp 21.500 mal ausgeliefert und von 567 Nutzern vollständig beantwortet. Um eine ausreichende Anzahl an Datensätzen, die sowohl Befragungs- als auch Interaktionsinformationen liefern, zu erhalten, können demnach in einigen Fällen hoher Traffic auf der Seite oder ein längerer Trackingzeitraum notwendig sein. Jedoch kann auch eine geringere Zahl an Befragungsdaten als Grundlage für eine Analyse der Gesamtheit der Mouse-Tracking-Daten dienen. 4. Praxisbeispiele zum Einsatz Die Methoden-Kombination wurde bisher vorwiegend dazu genutzt, die nicht-reaktiven Beobachtungsdaten mit Informationen aus der Befragung anzureichern. Merkmale wie soziodemografische Daten oder geäußerte Intentionen dienen dabei als Filter zur Segmentierung von

Auffälligen Bewertungen wird dann durch die Analyse von Heatmaps von Klicks und Mausbewegungen sowie Mouse-TrackingFilmen nachgegangen.

Die Frage nach der Nutzung der Drag&-Drop-Funktion konnte beantwortet werden, indem ein Segment gesetzt wurde, sobald ein Nutzer eine entsprechende Aktion ausführte. Nur sehr wenige Befragte (3%) machten von der interaktiven Bedienmöglichkeit Gebrauch. Als auslösende Events für den Fragebogen dienten das erfolgreiche Durchlaufen des Checkout-Prozesses bzw. eine Verweildauer von einer Minute auf einer Produktdetailseite. In Abbildung 3 zeigt sich, dass hinsichtlich der abgefragten Eigenschaften generell eine positive Bewertung des Webshops erfolgt. Es ist weiterhin zu erkennen, dass Besucher, welche die Drag-&-DropFunktion genutzt haben, den Webshop tendenziell besser3 bewerten, als Nutzer, die dieses Feature nicht verwendeten. Aufgrund der geringen Fallzahl der Drag&-Drop-Nutzer ist allerdings eine Interpretation der Abweichung im Sinne eines tatsächlichen Unterschiedes nicht möglich. Aus den Ergebnissen lässt sich eine weitere interessante Fragestellung danach ableiten, warum nur so wenige Besucher die Drag&-Drop-Funktionalität überhaupt nutzen. Da bei Online-Umfragen stetig Ergebnisse übertragen werden, konnte bereits kurz

199


Abb. 3. Beurteilung des Cyberport Webshops

nach Projektstart die Erkenntnis gewonnen werden, dass nur eine sehr geringe Nutzung des Features erfolgt. Um der genannten Frage nachzugehen, wäre es nötig gewesen, einen weiteren kurzen Fragebogen mit einem entsprechenden Event (z. B. nach Hinzufügen eines Artikels zum Warenkorb mittels Button) auf der Website zu schalten. Mit der Methodenkombination kann demnach auf neue projektspezifische Situationen, die sich während der Erhebungsphase ergeben, eingegangen werden. Dabei ist das Vorgehen jedoch nicht so flexibel wie es „klassische“ UsabilityTests unter Einsatz der Methode des lauten Denkens sein können.

Auf die Frage danach, ob die Website alle gesuchten Informationen enthalte, antworteten 28% der Nutzer mit „Nein“. In einer

4.2. Fallbeispiel Filmfest Dresden (filmfest-dresden.de) Fragestellung: Von Interesse war es, eine allgemeine Bewertung der User Experience der Seite vorzunehmen sowie Usability-Probleme zu identifizieren. Als auslösendes Event für die Anzeige des Fragebogens wurde eine Verweildauer von 2 Minuten auf der Website festgelegt. Die Orientierung auf der Website wurde vergleichsweise differenziert bewertet und von knapp 1/3 der Besucher bemängelt.

200

Abb. 4. Mausbewegung eines Besuchs auf der Seite „Preise“

offenen Abfrage konnten die vergeblich gesuchten Informationen genannt werden. Einige Nutzer gaben an, auf der Suche nach Karten bzw. Eintrittspreisen zu sein („Ich wollte Eintrittskarten reservieren!“). In den zugehörigen Sessions wird der Navigationspunkt „Preise“ angeklickt. Jedoch verbirgt sich dahinter die Auflistung der im Festival vergebenen Awards. Entsprechend gestaltet sich die Interaktion der Nutzer mit dieser Unterseite. Da sie etwas anderes hinter dem Navigationspunkt erwarten, führen sie kurz Bewegungen im oberen Bereich aus. Sobald verstanden wurde, um was es auf der Seite tatsächlich geht, wird ein anderer Navigationspunkt ausgewählt. Die unteren Seitenbereiche werden kaum angesehen. [Abb. 4] Das in den Einzelsessions beobachtete Verhalten wird durch die Scrollingmap aller Besuche auf der Seite erhärtet. Für die Hälfte der Besuche ist der untere Seitenbereich überhaupt nicht sichtbar. [Abb. 5]


Usability Professionals 2011 Methoden

2. Broschart, S. (2010): Suchmaschinenoptimierung & Usability. Website-Ranking und Nutzerfreundlichkeit verbessern. Poing: Franzis. 3. Erlbeck, H. (2011): Neue Möglichkeiten des Mousetrackings: Automatisierte Mustererkennung erleichtert die UsabilityAnalyse. i-com, 1/2011, S. 67 ff. 4. Hassenzahl, M.; Burmester, M.; Koller, F. (2003): AttrakDiff: Ein Fragebogen zur Messung wahrgenommener hedonischer und pragmatischer Qualität. In: J.Ziegler; G. Szwillus (Hrsg.): Mensch & Computer 2003. Interaktion in Bewegung. Stuttgart: Teubner. S. 187-196. 5. Knapp, F. (2004): Zielgruppengerechte Website-Entwicklung. In K.-P. Wiedmann, H. Buxel, T. Frenzel, G. Walsh (Hrsg.): Konsumentenverhalten im Internet. Konzepte – Erfahrungen – Methoden. Wiesbaden: Gabler. S. 349-362. 6. Lütters, H. (2004): Online-Marktforschung. Eine Positionsbestimmung im Methodenkanon der Marktforschung unter Einsatz eines webbasierten Analytic Hierarchy Process (webAHP). Wiesbaden: Deutscher Universitäts-Verlag. Abb. 5. Scrollingmap der Seite „Preise“ (Aufrufe)

7. Scholl, A. (2009): Die Befragung. Sozialwissenschaftliche Methode und kommunikationswissenschaftliche Anwendung. Konstanz:

4.3. Learnings In beiden vorgestellten Fallbeispielen zeigt sich, dass sich die mit der Verknüpfung der beschriebenen Methoden – MouseTracking und Befragung – einhergehenden Erwartungen bzgl. eines größeren Erkenntnisgewinns bestätigen. Einerseits können anhand der subjektiven Befragungsdaten die beobachteten Interaktionen besser interpretiert werden (Filmfest Dresden). Außerdem ist es auch möglich, Hintergrundinformationen zu Befragungsdaten zu erhalten, ohne explizit danach zu fragen bzw. eine abgegebene Bewertung anhand von Interaktionsdaten nachzuvollziehen (Nutzung der Drag-&-Drop-Funktion im Cyberport Webshop).

sich ein Problem, wenn nur die Daten (eines Teils) der Befragungsteilnehmer als Grundlage zur Erstellung von Heatmaps dienen sollten. Es waren für beinahe alle interessanten Seiten zu wenige Daten verfügbar, sodass die Heatmaps keine aussagekräftigen Bilder von der Interaktion dieser abgesteckten Gruppe zeichnen konnten.

Anonymisierung von Tastatureingaben. URL: http://www.m-pathy.com/cms/blog-details/ items/datenschutz-neue-anonymisierungvon-tastatureingaben (Stand: 17.06.2011).

Insbesondere bei der Analyse von Formularen

1

Ein möglicher Ansatzpunkt zur Lösung dieses Problems kann es sein, zukünftig verstärkt Fragen zu kleiner abgesteckten Bereichen einer Website zu stellen und auch nur für diese Bereiche der Website MouseTracking-Daten zu sammeln. Beispielsweise könnte man die Befragung der Nutzer thematisch auf die Startseite, eine Produktdetailseite oder einen Prozess einschränken.

ist es jedoch wichtig, Nutzereingaben möglichst genau nachzuvollziehen, um Usability-Probleme aufzudecken. Aus diesem Grund verwendet m-pathy eine zeichenklassenbasierte Anonymisierung, die es erlaubt, analyserelevante Eigenschaften von Zeichen trotz Anonymisierung erkennen zu können (vgl. Schulze 2011). Realistisch sind lt. Lütters (2004) Quoten im

2

Bereich von ein bis drei Prozent.

Literatur In beiden vorgestellten Fallbeispielen wurde die vollständige Website des Anbieters getrackt, wodurch sich die Besuche auf viele Unterseiten verteilen. Dadurch ergab

UVK-Verlagsgesellschaft. 8. Schulze, D. (2011): Datenschutz: Neue

1. Berekoven, L., Eckert, W., Ellenrieder, P. (2006): Marktforschung. Methodische

V. a. im Sinn einer hohen hedonischen

3

Qualität (originell, kreativ, mutig) – Items aus dem AttrakDiff 2 (Vgl. Hassenzahl et al. 2003).

Grundlagen und praktische Anwendung. Wiesbaden: Gabler.

201


137

360° User Experience

Juergen Kiefer eye square GmbH

Carina Lehne Unit Lead, eye square GmbH

Abstract Es sollte ein Studienansatz gefunden werden, der es ermöglicht, die User Experience bei der Nutzung von touch-based Mobile Devices ganzheitlich zu erfassen und zu verstehen. Es wurde ein Methoden-Portfolio entwickelt, mit dem die vier Teilaspekte des Nutzererlebens, Utility, Usability, Joy of Use und Aesthetics, auf der bewussten und der unbewussten Ebene untersucht werden können. Neben klassischen Befragungs- und etablierten impliziten Methoden wie Eye Tracking und Verhaltensbeobachtung kamen dabei auch EEGund Hautleitwertmessung zum Einsatz. Dieser Beitrag stellt die Ergebnisse aus 14 User Experience Studien mit Smartphones und einer Studie zu TabletPC Apps vor. Diese zeigen deutlich den Mehrwert der gewählten Methodenkombination und geben klare Hinweise, wie das Interface-Design von touch-based Mobile Devices optimiert werden kann.

1. User Experience Aktuell erleben Menschen ein Überangebot an Informationen und Handlungsoptionen bei immer knapper werdenden zeitlichen Ressourcen. Dies macht eine Informationsverarbeitung notwendig, die nicht seriell, sondern vielmehr parallel erfolgt. Wie gehen Menschen nun mit dieser Reizkonfrontation im Kontext der Mediennutzung um? Studien aus den letzten zehn Jahren haben gezeigt, dass die Informationsüberflutung auf Seiten der User von Web- und Produktinterfaces zu Orientierungslosigkeit und einem diffusen Gefühl der Überforderung führt. Wie gelingt es ihnen dennoch, Nutzungsentscheidungen zu treffen, Medien wahrzunehmen und elektronische Produkte zu bedienen? Die Nutzung erfolgt eben nicht auf Basis eines Vergleichs aller Attributausprägungen der verfügbaren Optionen, wie es die klassische Entscheidungstheorie der Ökonomen noch bis in die 70er Jahre propagiert hatte. Entscheidungen stellen vielmehr Anpassungsprozesse an die Umwelt dar. Dabei verwenden wir Heuristiken, die implizit ablaufen und

202

der Introspektion kaum zugänglich sind. Weiche Faktoren wie „Hedonic Quality“ und „Joy of Use“ sind mindestens ebenso wichtig wie „Utility“ und „Usability“. Diese Heuristiken sparen kognitive Ressourcen ein, emotionale Lagen bestimmen die Prozesse mit, man lässt einfach im Augenblick „den Bauch entscheiden“. Wie kann also diese vielschichtige User Experience bei der Nutzung von touchbased Mobile Devices ganzheitlich erfasst und verstanden werden? Welche Methoden sind geeignet bewusste und unbewusste Prozesse auf kognitiver und emotionaler Ebene zu messen und für die Verbesserung der User Experience fruchtbar zu machen? Besonders Mobile Devices haben sich in den letzten Jahren zu immer komplexeren und mächtigeren Produkten entwickelt. Aktuelle Smartphones und Tablet-PCs sind nicht mehr vergleichbar mit MobilTelefonen oder Laptops. Sie bieten völlig neue Interaktionsmöglichkeiten und stellen Designer und Anwendungsentwickler vor die Aufgabe, hochkomplexe Geräte dennoch einfach bedienbar zu gestalten. Je komplexer das untersuchte Produkt,

Michael Schiessl Geschäftsführer, eye square

Keywords: /// 360° User Experience Research /// Mobile /// Touch Screen /// EEG /// GSR /// Eye Tracking

desto komplexer auch das Nutzungsverhalten und desto geringer die Fähigkeit des Nutzers dieses introspektiv selbst zu beschreiben. Das Nutzungsverhalten wird nicht durch einen einzigen Prozess gesteuert, sondern vielmehr durchdringen sich mehrere Entscheidungsebenen und spannen eine Matrix zwischen expliziten und impliziten sowie kognitiven und affektiven Prozessen auf. Die vier Teilaspekte der User Experience, Usability, Utility, Joy of Use und Aesthetics, kommen dabei sowohl auf der expliziten, also bewussten, als auch auf der impliziten, also unbewussten Ebene zum Tragen. Die explizite Usability zeigt sich beispielweise an der Gestaltung von Navigationselementen wie Buttons oder Navigation-Bars. Diese Bedienelemente sind sichtbar und können quasi „von außen“ erfasst und bewertet werden. Implizite Usability zeigt sich vor allem bei touch-basierten Geräten, die auf eine unmittelbare und unsichtbare Interaktion mit Inhaltselementen setzt statt auf Navigationselemente. Das Scrollen mit dem Finger durch eine Liste auf einem Mobile Device entspricht einem bereits jenseits von touch-based Devices erlernten


Usability Professionals 2011 Methoden

Abb. 1. User Experience ganzheitlich betrachten

Leseverhalten wie man es z. B. aus der Nutzung von Telefonbüchern kennt. Eine solche unsichtbare Bedienbarkeit ist daher intuitiv möglich und wirkt eher auf der impliziten Ebene. [Abb. 1] Ein ganzheitliches Bild dieses komplexen Nutzungsverhaltens kann nur ermittelt werden, wenn die gesamte Matrix der User Experience Prozesse durch geeignete Forschungsmethoden abgedeckt wird. Die Bewertungen der Utility und der Ästhetik auf der expliziten Ebene lassen sich durch Befragungen sehr gut erheben. Die explizite Usability über aufgabenbasierte Tests und die Analyse der benötigten Dauer bzw. Anzahl der Fehlversuche. Die implizite User Experience ist der Introspektion durch die Nutzer jedoch weitgehend verschlossen. Hier sind bereits indirekte Methoden wie Eye Tracking etabliert, das sich auf die Wahrnehmungsebene konzentriert und Aufschluss über die implizite Usability und Utility gibt. Aktuell werden diese durch Neuro-Methoden wie Elektroenzephalographie (EEG) und Hautleitwertmessung (Galvanic Skin Response – GSR) ergänzt. Diese bietet ein ebenfalls hochauflösendes Feedback, das jedoch stärker auf der affektiven als auf der kognitiven Ebene angesiedelt ist. Frustration, Excitement und Relaxation lassen sich mit EEG ermitteln und lösen Methoden wie Lautes Denken oder Verlaufsbewertungen ab, die das Nutzungserleben stören.

Abb. 2. User Experience Methoden

Die Hautleitwertmessung zeigt den Grad der Aktivierung, d.h. den Stress-Level. Mit EEG (Hirnstrom-Messung auf 16 Kanälen) werden Emotionen erhoben wie Excitement und Frustration. Beide Methoden weisen zum einen auf Mängel im Bereich Joy of Use aber auch auf Usability-Probleme hin. Die Reaktionszeitmessung kann das implizite Tool-Set sinnvoll ergänzen und dient der Ermittlung impliziter Einstellungen und Assoziationen, die mit einem Produkt verknüpft werden. Vergleicht man die Daten aus einem Reaktionszeittest vor und nach der Nutzung, lassen sich Einflüsse von Designvarianten auf die unbewussten Einstellungen und das implizite Markenimage festmachen. Das entwickelte MethodenPortfolio zur User Experience Analyse wurde anschließend in 14 interkulturellen Studien mit Smartphones und einer Studie mit Tablet-PCs angewendet. [Abb. 2] 2. Studienablauf Für die Smartphone Studien wurden insgesamt mehr als 140 Probanden untersucht, darunter sowohl Nutzer als auch NichtNutzer von touch-based Devices. Ihnen wurden realitätsnahe Nutzungsszenarien gestellt, z. B. sollten Sie einen neuen Kontakt erstellen, eine Email schreiben und versenden, Musik im Internet finden, herunterladen und anhören. Ihr

Nutzungsverhalten wurde auf Video aufgezeichnet, die Erfolgsrate, die benötigte Zeit und die Anzahl von Fehlversuchen bis zur Lösung der Aufgaben wurden anschließend analysiert. Die Blickbewegungen wurden über ein mobiles Eye Tracking Gerät, die Hirnaktivität über EEG gemessen. Ferner wurde der Hautleitwert über ein Handgelenk-GSR-Gerät gemessen, um die Handbewegungen der User nicht einzuschränken. Nach dem Test wurden die Probanden zu ihrer User Experience interviewt und gaben System Acceptance Ratings ab. [Abb. 3] Ein ähnliches Testsetting wurde für die Tablet-PC Studie verwendet. 12 Probanden im Alter zwischen 18 und 41 Jahren sollten über verschiedene Apps nach einer Wohnung oder einem Gebrauchtwagen suchen, über eine Social Network App Freunden eine Nachricht senden und in Magazinen bzw. Tageszeitungen blättern. [Abb. 4] Die Testpersonen konnten das iPad ganz normal in die Hand nehmen und frei wählen was sie wie lange nutzen, ansehen oder lesen. Gemessen wurden EEG (Hirnaktivität), GSR (Hautleitwert) und Blickbewegungen, das Nutzungsverhalten wurde auf Video aufgezeichnet und abschließend ein Interview und System Acceptance Rating durchgeführt.

203


Die GSR- und EEG-Messungen dienten sowohl in den Smartphone-Studien als auch beim Tablet-PC Test als Grundlage für die Berechnung der emotionalen Indikatoren „Frustration“, „Excitement“, „Relaxation“ und „Stress“ während der Nutzung. 3. Studienergebnisse Die User Experience von Smartphones wird deutlich verbessert, wenn Icons intuitiv erkennbar sind, d.h. beim Design sollte auf gelernte Archetypen zurückgegriffen werden. Dennoch sollten sie zusätzlich klar beschriftet werden, um eine schnelle Orientierung zu ermöglichen. Auch die Menüstruktur trägt zu einer hohen expliziten Usability bei. Als vorteilhaft zeigten sich flache Hierarchien, die ein zeitraubendes Navigieren in die Tiefe ersparen. Verschiedene Funktionen sollten darüber hinaus inhaltlich sinnvoll gruppiert werden und nicht etwa alphabetisch. Um verschiedenen Nutzertypen und ihren Navigationspräferenzen gerecht zu werden, sollten alle Funktionen über mehrere Zugänge erreichbar sein. Als besonders wichtig für die explizite Usability erwies sich ein klares, auch haptisches Feedback. Tasten sollten nicht nur über Geräusche sondern auch fühlbaren Wiederstand, Touchscreens über Vibration

dem User anzeigen, ob seine letzte Aktion erfolgreich war. Wird kein Feedback gegeben, fühlen sich User verwirrt, ihr mit EEG und GSR-gemessener Frustrationslevel steigt deutlich an. Auch auf der impliziten Ebene lieferte der 360° Methodenansatz Hinweise, wie die User Experience von Smartphones optimiert werden kann. So zeigte sich eine hohe System Acceptance und Joy of Use bei Geräten, die besonders schnell auf die Nutzereingaben reagierten. Auch ein hohes Maß an Personalisierbarkeit, z. B. durch die Platzierung von Short Cuts oder Widgets, und die Verwendung hochwertiger Materialien wirkte sich positiv auf den Joy of Use und das ästhetische Empfinden aus. Smartphones mit innovativen Bedienungskonzepten wie Motion UI oder Gesture UI machten den Usern Spaß. Dadurch stieg ihre allgemeine Bereitschaft das Device zu nutzen ebenso wie ihr Joy of Use Level. In der Studie zeigte sich auch, dass durch das umfassende Methoden-Portfolio Ergebnisse erzielt wurden, die durch klassische Befragungen nicht möglich gewesen wären. Befragt danach, auf welcher Seite des Geräts sich die User die Lautstärkeregelung wünschen, antwortete die Hälfte auf der linken, die andere Hälfte auf der rechten Seite. Die Analyse der

aufgezeichneten EEG-/und GSR-Werte für Frustration und Stress zeigte jedoch klar, dass eine Platzierung auf der linken Seite die bessere Wahl ist. Auch Schwierigkeiten bei der Entriegelung der Tastensperre konnten zwar nicht über Befragungen, jedoch über die EEG-Analyse aufgedeckt werden. [Abb. 5] Die Ergebnisse der Tablet-PC Studie zeigen vor allem Eines klar: Tablet-PCs sind keine größeren Smartphones, sondern eigene Medien. Apps, die ursprünglich für Smartphones erstellt und einfach in einer größeren Variante angeboten wurden, stellten die Nutzer ebenso vor Probleme wie Apps die Web-Layouts nachahmten oder gar vom Design her an Print-Produkte angelehnt waren. Dies zeigte sich insbesondere bei den Magazinen und Tageszeitungen. Die eJournal Apps konnten in drei Gruppen unterschieden werden: „Papier“-, „Hybrid“- und Tablet-PC-optimierte Apps. Besonders die „Papier“- und „Hybrid“Apps enttäuschten die User durch zu viel Text in zu kleiner Schrift, eine starke Anlehnung an das Print-Layout, Umblättern, das große Bewegungen erforderte, und fehlende Interaktionsmöglichkeiten. In der EEG-Messung zeigte sich bei den „Papier“-Varianten ein stetig sinkender

Abb. 3. Nutzerverhalten bei Smartphones

204


Usability Professionals 2011 Methoden

Ruhelevel und ein Anstieg der Frustration. [Abb. 6] Die Tablet-PC-optimierten Apps ermöglichten es den Nutzern dagegen, direkt mit den Inhalten zu interagieren und diese individuell anzupassen, z. B. konnten sie mit einer kleinen Bewegung zwischen reinen Bild- und Bild-/ Textdarstellungen wählen. Außerdem setzen sie konsequent auf „Pinching Interaction“ (Zwei-FingerZoom, „Fingerwischen“) und nicht wie die „Hybrid“-Apps auf eine einfache Übertragung der PC-Bedienung (Klicks, Scrollen). Das Eye Tracking zeigte außerdem, dass bei den Tablet-PC-optimierten eJournals weniger visuelle Aufmerksamkeit auf Bedienelementen benötigt wurde, da konsequent eine „touch-based“ Interaktion ohne Abwendung vom Inhalt stattfinden konnte. Für Tablet-PC Novizen stellte diese „unsichtbare Bedienung“ nur kurzfristig ein Usability-Problem dar. Kleinere Frustrationsspitzen waren in der EEG-Aufzeichnung zu erkennen, die jedoch schnell wieder absanken. Grund: Die User konnten die für sie zunächst unbekannte Funktion schnell erlernen. Apps, die konsequent mit Pinching Interaction bedient werden konnten, boten die Möglichkeit das erlernte Wissen leicht zu übertragen, die User Experience wurde daher nicht negativ beeinflusst. Ganz im Gegenteil, denn der Excitement-Level stieg bei neu entdeckten Interaktionsmöglichkeiten sogar deutlich an. Die Bedienung selbst machte also Spaß – unabhängig vom Inhalt. Dies ist ein wichtiger Befund für App-Entwickler, denn sie können die Nutzer über den „Joy of Use“ für ihr Produkt interessieren. Im Vergleich zwischen expliziter Bewertung und implizit ermitteltem User-Erleben zeigte sich auch, dass die Bewertung stark vom Marken-Image beeinflusst wird. Die App eines glaubwürdigen, etablierten Anbieters wurde in Sachen expliziter User Experience gut bewertet, obwohl die Nutzer bei der Bedienung zunehmend frustrierter und gestresster wurden. Hier zeigt sich, dass nur die sinnvolle Kombination von expliziter Befragung und impliziter

Messung ein ganzheitliches Bild des Nutzererlebens wiedergeben und störende Effekte wie Marken-Image oder „Soziale Erwünschtheit“ überwinden kann. 4. Fazit 4.1. Der 360° User Experience Ansatz mit Neuro-Methoden ist praktikabel und liefert Mehrwerte Durch den Methodenansatz, der die vier Ebenen der Kognition, Emotion, des Impliziten und Expliziten berücksichtigt, kann ein ganzheitliches Bild der User Experience gezeichnet werden. Durch den Einsatz von Neuro-Methoden ist ein Erkenntnisgewinn möglich, der durch etablierte Befragungs- und Verhaltensbeobachtungsmethoden allein nicht erzielt werden kann. Die Vorteile einer Einbindung impliziter Forschungsmethoden liegen vor allem in den drei Bereichen Validität und Anwendbarkeit der Daten sowie in der Kraft der Inspiration. a) Validität Die User Experience Studien zu Smartphones und Tablet-PC Apps zeigen, dass Marken selbst einen starken Einfluss auf die explizite Bewertung des Nutzungserlebens haben. User stufen Produkte von einer Marke mit hoher Reputation besser ein als sie tatsächlich sind, wenn man die Selbsteinschätzung mit ihrem tatsächlichen Blick- und Nutzungsverhalten sowie den gemessenen Stressindikatoren vergleicht. Doch selbst wenn sie wollten, könnten die User nicht immer valide Antworten geben. Besonders bei der Wahrnehmung erliegen sie Illusionen und glauben Dinge gesehen zu haben, die sie laut Eye Tracking Analyse gar nicht beachtet haben. Objektive Daten, wie auch die gemessene Bearbeitungsdauer und die Zahl der richtig gelösten Aufgaben bei einem task-basierten Usability-Test, sagen mehr über die Bedienbarkeit von Produkten aus als die Selbsteinschätzung der User. b) Anwendbarkeit

Abb. 4. Interaktion mit dem Apple iPad

Neben der höheren Validität der Daten liefern implizite Methoden auch direkt anwendbare Ergebnisse, die von der hohen Detailauflösung im zeitlichen Verlauf herrühren. Durch Eye Tracking, EEG, GSR und die Analyse des User-Verhaltens lassen sich Pain-Points exakt isolieren. Die ermittelten emotionalen Indikatoren zeigen deutlich, zu welchem Zeitpunkt der Nutzer welchen Zustand empfunden hat, z. B. in welchem Moment der Interaktion mit dem Interface der User gestresst oder entspannt war. Aus diesen Ergebnissen lassen sich strategisch relevante Empfehlungen ableiten und Produktentwickler erhalten so gezieltes Feedback für die Design-Optimierung. c) Inspiration Die präzisen Ergebnisse impliziter Messverfahren lassen sich auch anschaulicher aufbereiten als Befragungsdaten und werden so für User Experience Forscher, Interface-Designer und Hersteller nachvollziehbar. Statt trister Diagramme und Tabellen regen Videos und Visualisierungen letztlich einen bildhafteren und emotionaleren

205


Abb. 5. Nutzer in Interaktion

Produktentwicklungsprozess an. Die implizite User Experience Forschung ermöglicht so einen Perspektivwechsel weg von der Analyse rein rationaler Nutzer-Outputs hin zu einer ganzheitlichen Untersuchung unbewusster kognitiver Prozesse und Emotionen von Menschen, die dennoch leicht verständliche und nachvollziehbare Ergebnisse liefert. 4.2. Tablet-PCs und Smartphones sind keine kleinen Computer sondern eigenständige Medien Usability-Probleme und eine negative User Experience traten in den Smartphone-Tests und der Tablet-PC Studie vor allem dann auf, wenn Inhalte dargeboten wurden, die nicht eigens an das spezielle Device angepasst waren. Eine Übertragung von Designs und Interaktionsmöglichkeiten aus dem Web oder gar Print-Bereich auf die touch-based Devices störte die Nutzung in großem Umfang.

Interaktionsmöglichkeiten einzelne Medien ihm bieten. Bewegtbilder, Interaktionen und andere screenspezifische Features werden zum Beispiel von einem Papiermedium gar nicht erst erwartet - von Mobile Devices hingegen schon. Diese unterschiedlichen Einstellungen und Erwartungen des Users bilden das Implicit Mindset, das seine Aufmerksamkeit und sein Nutzungsverhalten steuert. Das Interface-Design von Mobile Devices kann eine intuitive Bedienbarkeit ermöglichen, wenn es die Implicit Mindsets der Nutzer berücksichtigt und an das Vorwissen der User anknüpft. Besonders viel Handlungsbedarf zeigt sich in dieser Hinsicht bei den Apps für Tablet-PCs. User gehen an diese mit dem Implicit Mindset heran, das sie auch für die PC-Nutzung aufrufen. Bedient werden müssen die Apps bislang jedoch wie bei Smartphones. Diese Diskrepanz führt häufig zu Frustration. Es müssen also besonders bei Tablet-PCs

die neuen und einzigartigen Interaktionsmöglichkeiten ausgeschöpft werden, die schließlich auch zur Bildung eines neuen Implicit Mindsets für Tablet-PCs führen werden. 4.3. Design-Empfehlungen für touch-based Mobile Devices a) Design-Empfehlungen für Smartphones: –– eine intuitive Bedienung ermöglichen z. B. durch Integration bereits gelernter Interaktionsmöglichkeiten, z. B. Analogien aus dem Alltag aufgreifen (Kartenlesen mit dem Finger) –– hochwertige Materialien verarbeiten und dadurch den Joy of Use und die ästhetische Akzeptanz steigern –– auf unsichtbare Bedienung und direkte Touch-Interaktion setzen, auf Schalter, Knöpfe und „webtypische“ Navigationselemente verzichten

Ein Grund dafür ist, dass jeder User ein bestimmtes Medium mit einem ganzen Bündel an unbewussten Erwartungen, Erfahrungen und Einstellungen nutzt. Er hat gelernt, wie eine Zeitung aussieht, wie man im Internet navigiert oder ein Mobiltelefon benutzt. Er kennt typische Layouts und weiß, welche

206

Abb. 5. Anstieg an Frustration bei print-orientierten eJournals: Tablet-PC-optimierte Apps mit „neuen“ (intuitiven) Interaktionsmöglichkeiten führen zu einem kurzzeitigen Frustrationshoch. Jedoch sinkt die Frustration insgesamt.


Usability Professionals 2011 Methoden

–– klares, haptisches Feedback geben, damit User wissen, ob ihre Aktionen erfolgreich sind und so die Usability verbessert wird b) Design-Empfehlungen für Tablet-PC Apps: –– eine intuitive Bedienung ermöglichen z. B. durch Integration bereits gelernter Interaktionsmöglichkeiten, z. B. Analogien aus dem Alltag aufgreifen (Kartenlesen mit dem Finger) –– auf unsichtbare Bedienung und direkte Touch-Interaktion setzen, auf Schalter, Knöpfe und „webtypische“ Navigationselemente verzichten –– Tablet-PC spezifische Interaktionsmöglichkeiten entwickeln und nicht einfach von Print-, Weboder Smartphone-Anwendungen übertragen –– Orientierung bieten auch ohne Navigationsleisten: durch Inhaltsverzeichnisse und Übersichtseiten –– neue Funktionen und Interaktionsmöglichkeiten einbauen, die sich schnell und spielerisch erlernen lassen – das steigert den Joy of Use –– eine personalisierte Rezeption von Content ermöglichen, z. B. durch die dynamische Anordnung von Text, Bild und Video, die je nach Vorlieben ausgeblendet oder ins Bild gezogen werden können –– konsequent auf Multi-Media setzen, User erwarten auf dem Tablet-PC keine Textwüsten, sondern Videos, Bilder und kürzere Texte

Umgebungen vereinfacht wird. Neben den bisher angewandten Indikatoren für den emotionalen Zustand des Nutzers wird die Hirnforschung weitere psychologische Erkenntnisse liefern, die in unsere Nutzerstudien einfließen werden. Neben den bereits bekannten impliziten Methoden vermuten wir zudem, dass die MimikErkennung von immer größerer Bedeutung werden wird. Die in den 1970er Jahren gewonnenen wissenschaftlichen Erkenntnisse zu den kulturell-unabhängigen BasisEmotionen wurden bereits in Software integriert, um aus Video-Aufzeichnungen heraus den emotionalen Zustand des Nutzers (fröhlich, traurig, etc.) abzuleiten. Diese Methode wird sich auch in der User Experience Forschung etablieren, da sich so das Nutzerempfinden direkt aus dem Testverlauf heraus ableiten lässt. Das ToolSet für die User Experience Forschung wird in den kommenden Jahren um weitere implizite Methoden bereichert werden und angesichts der wertvollen Ergebnisse zu einem festen Bestandteil der Nutzerforschung werden.

5. Ausblick Wir sind der Meinung, dass eine Verbindung von sowohl expliziten als auch impliziten Methoden eine sinnvolle Kombination ist, das Nutzerverhalten ganzheitlich zu erfassen und zu verstehen. Im Bereich Neuro-Methoden erwarten wir für die Zukunft, dass wie vor Jahren im Bereich Eye Tracking, eine stetige Verbesserung der Messgeräte erzielt wird, wodurch das Testen von Produkten in sämtlichen

207


132

Remote Usability Testing für einen multinational agierenden Großkonzern Marian Möhren Pixelpark Agentur Cäcilienkloster 2 50676 Köln marian.moehren@pixelpark.com

Abstract Der Kurzbeitrag präsentiert die Methode des moderierten Remote Usability Testings anhand der Erfahrungen eines Praxisbeispiels. Dabei werden Schwierigkeiten und Tipps hinsichtlich Recruiting und Vorbereitung, Setup und Technik sowie Durchführung und Moderation des Testings beschrieben.

1. Einleitung Vor dem Hintergrund einer zunehmenden Ausweitung der Geschäfte auf globale Märkte und vermehrt standortübergreifender Teamarbeit steigt für immer mehr Unternehmen die Bedeutung des Usability Testings von internen und externen Online-Angeboten, deren Nutzer sich an geographisch entfernten Orten befinden. Da folglich auch mit Testpersonen aus diesen Orten getestet werden sollte, bietet sich hierfür die Methode des synchronen (d.h. moderierten) Remote Usability Testings an. Der vorliegende Beitrag präsentiert anhand eines Praxisbeispiels konkrete Tipps, aber auch Schwierigkeiten beim Einsatz dieser Testingmethode. 2. Ausgangslage und Zielsetzung des Testing-Beispiels Im Rahmen der konzeptionellen und gestalterischen Entwicklung einer Länderwebsite für einen Unternehmensbereich eines internationalen Großkonzerns galt es, die erarbeiteten Vorschläge zu testen, bevor die komplette, detaillierte Ausarbeitung und die technische Umsetzung erfolgen sollten. Aufgrund der geographischen Lage der Zielgruppe (amerikanischer Markt) und enger Zeitvorgaben wurde die Methode des moderierten Remote Usability Testings ausgewählt, zumal hiermit

208

erfahrungsgemäß wertvolle Ergebnisse zu erzielen sind (vgl. hierzu auch Gough/ Phillips 2003). Außerdem konnte so dem Wunsch entsprochen werden, das Testing nicht komplett an externe Partner in Amerika zu vergeben und dadurch weitgehend alle Einflussmöglichkeiten einzubüßen. Getestet werden sollten die Verständlichkeit und Bedienbarkeit sowohl der geplanten Website-Struktur samt Navigationsmechanismen und -Wordings, als auch verschiedene Aspekte des Grafik- und Interaktionsdesigns. Als Testgegenstand wurde hierzu ein klickbarer HTML-Prototyp der Länderwebsite erstellt, der die wichtigsten Seiten und Elemente enthielt und somit die Durchführung der Testaufgaben ermöglichte. 3. Schwierigkeiten & Tipps 3.1. Recruiting Grundsätzlich hat sich gezeigt, dass das Recruiting der Testpersonen für den Erfolg des Remote Testings eine noch größere Bedeutung hat als bei Vor-Ort-Testings, da die Testpersonen mehr noch als sonst in der Lage sein müssen, sich verbal auszudrücken. Die Aufnahme nonverbaler Kommunikationssignale wie Gesten etc. ist kaum möglich (das Setup des vorliegenden Beispiels beinhaltete auch kein paralleles Videoconferencing, über das

Keywords: /// Remote Usability Testing /// Methode /// Praxisbericht /// Tipps

sich Proband und Moderator hätten sehen können, vgl. nächstes Kapitel). Im vorliegenden Beispiel war die Tendenz festzustellen, dass die Probanden bei einem Remote Testing dazu neigen, entweder eigenständig sehr viel zu sprechen (auch abweichend von der eigentlichen Aufgabe), oder aber die verbale Kommunikation auf ein Minimum zu beschränken, d.h. weniger als gewünscht durch „Think Aloud“ ihre Gedanken und Aktionen zu artikulieren. Beides ist vermutlich auf die fehlende physische Präsenz des Moderators zurückzuführen, der bei Vor-Ort-Tests einerseits „regulierend“ wirkt, andererseits aber auch einen direkten, körperlich vorhandenen Ansprechpartner darstellt, dessen Präsenz die Kommunikation erleichtert. Beim Recruiting für Remote Testings ist es weiterhin empfehlenswert, mehr „Fallback“-Testpersonen als sonst zu rekrutieren, da die Ausfallquote höher zu sein scheint (im vorliegenden Beispiel wählten sich mehr als ein Drittel der Probanden zum vereinbarten Testing-Termin nicht ein und waren auch nicht erreichbar; vgl. zu diesem Thema auch Bolt 2006). Auch die Fallback-Testpersonen müssen dann in den Testing-Zeitplan integriert werden (hierbei dürfen im Übrigen die verschiedenen Zeitverschiebungen nicht vergessen werden). Die insgesamt höhere Ausfallquote mag auch den Umständen der Testsituation geschuldet sein: Ein


Usability Professionals 2011 Methoden

Termin zu Hause oder bei der Arbeit kann leichter durch andere Termine oder Vorfälle „verdrängt“ werden als ein externer Termin an einem anderen Ort. In jedem Fall sollte bereits beim Recruiting das technische Setup bei den Probanden vollständig abgeklärt werden. So lassen sich diverse Hürden, die ein erfolgreiches Testing blockieren (vgl. Kapitel „Technik“), bereits im Voraus eliminieren. Beim Recruiting der Testpersonen in einem multikulturellen Land wie den USA ist interessanterweise auch damit zu rechnen, dass nicht alle Personen der Zielgruppe die Landessprache auf muttersprachlichem Niveau beherrschen (zumindest traf dies auf einen Teil der Probanden im vorliegenden Beispiel zu). Dies erschwert zwar das Ziehen von Schlussfolgerungen aus den Testergebnissen, gibt auf der anderen Seite jedoch auch Hinweise auf Aspekte, die für die Gestaltung zusätzlich zu berücksichtigen sein könnten (insbesondere hinsichtlich der Verständlichkeit von Wordings). 3.2. Test-Setup Das Setup der eigentlichen Testsessions stellte sich wie folgt dar: Der HTML-Prototyp wurde auf einem Server in Deutschland gehostet, die jeweilige Testperson in den USA konnte über die ScreensharingSoftware „GoToMeeting“ auf diesen zugreifen und ihn bedienen. Parallel war die Testperson über eine Audiokonferenz (Telefon oder VoIP im virtuellen Meetingraum) mit dem Moderator des Testings verbunden. Zusätzlich waren Mitglieder der für Konzept und Design verantwortlichen Online-Agentur sowie mehrere Stakeholder des Kunden (d.h. des WebsiteAnbieters) in Deutschland und den USA als „stille Zuhörer“ in die Telefonkonferenz und auch in die Webkonferenz des Screensharing-Tools eingeloggt, konnten also sowohl die Aussagen von Moderator und Testperson als auch alle Aktivitäten auf der Website live mitverfolgen. Diese „Teilnahme“ war hinsichtlich gemeinsamer und zeitnaher Entscheidungen über erkannte

Usability-Probleme und entsprechende Änderungen an der Website sehr wertvoll. Als außerordentlich hilfreich erwies sich zudem die Verbindung des Moderators mit dem „Zuhörerteam“ über einen Instant Messaging Service (in diesem Fall Skype) während der Testsessions. So konnten dem Moderator on-the-fly Hinweise zur Moderation oder weitere zu stellende Nachfragen mitgeteilt und somit der Verlauf der Session direkt beeinflusst werden, um möglichst wertvolle Ergebnisse zu erzielen. Insgesamt hat das beschriebene Setup trotz einiger Schwierigkeiten (vgl. nächstes Kapitel) funktioniert und es wurden mit damit 12 moderierte Remote-Testsessions erfolgreich durchgeführt. 3.3. Technik Die Technik war beim Remote Usability Testing viel mehr als bei „herkömmlichen“ Tests ein entscheidender Faktor für ein erfolgreiches Testing. Einerseits muss das technische Setup auf Probanden- und Testteam-Seite funktionieren, um überhaupt die entsprechenden Interaktionsmöglichkeiten für ein Remote Testing herstellen zu können, andererseits sollten die Interaktionen an sich nicht durch technisch bedingte Schwierigkeiten beeinflusst werden. Schwierigkeiten sind dabei eher Detailbezogen als grundsätzlicher Art. So lag bezüglich des allgemeinen Setups der Prototyp zwar auf einem eigenen Rechner des Testing-Teams und somit im eigenen Einflussbereich (der Prototyp wurde von den Testpersonen bei der Bedienung sozusagen nur „ferngesteuert“), jedoch mussten die Testpersonen auf ihrem eigenen Rechner ein Browser-Plugin installieren, um das GoTo-Meeting ScreensharingTool nutzen zu können. Hierbei ist (leider) nicht davon auszugehen, dass, obwohl ein eigentlich simpler Prozess, die Installation von allen Testpersonen problemlos zu erledigen ist. So gab es mitunter Schwierigkeiten aufgrund fehlender Nutzerrechte zur Installation von Plugins, aber auch der Installationsprozess an sich bzw. das Betreten des virtuellen Meetingraums nach erfolgreicher Installation erwies sich nicht

für alle Teilnehmer als selbsterklärend. Bei zwei Testpersonen war ein seitens des Moderators per Telefon „geführtes“ Installieren des Plugins und Betreten der Webkonferenz notwendig, bevor das eigentliche Testing starten konnte. Dies sollte nach Möglichkeit bereits im Vorfeld des Testings, also während der RecruitingPhase, über entsprechende Abfragen von technischem Setup und Installationsrechten bei den Probanden sowie ggf. vorheriger „geführter“ Plugin-Installation abgefangen werden. Bezüglich einer möglichen Beeinflussung der Interaktionen durch technische Gegebenheiten lässt sich sagen, dass es durch die „Fernsteuerung“ des Browsers über das Screensharing-Tool zu leichten Verzögerungen in den wahrgenommenen Reaktionszeiten von Maus- und Websiteinteraktionen kommen kann. Diese können das Testing negativ beeinflussen, da sie sich auf die Wahrnehmung der Erwartungskonformität der Website auswirken. Es ist daher ein entsprechend performanter Host-Rechner für den Prototyp und eine ausreichend hohe Bandbreite auf Testerund Probandenseite sicherzustellen, um diesen Effekt zu minimieren. Im vorliegenden Beispiel spielten die Faktoren Bandbreite bzw. Verzögerungseffekt sowie Art und Größe des Prototypen glücklicherweise in keiner der Testsessions eine Rolle. Für die Audio-Verbindung mit den Probanden ist es empfehlenswert, sowohl die Möglichkeit einer VoIP-Audioverbindung (in diesem Fall über das GoToMeeting-Tool möglich), als auch über eine normale Telefonleitung anzubieten. Einige Probanden hatten kein Mikrofon am Rechner und waren daher auf ein normales Telefon für die Audiokonferenz angewiesen. Eine Testsession musste gar ausfallen, da sich herausstellte, dass der Proband weder ein Mikrofon am Rechner hatte, noch ein Telefon in die Nähe des Rechners bringen konnte (und auch nicht den Rechner zum Telefon, ohne die Internetverbindung zu verlieren, da das Kabel nicht lang genug war).

209


Insgesamt erwiesen sich „normale“ Telefonkonferenzen als vorteilhaft in Bezug auf die Tonqualität. In jedem Fall ist die Verwendung eines Headsets seitens des Probanden empfehlenswert. Einige Testpersonen hatten während der Testsession ein Telefon in der Hand, was die Interaktion am Rechner laut eigener Aussage schwieriger machte. Auch die Audio-Setup-Möglichkeiten der Probanden sollten nach Möglichkeit bereits beim Recruiting geklärt werden. 3.4. Moderation & Durchführung Die Moderation der Testsessions erwies sich ebenfalls als noch bedeutender als bei Vor-Ort Testings, da den Probanden aufgrund der räumlichen Trennung zum einen noch mehr als sonst das Testsetting, der Ablauf und die Aufgabenstellungen erklärt werden müssen, und zum anderen das Gespräch allein auf verbaler Ebene geleitet werden kann. Sprachlich wurde schnell klar, dass der Moderator ein wirklich muttersprachliches Niveau der Testsprache benötigt, um dies leisten zu können. Klar zu Empfehlen ist also, mit muttersprachlichen Moderatoren zu arbeiten. Im Detail ergaben sich folgende Aspekte als fundamental für erfolgreiche Testsessions: Neben der üblichen Beschreibung des grundsätzlichen Testablaufs muss beim Remote Testing zu Beginn die Funktionsweise des genutzten Screensharing-Tools durch den Moderator erläutert werden, damit dem Probanden verständlich wird, dass er den Prototypen auf dem entfernten Rechner fernsteuern und sozusagen „normal“ über einen Browser bedienen kann. Außerdem schien es wichtig, dass der Moderator die Fragestellungen der zu bewältigenden Testaufgaben mehrfach wiederholt, da im Gegensatz zu Vor-OrtTestings dem Probanden die Fragestellung nicht zum Nachlesen bspw. auf Papier neben den Monitor gelegt werden konnte. Ein wiederholtes Nachlesen bzw. in diesem Fall Nachhören der Fragestellung war für viele Testpersonen für die Bearbeitung der Testaufgaben jedoch wichtig. Wie auch bei Burger et al (vgl. Burger/Burmester/

210

Selter 2008) erwähnt ist es daher sehr hilfreich, dem Probanden die jeweilige Fragestellung parallel zum Testobjekt einzublenden. Im vorliegenden Fall bot das GoToMeeting-Tool diese Möglichkeit zwar nicht direkt an (spezielle Remote-Testing Softwarelösungen scheinen diesbezüglich ausgereifter), jedoch wurde die enthaltene Chatfunktion zu diesem Zwecke umfunktioniert: Im GoToMeeting Control-Panel kann ein Chatfenster ausgeklappt werden, in welches der Moderator die Fragestellungen postete, so dass sie für den Probanden während der Aufgabe stets lesbar auf dem Bildschirm stand. Das Control-Panel kann jedoch je nach Nutzerinteraktion verschiedene Zustände annehmen, so dass bei einigen Probanden das Chatfenster nicht sichtbar war oder übersehen wurde. In diesen Fällen war eine Erklärung des Moderators zum Auffinden der Fragestellungen notwendig, was dann auch in fast allen Fällen den gewünschten Effekt erzielte. Grundsätzlich ist also zu Empfehlen, seitens des Moderators zu Beginn der Session auf das Chatfenster und das dortige Vorhandensein der Fragestellungen hinzuweisen bzw. die Sichtbarkeit auf Probandenseite sicherzustellen. Während der Session muss dann stets die aktuelle Frage in den Chat eingegeben werden, was jedoch auch durch Teilnehmer der „stillen Zuhörer“ geschehen kann.

4. Fazit Als Kurzfazit lässt sich sagen, dass vor allem Moderation und technisches Setup entscheidende Faktoren für erfolgreiches Remote Usability Testing sind. Das vorliegende Beispiel hat gezeigt, dass wenn beides gut funktioniert, die Methode für akzeptable Kosten (und vermutlich insgesamt geringere Kosten als für ein ausgelagertes Vor-Ort-Testing samt entsprechendem Ergebnis-Übertrag) durchaus sehr wertvolle und valide Testergebnisse liefert. Von den 12 Testpersonen wurden ca. 10 verwertbare Usability-Probleme gemeldet (wovon 3-4 als sehr klein eingestuft werden können). Vier davon ließen sich nach der Hälfte der Testings bereits im Prototyp ändern und traten anschließend auch nicht mehr auf. Insgesamt kann davon ausgegangen werden, dass die wichtigsten Probleme aufgedeckt wurden. Somit kann als abschließende Erkenntnis die Methode des moderierten Remote Usability Testings zum Testen von Online-Angeboten für geographisch entfernte Zielgruppen durchaus empfohlen werden.

Literatur 1. Bolt, N. (2006): Guide to Remote Usability Testing. Online unter: http://okcancel. com/archives/article/2006/07/guide-toremote-usability-testing.html (letzter Aufruf:

Ein weiterer Aspekt der Moderation betrifft die Kontrolle der Maus auf dem Bildschirm: Hier erwies sich als notwendig, dass der Moderators immer sagt und wiederholt, wann genau Testperson oder Moderator die Mauskontrolle übernimmt, um einerseits dem Probanden klarzumachen, wann er interagieren kann, und andererseits den „stillen Zuhörern“ zu signalisieren, welche Interaktionen nicht durch die Testperson ausgeführt werden, um Fehlinterpretationen zu vermeiden. Einige anfängliche Unklarheiten konnten so im vorliegenden Beispiel durch entsprechende Ansagen des Moderators schnell beseitigt werden.

27.05.2011) 2. Burger, S., Burmester, M. & Selter, A. (2008): Formatives Remote Usability Testing. i-com, Vol. 7, Issue 1, pp. 47-50. Auch online unter: http://www.sciweavers.org/publications/ formatives-remote-usability-testing (letzter Aufruf: 27.05.2011) 3. Gough, D. & Phillips, H. (2003): Remote Online Usability Testing: Why, How, and When to Use It. Online unter: http://www.boxesandarrows. com/view/remote_online_usability_testing_ why_how_and_when_to_use_it (letzter Aufruf: 27.05.2011)


211


124

Adaptierbares Onsite-Befragungstool für Websites Franziska Leithold Ludwig-Maximilians-Universität München Ludwigstraße 28 80539 München leithold@bwl.lmu.de

Özlem Can, Ben Heuwing, Ieva Karalyte, Thomas Mandl, Christa Womser-Hacker Universität Hildesheim Marienburger Platz 22 31141 Hildesheim {ocan0106, heuwing, ikar0113, mandl, womser}@ uni-hildesheim.de

Abstract Um Websites von Nutzern online bewerten zu lassen und daraus direkt auf Schwachstellen und Verbesserungsmöglichkeiten zu schließen, existiert eine Reihe universeller Werkzeuge. Das Fragebogen-Tool „E-Quest“ ermöglicht es, ohne spezielles Expertenwissen einen spezifischen Usability-Fragebogen für eine Website zu erstellen. Dafür wurden geeignete Fragen entwickelt, die typische Schwachstellen von Websites berücksichtigen. Aus diesen Fragen kann in einem Online-Tool ein Fragebogen zusammengestellt werden. Die Nutzer der Seite können damit zu relevanten Aspekten befragt werden. Auf dieser Grundlage können konkrete Probleme und Verbesserungsmaßnahmen abgeleitet werden.

1. Einleitung Kleine und mittlere Unternehmen entwickeln und verbessern in regelmäßigen Abständen ihre webbasierten Anwendungen, um die Kommunikation mit ihren Kunden zu optimieren. Das Befragungstool E-Quest soll in diesem Kontext helfen, die Ergebnisse der Entwicklung von den jeweiligen Nutzern einschätzen zu lassen. Die Betreiber und Entwickler sollen dadurch erste Hinweise auf umsetzbare Verbesserungen erhalten. Den Anwendern von E-Quest wird die Möglichkeit geboten, ohne Expertenwissen im Bereich der Fragebogenkonstruktion einen auf ihre jeweilige Website angepassten Nutzerfragebogen zu generieren und eine Onsite-Befragung durchzuführen. Dafür wurden für unterschiedliche Kategorien von Websites geeignete Fragen entwickelt, die sich auf typische UsabilityProbleme in dieser Kategorie beziehen. E-Quest ist Bestandteil der ServicePlattform usability-toolkit.de (vgl. Bartel u. a. 2009). Dort werden weitere einfach einzusetzende Werkzeuge, Informationen und Tutorials zu Web-Usability und zu den Methoden der nutzerzentrierten

212

Entwicklung angeboten. Bestehende und bewährte Methoden sollen dabei nicht ersetzt, sondern ergänzt und ihr Bekanntheitsgrad gesteigert werden. 2. Vergleich mit anderen Fragebogenverfahren Bei der Evaluation interaktiver Systeme werden häufig die subjektive Wahrnehmung des interaktiven Systems und die Erwartungen der Nutzer erfasst. Standardisierte Fragebogeninstrumente, die sich auf die Usability von Produkten und die Zufriedenheit der Nutzer beziehen, lassen sich einteilen in Fragebögen, welche die subjektive Einstellung der Nutzer zu einem Produkt in verschiedenen Dimensionen erfassen und solche, welche sich auf einzelne Schwachstellen eines Systems beziehen. Weiterhin gibt es die Möglichkeit, kontextspezifisch eigene Fragebögen zu entwickeln. Einige der existierenden, standardisierten Befragungsinstrumente ermöglichen die zuverlässige Erfassung verschiedener Aspekte der Einstellung der Nutzer zu einem System (etwa QUIS1, AttrakDiff2, UEQ3). Sie liefern jedoch keine direkten Hinweise auf die Ursachen und stellen

Keywords: /// Evaluation /// Web-Usability /// Nutzerbefragung /// Adaptierbarkeit

damit, zumindest ohne weitere Interpretation, keine direkte Hilfe bei der Verbesserung des Systems dar. Dafür sind sie meist eingehend überprüft und verbessert worden. Die Qualität (hinsichtlich Validität und Reliabilität) erhöht sich dabei vor allem durch die Möglichkeit der Skalenbildung, bei der bestimmte Faktoren durch verschiedene Einzelfragen ermittelt werden. Diese Zielrichtung ist bei einem adaptiven Verfahren, wie dem von E-Quest, durch die individuelle Zusammenstellung der Einzelfragen nicht direkt umsetzbar. Andere Fragebogen-Verfahren versuchen Hinweise auf konkrete Fehlerquellen des untersuchten Systems zu erheben. Dazu gehören etwa „IsoMetrics“ (vgl. Gediga & Hamborg 2002:7) und „SUMI“ (Kirakowski & Corbett 1993). Der Bezug zu Eigenschaften der Anwendung bleibt dabei jedoch eher allgemein. Einen spezifischeren Bezug bietet „WAMMI“ (Kirakowski u. a. 1998), eine auf Websites angepasste Version des „SUMI“. Kontextspezifische, dem Kontext der Anwendung und der Nutzergruppe angepasste Fragestellungen können direkte Hinweise auf mögliche Problemursachen aufzeigen. Die Konstruktion eines eigenen Fragebogens wird jedoch nur empfohlen,


Usability Professionals 2011 Methoden

wenn auch entsprechende Fachkenntnisse vorhanden sind (vgl. etwa Sarodnick & Brau 2006:170). Für „E-Quest“ werden vorformulierte Items für verschiedene Website-Kategorien angeboten, aus denen relevante Fragen ausgewählt werden, so dass auf dieser Basis jeweils semi-individualisierte Lösungen entwickelt werden können. Dies reduziert den Aufwand im Vergleich zu vollständig individuellen Lösungen und erfordert vom Durchführenden weniger Vorwissen. Die Intention des gewählten adaptiven Ansatzes ist es, die Auswertung der Ergebnisse in Hinblick auf bestehende Usability-Probleme zu erleichtern, wobei eine Überprüfung dieser Annahme noch aussteht. Für die Sicherung der Zuverlässigkeit der Ergebnisse wird die Kombination mit anderen Methoden (etwa Expertenbeurteilungen oder Nutzertests) empfohlen. 3. Entwicklung der Fragebogenitems Für die Entwicklung eines adaptiven Befragungstools mussten im Vorfeld die möglichen Anwendungskontexte, deren Gegenstand abgedeckt wird, definiert und beschrieben werden (Leithold 2010:31-35). Aufbauend auf einer Analyse der UsabilityAnforderungen und häufiger Probleme in den jeweiligen Kontexten wurden dann die einzelnen Fragen definiert. 3.1. Kategorisierung der Anwendungskontexte Die dynamische Natur und zunehmende Komplexität des World Wide Web erschweren die Kategorisierung von Websites. Entsprechend wurde für das zu entwickelnde Befragungstool ein eigenes Klassifikationsschema entworfen. Dabei erfolgte eine Orientierung an den Kategorisierungsansätzen von (Hong & Kim 2004) sowie (Thielsch 2008), die für die Entwicklung des Tools als thematisch geeignet erschienen. Hierbei wurden in Anlehnung und unter Vergleich der beiden Klassifikationsansätze eigene Kategorien

entwickelt. Ergebnis des Vorgehens waren die folgenden sechs Kategorien: –– E-Commerce –– Entertainment –– E-Learning –– Social Software –– Information –– Präsentation Dabei ist anzumerken, dass die genannten Kategorien nicht für alle Fälle vollkommen trennscharf sein können. Der Trend zu multidimensionalen Seiten, die dem Nutzer umfassende Funktionskataloge bieten (Information, Shop, Kommunikation mit anderen Nutzern, Profilerstellung), erschwert eine widerspruchsfreie Kategorisierung. 3.2. Entwicklung der Fragebogenitems Für die genannten Kategorien wurden mithilfe einer Literaturanalyse (Leithold 2010:38-52) konkrete Usability-Anforderungen und -Probleme ermittelt, welche die Grundlage für die kategorienspezifischen Fragen bilden. Die ermittelten Kriterien lassen sich teilweise in die Anforderungen nach DIN EN ISO 9241-11 (ISO 1996) einordnen, gehen jedoch in einzelnen Fällen über diese hinaus. Da für das Befragungstool in erster Linie eine pragmatische Strukturierung der Kriterien von Bedeutung ist, wurden die ermittelten Kriterien gemäß den sieben Grundsätzen der Dialoggestaltung nach DIN EN ISO 9241110 gegliedert. Aus den gesammelten Kriterien wurden anschließend Einzelfragen entwickelt, welche die Grundlage für das adaptive Befragungstool bilden. Bei der Erstellung der Fragen (Leithold 2010:55-68) ließen sich unter methodischen Gesichtspunkten folgende Problemstellungen identifizieren: Die Wahl der Skala und die Wahl des Fragentyps. Die Wahl fiel auf eine fünfstufige Likert-Skala, da diese durch Zustimmung oder Ablehnung zu einer Aussage die Einstellung eines Benutzers zu einem bestimmten Sachverhalt erheben kann (vgl. Bortz & Döring 2006:252). Die Anzahl der Likert-Skalenstufen wurde anhand von Überlegungen

zur Übersichtlichkeit auf dem Bildschirm bei verschiedenen Auflösungen und Monitorgrößen sowie hinsichtlich des kognitiven Aufwands für den Befragten bei der Konfrontation mit der Skala festgelegt. Dementsprechend wurde die Anzahl der Skalenstufen auf fünf beschränkt. Die einzelnen Usability-Kriterien wurden als Aussagen, denen der Nutzer mit Zustimmung oder Ablehnung begegnen kann, formuliert. Insgesamt wurden 179 Fragen generiert. Die Aufteilung auf die unterschiedlichen Kategorien ergab sich hierbei wie folgt: –– E-Commerce (49) –– Entertainment (31) –– E-Learning (31) –– Social Software (25) –– Information (26) –– Präsentation (17) 3.3. Überprüfung der Fragebogenitems Die erstellten Items wurden im zweiten Schritt von Experten und Studierenden getestet, um die Brauchbarkeit der Items sicherzustellen sowie deren Verständlichkeit und Akzeptanz bei späteren Nutzern zu beurteilen. Die Items wurden dabei auf die Kriterien Relevanz, Vollständigkeit und Verständlichkeit geprüft. Insgesamt wurden zwölf Experten (Universitätsmitarbeiter, im Usability-Bereich berufstätige Personen, Absolventen der Informationswissenschaft mit Abschlussarbeiten im entsprechenden Themenbereich) gebeten, die Fragen gemäß ihrer Expertise und Erfahrung zu beurteilen. Zusätzlich wurde parallel eine Revision der Fragen mit Studierenden der Informationswissenschaft vorgenommen, um die Verständlichkeit der Formulierungen sicherzustellen sowie eine ergänzende Relevanzeinschätzung zu leisten. Nach Eingang aller Experten- und Nutzerurteile wurde ein Relevanzwert für jede einzelne Frage berechnet. Dies sollte dazu dienen, Fragen, die sowohl von Experten als auch von den Studierenden als irrelevant beurteilt wurden, aus dem Fragenpool zu entfernen und die Fragen im späteren Befragungstool nach Relevanz sortiert

213


anzubieten. Hierzu wurde im ersten Schritt getrennt nach Experten und Studenten für jede Frage der Relevanzwert RItem, basierend auf dem Verhältnis von „relevant“Bewertungen zur Gesamtzahl der Bewertungen errechnet. Entsprechend war

Aufgrund des umfangreicheren Fachwissens und der langjährigen beruflichen Erfahrung wurde der ermittelte Relevanzscore der Experten für jede Frage (R(E)) bei der Berechnung des endgültigen Relevanzwertes doppelt so stark gewichtet, wie derjenige der Studierenden (R(S)). Der Relevanzwert für die jeweiligen Fragen ergab sich damit als

Nach der Auswertung der Freitextkommentare von Experten- und Studierenden wurde der gesamte Fragenpool unter Berücksichtigung der ermittelten Relevanzwerte revidiert und Anregungen wurden eingearbeitet. Darüber hinaus wurde die Anzahl der Fragen reduziert. Redundante Aussagen wurden zusammengefasst und Fragen mit niedrigem Relevanzscore zum größten Teil entfernt.

E-Learning mit lediglich 19 vollständig ausgefüllten Fragebogen) zum Teil jedoch als kritisch betrachtet werden. Im Rahmen der vorläufigen Untersuchung konnten keine Hinweise auf grundlegende Probleme in Bezug auf die Relevanz des Fragenkatalogs ermittelt werden. Nach dem erfolgreichen Abschluss des Benutzertests erfolgte die Umsetzung des Prototypen und der endgültigen Version des Fragebogentools E-Quest. 4. Das Online-Tool E-Quest Mit dem Online-Tool E-Quest wird dem Anwender die einfache Erstellung eines Fragebogens in drei Schritten ermöglicht. 1. Allgemeine Angaben zum Fragebogen: Neben der URL der zu untersuchenden Website und einem Titel für die Umfrage, wird in diesem Schritt die Hauptkategorie der Website aus einer Liste von WebsiteKategorien (siehe Abschnitt 3.2.) festgelegt. Weitere Einstellungen wie die Festlegung von Begrüßungstext, Abschlusstext oder einer Datenschutzerklärung sowie

Die Fragen der jeweiligen Kategorien wurden im Anschluss weiteren Nutzern in einem Pretests vorgelegt, um eventuelle Schwierigkeiten in Nutzung und Umgang im Vorfeld aufzudecken und gegebenenfalls zu beheben. Innerhalb des Pretests wurde jeder der sechs Bogen von zwei Benutzern getestet. Im Anschluss erfolgte die Testanwendung der Fragebögen in einer Online-Version. Für jede Kategorie wurde eine Website ausgewählt und eine Evaluierung mit allen erstellten Fragen durchgeführt. Der Link zu den Umfragen wurde per E-Mail an potentielle Teilnehmer verschickt, insgesamt konnten innerhalb von 19 Tagen 193 Personen den Fragebogen vollständig beantworten. Dies kann bezüglich der Gesamtzahl an Teilnehmern als akzeptabel, in den einzelnen Kategorien (z. B.

214

Abb. 1. E-Quest – Auswahl der Fragen in der Hauptkategorie

die Option, ein Kommentarfeld und die Abfrage von demografischen Daten zum Umfrageteilnehmer an das Ende der Umfrage hinzuzufügen, sind optional anzugeben. 2. Fragen aus der Hauptkategorie auswählen: Hierfür werden die vorformulierten Fragen aus der im Schritt 1 gewählten Hauptkategorie zur Auswahl präsentiert (Abbildung 1). Dabei sind die kategorienspezifischen Standardfragen vorausgewählt und Fragen mit besonderes hoher Relevanz-Gewichtung kenntlich gemacht. Der Anwender kann so Fragen, die keinen Bezug zu der zu untersuchenden Website haben (z. B. weil die entsprechenden Interface-Elemente nicht vorhanden sind) abwählen und entsprechend aktueller Fragestellungen zusätzliche Fragen ergänzen. 3. Fragen aus den übrigen Kategorien hinzufügen: Für multifunktionale Websites können zusätzliche Fragen aus den übrigen Kategorien hinzugefügt werden. Da erfahrungsgemäß die Abbruchquote bei Umfragen mit über 20 Fragen hoch ist, wird bei Überschreitung dieser Anzahl ein Warnhinweis gegeben. Mit der Hilfe einer


Usability Professionals 2011 Methoden

Vorschau auf die Online-Umfrage kann der Anwender seine gewählten Einstellungen und Fragen überdenken und den Fragebogen bei Bedarf nachträglich bearbeiten. [Abb. 1] Der Menüpunkt „Fragebögen verwalten“ gibt eine Übersicht über alle erstellten Fragebögen und bietet folgende Optionen: –– Aktivierung der Online-Umfrage über die Festlegung eines Start- und Endzeitpunktes für die Befragung –– Bearbeitung eines Fragebogens (nur vor der Aktivierung) –– Einfache Auswertung zur Laufzeit und nach Ablauf Umfrage –– Export des Fragebogens und der Ergebnisse Um eine schnelle Einarbeitung und eine intuitive Nutzung des Tools zu gewährleisten, wurde vor der Implementierung des Tools ein interaktiver Prototyp in mehreren Schritten von Usability-Experten und mit Nutzertests evaluiert und verbessert. Das Online-Tool mit den vorbereiteten Fragen wird auf der Service-Plattform usabilitytoolkit.de zur Verfügung gestellt. 5. Ausblick

Europäischen Union im Rahmen des EFRE Strukturfonds in der Förderlinie 2.2.1 „Innovative FuE-Verbundprojekte Wissenschaft – Wirtschaft: Innovative Kooperationsprojekte mit KMU“ gefördert. Unser besonderer Dank gilt allen, die die Entwicklung von E-Quest durch ihre Urteile und Teilnahme an Evaluierungen unterstützt haben.

8. Laugwitz, B., Schubert, U., Ilmberger, W.,

Literatur

9. Leithold, F. (2010). Adaptierbare Online-

Held, T., Tamm, N., & Schrepp, M. (2009). Subjektive Benutzerzufriedenheit quantitativ erfassen: Erfahrungen mit dem User Experience Questionnaire UEQ. In: Brau, H., Diefenbach, S., Hassenzahl, M., Kohler, K., Peissner, M., Petrovic, K., Thielsch, M. T., Ullrich, D., & Zimmermann, D. (Hrsg.). Usability Professionals 2009. Stuttgart: Fraunhofer Verlag, 289-291

1. Bartel, T., Heuwing, B., Mandl, T., Quint, G.,

Nutzerbefragungen zur Beurteilung von

Weichert, S., & Womser-Hacker, C. (2009).

Websites. Magisterarbeit Internationales

Vermittlung von Praxiswissen zu Web-

Informationsmanagement, Universität

Usability – Aktueller Entwicklungsstand von

Hildesheim. Online: http://eprints.rclis.org/

usability-toolkit.de. In: Brau, H., Diefenbach, S., Hassenzahl, M., Kohler, K., Peissner,

handle/10760/14606 10. Ollermann, F. (2004). Verhaltensbasierte

M., Petrovic, K., Thielsch, M. T., Ullrich,

Validierung von Usability-Fragebögen.

D., & Zimmermann, D. (Hrsg.). Usability

In: Keil-Slawik, R., Selke, H., & Szwillus,

Professionals 2009. Stuttgart: Fraunhofer

G. (Hrsg.). Mensch & Computer:

Verlag, 289-291

Allgegenwärtige Interaktion. München:

2. Bortz, J. & Döring, N. (2006). Forschungsmethoden und Evaluation für

Oldenbourg Verlag, 55–64 11. Sarodnick, F. & Brau, H. (2006). Methoden

Human- und Sozialwissenschaftler. 4. Aufl.

der Usability Evaluation: Wissenschaftliche

Springer Medizin: Heidelberg

Grundlagen und praktische Anwendung.

3. Gediga, G. & Hamborg, K.-C. (2002). Evaluation in der Software-Ergonomie. In:

Bern: Huber 12. Thielsch, M. T. (2008). Ästhetik von

Zeitschrift für Psychologie Bd. 210, Nr. 1,

Websites: Wahrnehmung von Ästhetik

40-57

und deren Beziehung zu Inhalt, Usability

4. Hong, S. & Kim, J. (2004). Architectural

und Persönlichkeitsmerkmalen. 1. Aufl.

criteria for website evaluation–conceptual

Monsenstein und Vannerdat

framework and empirical validation. In:

Die entwickelten Fragen wurden einer Beurteilung durch Usability-Experten in Hinblick auf ihre Relevanz für die zu bewertenden Objekte unterzogen und innerhalb eines evaluativen Tests erprobt. Eine darüber hinausgehende, vergleichende Untersuchung der externen Validität und der Reliabilität steht damit noch aus und könnte beispielsweise im Vergleich mit Nutzertests erfolgen (vgl. Ollermann 2004), beinhaltet jedoch aufgrund des adaptiven Ansatzes methodische Herausforderungen in Bezug auf die Wiederholbarkeit der Testergebnisse und der Verwendung gleichartiger Fragebogen zur Feststellung der externen Validität.

Behaviour & Information Technology Bd. 23, Nr. 5, 337–357 5. ISO (1996). ISO 9241. Ergonomic

1

zugänglich auf http://www.attrakdiff.de/

display terminals – part 11: Guidance on

2

usability. International Organization for

3

Standardization

Questionnaire for User Interaction Satisfaction auf http://lap.umd.edu/quis/

requirements for office work with

User Experience Questionnaire (vgl. Laugwitz u. a. 2009)

6. Kirakowski, J., Claridge, N., & Whitehand, R. (1998). Human centered measures of success in web site design. In: Proceedings of the Fourth Conference on Human Factors & the Web 7. Kirakowski, J. & Corbett, M. (1993). SUMI: The software usability measurement inventory. In: British Journal of Educational Technology Bd. 24, Nr. 3, 210-212

Danksagung Die Entwicklung der ServicePlattform usability-toolkit.de ist ein Kooperationsprojekt mit usability. de (Hannover) und wurde von der

215


144

Usability Testing für und mit Senioren

Marc Turnwald, Alexandra Frerichs, Michael Prilla Lehrstuhl Informations- & Technikmanagement, Ruhr-Universität Bochum1, marc.turnwald@rub.de; alexandra.frerichs@rub.de; michael.prilla@rub.de

Abstract Usability Tests mit Probanden aus der Gruppe der momentanen Senioren sind aus verschiedenen Gründen oft schwierig durchzuführen. In diesem Beitrag werden die Schwierigkeiten, welche bei der Vorbereitung und in den einzelnen Phasen eines Usability Tests im Rahmen des Forschungsprojektes service4home beobachtet wurden, vorgestellt. Durch eingehende Reflektion dieser Probleme und iterative Anpassungen der Testkonzeption werden Vorschläge erarbeitet, die zukünftigen Testern die Planung und Durchführung von Usability-Tests mit Senioren erleichtern sollen.

1. Einleitung Der demographische Wandel und die Orientierung hin zur technisch unterstützten Dienstleistungsgesellschaft resultieren in der immer stärkeren Fokussierung auch älterer Generationen als Zielgruppe von Technik und Dienstleistungen. Ältere Menschen werden dabei auch immer stärker in die Entwicklung technisch unterstützter Dienstleistungen einbezogen, um deren Nutzbarkeit und Nützlichkeit sicher zu stellen, ihre Akzeptanz zu fördern und damit ihren Erfolg bei der Markteinführung zu verbessern. Bereits Eisma et al. (2003; 2004) haben dies deutlich gemacht, allerdings reichen unserer Ansicht nach die Empfehlungen, welche die Einbeziehung von älteren Menschen in die Entwicklung und Verbesserung von Technik und Dienstleistungen erleichtern sollen, noch nicht aus. So empfehlen sie z. B. eine motivierende Atmosphäre zu schaffen und intensiv auf die Testpersonen einzugehen, geben aber keine Empfehlungen für die Durchführung von aussagekräftigen bzw. wirkungsrelevanten Usability-Tests. Die im Folgenden beschriebenen Erfahrungen mit Probanden aus der Gruppe der Senioren basieren auf den im Rahmen der BMBF Projekts service4home zu

216

Anfang des Jahres 2010 durchgeführten Usability-Tests. Dabei sind die einzelnen Usability-Tests und die zugrunde liegende Technik in diesem Beitrag nur von untergeordnetem Interesse. Der Fokus liegt auf den beobachteten Schwierigkeiten, die im Umgang mit den Probanden aus der Gruppe der Senioren aufgetreten sind und den empfohlenen Lösungsansätzen. Um die einzelnen beschriebenen Situationen und Beobachtungen besser erklären zu können, wird im Folgenden kurz der Kontext des Projekts und die im Projekt verwendetet Technik, sowie die Konzeption des Tests beschrieben. 2. Das Forschungsprojekt service4home Im Rahmen des Projekts wurde eine Dienstleistungsagentur gegründet, die eine Reihe von Dienstleistungen anbietet, um älteren bzw. mobilitätseingeschränkten Menschen eine selbstbestimmte Lebensführung zu ermöglichen. Dazu wird Mikrosystemtechnik, bestehend aus einem digitalen Stift eingesetzt, der in Kombination mit speziell bedrucktem Papier Handschrift digitalisiert und zur Weiterverarbeitung z. B. an ein Handy übermittelt. Auf Basis dieser Technik - im Folgenden als Pen&Paper-Technologie bezeichnetwurden im Projekt Formulare entwickelt,

Keywords: /// Usability, Testing /// Senioren /// Akzeptanz /// Vertrauen /// Probandenauswahl /// Testszenario

die zur Bestellung der angebotenen Dienstleistungen, von Senioren verwendet werden sollten. 3. Einsatz von Pen&Paper-Technologie Zur Bestellung, Änderung oder Stornierung einer Dienstleistung wurden gemeinsam mit Experten aus der Seniorenbetreuung Formulare entwickelt, die mittels der Pen&Paper-Technologie von Senioren verwendet werden sollten. Dabei war als Hauptanwendungsfall geplant, dass ältere Menschen die von ihnen gewünschten Dienstleistungen von zuhause aus oder in der Dienstleistungsagentur durch Ausfüllen des Formulars mit dem digitalen Stift bestellen. Die eingetragenen Formulardaten werden nach ankreuzen des „Absenden“-Felds elektronisch an die Dienstleistungsagentur weitergeleitet und können bearbeitet werden. Die Vor- und Nachteile der Verwendung von Pen & Paper Technologie für den genannten Anwendungszweck werden deutlich, wenn sie mit anderen Alternativen wie Computerterminal, Handheld-PC oder Telefon vergleichen werden. Vorteile sind die vertraute und leicht zu erlernende Bedienung. Wenn ein Nutzer schreiben kann und bereits Formulare ausgefüllt hat,


Usability Professionals 2011 Methoden

ist die Transferleistung zur Bedienung der Pen&Paper-Technologie gering. Verglichen mit einer Bestellung per Telefon entsteht beim Ausfüllen des Formulars ein physisches Artefakt, das dem Anwender als spätere Erinnerung an die Bestellung dienen kann. Nachteile der Nutzung von Pen&Paper-Technologie sind der fehlende Rückkanal zum Anwender und die fehlende unmittelbare Validierung von Eingabedaten. Obwohl Pen&Paper-Technologie im Bereich medizinischer Anwendungen (bspw. DiabCareOnline2) etabliert ist, waren zur Zeit der Entwicklung der beschriebenen Formulare kaum Erkenntnisse zur Nutzung dieser Technologie durch Senioren vorhanden. Um Probleme beim Umgang mit den entwickelten Formularen erkennen zu können, sah das beschriebene Projekt daher unter anderem den Test der Gebrauchstauglichkeit mit der angestrebten Nutzergruppe vor. 4. Die Testkonzeption Da für den beschriebenen Einsatzzweck noch keine Erkenntnisse zur Gebrauchstauglichkeit vorlagen, gestaltete sich die Testkonzeption klassisch entlang den Richtlinien der ISO 9241-11. Praktische Hinweise hierzu, sowie weitere allgemeine Empfehlungen zur Planung und Durchführung von Usability-Tests finden sich z. B. im Standardwerk von Jacob Nielsen (1993) und sind soweit wie möglich in die Konzeption eingeflossen.

dem die Formularnutzung auf Grund der Einrichtung und Umgebung nicht erschwert wird. Zur Bewertung der Gebrauchstauglichkeit sollten die Kriterien Effektivität und Effizienz bei der Durchführung beobachtet und zusätzlich mit der Zufriedenheit der Nutzer am Ende reflektiert werden. Konkrete Beobachtungskriterien waren z. B. ob die Dienstleistung vollständig, wie vom Anwender gewünscht, konfiguriert werden konnte (Effektivität), ob die Reihenfolge der abgefragten Informationen, der Reihenfolge entsprachen, die der Proband erwartet oder ob Fragen übersprungen und später beantwortet werden (Effizienz). Während die Absteckung des Testrahmens soweit relativ gut möglich war, gestaltete sich die anschließende Beschreibung der Nutzergruppe unerwartet schwierig. 5. Schwierigkeiten beim Testen mit älteren Menschen Beim Usability-Testing mit Senioren konnten einige Probleme beobachtet werden, welche die Vorbereitung und Durchführung von Tests schwieriger gestalten als bei anderen Benutzergruppen, wie z. B. Jugendlichen oder Computerspielern. Im Folgenden werden die gemachten Beobachtungen näher beschrieben, wobei zunächst die eingangs erwähnten Probleme bei der Definition der Benutzergruppe beleuchtet werden, da sich diese ebenfalls auf andere Beobachtungen und Empfehlungen auswirken.

5.1. Zur Bestimmung der Zielgruppe: „Alter“ ist keine Altersfrage Die erste Schwierigkeit tritt bei der Beantwortung der Frage auf, welche Nutzergruppe genau mit dem Begriff „ältere Menschen“ gemeint ist. Die Abgrenzung der Gruppe durch die Beschreibung ihrer spezifischen Merkmale (z. B. Altersgrenzen, soziales Umfeld, gesundheitliche Aspekte) erweist sich als nicht durchführbar, da diese Merkmalsausprägungen und -grenzen stark variieren. Abgesehen davon gibt es auch keinen einheitlichen Begriff zur Benennung der Zielgruppe. In der Literatur werden Begriffe wie 50plus, Best Ager oder Ältere Menschen (Neundorfer, 2009, S. 101) verwendet, aber es ist nicht klar inwiefern sie sich unterscheiden. Eine Selbstklassifikation ist ebenfalls problematisch, da Begriffe wie „älterer“ oder „Senior“ häufig als Stigmatisierung empfunden werden. Dies zeigt sich unter anderem auch an der Ablehnung von Seh- oder Hörhilfen bei älter werdenden Menschen. Bezüglich der Gewinnung aussagekräftiger Ergebnisse zur Usability einer bestimmten Anwendung besteht die Hauptschwierigkeit darin diejenigen Probanden auszuwählen, für die tatsächlichen altersbedingten Usabilityprobleme eines Artefakts beobachtet werden können. So kann es z. B. einerseits möglich sein, Probanden zu testen, deren Fähigkeiten keinerlei altersbedingten Beeinträchtigungen unterliegen. Bei einem

Testgegenstand waren die entwickelten Formulare in Kombination mit dem digitalen Stift. Die Ziele des Benutzers waren die Durchführung der drei Anwendungsfälle: (1) Bestellung, (2) Änderung oder (3) Stornierung einer gewählten Dienstleistung mit den bereitgestellten Formularen, dem digitalen Stift und Zusatzmaterialien, wie z. B. einem Kalender mit Terminen, an denen eine Dienstleistung angeboten wird. Als Benutzungskontext sollte die Durchführung der Bestellung in einer für Schreibarbeiten geeigneten Umgebung erfolgen, also einem für gewöhnlich ruhigen Ort, an

Abb. 1. Zusammenhänge zwischen dem Mittelwert der altersbedingten Fähigkeiten der Probanden und dem für die Zielgruppe angestrebten Usabilityniveau eines Artefakts

217


Test mit dieser Probandengruppe wären dann keine altersbedingten Usabilityprobleme zu beobachten, da ihre Fähigkeiten die altersrelevanten Probleme vollständig kompensieren können. Andererseits können Probanden getestet werden, deren Fähigkeiten so starken altersbedingten Beeinträchtigungen unterliegen, dass sie den angestrebten Anforderungslevel des Artefakts nicht mehr ausreichend sind. In diesem Fall können ebenfalls Probleme beobachtet werden, die bei Probanden der angestrebten Zielgruppe nicht auftreten und daher auch nicht notwendigerweise behoben werden müssen oder behoben werden sollen. [Abb. 1] Abbildung 1 stellt den Zusammenhang zwischen dem Mittelwert der altersbedingten Fähigkeiten der Probanden und dem für die Zielgruppe angestrebten Usabilityniveau eines Artefakts dar. Im Bereich „wenig eingeschränkt“ kompensieren die Fähigkeiten die altersbedingten Usabilityprobleme und im Bereich „stark eingeschränkt“ verstärken die altersbedingt abnehmenden Fähigkeiten der Probanden die beobachtbaren Probleme über das angestrebte Niveau hinaus. 5.2. Beobachtete Probleme bei Planung und Vorbereitung Da wie beschrieben eine definitorische Klassifikation der Probanden weder durchführbar noch sinnvoll ist, haben wir den Ansatz gewählt, Probanden von Partnern aus dem sozialen Bereich auswählen zu lassen. Diese haben durch ihre intensive Arbeit mit Senioren sowohl eine gute Kenntnis der allgemeinen Zielgruppe älterer Menschen als auch einzelner Menschen, mit denen sie arbeiten. Im Dialog mit Usability-Experten können sie hierdurch den Schlüssel bei Auswahl von in Frage kommenden Probanden darstellen. Dabei hat es sich zum einen als nützlich erwiesen, Partner auszuwählen, die an der Entwicklung der Technik beteiligt waren oder diese bereits kennen gelernt hatten, da dadurch die wesentlichen Anforderungen zu deren Benutzung bereits bekannt waren. Zudem zeigte sich als Vorteil, dass

218

sie aufgrund ihres häufigen Umgangs mit Senioren bereits einen gewissen Grad an Bekanntschaft mit den potentiellen Probanden hatten und somit ihre Fähigkeiten und Akzeptanz abschätzen konnten. Die Eignung dieser Herangehensweise wird durch Eisma et al. (2003 & 2004) bestätigt, die einen ähnlichen Ansatz wählen. Ein weiteres Problem stellt die eingeschränkte Mobilität der Nutzergruppe dar. So kann man die Probanden zwar mit Hilfe der erwähnten Mediatoren erreichen, hat dann allerdings das Problem diese an einen vorgegebenen Testort zu bekommen. In diesem Fall bestand die Lösung des Problems darin, die Usability Tests vor Ort bzw. in den Räumlichkeiten des Seniorenzentrums durchzuführen. Aufgrund dessen war auf Seiten der Tester ein entsprechender Vorbereitungsaufwand notwendig, weil die gesamte Ausrüstung mitgebracht werden musste. 5.3. Beobachtungen bei der Testdurchführung Neben einer guten Planung und Vorbereitung des Testablaufs hat sich in der Praxis gezeigt, dass auch ein flexibler Umgang mit der vorgefundenen Situation entscheidend sein kann, um ein aussagekräftiges Testergebnis zu garantieren. So kann auf Grund der vermittelten Probandenauswahl und der damit verbundenen kontingenten Verbindlichkeit vorkommen, dass einige Probanden nicht erscheinen bzw. noch kurz vor dem Termin abspringen. In diesem Zusammenhang hat sich gezeigt, dass die Test-Durchführung vor Ort auch die ad-hoc Anwerbung weiterer Probanden ermöglicht. Insbesondere die Test-Durchführung im „semi-öffentlichen“ Raum kann Vertrauen aufbauen und dem Problem der Versagensangst entgegen wirken. Der Begriff des semi-öffentlichen Raums ist dabei der Terminologie des Datenschutzes entlehnt und bezeichnet den Bereich, der nur bis zu einem gewissen Detailgrad öffentlich beobachtet werden kann. Ein klassisches Beispiel ist die Benutzung eines Geldautomaten. Hier kann ein Wartender zwar beobachten, dass ein Akteur Geld

abhebt, Details wie Höhe des Betrags oder Geheimzahl bleiben aus seiner Perspektive aber verborgen. Bei der konkreten Testdurchführung im Seniorentreff haben wir deshalb einen etwas abseits der stärker frequentierten Durchgänge gelegenen Tisch am Rande des Raums gewählt. So konnte bei einigen Anwesenden durch die Beobachtung des Testablaufs eigenes Interesse an der Teilnahme geweckt werden, ohne dass diese bereits Einblick in die Inhalte bekommen, oder der aktuelle Proband Angst vor einer Bloßstellung seiner Fähigkeiten haben musste. Dazu ist ein behutsamer und gelassener Umgang mit den Probanden erforderlich. Hierbei haben wir uns streng an die Empfehlungen von Nielsen (1993) gehalten und jeden Teilnehmer als Experten behandelt. Ebenfalls hat sich gezeigt, dass die Planung von ausreichend Zeitpuffer zwischen den einzelnen Probanden zu einem entspannten Umgang wesentlich beiträgt, wenn gleichzeitig die Wartesituation der anderen Probanden angenehm und kurzweilig gestaltet wird. Im Zusammenhang mit den Vorteilen der semi-öffentlichen Testdurchführung und den bereits erwähnten Problemen, bei der vermittelten Probandenauswahl ist, dass Probanden anwesend sein können, bei denen der Testleiter bereits vor dem Test, bzw. kurz nach Testbeginn erkennt, dass der Proband nicht in das gewünschte Auswahlintervall fällt (siehe Abb. 1). Hier sollte man der Empfehlung von Nielsen (1993) folgen und den Test keinesfalls abbrechen, da dies anderen anwesenden Probanden, die den Testablauf aus einiger Entfernung beobachten, verunsichern oder negativ beeinflussen kann. Beide Probleme lassen sich an einem bei den Tests tatsächlich beobachteten Beispiel veranschaulichen. An einem der Termine erschien eine 89-jährige Frau in Begleitung einer jüngeren Frau, die, an ihrer Sehhilfe erkennbar, eine starke Einschränkung der Sehstärke hatte. Beim Beginn des Tests stellte sich dann heraus, dass die ältere Frau noch schlechter sehen konnte. Sie verwendete eine mitgebrachte Lupe um den Formularinhalt zunächst zu lesen, legte diese dann anschließend zur


Usability Professionals 2011 Methoden

Abb. 2. Probandin aus der Gruppe „stark eingeschränkt“

Seite, um mit dem Stift das Formular auszufüllen. [Abb. 2] Da sie ohne die Lupe die Feldbegrenzungen nicht erkennen konnte, schrieb sie stets neben die vorgesehenen Formularfelder. An dieser Stelle war für den Tester bereits erkennbar, dass das Ergebnis keinen formativen Einfluss auf das Formular haben würde, da auch eine wesentliche Vergrößerung der Formularfelder das Problem nicht beheben würde (vgl. Abbildung 1, Proband aus der Gruppe „stark eingeschränkt“). Der Tester entschied sich allerdings trotzdem dazu den Test dem Anschein nach weiter durchzuführen, um die jüngere Frau bezüglich ihrer Sehbehinderung nicht zu verunsichern.

Ein weiteres beobachtetes Problem bei Probanden aus der Zielgruppe war, dass diese Schwierigkeiten hatten den szenarischen Rahmen des Tests als fiktiv einzustufen. So kam es z. B. mehrfach vor, dass sich Probanden strikt weigerten ihren Namen oder auch nur einen erfunden Namen in das entsprechende Formularfeld einzutragen, aus Angst übervorteilt zu werden oder einen Vertrag abzuschließen. Bei der praktischen Durchführung von szenarischen Testfällen hat sich bezüglich dieses Problems ein Rollentausch als kognitiv eingänglicher erwiesen. So sagte z. B. der Testleiter dem Probanden: “Stellen Sie sich bitte vor, dass ich schlecht sehen kann und Sie daher bitte das Formular für mich ausfüllen müssen. Fragen Sie mich bitte, was Sie dazu wissen müssen und tragen Sie

meine Antworten in das Formular ein.“ Der Testleiter verwendete hierzu vorbereitete Szenarien und teilte den Probanden auf Nachfrage Einzelheiten dazu mit. Neben des Vorteils der erleichterten Durchführung mit Probanden aus der Zielgruppe konnten so auch Fälle getestet werden, die ansonsten nur schwierig zu beschreiben gewesen wären. 6. Zur Notwendigkeit von Usability-Tests mit Senioren Trotz der beschriebenen Schwierigkeiten und des zu erwartenden höheren Aufwands sind Usability Tests mit älteren Menschen unbedingt notwendig, wenn die Gebrauchstauglichkeit eines Artefakts oder Systems für diese Gruppe sichergestellt

Abb. 3. Exemplare der bei den Tests eingetragenen Terminwünsche

werden soll, wie ein weiteres beobachtetes Beispiel zeigt. So wurde im Rahmen der Gestaltung der Formulare zunächst mit etwa 15 in der Usability-Analyse geschulten Personen ein Walkthrough mit dem vorhandenen Prototypen durchgeführt. Dabei wurden ca. 100 Verbesserungsvorschläge gesammelt und eingearbeitet. Bei der folgenden ersten Testiteration mit der Zielgruppe schlug der Formularabschnitt in dem Datum und Uhrzeit der Dienstleistung eingetragen werden sollten bei allen Probanden fehl. [Abb. 3] Das Problem war, dass die Experten zum einen die vorhanden altersspezifischen Probleme nicht erkennen konnten, da ihre Fähigkeiten diese kompensierten, zum anderen, dass sie über keinerlei Erfahrung oder Wissen verfügten, welche Schwierigkeiten ältere Menschen mit der konkreten Problemstellung haben könnten. 7. Einige praktische Empfehlungen Aufgrund der gemachten Beobachtungen lassen sich folgenden Empfehlungen ableiten: –– Sofern das zu testende Artefakt es zulässt, sollten die Tests in einer den Probanden bekannten Umgebung durchgeführt werden, da sie sich in ihrem bekannten sozialen Umfeld sicher fühlen. Es erhöht zwar den Aufwand, erleichtert aber auch die Anwerbung weiterer Probanden. Darüber hinaus ist empfehlenswert, dass die Tester bereits im Vorfeld der Tests an Veranstaltungen der Senioren teilnehmen. Dies fördert sowohl die Bekanntheit der Tester, wie auch das Vertrauen, das die Probanden ihnen später entgegenbringen. Zugleich ermöglicht dies die vorhandene Raumsituation im Vorfeld zu begutachtet, um z. B. festzustellen mit welchen störenden Einflüssen, wie mangelnder Beleuchtung oder Störgeräuschen, bei einem Vor-OrtTest zu rechnen ist. Gute Anlaufstellen zur Anwerbung von Probanden sind Orte an denen sich ältere Menschen in sozialen Gemeinschaften

219


zusammenschließen. Hierzu zählen z. B. Seniorentreffs oder Kirchengruppen. –– Es hat sich als nützlich erwiesen auf eine Strategie zu setzten, bei der vorläufige Termine oder ein ungefährer Zeitraum mit einigen Probanden vereinbart wird, und diese den Test in einer semi-öffentlichen Situation durchführen zu lassen. Dabei können andere potentielle Probanden einen Eindruck davon gewinnen, was während eines Tests passiert. –– Um eine kognitive Belastung der Probanden als Einflussgröße zu vermeiden, können Hilfestellungen gegeben werden, die den Imaginationsteil der Testaufgabe erleichtern und somit den Fokus auf die Bedienung des Artefakts beschränken. Ein konkretes Beispiel hierfür ist „der helfende Proband“. Anstatt den Proband zu bitten sich vorzustellen eine fiktive Aufgabe mit Hilfe des Artefakts zu erledigen, soll dieser den Testleiter fragen, was er zur Erledigung der Testaufgabe wissen muss. Der Proband beschränkt sich darauf die vorgegebenen Anweisungen mit dem Artefakt durchzuführen. Auf diese Weise können auch schwierig zu umschreibende Testfälle überprüft werden.

sowie die geduldige Unterstützung der Probanden während der Tests zu nennen. Zudem hat sich gezeigt, dass die Vorgabe fiktiver Szenarien für ältere Menschen problematisch sein kann und dass dies durch ein Rollenspiel, in dem der Testleiter die Rolle einer zu unterstützenden Person einnimmt, kompensiert werden kann. Literatur 1. Eisma, R.; Dickinson, A.; Goodman, J.; Mival, O.; Syme, A. & Tiwari, L. (2003). Mutual inspiration in the development of new technology for older people. Proceedings of Include 2003, London, pp. 252-259. 2. Eisma, R.; Dickinson, A.; Goodman, J.; Syme, A.; Tiwari, L. & Newell, A. F. (2004). Early User Involvement in the Development of Information Technology-Related Products for Older People. Universal Access in the Information Society, 3 (2), pp.131-140. 3. Neundorfer, Lisa (2009). Die Durchbrechung des Alterstabus – Qualitative Marktforschung auf der Spur einer „schwierigen Zielgruppe“. In H. Mayer-Hentschel; G. Mayer-Hentschel (Hrsg.): Jahrbuch Seniorenmarketing 2008/2009, S. 99-118. Frankfurt a.M.: Deutscher Fachverlag. 4. Nielsen, J. (1993).Usability Engineering. Morgan Kaufmann Publishers Inc.

Das Projekt „service4home“ wird vom

1

7. Fazit

Bundesministerium für Bildung und Forschung (BMBF) unter dem Förderkennzeichen 01 FC08008 gefördert. Mehr Informationen

Der vorliegende Beitrag zeigt am Beispiel eines umfangreichen Usability-Tests die Rahmenbedingungen und Eigenschaften, die beim Testen mit Senioren als Zielgruppe zu berücksichtigen sind. Diese definieren keine neuen Bestandteile von Usability-Tests, zeigen aber deutlich, dass die bekannten Elemente solcher Tests auf die Zielgruppe angepasst werden müssen und dass insbesondere bei der Konzeption und Testdurchführung ein Testleiter benötigt wird, der die Eigenheiten der Zielgruppe kennt und berücksichtigt. Als besonders wichtig sind dabei Aspekte wie die fachliche Unterstützung bei der Auswahl von Probanden, die Herausbildung von Vertrauen vor und während des Tests

220

stehen unter http://service4home.net bereit. 2

DiabCareOnline; DiabCareOnline. Leicht leben mit Diabetes. diabcareonline.de.


Werkzeuge

221


185

Das Usability Engineering File in der Medizintechnik – Ein Stapel Papier als Business Case Tobias Walke User Interface Design GmbH Claudius-Keller Straße 3c 81669 München tobias.walke@uid.com

Henning Brau User Interface Design GmbH Claudius-Keller Straße 3c 81669 München henning.brau@uid.com

Abstract Internationale Normen verpflichten Hersteller von Medizinprodukten mittlerweile dazu, bei der Produktgestaltung und -entwicklung einen Usability Engineering Prozess durchzuführen. Diesen Prozess müssen Hersteller nachweislich in einer Akte dokumentieren und einer „Benannten Stelle“ vorlegen. Diese Akte wird als Usability Engineering File bezeichnet. Doch das Usability Engineering File ist viel mehr als nur ein Stapel Papier mit technischen Dokumentationen. Es ist ein von übergeordneter Stelle vorgeschriebener Ansatz, der eine nutzerzentrierte Entwicklung von der gesamten Branche der Medizinproduktentwicklung einfordert – was in der Konsumgüterindustrie und im Web-Bereich mittlerweile selbstverständlich sein sollte. Dabei hat das Usability Engineering mehrere Nutzen: Es führt nicht nur zur Verbesserung der Usability für das medizinische Personal, sondern kann durch eine optimierte Produktgestaltung Verletzungen von Patienten, Nutzern und Dritten vorbeugen. Der Beitrag zeigt die enge Verknüpfung von nutzerzentrierter Entwicklung mit dem in der Branche vorgeschrieben Risikomanagement auf. Er skizziert die Inhalte, die Hersteller gemäß den Normen DIN EN 62366 und DIN EN 60601 1-6 im Usability Engineering File mindestens dokumentieren müssen.

1. Einleitung Neue interaktive Technologien haben in der Vergangenheit die öffentliche Aufmerksamkeit für beziehungsweise die Forderung nach Usability und User Experience geweckt. So haben sie dazu beigetragen, das Berufsfeld der Usability Professionals zu entwickeln (German UPA, 2011). In den 90er-Jahren waren dies vor allem das sich explosionsartig ausbreitende Internet sowie die zeitgleich stattfindende Revolution der mobilen Telefonie. Seit einigen Jahren sind es die Smartphones, durch die mobiles Internet und natürliche Interaktion zu Standards wurden. Eine benutzerfreundliche Produktgestaltung wird bei Alltagsgegenständen wie Mobiltelefonen oder mobilen Navigationsgeräten mittlerweile im Allgemeinen erwartet. Ähnliches gilt für E-Commerce oder ähnliche kundenorientierte Webangebote, wenn sie am Markt bestehen wollen. Hier wie dort führt eine schlechte Usability zu Frustration

222

der Nutzer und im schlimmsten Fall zur Rückgabe des Geräts oder zum Vermeiden der Website. Bei der Entwicklung von Medizinprodukten spielte das Thema Usability in der Vergangenheit allerdings oft eine untergeordnete Rolle. Dies ist alarmierend, denn schlechte Usability führt hier nicht nur zu Einbußen in der Effektivität, Effizienz und Zufriedenstellung der Nutzer (in erster Linie Ärzte und Pflegepersonal), sondern gefährdet im ungünstigsten Fall die Gesundheit von Patienten, dem Nutzer selbst oder auch von Dritten mitunter gravierend Wissenschaftliche Publikationen dokumentieren eine Vielzahl medizinischer Zwischenfälle, die durch Bedienfehler von Medizinprodukten entstehen (z. B. Matern, Koneczny, Scherrer & Gerlings, 2006; Leitgeber, 2009). Ein häufiger Grund: Die Geräte wurden nicht an die besonderen Gegebenheiten des Nutzungsumfelds angepasst, beispielsweise an die simultane

Keywords: /// Medical /// Usability Engineering File /// UEF /// DIN EN 62366 /// DIN EN 60601 /// Business Case

Verwendung verschiedener Geräte durch unterschiedliche Nutzergruppen, auf engstem Raum und unter Zeitdruck. Auch die besonderen Anforderungen an die Nutzer der Geräte, wurden bei der Geräteentwicklung oftmals zu wenig berücksichtigt. Diese sind oftmals hoher physischer und psychischer Beanspruchung sowie langen Arbeitszeiten ausgesetzt und dadurch potenziell fehleranfälliger. Zu den steigenden Belastungen der Nutzer kommt eine ebenfalls stetig wachsende Komplexität der Medizingeräte hinzu (z. B. Buhr, 2010). So hielten mit der zunehmenden Durchdringung des Marktes mit Software-basierten Systemen auch immer mehr Monitore Einzug in Praxen und Kliniken, auf denen eine Fülle von Informationen dargestellt wird. Ein weiterer Trend unterstreicht die Notwendigkeit eines Mensch-zentrierten Entwicklungsansatzes (DIN 9241-210, 2010): Durch die verstärkte Verlagerung


Usability Professionals 2011 Werkzeuge

von Behandlungsanteilen in das häusliche Umfeld müssen sich Laienanwender, also die Patienten selbst oder betreuende Angehörige, mit Medizingeräten auseinander setzen und diese sicher benutzen können. Viele der heute am Markt erhältlichen Geräte wurden aber für eine Anwendung im Praxisbereich ausgelegt. Sie sind daher (noch) wenig oder gar nicht auf diese neue Nutzergruppe ausgelegt, was wiederum Gefährdungen der Gesundheit durch unsachgemäße Anwendung und Nutzerfehler impliziert. Eine Vielzahl von gesundheitsgefährdenden Zwischenfällen in der Medizin wird auf menschliche Faktoren, organisatorische Aspekte, aber auch auf die falsche Anwendung von Medizingeräten zurückgeführt. In einer Umfrage unter Ärzten gaben 69,8% aller Befragten an, die Geräte „nicht in jeder Situation intuitiv richtig“ bedienen zu können. Bei befragten Pflegekräften waren es noch 48,9% (Matern et al., 2006). 2. Normen zur Verbesserung von Usability Der Gesetzgeber reagierte auf diese kritische Situation durch die Verankerung von Normen, die zur Verbesserung der Usability medizintechnischer Geräte beitragen. Zunächst erschien DIN EN 60601 1-6 (2007), welche die Durchführung eines Usability Engineering Prozesses beschreibt und einen Nachweis der Einhaltung dieses Prozesses verlangt. So kann eine sogenannte „Benannte Stelle“ (technische Prüfstelle wie beispielsweise TÜV oder Dekra) damit medizinisch-elektrische Geräte zulassen. Diesen Usability-EngineeringProzess griff die darauffolgende Norm DIN EN 62366 (2008) auf, erweiterte aber die Gültigkeit auf nahezu alle Medizingeräte, die zur Beobachtung, Prävention, Diagnose, Behandlung, Linderung von Krankheiten verwendet werden. Sie umfasst also auch nicht-elektrische Medizingeräte. Für Hersteller solcher Medizingeräte bedeutet dies, dass sie einen Prozess während der Entwicklung ihrer Produkte durchführen müssen, welcher verschiedene

Aktivitäten zur Verbesserung der Usability beinhaltet.

Inhalte erweitert und zur Prüfung eingereicht werden muss.

Dieser Prozess steht in enger Verbindung mit dem Risikomanagement gemäß DIN 14971 (2009). Letzteres will potenzielle Gefährdungen identifizieren und die damit verbundenen Risiken bewerten und minimieren. Der Usability-Engineering-Prozess liefert auf der einen Seite einen wichtigen Beitrag zur Identifizierung von bestehenden Gefährdungen, auf der anderen Seite minimiert er durch benutzerfreundliche Lösungen Risiken von vornherein – oder verhindert diese, bevor sie entstehen können. Wie das Risikomanagement muss der Hersteller auch den UsabilityEngineering-Prozess in einer Akte, dem sogenannten „Usability Engineering File“, dokumentieren. Die Gültigkeit der DIN EN 62366 trat mit der neuen EU-Richtlinie für Medizinprodukte ab dem 21. März 2010 in Kraft. Ihre Anwendung ist somit für Hersteller von Medizinprodukten verbindlich vorgeschrieben.

Doch das Usability Engineering File ist deutlich mehr als ein zusätzlicher Stapel Papier für die Prüfstelle. Es ermöglicht vielmehr, einen Prozess in der Entwicklung des Medizingerätes fest zu verankern. Dieser zieht den Nutzer von Beginn an mit ein, identifiziert dessen Bedürfnisse, leitet daraus Anforderungen ab und überprüft diese bis zum Produktionsstart immer wieder an realen Nutzern.

3. Das Usability Engineering File Das Usability Engineering File dokumentiert die gesamte Entwicklung eines Medizinproduktes hinsichtlich seiner Usability und beschreibt den konkreten UsabilityEngineering-Prozess sowie Maßnahmen zur Verifizierung und Validierung der Usability. Es kann Bestandteil der Risikomanagement-Akte sein oder losgelöst von dieser bestehen. Nach Erfahrungen der Autoren in den letzten Jahren fokussieren sich viele Hersteller von Medizingeräten derzeit noch hauptsächlich auf die Validierung der Usability. Deren Kern ist eine Überprüfung der Benutzerschnittstelle mit repräsentativen Nutzern. In der Regel wird diese Validierung als Usability Test durchgeführt, da eine Nutzerbeteiligung zwingend vorgeschrieben ist. Die übrigen Bestandteile des Usability Engineering File werden eher vernachlässigt und mitunter gar als lästige Pflicht angesehen, bei der die bestehende technische Dokumentation um ein paar

Einige Unternehmen sind zusammen mit den Autoren gerade dabei, einen solchen Prozess zu implementieren. In der medizintechnischen Branche insgesamt entsteht aber erst allmählich ein Bewusstsein dafür, welches Potenzial tatsächlich in den genannten Normen steckt. Aus Sicht der Usability-Dienstleister hingegen ist dieser Stapel Papier ein veritabler Business Case: Hier hat sich ein Markt entwickelt, der nicht von der Notwendigkeit des Usability Engineerings überzeugt werden muss, da er ja zu diesem verpflichtet ist. Allerdings ist es wichtig, den Kunden davon zu überzeugen, dass ein professionell durchgeführtes und dokumentiertes Usability Engineering weit mehr für ein Produkt erreichen kann, als seine Zulassung grundlegend zu ermöglichen. Doch der Markt ist anspruchsvoll: Enge Vorgaben durch Qualitäts- und Risikomanagement auf der Basis von Gesetzen, Verordnungen und Normen beschränken den methodischen wie kreativen Spielraum deutlich. Auch gehört eine hohe Expertise des Dienstleisters im medizinischen, medizinisch-organisatorischen (zum Beispiel Abläufe und Prozesse während einer Operation) wie auch medizintechnischen Umfeld dazu, um sich als Dienstleistungspartner und nicht als notwendiges Übel erfolgreich zu positionieren. 4. Zulassungsrelevante Dokumentation Um eine Zulassung eines Medizingerätes für den europäischen Markt zu erhalten, müssen Hersteller – wie bereits

223


angedeutet – den gesamten Gestaltungsund Entwicklungsprozess nachweislich dokumentieren. Genau dies geschieht mit dem Usability Engineering File. Zusammen mit der gesamten technischen Dokumentation muss es bei einer Prüfstelle eingereicht werden. Diese prüft vor allem, ob mit Hilfe des Usability Engineering potenzielle Gefährdungen und damit verbundene Risiken durch konstruktive Maßnahmen während des Entwicklungsprozesses sukzessive minimiert wurden. Deshalb sollten Hersteller von Medizingeräten aufzeigen, welche nutzerzentrierten Methoden sie angewendet haben und welche Auswirkungen diese auf Funktion und Design des Medizinproduktes hatten. Das Usability Engineering File und die Inhalte der Normen legen für den Produkthersteller bereits die Basis dafür, einen solchen Prüfprozess mit dem eigenen Produkt erfolgreich bestehen zu können. Die Erfahrung zeigt jedoch, dass es für die Durchführung des Prozesses einschlägiges Usability-Fachwissen vor allem über Beteiligung von erfahrenen Usability Engineers benötigt. Mit der eigens entwickelten Dienstleistung „Medical Safety Design“ ist die User Interface Design GmbH (UID) seit über vier Jahren auf dem Gebiet der normenbasierten Usability von Medizingeräten aktiv. Medical Safety Design unterstützt Hersteller bei der Durchführung der Prozessabläufe durch Beratungsleistungen und hilft bei der Dokumentation durch speziell entwickelte Templates. Nachfolgend wird ausgeführt, welche Inhalte im Usability Engineering File verbindlich erfasst werden müssen und wie eine effiziente Strukturierung umgesetzt werden kann. 5. Welche Inhalte müssen dokumentiert werden? 5.1. Die Makrostruktur Um einen Überblick über alle Dokumente zu bekommen, die ein Usability

224

Engineering File enthalten muss, hat UID in Zusammenarbeit mit dem Risikomanager Jörg Stockhardt (http://www. consultingandmore.de) die sogenannte „Makrostruktur“ entwickelt. Diese Makrostruktur zeigt alle Dokumente, welche die Normen DIN EN 62366 und DIN EN 60601 1-6 fordern. Darüber hinaus wurden Inhalte ergänzt, die UID aufgrund langjähriger Erfahrung für eine optimale Dokumentation des Usability Engineerings empfiehlt. Sie vereint den klassischen Produktentwicklungsprozess eines Medizinprodukts mit dem Usability-Engineering-Prozess und visualisiert die chronologische Abfolge seiner Dokumentation. Die dargestellten Phasen von „Analysis“ bis „Documentation“ bauen aufeinander auf. Sie beginnen idealerweise bereits, sobald erste konkrete Gestaltungsansätze für ein neues Produkt oder für eine Produktüberarbeitung vorhanden sind. Die Inhalte der Makrostruktur setzen sich aus unterschiedlichen Dokumententypen zusammen, die jeweils verschiedene Funktionen erfüllen. Die Benennung der einzelnen Dokumente entspricht weitestgehend der Benennung innerhalb der zugrundeliegenden Normen. Den Kern des Usability Engineering File bilden Dokumente von der „Application Specification“ bis hin zum „Final Report“. Sie decken alle für das Usability Engineering wichtigen Inhalte der Produktentwicklung ab. Diese Dokumente enthalten diverse Kapitel, beispielsweise „Intended Use“ und „Medical Purpose“. Diese stellen die Dokumentation der geforderten Inhalte der Normen sicher. In den „Usability“-Dokumenten ( [Abb. 1]; „02 Concept“ und „03 Realisation“) wird festgelegt, welche Usability-Methoden für die Verifizierung und Validierung von Nutzeranforderungen eingesetzt werden sollen. Außerdem dokumentieren sie die Ergebnisse dieses Methodeneinsatzes. Jede Phase schließt mit einer Prüfung der Inhalte durch das Risikomanagement ab. Das jeweilige Ergebnis fließt in die nächste Phase ein, wodurch entsprechende nutzerorientierte Maßnahmen im Usability Engineering unternommen

werden können. Somit entsteht eine enge Verzahnung des Usability Engineering File mit dem Risikomanagement; dies mit dem Vorteil, dass Risiken sukzessive minimiert und noch einmal am Nutzer getestet werden können. Die Makrostruktur beinhaltet implizit die iterative Vorgehensweise des Menschzentrierten Gestaltungsprozesses nach DIN EN ISO 9241-210. Die Phasen können chronologisch durchlaufen werden, Anpassungen der Inhalte des UEF aus vorangegangenen Phasen, beispielsweise nach Tests und Interviews durch Nutzer, sind dabei im Rahmen einer kontinuierlichen Konzeptverbesserung aber durchaus die Regel. 5.2. Die „Analysis“-Phase Die erste Phase der Makrostruktur („Analysis“) enthält grundlegende Dokumente, welche die Ergebnisse der Analyse von relevanten Nutzergruppen, dem Nutzungskontext und des bestehenden Marktes dokumentieren. Zudem halten sie einen ersten Satz von Anforderungen an das Produkt und dessen Hauptbedienfunktionen fest. Die beiden darin enthaltenen Dokumente „Application Specification“ und „Primary Operating Functions“ bilden die Ausgangsbasis für alle nachfolgenden Dokumente sowie Aktivitäten für diese und die nachfolgenden Phasen. Die „Application Specification“ definiert die Nutzergruppen des zu entwickelnden Medizinprodukts sowie dessen Nutzungskontext. Dazu wird ein „vorgesehenes Benutzer-Profil“ angelegt und die „vorgesehenen Gebrauchsbedingungen“ beschrieben. Diese spezifizieren die hygienischen Vorrausetzungen der Nutzung, die vorgesehene Häufigkeit des Gebrauchs, Orte der Nutzung sowie Angaben über die Mobilität des Medizingeräts. Während diese Angaben noch zum allgemeinen Grundumfang der Dokumentation in der Analysephase innerhalb eines UsabilityEngineering-Prozesses gehören, geht die Application Specification noch deutlich darüber hinaus: Die medizinische Indikation (was mit dem Medizingerät behandelt


Usability Professionals 2011 Werkzeuge

wird), die Patienten-Gruppe und für die Interaktion vorgesehene Körperteile oder Gewebetypen werden beschrieben. Ein weiterer wichtiger Bestandteil ist die medizinische Zweckbestimmung („Intended Use“). Sie macht Angaben darüber, für welche Zwecke das Medizinprodukt eingesetzt werden soll. Besonders bei Produkten im Home-Care-Bereich spielen diese Angaben eine wesentliche Rolle, da hier Patient und Nutzer ein und dieselbe Person bzw. medizinische Laienanwender (Angehörige) sein können. Das zweite Dokument in dieser Phase sind die „Primary Operating Functions“. In ihnen werden häufig genutzte oder sicherheitsrelevante Funktionen aufgelistet und beschrieben. Dahinter verbirgt sich, dass von diesen Funktionen das höchste Gefährdungspotenzial durch Benutzungsfehler ausgehen kann. Aus diesem Grund werden die „Primary Operating Functions“ während des gesamten UsabilityEngineering-Prozesses immer wieder herangezogen: Sie dienen zum Aufbau von Nutzungsszenarien und Anforderungen, können die Grundlage für eine Informationsarchitektur bilden und müssen später mit realen Nutzern getestet (validiert) werden. Die Erfahrung zeigt, dass sie sich auch für die Grundstruktur einer später zu erstellenden Gebrauchsanweisung eignen. Bereits in dieser frühen Phase des Usability-Engineering-Prozesses können Hersteller durch die Inhalte der Dokumente vorhersehbare Gefährdungen im Zusammenhang mit der Usability des Produkts identifizieren. Die erste Phase schließt daher mit einer Sichtung der Dokumente durch das Risiko Management ab. Ein Risikomanager bewertet die identifizierten Risiken und beschließt im Anschluss Maßnahmen zur Risikominimierung. Diese Maßnahmen werden als Anforderungen in die darauffolgende Phase übernommen.

Abb. 1. Die Makrostruktur von Medical Safety Design

5.3. Die „Concept“-Phase Die Phase „Concept“ definiert das Produktkonzept anhand von Nutzungsszenarien und Anforderungen. Beide werden

225


im Dokument „Usability Specification“ festgehalten. Eine Besonderheit der Nutzungsszenarien ist hierbei, dass auch sogenannte „Worst-Case-Szenarien“ betrachtet werden. Die Projektbeteiligten müssen sich also fragen: „Was ist das Schlimmste, was bei der Anwendung dieses Produktes in einem bestimmten Nutzungsszenario durch die definierte Nutzergruppe passieren könnte?“ Worst-Case-Szenarien lassen sich aus den in der vorherigen Phase definierten Risiken ableiten. Auch sie dienen also der Verbildlichung von Vorgängen bei der Nutzung und ermöglichen die Generierung weiterer funktionaler wie nicht-funktionaler Anforderungen an das Produkt – nur eben aus einer für das ‚klassische‘, eher positivistische Usability Engineering („Was ist das Beste, das wir hier für den Nutzer erreichen können?“) ungewohnten Perspektive. Aus den Nutzungsszenarien abgeleitete Anforderungen beziehen sich direkt auf die Nutzer und deren Aufgaben, sowie auf den Nutzungskontext. Der aufgestellte Satz an Anforderungen sollte in dieser Phase immer wieder anhand verschiedener Methoden wie zum Beispiel Experten Reviews, Fokusgruppen oder auch Usability Tests verifiziert oder auch falsifiziert bzw. ergänzt werden. Die Planung – aber auch die Ergebnisse dieser Verifizierungen – werden im Dokument „Usability Verification“ festgehalten. Sollten sich dabei Anforderungen ändern oder neue hinzu kommen, werden diese in der Usability Specification angepasst. Somit kommt der “Concept“-Phase (und hier insbesondere dem Dokument Usability Specification) eine zentrale Rolle im Usability-Engineering-Prozess zu. Erfahrungsgemäß ist es das Dokument, das die meisten Änderungen und Anpassungen erfährt. Bereits in dieser Phase sollte der „Usability-Validation-Plan“ entstehen. Die Usability-Validierung überprüft die Zweckbestimmung des entwickelten Medizingerätes mit repräsentativen Nutzern und mit Hilfe der Hauptbedienfunktionen. Dieser bereits finale Nutzertest wird geplant und seine Planung im Usability-Validation-Plan

226

dokumentiert. Auf diese Weise kann die Prüfstelle die Validierungsplanung bereits vor Durchführung bestätigen, so dass im schlimmsten Fall die Planung nicht nachträglich als unzureichend abgelehnt wird. Der Usability-Validation-Plan enthält Angaben zur Testmethode, den zu rekrutierenden Teilnehmern sowie zum Testablauf und den zu überprüfenden Akzeptanzkriterien. Mit diesen Akzeptanzkriterien definiert der Hersteller, unter welchen Bedingungen eine Validierung als erfolgreich gelten kann – beziehungsweise wann das Medizinprodukt sie nicht bestanden hat. Ein Akzeptanzkriterium für ein Fieberthermometer könnte beispielsweise sein, dass 80% aller Teilnehmer eine erhöhte Körpertemperatur richtig ablesen können müssen. Akzeptanzkriterien können an nahezu jede Anforderung geknüpft werden. In der Praxis empfiehlt es sich aber rein aus quantitativen Gründen schon, dies nur für sicherheitsrelevante Anforderungen bzw. potenzielle Gefährdungen zu tun. Die Definition der minimal zu erreichenden Grenze des Akzeptanzkriteriums in Prozent liegt allein beim Hersteller. Sie sollte allerdings in Relation zur Wahrscheinlichkeit des Auftretens und zum Schweregrad der Verletzung bei Eintreten des zugrunde liegenden Risikos stehen. 5.4. Die „Realisation“-Phase Die “Realisation“-Phase setzt die Erkenntnisse aus der “Concept“-Phase um und stößt die Realisierung des Medizinproduktes als Vorserienmodell an – also als vollfunktionaler Prototyp, der grundsätzlich bereits für den Markt produziert werden könnte. Diese Umsetzung geschieht mit Hilfe verschiedener Spezifikationen, welche die Konzeptlösungen aus den Anforderungen der Usability Specification (siehe 1.5.3) dokumentieren. Dies können zum Beispiel interaktionsbezogene Lösungen sein („Functional Specification“) oder auch Lösungen, welche die visuelle Umsetzung betreffen („Design Specification“). Auch die sogenannten Begleitdokumente, wie die Gebrauchsanweisung oder Trainings- und Montageanleitungen, sollen in dieser Phase weitestgehend fertiggestellt

und deren Vorhandensein dokumentiert werden. Die wichtigste Tätigkeit ist die „Usability Validation“. Auch deren Ergebnisse sollen im gleichnamigen Dokument dokumentiert werden. Anhand der zuvor definierten Akzeptanzkriterien (siehe 1.5.3) prüft sie mittels der Primary Operating Functions, ob das entwickelte Medizingerät seiner Zweckbestimmung (Intended Use) entspricht. Diese Überprüfung muss zwingend mit repräsentativen Nutzern geschehen, weshalb sich ein Usability Test als Methode der Wahl gelten muss. Für Hersteller, die in den vorangegangen Verifikation noch nie Nutzer befragt oder die Konzepte durch sie validiert haben lassen, kann die Usability Validation zur Zitterpartie werden, da hinreichende Erkenntnisse über die Nutzerzentrierung fehlen. Mitunter muss dann das Medizingerät noch einmal überarbeitet und neu validiert werden. Eine Besonderheit gegenüber ‚klassischen‘ Usability Tests mit Nutzern ist, dass zwingend auch die Gebrauchsanweisung zusammen mit dem Medizingerät validiert wird. Dies kann je nach Komplexität des Geräts in einem ganzheitlichen Usability Test geschehen, oder auch in mehreren Teiltests. Das Gerät muss jedoch immer in seiner Gesamtheit untersucht werden (summativer Test), Ergebnisse von Teiltests müssen also integriert werden. 5.5. Die „Clinical Study“-Phase In der vierten Phase „Clinical Study“ wird das Medizinprodukt einer klinischen Studie unterzogen. Die Studie wird mit Patienten oder gesunden Probanden durchgeführt, um Medikamente, bestimmte Behandlungsformen oder medizinische Interventionen auf ihre Wirksamkeit und Sicherheit zu überprüfen. Dies soll die medizinische Behandlung zukünftiger Patienten verbessern. Die Ergebnisse einer solchen Studie werden auf relevante Befunde hinsichtlich ihrer Usability und des Risikos analysiert und gegebenenfalls in das Usability Engineering File integriert. Werden in der “Clinical Study“-Phase noch UsabilityProbleme festgestellt, so werden diese bis in die jeweilige Phase zurück verfolgt. Dort


Usability Professionals 2011 Werkzeuge

werden Spezifikationen oder gegebenenfalls auch Anforderungen verändert, um die Usability nachhaltig zu verbessern. 5.6. Die „Documentation“-Phase In der abschließenden „Documentation“Phase werden verschiedene Reports aus den Bereichen Design, Usability und Risikomanagement erstellt und in das Usability Engineering File integriert. Das File umfasst am Ende also alle notwendigen Dokumente für den Nachweis der Durchführung eines Usability-EngineeringProzess. Es beschreibt auch die Ergebnisse von durchgeführten Evaluationen sowie ergriffene Maßnahmen zur Optimierung. 6. Durchführung der Dokumentation und Usability Engineering File Plan Die Mindestanforderung der Normen hinsichtlich der Dokumentation besteht in einer Struktur, aus der heraus auf sämtliche Dokumente des Entwicklungsprojektes verwiesen wird. Für die Prüfstelle erschwert dies jedoch die Arbeit und verlängert unnötig und ganz entgegen der Interessen des Medizinproduktherstellers das Zulassungsverfahren. Deshalb dokumentiert UID ein Usability Engineering File immer als in sich geschlossene Dokumentenstruktur mit ausformulierten Inhalten. Verweise werden nur innerhalb des Usability Engineering File selber eingesetzt. Lediglich bei zu umfangreichen Inhalten des Originaldokuments oder im Fall von sich sehr häufig ändernden Anforderungen wird auch auf losgelöste Dokumente verwiesen. Ein wesentlicher Punkt für die Prüfstelle ist ein roter Faden im File der aufzeigt, wie die Usability während der Entwicklung des Medizinprodukts sichergestellt und verbessert wurde. Deshalb müssen alle Entwicklungsstände und Entscheidungen so dokumentiert werden, dass eine chronologische Reihenfolge erkennbar ist. Zweckmäßig sind hierfür beispielsweise Tabellen, welche die konstruktiven oder gestalterischen Entscheidungen gesamtheitlich auflisten.

Vor Beginn der eigentlichen Dokumentation sollten sich Hersteller darüber im Klaren sein, welche Dokumente minimal entstehen müssen und welche verfügbaren oder noch entstehenden Dokumente des Projektes die Inhalte für diese liefern können. Genau das leistet der sogenannte „Usability Engineering File Plan“. Er bietet eine Übersicht darüber, welche Dokumente das Usability Engineering File umfasst und von welchen Inhalten der Projektdokumentation diese Dokumente gespeist werden können. Er ermöglicht später einen schnellen Einstieg in das Usability Engineering File sowohl für projektfremde Mitarbeiter im Unternehmen als auch für die der Prüfstelle.

benutzerfreundlicher, vor allem aber auch sicherer zu gestalten. Literatur 1. Buhr, D. (2010). Design in der Medizintechnik: Produktgestaltung zum Wohle aller. In: Deutsches Ärzteblatt. 107(45): [16]. 2. DIN EN ISO 14971 (2009). Medizinprodukte – Anwendung des Risikomanagements auf Medizinprodukte (ISO 14971:2007, korrigierte Fassung 2007-10-01); Deutsche Fassung EN ISO 14971:2009 Berlin: Beuth Verlag. 3. DIN EN 60601 1-6 (2007). Medizinische elektrische Geräte – Teil 1-6: Allgemeine Festlegungen für die Sicherheit einschließlich der wesentlichen

Wie bei der Dokumentation der Medizinprodukte-Entwicklung ohnehin üblich, sollten auch die Dokumente des Usability Engineering File mehrere Prüfschleifen innerhalb des Projekts durchlaufen. Idealerweise sollten sich die Prüfer multidisziplinär zusammen setzen, beispielsweise aus Design, Ergonomie sowie technischer und genereller Projektleitung. Somit findet zum einen eine Qualitätssicherung der Inhalte statt, zum anderen werden Projektteilnehmer für das Thema Usability sensibilisiert.

Leistungsmerkmale – Ergänzungsnorm: Gebrauchstauglichkeit (IEC 60601-1-6:2006); Deutsche Fassung EN 60601-1-6:2007. Berlin: Beuth Verlag. 4. DIN EN 62366 (2008). Medical devices – Application of usability engineering to medical devices (IEC 62366:2007); German version EN 62366:2008. Berlin: Beuth Verlag. 5. DIN EN ISO 9241-210 (2010). Ergonomie der Mensch-System-Interaktion – Teil 210: Prozess zur Gestaltung gebrauchstauglicher interaktiver Systeme (ISO 9241-210:2010); Deutsche Fassung EN ISO 9241-210:2010.

7. Fazit

Berlin: Beuth Verlag. 6. Leitgeber, N. (2009). Sicherheit von Medizingeräten: Recht – Risiko – Chancen.

Das Führen des Usability Engineering File ist verbindlicher Bestandteil der Produktentwicklung von medizintechnischen Geräten. Es sollte aber nicht als bloße technische Dokumentation missverstanden werden. Hersteller sollten es vielmehr als Chance nutzen, ihre Medizinprodukte optimal an die Bedürfnisse ihrer Nutzer anzupassen. Denn nur wenn die Nutzer der Produkte und ihre Bedürfnisse (wie gegebenenfalls Behinderungen) genau erkannt und dokumentiert werden, können potenziell auftretende Gefährdungen festgestellt und entsprechend vermieden beziehungsweise auf ein Mindestmaß reduziert werden. Während das Usability Engineering File für den Usability-Dienstleister ein profitabler und anspruchsvoller Business Case sein kann, ist für den Hersteller eines Medizinprodukts damit ein effizienter Prozess verbunden, um das eigene Produkt

Wien/New York: Springer. 7. Matern, U., Koneczny, S., Scherrer, M. & Gerlings, T. (2006). Arbeitsbedingungen und Sicherheit am Arbeitsplatz OP. In: Deutsches Ärzteblatt Jg. 103, Heft 47, 24. Neale, G., Woloshynowych, M. & Vincent, C. (2001). Exploring the causes of adverse events in NHS hospital practice. J R Soc Med, 94, S. 322-330. 8. Ollenschläger, G. (2001). Evidenzbasierte Leitlinien – Risiken und Chancen Beitrag für Tagungsband XIII. Kölner Symposium der AG Rechtsanwälte im Medizinrecht. In: Arbeitsgemeinschaft für Rechtsanwälte im Medizinrecht (Hrsg.). Leitlinien, Richtlinien und Gesetz. Wieviel Reglementierung verträgt das Arzt-Patienten-Verhältnis? Berlin: Springer.

227


142

HTML5 – ein „NochnichtStandard“ erorbert die mobile Welt Sascha Meier Creative Director, ARITHNEA GmbH Prof.-Messerschmitt-Straße 1 85579 Neubiberg bei München Sascha.meier@arithnea.de

Abstract Das sich rasant verändernde Web führt heute dazu, dass man mit der Entwicklung einheitlicher Standards, die neuen Nutzeranforderungen Sorge tragen, nicht mehr hinterherkommt.

Als das Web in den 90igern zur allgemeinen Nutzung freigegeben wurde, dachte sicher niemand, dass nur zwei Dekaden später multimediale Feuerwerke und überschäumende soziale Netzwerke in den Nutzerfokus drängen. Bemerkenswert ist der permanente Änderungsprozess, dem das Web unterworfen ist. Seit ein paar Jahren strömen nun mobile Endgeräte wie Smartphones und Tablets ins Web und verändern dieses signifikant. Ausgerüstet mit Kamera, GPS, WLAN und 3G, kann der Nutzer von überall aus auf das Web zugreifen. Ein multitouchsensitiver Bildschirm nimmt Nutzer-Gesten entgegen, eine ausgeklügelte Sensorik misst Erschütterungen, Richtungswechsel, Neigungswinkel. Sogar Kamerabilder und Standortbestimmungen fließen in die Bedienung ein. Die Nutzer solcher Geräte haben andere Anforderungen an mobile Websites als jene Pioniere, die vor wenigen Jahren mit ersten Farbdisplays WAPSeiten zu Informationszwecken besuchten. Heute sind Unterhaltung und Interaktion entscheidend. Der Nutzer als Individuum versteht sich als Teil der Web-Community – er will mitbestimmen, kommentieren, bewerten und eigene Inhalte mit Freunden teilen. Die Bedürfnisse der Nutzer verändern sich also rasant. Wer vor dieser bedeutenden Zielgruppe bestehen will, muss seine mobile Präsenz fortwährend an ihre Bedürfnisse anpassen.

228

Heute gelten Hypertextdokumente als Relikt der alten Tage und Flash geriet mangels mobiler Unterstützung ins Hintertreffen. Hipp sind Multitouch-Apps – so bietet Apples Appstore mehr als 350.000 Programme für alle erdenklichen Anwendungsfälle. In Kürze wird die Marke von einer halben Million überschritten sein und damit das Finden von Apps noch schwieriger. Bewertungen werden so immer wichtiger um im App-Dschungel relevante Apps zu finden. Denn Relevanz wird bei dem begrenzten Platz des Homescreens der Schlüssel erfolgreicher Apps. Der Smartphone-Markt macht die Entwicklung nativer Apps indes sehr teuer, da sie oft für mehrere Plattformen entwickelt werden. In den kommenden 4 Jahren wird vom IDC eine Verschiebung der Marktanteile vorausgesagt: demnach würden 2015 neben iOS (15,3%) und Android (45,4%) auch Windows Phone (20,9%) und Blackberrey (13,7%) relevante App-Plattformen. HTML5 erscheint hier der Ausweg, da es im Grunde alle Nutzeranforderungen erfüllt – aber plattformunabhängig ist. HTML5 baut auf etablierten WebStandards auf und bündelt mit seinem erweiterten Sprachschatz neue Technologien wie hardwarebeschleunigtes Abspielen von Filmen, komplexe Animationen – selbst an lokale Datenbanken wurde gedacht. Mittels progressive Enhancement kann HTML5 in Verbindung mit CSS3 gar unterschiedliche Endgeräte bedienen. Und das mit einem einheitlichen Markup. Im Stylesheet werden gezielt Darstellungsvarianten für ganze Auflösungskorridore und

Keywords: /// HTML5 /// Standard /// W3C /// User Experience /// Semantik /// Multimedia

damit unterschiedlicher Endgeräte hinterlegt. Liegt die Zukunft mobiler Apps und Websites also möglicherweise in HTML5? Wäre da nur nicht das W3C-Konsortium, was sich mit der Finalisierung von HTML5 unendlich Zeit zu lassen scheint. So wird aus einer guten Idee eines Standards eine freie Interpretation eines möglichen Standards. Heute bildet ein Arbeitsstand die Grundlage für unterschiedlichste proprietäre Lösungsansätze der marktbestimmenden Browser. Jeder Browser verhält sich dabei anders und nutzt teilweise sogar eigene Syntax. Das ist nicht Standard, das ist Chaos. Und der Nutzer? Ihm ist die Technologie vollkommen egal. Für ihn zählen Nutzen und User Experience und diese müssen sowohl bei nativen, wie hybriden Apps gegeben sein. Literatur 1. FRAMINGHAM, Mass (29.3.2011): IDC Forecasts Worldwide Smartphone Market to Grow by Nearly 50% in 2011 http://www.idc. com/getdoc.jsp?containerId=prUS22762811. Andy Budd (21.3.2011): Beyond the Mobile Gold Rush- http://www.iakonferenz.org/ sessions/31. Brad Cooper (12.4. 2010): The Gradual Disappearance Of Flash Websites http:// www.smashingmagazine.com/2010/04/12/ the-gradual-disappearance-of-flash-websites/


Usability Professionals 2011 Werkzeuge

229


123

Effizientes Prototyping mit der Software ANTETYPE Erstellung von interaktiven Hi-Fi Prototypen mit dynamischem Layout und wiederverwertbaren User Interface Widgets Tim Klauck ERGOSIGN GmbH Europa-Allee 12, 66113 Saarbrücken klauck@ergosign.de

Abstract Der Beitrag gibt anhand eines konkreten Beispiels einen Überblick über die Funktionen der Software ANTETYPE (www.antetype.com). Es werden die wesentlichen Merkmale dieses Tools auch im Vergleich zu anderen Prototyping-Ansätzen erläutert. Dazu gehören unter anderem detailliertes visuelles Design, dynamisches Layout, Wiederverwertbarkeit von User Interface Widgets und eine umfangreiche Widget Library mit verschiedenen Look and Feels in unterschiedlichen visuellen Detailgraden (Wireframe, Windows 7, iOS, Android, Mac OS X). ANTETYPE läuft zur Zeit ausschließlich unter Mac OS X. Zur einfachen Verteilung gibt es die Möglichkeit, die Prototypen in vollem Funktionsumfang zu exportieren und in einem Web-Browser zu betrachten. Außerdem wird die Möglichkeit erläutert, die mit ANTETYPE erstellten Dateien auf einem iPad anzuschauen.

1. Allgemeines Die Entwicklung der Software ANTETYPE begründet sich durch das Fehlen passender Tools zur Erstellung detailreicher und interaktiver Prototypen. Die ERGOSIGN GmbH, einer der führenden europäischen Anbieter für User Interface Dienstleitungen, hat sich aus diesem Grund entschlossen, eine Software zu entwickeln, die diese Lücke schließt und Produktivitätsvorteile gegenüber den bestehenden Lösungen bietet.

Die Entwicklung der Software wurde vom Europäischen Fonds für regionale Entwicklung und dem Ministerium für Wirtschaft und Wissenschaft des Saarlandes gefördert. Im Folgenden werden die Funktionen der Software erläutert und anhand konkreter Beispiele verdeutlicht.

Keywords: /// Prototyping /// User Interface Design /// Interaktiver Prototyp /// iPad Viewer

2. Widget Library ANTETYPE wird mit einer umfassenden Widget Library ausgeliefert. Widgets sind Standard-GUI-Kontrollelemente wie z. B. Buttons, Checkboxes, Drop Down-Menüs oder Scroll Bars. Die Widget Library

ANTETYPE liegt nach dreijähriger Entwicklungszeit und einem über sechs Monate angelegten Beta-Test mit etwa zweitausend Testern seit Anfang 2011 in Version 1.0 vor. Die Software wurde seither (bis Mai 2011) etwa zweitausend Mal heruntergeladen und wird von internationalen Firmen wie z. B. den Pixar Animation Studios und Universitäten verwendet. Regelmäßige Updates und zukünftige Versionen von ANTETYPE sollen die Produktivität und Kreativität der Designer durch neue Features weiter fördern und so die Alleinstellungsmerkmale von ANTETYPE weiter ausbauen.

Abb. 1. Widget Library – iOS Look and Feel

230


Usability Professionals 2011 Werkzeuge

beinhaltet aber auch spezielle Elemente, die nur auf bestimmten Plattformen verfügbar sind, wie z. B. einen iOS Switch oder Date Picker. ANTETYPE bietet die Möglichkeit, Widgets für unterschiedliche Look and Feels hinsichtlich der visuellen Ausprägung und des Layouts anzupassen und dauerhaft zu speichern. Die Widget Library umfasst standardmäßig sechs moderne Look and Feels und mehr als 50 Widgets. Alle Widgets sind an die unterschiedlichen Look and Feels angepasst und können sofort verwendet werden. [Abb. 1] Look and Feels in ANTETYPE: –– Android –– ANTETYPE –– iOS –– Mac OS X –– Windows 7 –– Wireframe 2.1. Anpassen vorhandener und Erstellung eigener Custom Widgets Um ein hohes Maß an Wiederverwertbarkeit zu gewährleisten, bietet ANTETYPE die Möglichkeit, vorhandene Widgets anzupassen und eigene zu erstellen. StandardWidgets können auch dupliziert und dann angepasst werden. Dies ist sinnvoll, da die Standard Widgets bei Programm-Updates verändert und somit eigene Veränderungen verloren gehen können, wenn eine neue Version des Standard-Widgets vorliegt. Da alle Widgets aus einfachen Elementen wie Rechtecken, Dreiecken, Kreisen und Tabellen zusammengebaut werden, ist es möglich, jede Eigenschaft zu modifizieren und dann zu speichern. Somit können auch komplett neue Custom Widgets erstellt und dauerhaft in der Widget Library gespeichert werden. Das Widget System erkennt automatisch, wenn Änderungen an einem Widget vorgenommen werden und zeigt dies dem Benutzer an. Der Benutzer kann dann die Änderung für das Widget speichern und somit alle anderen Instanzen des Widgets aktualisieren. Außerdem werden die

Abb. 2. Der rote Punkt zeigt an, ob sich eine Einstellung geändert hat. Klickt man den Punkt, öffnet sich ein Menü, über das man die Änderungen permanent im Widget speichern oder rückgängig machen kann.

Abb. 3. Verschiedene States eines Buttons im Windows 7 Look and Feel

Änderungen in der Widget Library gespeichert, sodass auch zukünftige Instanzen die Änderungen aufweisen. [Abb. 2]

schachteln. Das Layout-System bietet die Möglichkeit, Elemente aktiv oder passiv anzuordnen.

Die Änderungen und neuen Widgets können auch dateiübergreifend verfügbar gemacht werden: Somit ist es möglich, verschiedene Dateien mit nur wenigen Klicks auf den aktuellen Stand zu bringen.

3.1. Aktives Layout

2.2. States Widgets können in beliebig vielen States vorliegen. Als Default sind die States Normal, Mouse Over, Pressed und Disabled vorhanden. Der Benutzer kann eigene States hinzufügen. Alle visuellen und layouttechnischen Einstellungen sind zwischen den States unabhängig, können frei definiert und im Widget gespeichert werden. [Abb. 3] 3. Layout Im Gegensatz zu den meisten anderen Prototyping- und Design-Tools hat ANTETYPE ein sehr flexibles Layout-System, mit dem komplexe Layouts umgesetzt werden können. Weiterhin ist es möglich, einen Prototypen in verschiedenen Auflösungen zu testen und das Verhalten bei Vergrößerung oder Verkleinerung des gesamten Screens oder bestimmter Elemente auf dem Screen zu simulieren. Hierzu stehen dem Benutzer zahlreiche Layout-Funktionen zur Verfügung. Um das Layout effizient zu nutzen, ist es notwendig, Elemente zu

Bei dieser Methode werden Elemente unabhängig von anderen Elementen und Layout Constraints angeordnet. Der Benutzer kann ein Element in den Ecken oder Seiten des Screens oder Parent Containers anordnen. 3.2. Passives Layout Hierbei definiert der Parent Container, wie sich die geschachtelten Elemente verhalten. Die Layoutmethoden sind: –– Free: Die Elemente können frei im Container positioniert werden. –– Stacked: Die Elemente werden übereinander angeordnet. –– Horizontal Flow: Die Elemente werden nebeneinander angeordnet. –– Vertical Flow: Die Elemente werden untereinander angeordnet. Innerhalb dieser Layouts, außer beim Free Layout, kann definiert werden, an welcher Position des Parent Containers die Elemente ausgerichtet werden. Je nach Methode stehen die Kombinationen aus oben/mittig/unten und links/zentriert/ rechts zur Verfügung. Diese Layoutmethoden stehen auch für Tabellenzellen zur Verfügung.

231


3.3. Automatische Größenanpassung Elemente können entweder manuell vergrößert oder verkleinert oder automatisch an die Größe ihres Inhalts oder an die Größe des Parent Containers angepasst werden. Hierfür stehen die Funktionen Stretch und Shrink zur Verfügung. 3.4. Margin und Padding Abstände zwischen Elementen können über Margin oder Padding definiert werden. Margin ist hierbei der Abstand eines Elements nach außen, zu Elementen auf gleicher Ebene und Padding nach innen, also zu den geschachtelten Elementen. Margin und Padding kann für jede Seite separat definiert werden. 4. Interaktion

Abb. 4. Prototyp im Web Viewer

Zur Simulation von Interaktionen stehen Actions zur Verfügung, die bei Events auf einzelnen Elementen im Presentation Mode ausgelöst werden. Als Events können definiert werden: –– Mouse Enter –– Mouse Out –– Mouse Down –– Mouse Up –– Mouse Click –– Rotate (nur für die iOS App) Für jedes Event stehen folgende Actions zur Verfügung: –– Show: Ausgeblendete Elemente werden eingeblendet. –– Collapse: Eingeblendete Elemente werden ausgeblendet. –– Change State: Der State eines Elements kann geändert werden. –– Toggle State: Bietet die Möglichkeit, zwischen zwei States zu wechseln. –– Goto Screen: Wechselt auf einen anderen Screen.

Abb. 5. Prototyp auf dem iPad

4.1. Presentation Mode Der Presentation Mode kann direkt aus dem Programm gestartet werden. Die

232

definierten Actions werden in diesem Modus ausgeführt. Zusätzlich werden bestimmte Default States automatisch ausgeführt. Wenn z. B. ein Mouse Over State definiert ist, wird dieser im Presentation


Usability Professionals 2011 Werkzeuge

Mode automatisch ausgeführt, wenn die Maus über ein Widget bewegt wird. Bei Mouse Out wechselt das Widget wieder in den Normal State. 5. Visual Design Zur Erstellung von Hi-Fi Prototypen ist es wichtig, detaillierte Einstellungen vornehmen zu können. In ANTETYPE stehen folgende Funktionen für alle Elemente und Texte zur Verfügung: –– Color –– Gradient –– Picture: Bilder können als Hintergrund eines Elementes in Originalgröße, skaliert oder wiederholt dargestellt werden. Zusätzlich kann die Position innerhalb eines Containers festgelegt werden. –– Shadow –– Border Width/Color: Kann für jede Seite separat definiert werden. –– Rounded Corners: Kann für jede Ecke separat definiert werden. –– Font, Font Color –– Rich Text Options (Underline, Line Spacing, etc) –– Text Shadow

Abb. 6. Landscape-Ansicht

6. Web und iOS Viewer ANTETYPE bietet die Möglichkeit, Projekte zu exportieren und dann in einem Browser oder auf einem iPhone oder iPad zu betrachten. Zur Zeit werden die aktuellen Versionen der Browser Apple Safari, Google Chrome und Mozilla Firefox unterstützt. Zu beachten ist, dass sowohl alle visuellen und Layout Features, also auch Interaktionen, unterstützt werden. [Abb. 4] Für iOS Geräte steht eine native App zur Verfügung, die über den App Store verfügbar gemacht wird. Die Dateien können über iTunes synchronisiert werden. Auch der iOS Viewer bietet den gesamten Funktionsumfang. [Abb. 5]

Abb. 7. Mail Portrait

7. Beispiel: iPad Mail App In dem Beispiel wurde die iPad MailAnwendung prototypisch in ANTETYPE nach-gebaut. Hierfür kamen sowohl vordefinierte als auch Custom Widgets zum Einsatz. Das Layout wurde dynamisch angelegt, sodass eine einfache Anpassung an unterschiedliche Screen-Ausrichtungen möglich ist.

Die Beispieldatei kann zusammen mit der ANTETYPE Testversion des Programms unter www.antetype.com heruntergeladen werden. [Abb. 6] [Abb. 7] 7.1. Layout Das Layout besteht aus mehreren geschachtelten Ebenen. Aus der folgenden Abbildung werden die grundsätzlichen Layout Regeln ersichtlich:

233


Abb. 8. Layout-Regeln

–– Title Bar und Content Cell sind in einem Vertical Flow Layout Container, wobei die Breite bei beiden Elementen als Flex definiert ist. Dieser Container passt sich automatisch an die Screengröße von 1024 x 768 Pixeln an. Höhe und Breite sind flexibel. –– Die Title Bar hat eine manuelle Höhe, wobei die Höhe der Content Cell sich an den vorhandenen Platz anpasst. –– Die Content Cell beinhaltet die Message List und die Mail View, die wegen des Horizontal Flow Layouts nebeneinander angeordnet sind. –– In der Message List werden Toolbar, Search Field und die Listeneinträge untereinander angeordnet (Vertical Flow). [Abb. 8] 7.2. Widgets Die meisten benötigten Widgets sind bereits in der Standard Widget Library enthalten und können sofort verwendet werden. Hierzu zählen Toolbar, Fly Out, Token, Button, Navigation Button, etc. Ein Beispiel für ein Custom Widget sind die Listeneinträge. [Abb. 9] Das Widget hat verschiedene States, die in der Abbildung dargestellt sind. Die States können einfach per Klick über den Inspektor zugewiesen werden. Danach

234

Abb. 9. Listeneinträge

können die Texte geändert werden, um einen möglichst realistischen Eindruck zu vermitteln. 7.3. Interaktion In der Beispieldatei sind verschiedene Aktionen definiert, um das Verhalten der Applikation zu simulieren. Ein Klick auf die Message-Einträge zeigt die unterschiedlichen Mails im Mail View Bereich an. Außerdem wird jeweils der State der Listeneinträge verändert. Klickt man auf die Telefonnummer in der E-Mail-Signatur, wird ein Optionsmenü eingeblendet. [Abb. 10] In der Portraitansicht kann man über den Inbox-Button in der Toolbar das Fly Out mit den Listeneinträgen öffnen. 8. Fazit ANTETYPE bietet UI Designern ein umfassendes Feature-Set zur Erstellung interaktiver Prototypen. Hervorzuheben sind vor allem die Gestaltung und Bearbeitung von Look and Feels und Widgets und die Möglichkeit, Änderungen innerhalb von Projekten und auch projektübergreifend automatisch verfügbar zu machen und dauerhaft zu speichern, sodass alle Projekte immer

Abb. 10. Eingeblendetes Optionsmenü

auf dem aktuellen Stand sind. Die Vielzahl an Layout-Optionen erlaubt eine einfache Anpassung an verschiedene Screen-Größen und Auflösungen und ermöglicht die Simulation des dynamischen Layouts bei Größenänderungen von Elementen. Mit ANTETYPE können sowohl einfache Wireframes als auch Prototypen mit detailliertem Visual Design erstellt werden. Die Übergänge zwischen Lo-Fi und Hi-Fi sind dank des Widget Systems fließend und der Detailgrad kann nach und nach verfeinert werden, ohne immer wieder alle Elemente anzupassen. Mit wenigen Klicks werden statische Screens zu interaktiven Prototypen, die sowohl direkt mit ANTETYPE als auch auf iOS Geräten oder in einem Web-Browser präsentiert werden können. Der UI Designer erhält somit ein Werkzeug, das ihn in allen Phasen des Design Prozesses unterstützt.


Wirtschaft und Wissenschaft

235


148

Von der Wissenschaft in die Wirtschaft Wissenstransfer in Sachen Usability Erfahrungen aus einem dreijährigen BMI-geförderten Usability-Projekt Daniela Kessner Zentrum Mensch-Maschine-Systeme Technische Universität Berlin Franklinstraße 28/29, 10587 Berlin daniela.kessner@tu-berlin.de

Frank Dittrich Professur Arbeitswissenschaft Technische Universität Chemnitz Erfenschlager Str. 73, 09125 Chemnitz frank.dittrich@mb.tu-chemnitz.de

Abstract Beim Thema „User Centered Design“ fallen die Namen der Großkonzerne und in der Regel nicht die von kleinen oder mittelständischen Unternehmen (KMU). Vielen KMU, vor allem in den neuen Bundesländern, sind Inhalte und Potentiale von Usability häufig noch unbekannt. Im Verlauf von drei Jahren unterstützte die Kompetenzinitiative Usability 60 Unternehmen in den neuen Bundesländern und Berlin mit Usability-Dienstleistungen. Der Beitrag möchte das Projekt „Kompetenzinitiative Usability“ vorstellen, die Erfahrungen in der Zusammenarbeit mit KMU auswerten und damit die Diskussion um KMU als Zielgruppe für Usability Professionals anregen.

Nina Bär Professur Allgemeine und Arbeitspsychologie Technische Universität Chemnitz Wilhelm-Raabe-Str. 43, 09120 Chemnitz nina.baer@psychologie.tu-chemnitz.de

Keywords: /// Wissenstransfer /// Kleine und Mittelständische Unternehmen /// Usability-Dienstleistungen /// Erfahrungsbericht /// Usability-Projekte

1. Einleitung

2. Vorhaben

Vor dem Hintergrund eines wachsenden Bewusstseins über die Bedeutung von Usability für technische Produkte entstand die Projektidee zur „Kompetenzinitiative Usability“ (KiU) beim Wettbewerb „Wirtschaft trifft Wissenschaft“ des Bundesministerium für Wirtschaft und Technologie. Fokus der Initiative sind kleine und mittelständische Unternehmen (KMU) in den neuen Bundesländern, also eine Zielgruppe, die sich das wirtschaftliche Potential des Wettbewerbsfaktors Usability bisher noch kaum erschlossen hat. Als mögliche Gründe hierfür wurden Defizite im Know-how sowie Defizite bei personellen und finanziellen Ressourcen angenommen, die von der Kompetenzinitiative in der Zusammenarbeit mit den KMU gezielt adressiert werden sollten.

Der Projektentwurf sah ein Paket aus drei verschiedenen Transfermaßnahmen vor, mit dem die KMU erreicht und für das Thema Usability-Engineering gewonnen werden sollten: Öffentlichkeitsarbeit, Schulungsmaßnahmen und Usability-Dienstleistungen. Die Maßnahmen richteten sich dabei gezielt an Unternehmen, die bisher noch keine Erfahrungen mit UsabilityMethoden haben, für deren Produkte das Thema Usability aber bedeutsam ist.

Mobilität und Kommunikation in Berlin und Brandenburg“ (MOBKOM) und der „Kompetenzinitiative eCOMM“ oder auch den Industrie- und Handelskammern der Bundesländer. In Kooperation mit den Multiplikatoren richtete die Kompetenzinitiative mehrere Großveranstaltungen in Berlin und Chemnitz aus, die jeweils eine gute Nachfrage bei den Unternehmen generierten. Weiterhin war die Kompetenzinitiative regelmäßig auf Messen, wie der Cebit, der Hannover Messe und regionalen Events vertreten, um direkt mit potentiellen Projektpartnern in Kontakt zu treten.

2.1. Öffentlichkeitsarbeit

2.2. Schulungen und Workshops

Zu Beginn der Projektarbeit entstanden neben dem Internet-Auftritt www. kiu-online.de außerdem Präsentationen, Poster und Flyer, die während der gesamten Projektlaufzeit eingesetzt wurden, um die Kompetenzinitiative in der Zielgruppe bekannt zu machen. Das Angebot wurde regelmäßig über die Pressestellen der beiden Universitäten veröffentlicht und vielfältig aufgegriffen. Es gab Beiträge in den Print- und Online-Medien, im Radio und im Fernsehen. Die Kompetenzinitiative suchte und unterhielt Kontakte zu Multiplikatoren wie etwa dem „Verein

In den ersten Monaten der Projektlaufzeit erarbeiteten die Teams der Kompetenzinitiative ein kombiniertes Schulungsprogramm aus Präsenzveranstaltungen und webbasierten Trainings („blended learning“), das eine Einführung in Theorie und Methoden des User Centered Design abbildete und besonders auf kleine Unternehmen zugeschnitten war. Das Schulungsprogramm sollte gleichermaßen Wissensdefizite abbauen und praktische Usability-Kompetenz aufbauen. Durch den Einsatz von E-Learning sollte sichergestellt werden, dass einerseits der zeitliche

Das Projekt startete im Oktober 2008 mit einer Laufzeit von drei Jahren. Mit dem kostenfreien Angebot werden Unternehmen angesprochen, die bisher noch über keine Erfahrungen mit dem Thema verfügen und dabei unterstützt, Methoden des User Centered Design zur Verbesserung der Gebrauchstauglichkeit ihrer Produkte einzusetzen, um ihre Wettbewerbsfähigkeit zu erhöhen.

236


Usability Professionals 2011 Wirtschaft und Wissenschaft

Aufwand so gering wie möglich ist und andererseits die Akzeptanz in den Unternehmen durch zeitliche Flexibilität hoch ist. 2.3. Usability-Dienstleistungen Mit den in den Schulungen vorbereiteten Unternehmen sollten im Anschluss kleine Usability-Projekte, wie etwa eine Expertenevaluation oder ein Nutzertest durchgeführt und so das Vorgehen und die Möglichkeiten einer Usability-Evaluation am konkreten Beispiel erfahrbar gemacht werden. Durch die Zusammenarbeit vor Ort und die direkte Beratung zur Integration von Methoden des Usability Engineerings sollten die Unternehmen dafür gewonnen werden, Maßnahmen zur Verbesserung der Gebrauchstauglichkeit nachhaltig in die Entwicklungsprozesse zu integrieren. In der Anfangsphase des KiU-Projektes entwickelten die beiden Teams ein Modell der Projektarbeit mit den KMU, das die drei Transfermaßnahmen wiederspiegelte: Die Unternehmen werden in einem ersten Schritt durch die Öffentlichkeitsarbeit für das Thema sensibilisiert und als Interessenten für die Teilnahme am Förderprogramm gewonnen. In einem zweiten Schritt werden die teilnehmenden Unternehmen gezielt zum Thema Usability Engineering geschult und in Theorie und Methoden eingeführt. Abschließend erhält jedes teilnehmende Unternehmen die Möglichkeit, ein erstes Usability Projekt mit der Kompetenzinitiative durchzuführen und am praktischen Beispiel zu lernen. Auf diese Weise wollten die Teams der Kompetenzinitiative für die Unternehmen den Einstieg in nutzerzentrierte Entwicklungsmethoden ebnen. 3. Durchführung An den beiden Standorten der TU Berlin sowie der TU Chemnitz wurden ProjektTeams eingerichtet. Das Berliner Team übernahm den nördlichen Einzugsbereich Berlin und Brandenburg, sowie Mecklenburg Vorpommern. Das Chemnitzer Team arbeitete im südlichen Einzugsbereich Sachsen, Thüringen und Sachsen-Anhalt.

Regelmäßige Projekttreffen beider Teams und des wissenschaftlichen Beirats, bestehend aus den am Projekt beteiligten Professor(inn)en, unterstützten den Erfahrungsaustausch und die Ausrichtung des Projektes. Die Nachfrage nach Usability-Beratung in der Zielgruppe begann bereits in der Anfangsphase des Projektes, in der noch Werbematerialien und Schulungsinhalte vorbereitet wurden, was auf Pressemitteilungen zum Preisgewinn im Wettbewerb „Wirtschaft trifft Wissenschaft“ zurückgeführt werden konnte. Die konkrete Nachfrage nach Projekten (und nicht nach Schulungen) verlangte eine gewisse Flexibilisierung des Modells zur Zusammenarbeit mit den KMU, indem Beratungsprojekte auch mit Unternehmen durchgeführt werden sollten, die vorab keine Schulung besucht haben. Im weiteren Verlauf konnte die Kompetenzinitiative Unternehmen der Zielgruppe sehr gut durch die verschiedenen Maßnahmen der Öffentlichkeitsarbeit erreichen. Großveranstaltungen wurden regelmäßig von ca. 70 Unternehmen besucht, auf Messen und Kongressen gab es reges Interesse am Angebot der Kompetenzinitiative. Bereits nach wenigen Monaten Projektlaufzeit führten die Teams eine Warteliste. Das Interesse der Unternehmen zielte allerdings auch im weiteren Verlauf des KiU-Projektes eindeutig auf konkrete Usability-Projekte ab, im Schwerpunkt Expertenreviews oder Nutzer-Tests, die die KMU von der Kompetenzinitiative durchgeführt haben wollten. Eine Nachfrage nach dem Schulungspaket mit blended learning zum Thema Usability bestand hingegen nicht. Angesichts dieser aus damaliger Sicht unerwarteten Nachfragelage ergab sich nun die Notwendigkeit, für die gefragten Kompetenzinitiative-Projekte Rahmenbedingungen zu setzen, die dem Projektauftrag des Mittelgebers so gerecht wie möglich wurden. Die Teams der Kompetenzinitiative vereinbarten einen Projekt-Umfang von fünf Personentagen als kostenloses Angebot für KMU in den neuen Bundesländern und Berlin.

Abb. 1. Standorte der beratenen Unternehmen

4. Ergebnisse In der aktiven Projekt-Phase von Februar 2009 bis Mai 2011 führte die Kompetenzinitiative über 70 Usability-Projekte mit 60 KMU in den neuen Bundesländern und in Berlin durch. Im Folgenden werden die Erfahrungen in der Projektarbeit dargestellt. Auf das Thema Öffentlichkeitsarbeit und Schulungen wird hier nicht weiter eingegangen. Es werden hier die Unternehmen und die mit ihnen durchgeführten Projekte zusammenfassend beschrieben. 4.1. Wer sind die 60 Unternehmen? Standorte der Unternehmen: Wie Abbildung 1 zeigt, führte die Kompetenzinitiative den größten Teil der Beratungsprojekte in Berlin/Brandenburg (zusammen 53%) und Sachsen (43%) durch. Die meisten der beratenen Unternehmen liegen demnach in den benachbarten Regionen der TU Berlin und TU Chemnitz, den beiden Standorten der Kompetenzinitiative. Projekte mit Unternehmen der anderen Bundesländer stellten die Ausnahme dar: so arbeitete die Kompetenzinitiative mit einem Unternehmen in Thüringen, einem in Sachsen-Anhalt und mit keinem in Mecklenburg Vorpommern [Abb. 1] Diese deutliche regional beschränkte Resonanz wurde nicht erwartet, weil die Kompetenzinitiative ihre

237


Abb. 2. Größe der beratenen Unternehmen

Abb. 3. Projektpartner der Kompetenzinitiative sind Hersteller verschiedener Produktgruppen

Abb. 4. Ausgangslage der Unternehmen

Abb. 5. In Anspruch genommene UsabilityVerfahren

238

Öffentlichkeitsarbeit auf alle neuen Bundesländer ausgedehnt hatte. Die räumliche Nähe und die Möglichkeit zu kurzfristigem persönlichen Kontakt spielten offenbar eine unerwartet große Rolle in der Zusammenarbeit mit Multiplikatoren und Unternehmen. Einige Projektpartner deuteten an, dass eine regionale Partnerschaft die Schwelle zu Usability-Maßnahmen verringert. Größe der Unternehmen: KMU lassen sich unterteilen in Kleinstunternehmen mit unter zehn Mitarbeitern, Kleinunternehmen mit zehn bis 49 Mitarbeitern und die Mittelständler mit 50 bis 250 Mitarbeiter (Bundesministerium für Bildung und Forschung, 2009). Laut Statistischem Bundesamt sind 99,3% aller Unternehmen in Deutschland KMU. Mit 81% sind die Kleinstunternehmen die stärkste Gruppe innerhalb der KMU (Deutsches Statistisches Bundesamt, Onlinequelle 2011). Diese Zahlen gelten branchenübergreifend (Statistisches Bundesamt, 2010). Zu erwarten wäre gewesen, dass die Kompetenzinitiative entsprechend der statistischen Gegebenheiten die meisten Projekte mit Kleinstunternehmen durchführt. Wie Abbildung 2 zeigt, waren aber fast die Hälfte (48%) aller Projekt-Partner Kleinunternehmen mit bis zu 49 Mitarbeitern, nur ein knappes Drittel Kleinstunternehmen (32%) mit unter zehn Mitarbeitern, jeder fünfte Projektpartner (20%) gehörte zum Mittelstand. [Abb. 2] Die Gruppe der Klein- und Mittelständischen Unternehmen machen nur 20% aller KMU aus, stellen aber 66% aller Projektpartner der Kompetenzinitiative. Die Erfahrungen aus dem gesamten Projekt sprechen dafür, dass Kleinstunternehmen mit den Kernaufgaben ihres Geschäfts auf Grund der dünnen Personaldecke offenbar ausgelastet sind und für das Thema Usability nur wenig Spielraum haben. Jenseits von zehn Mitarbeitern scheinen Unternehmen sich die Maßnahmen der strukturierten Qualitätssicherung regelmäßiger leisten zu können.

Zielgruppe Die Kompetenzinitiative hat die Branchenadressierung aufgrund regionaler Differenzen der beiden Standorte Berlin und Chemnitz bewusst offen gehalten. Während in Berlin Unternehmen im Bereich Software und Web in großer Zahl angesiedelt sind, ist die Branchenverteilung in Sachsen heterogener. So finden sich hier neben einer kleineren IT-Branche verstärkt Unternehmen der Medizintechnik, des Maschinenbaus und der Automobilzulieferindustrie. Aus diesem Grund sollte jedes Unternehmen Projektpartner der Kompetenzinitiative werden können, das im weitesten Sinne interaktive Produkte herstellt.

Wie Abbildung 3 zeigt, waren erwartungsgemäß die meisten Projektpartner der Kompetenzinitiative Hersteller oder Betreiber von Webseiten und -anwendungen, wie Shops, Communities, Spiele oder Suchmaschinen (68%). Software-Hersteller stellten die zweitstärkste Gruppe (18%). Die Produktpalette reicht hier von Netzwerksicherheit über CRM- und ERP-Systeme bis zu Zeiterfassung. Aber auch Produkte für den Verbraucher waren vertreten, wie etwa Fotobuchsoftware. Hersteller von interaktiver Hardware und anderen Artikeln stellten die kleinste Gruppe (14%). Hierzu gehörten Maschinenbauunternehmen, Hersteller von Poolreiningungsgeräten oder auch Hersteller von Verpackungen. [Abb. 3] Die Hersteller klassischer IT-Produkte machen mit zusammen 86% den größten Anteil aller KiU-Projektpartner aus. Wenn auch offenbleiben muss, ob die Kompetenzinitiative mit ihrer Öffentlichkeitsarbeit andere Branchen genauso gut erreicht hat, darf doch vermutet werden, dass Usability noch immer vorwiegend als Qualitätskriterium computer- oder internetbasierter Produkte verstanden wird, obwohl immer mehr Produkte jenseits der klassischen IT vom Fieberthermometer bis zur Heizungssteuerung interaktive Elemente und Displays besitzen und damit Gegenstand von Usability-Maßnahmen werden können. Der wenn auch kleine Anteil „anderer“ Produkte unterstreicht dennoch, dass wie schon von Sarodnick & Brau (Sarodnick, F.


Usability Professionals 2011 Wirtschaft und Wissenschaft

& Brau, H., 2006) beschrieben, UsabilityVerfahren grundsätzlich in allen Einsatzfeldern Verwendung finden können, wo Interaktionen zwischen Mensch und Maschine stattfinden. 4.2. Ausgangslage der Unternehmen Die Ausgangslage und Motivation der Projektpartner war naturgemäß vielfältig. Bei genauerer Betrachtung zeichnen sich jedoch drei grundsätzliche Ausgangssituationen ab, die sich dem Product Life Cycle zuordnen lassen: Unternehmen mit Produkten im Entwurfsstadium sowie Unternehmen mit neuen oder etablierten Produkten. Abbildung 4 veranschaulicht die verschiedenen Gegenstände der KiU-Projekte. Mit einer Ausnahme handelte es sich beim Projektgegenstand tatsächlich um Produkte. In einem Fall bezog sich die Usability-Beratung auf den Entwicklungsprozess des Unternehmens. [Abb. 4] Etablierte Produkte Mehr als die Hälfte der Unternehmen (62%) waren seit vielen Jahren mit einem etablierten Produkt am Markt, das durch vielfache Marktanpassungen und Funktionserweiterungen ein gewachsenes Ausmaß an Nutzungsproblemen aufwies. Der Bedarf der Unternehmen lag in der Identifizierung von Usability-Schwachstellen für eine gründliche Überarbeitung des User Interfaces unter Usability-Gesichtspunkten. Junge Produkte Ein gutes Viertel (28%) aller Projekte hatte neue Produkte zum Gegenstand. In der Regel handelte es sich um erfolgversprechende Produkte kurz vor oder nach der Markteinführung, die noch spürbare „Kinderkrankheiten“ hinsichtlich der Bedienbarkeit aufwiesen und deren User Interfaces sich offensichtlich noch auf dem Weg von einer guten Idee zu einer guten Lösung befanden. Der Bedarf der Unternehmen bestand darin, so schnell wie möglich Maßnahmen zu ergreifen, um elementare Usability-Schwachstellen zu beheben.

Produkte im Entwurfsstadium Eine kleine Gruppe von Unternehmen (8%) startete ein Projekt mit der Kompetenzinitiative ohne ein bestehendes User Interface. Der Bedarf dieser Projektpartner bestand in der Unterstützung bei der UINeukonzeption, bei der durch Hinzuziehen von Usability-Expertise Fehler von Beginn an ausgeschlossen werden sollten. Einführung von User Centered Design In einem Fall kam ein Unternehmen gezielt auf die Kompetenzinitiative zu, um Beratung bei der Einführung des User Centered Design (UCD) Prozesses in Anspruch zu nehmen. Auch wenn nicht ausgeschlossen werden kann, dass die Usability-Maßnahmen in anderen von der Kompetenzinitiative betreuten Unternehmen letztlich den Einstieg in UCD bedeutet haben, kann dieser explizite Bedarf des Unternehmens als Ausnahme gewertet werden.

Etablierte Produkte machten den größten Anteil in den Usability-Projekten der Kompetenzinitiative aus, was die Annahme im Vorfeld des Projektes bestätigt, in den neuen Bundesländern würden Produkte überwiegend ohne Usability Know How entwickelt. Erfreulich dagegen ist, dass ein knappes Drittel der Unternehmen Usability-Maßnahmen früh im Prozess einsetzte und damit von den Möglichkeiten des User Centered Designs besonders stark profitieren konnte. 4.3. Wie profitierten die Unternehmen? Die gängigste Frage im Erstgespräch könnte so zusammengefasst werden: „Was ist der Usability-Status-Quo meines Produkts - Was muss verbessert werden?“. Abbildung 5 zeigt, mit welchen Verfahren im KiU-Projekt auf diese Fragen Antworten gesucht wurden. Zugrunde liegen dieser Darstellung nur 60 der über 70 durchgeführten KiU-Projekte, nämlich jeweils das Erstprojekt, das ein Unternehmen mit der Kompetenzinitiative durchführte. Etwaige Folgeprojekte werden später beschrieben. Wurde in einem Projekt mehr als ein Verfahren angewandt, geht das Verfahren

in die Darstellung ein, das am stärksten zu den Projektergebnissen beigetragen hat, bzw. das im Zentrum des Projekts stand. [Abb. 5] Expertenreview Das am häufigsten verwendete Verfahren waren expertenbasierte Evaluationen (65%), wie die heuristische Evaluation oder der Cognitive Walkthrough. In einem Sonderfall wurde ein auf Expertenreview gestützter Produktvergleich durchgeführt. Der hohe Anteil von Expertenverfahren ist zum einen darauf zurückzuführen, dass kostenfreie KiU-Projekte maximal fünf Personentage umfassten, und sich Expertenreviews hier eher anboten als Nutzertests. Andererseits deuten auch die Ergebnisse der zu Beginn der Kompetenzinitiative gestarteten Umfrage FUN (Bär, N. und Reich, D., 2011) darauf hin, dass Expertenreviews ein beliebter Einstieg in Usability-Maßnahmen sind. So setzten dieser Umfrage nach 54% der Unternehmen, die überhaupt Usability-Evaluationen durchführten, auf Expertenevaluationen. Nutzertest Immerhin in jedem fünften Projekt (22%) wurden nutzerbasierte Verfahren, wie der klassische Usability-Tests oder aber Nutzerbefragungen eingesetzt. In der Regel wurden Tests im Labor, je nach Fragestellung auch unter Einsatz von Eye- oder Mousetracking-Technologie durchgeführt. Aufgrund der Rahmenbedingungen waren bei Nutzertests Einschränkungen bei der Stichprobengröße und dem Anwendungsbereich nötig. UI-Konzeption In allen Projekten, die die Ermittlung von Usability-Problemen zum Gegenstand hatten, wurden für ausgewählte Optimierungsvorschläge in kleinem Umfang UIKonzeptionen in Form von Mockups erstellt. Allerdings hatte nur jedes zehnte Projekt (11%) die User Interface (Neu-) Konzeption zum Hauptgegenstand. Reine Konzeptionsprojekte stellten somit die große Ausnahme unter den KiU-Projekten dar.

Mit insgesamt 87% stellen die Evaluationsprojekte den weitaus größten Anteil aller

239


KiU-Projekte, von deren konkreten Hinweisen zur Produktoptimierung die Unternehmen nach eigener Aussage auch am stärksten profitieren. Immer wieder zeigten sich Projektpartner erstaunt über die Erkenntnis, dass sich trotz gegenteiligem Empfinden Betriebsblindheit gegenüber Usability-Schwächen des eigenen Produkts einschleicht, und waren dankbar für den professionellen Blick „von außen“. 4.4. Welche Folgen hatten UsabilityProjekte in den Unternehmen? Übergreifend kann gesagt werden, dass die Ergebnisse der Usability-Projekte in den Unternehmen sehr positiv aufgenommen wurden. Sowohl was den Umfang als auch was die Inhalte der Ergebnisse anging, waren die Vertreter der Unternehmen häufig überrascht. Da nicht alle Optimierungsvorschläge schnell und einfach umsetzbar waren, erwarteten die KMU zumeist, mit den OptimierungsVorschlägen aus diesem kleinen Projekt für längere Zeit ausgelastet zu sein. Fortführung von UsabilityMaßnahmen in den KMU Im KiU-Projekt hat es keine kontrollierte Nachuntersuchung gegeben. Ein Versuch für eine Nacherhebung resultierte in sehr geringen Teilnahmezahlen. Verlässliche Daten über die mittelfristigen Folgen der Usability-Projekte in den Unternehmen liegen deshalb nicht vor. Aus den über das KiU-Projekt hinausgehenden Kontakten ist jedoch von zehn Unternehmen bekannt, dass sie Usability-Maßnahmen nach Abschluss des KiU-Projekts fortgesetzt oder sogar intensiviert haben. Für diese Unternehmen kann angenommen werden, dass sie einen Einstieg in den User Centered Design Prozess zumindest begonnen haben. Zu den konkret geplanten Maßnahmen gehören: –– der regelmäßige Kontakt mit Nutzern und das Einholen von Feedback –– die regelmäßige Usability-Evaluation der eigenen Produkte durch externe Berater –– die Weiterbildung eigener Mitarbeiter zu Usability-Verantwortlichen

240

–– die Einstellung von Usability-Fachleuten –– die Diskussion des Entwicklungsprozesses und das Verankern von Usability-Maßnahmen Folgeprojekte Von den 60 während der Projektlaufzeit unterstützten Unternehmen hat die Kompetenzinitiative selbst mit zehn Unternehmen mindestens ein weiteres Projekt durchgeführt, das nicht mehr Bestandteil des kostenfreien KiU-Angebots war. Von diesen zehn Unternehmen gaben drei ein weiteres Folgeprojekt bei der Kompetenzinitiative in Auftrag.

Die Partner für ein Folgeprojekt waren vier der 29 Kleinunternehmen (14%) und sechs der 12 Mittelständler (50%). Keines der 32 Kleinstunternehmen hat ein Folgeprojekt beauftragt. Dieses Ergebnis bestätigt die Vermutung, dass ein Spielraum für kostenpflichtige Usability-Maßnahmen erst ab einer Größe von mindestens zehn Mitarbeitern vorhanden ist. Der Spielraum wird dabei umso größer, je größer das Unternehmen ist. In sieben Fällen kam im Folgeprojekt das selbe Verfahren zum Einsatz wie im Vorgängerprojekt. Diese Wiederholung erscheint auf den ersten Blick etwas fragwürdig, erklärt sich aber wiederum aus dem kleinen Umfang der KiU-Projekte. So konnte häufig im Erstprojekt nur ein Produkt-Teilbereich überprüft werden und das Folgeprojekt ergänzte die Ergebnisse durch eine erweiterte Fragestellung. Zweimal wurde zunächst ein Expertenreview durchgeführt und danach eine größeres Konzeptions-Projekt in Auftrag gegeben, in dem die Optimierungsvorschläge aus dem Review in Mockups umgesetzt werden sollten. Dreimal wurde zunächst ein Expertenreview in Auftrag gegeben und die Ergebnisse anschließend um solche aus einem Nutzertest ergänzt. Die Effizienz der Kombination verschiedener Evaluationsverfahren hat Schmettow (Schmettow, M., Bach, C., Scapin, D., 2010) beschrieben. Er führt

aus, dass durch die Kombination zweier komplementärer Verfahren mehr Fehler gefunden werden als mit derselben Anzahl von Evaluatoren nur eines Verfahrens. Im Rahmen der beschriebenen Folgeprojekte können wir die Effekte einer Verfahrenskombination bestätigen: Tatsächlich deckten Experten und Nutzer in großem Umfang die gleichen Schwächen auf; zusätzlich fanden Experten aber Probleme, die Nutzern entgingen und umgekehrt. Bei der Mehrheit der Unternehmen können über mittelfristige Folgen der KiU-Projekte keine gesicherten Aussagen getroffen werden. Diese Unternehmen haben das Usability-Projekt zumindest als einmalige Chance genutzt, um professionelle Rückmeldung zu ihrem Produkt zu erhalten und Teile davon umzusetzen. Nicht ausgeschlossen werden kann natürlich, dass in diesen Unternehmen Konsequenzen aus dieser ersten Usability-Erfahrung erst später gezogen werden. 5. Zusammenfassung Die Kompetenzinitiative führte während der Laufzeit 73 Usability-Projekte mit 60 Unternehmen durch. Die Resonanz von KMU auf das Angebot der Kompetenzinitiative zeigt großen Bedarf an Usability-Dienstleistungen in den neuen Bundesländern auf, allerdings nicht an Usability-Schulungen. Der Bedarf besteht auch außerhalb traditioneller Usability-Zielmärkte, wie zum Beispiel im Maschinenbau. Auffallend ist, dass für Unternehmen eine räumliche Nähe zum Dienstleister bedeutsam zu sein scheint, indem ein persönlicher Kontakt die wahrgenommene Schwelle zur Usability-Thematik verkleinert. Auch wenn die meisten Projekte mit Kleinstunternehmen mit weniger als zehn Mitarbeitern zustande kamen, sind erst größere KMU ab zehn Mitarbeitern attraktive Projektpartner, die ein Budget für Usability einrichten wollen und können. Nur in Ausnahmefällen waren KMU an der Einführung von UCD interessiert, vielmehr ging es überwiegend darum, bestehende Usability-Schwächen eines etablierten


Usability Professionals 2011 Wirtschaft und Wissenschaft

Produkts zu beheben. In der Regel kamen dabei expertenbasierte Evaluationsverfahren zum Einsatz, die sich als kostengünstige und effektive Verfahren für den Erstkontakt eines Unternehmens mit Usability bewiesen haben. Die Wahrscheinlichkeit für Folgeprojekte stand in engem Zusammenhang mit der Größe der Unternehmen und lag für Mittelständler ab 50 Mitarbeiter bei 50%. Folgeprojekte stellten meistens gründlichere Ausführungen oder methodische Ergänzungen des ersten Evaluationsprojekts dar, die den Scope der Ergebnisse verbreitern sollten.

diese Weise einen Einstieg in nutzerzentrierte Entwicklungsprozesse zu finden. Weiterführende Fragen für die Diskussion: –– Ist der UCD-Prozess auf Großunternehmen zugeschnitten? –– Ist UCD für kleine und kleinste Unternehmen überhaupt möglich? –– Ist UCD ist eine Frage der Unternehmensgröße? Literatur 1. Bär, N. & Reich, D., 2011. Was Firmen wollen: eine Umfrage zu Usability-Dienstleistungen für klein- und mittelständische Unternehmen.

5.1. Ist Usability und UCD eine Frage des Preises und der Unternehmensgröße?

Artikel erscheint im selben Tagungsband „Usability Professionals 2011“. 2. Bundesministerium für Bildung und Forschung, 2009. EUB-Infoblatt: KMU

Der Bedarf an Usability-Projekten in KMU der neuen Bundesländer ist groß. Allerdings hält der Preis für Usability vor allem die kleinsten Unternehmen davon ab, ihre Vorteile gezielt zu nutzen. Sowohl die Anforderung, fehlende Usability-Expertise zuzukaufen, wie auch die Notwendigkeit, den eigenen mehr oder weniger etablierten Entwicklungsprozess zu verändern, stellt die kleinsten Unternehmen vor nicht bewältigbare Herausforderungen. Als scheinbar kostenneutrale Lösung wird das Thema Usability deshalb häufig von den Entwicklern „mit erledigt“. Für die kleinsten Unternehmen scheint das Usability-Projekt mit der Kompetenzinitiative eher eine einmalige Therapie, als einen Impuls zur nutzerzentrierten Produktentwicklung bedeutet zu haben; Usability bleibt damit ein Luxus-Gut, das sie sich nicht leisten können.

Definition (SME Definition). Onlinequelle von http://www.forschungsrahmenprogramm.de, 18.5.2011 3. Deutsches Statistisches Bundesamt, Kleine und Mittelständische Unternehmen, Onlinequelle von http://www.destatis. de/jetspeed/portal/cms/Sites/destatis/ Internet/DE/Content/Statistiken/ UnternehmenGewerbeInsolvenzen/ KMUMittelstand/ Aktuell,templateId=renderPrint.psml, 23.5.2011 4. Sarodnick, F. & Brau, H., 2006. Methoden der Usability Evaluation: Wissenschaftliche Grundlagen und praktische Anwendungen. Bern: Verlag Hans Huber, Hogrefe AG 5. Schmettow, M., Bach, C., Scapin, D., 2010. Effizientere Usability Evaluationen mit gemischten Prozessen. In J. Ziegler & A. Schmidt (Hrsg.): Mensch & Computer 2010, S. 271 - 280. München: Oldenbourg Verlag:

Irgendwann erreichen Unternehmen eine Größe, bei der die Grenze des ´bei uns macht jeder alles´ erreicht ist. Im Rahmen der dann folgenden Prozess-Optimierung und -Standardisierung werden die Kosten fehlender Usability bezifferbar (HotlineAuslastung, schlechteres Abschneiden in Produktvergleichen, eigene BenchmarkingStudien) und können mit Kosten für Usability-Maßnahmen gegengerechnet werden. Größere Unternehmen haben dann die Möglichkeit, auf der Grundlage von Usability-Budgets Usability-Maßnahmen wiederholt zum Einsatz zu bringen und auf

2010. 6. Statistisches Bundesamt, Unternehmensregister - System 95, Stand 30.06.201

241


145

Hedonische Qualität in der digitalen Fabrikplanung Karl-Josef Wack Daimler AG P.O. Box 2360 HPC U026 89013 Ulm karl-josef.wack@daimler.com

Franz Peschel Daimler Protics GmbH P.O. Box 2360 HPC U058 89013 Ulm franz.peschel@daimler.com

Abstract Konfrontiert mit der steigenden Komplexität industriell gefertigter Produkte bei gleichzeitiger Verkürzung der Entwicklungszeiten werden heutzutage in zunehmendem Maße virtuelle Technologien entlang des Produkt- und Produktionsplanungsprozesses eingesetzt. Dabei steht bereits in frühen Phasen ein digitales Abbild des später zu fertigenden Produkts- oder Produktionsmittels für Analysen, Simulationen und Absicherungsuntersuchungen zur Verfügung. Die Komplexität schlägt sich auch in den Softwarewerkzeugen der digitalen Fabrikplanung nieder, so dass bislang meist einfach zu berechnende Visualisierungsformen verwendet wurden. Die Daimler-interne Fabrikplanungsanwendung „VEO“ wurde nun um eine Komponente zur optisch plausiblen Visualisierung der digitalen Fabrik erweitert. Der Mehrwert einer realitätsnahen Visualisierung für die menschliche Wahrnehmung und somit einer verbesserten Entscheidungsgrundlage für die Beurteilung der digitalen Modelle steht außer Frage und wurde unter verschiedenen Aspekten bereits in der Fachliteratur nachgewiesen(Scheer & Keutel 2010). Aspekte der hedonischen Qualität einer solchen Visualisierung wurden bislang nur am Rande untersucht. In diesem Beitrag wird daher die realitätsnahe Visualisierung mit der vormals verwendeten einfachen Darstellung gegenübergestellt und hinsichtlich eines Mehrwerts zur Steigerung der hedonischen Qualität bewertet. Dazu wird die hedonische Qualität unter Verwendung der Methode AttrakDiff ermittelt. Die Ergebnisse der Studie werden präsentiert und bewertet.

1. Einleitung Automobile sind durch ihre Variantenvielfalt hochkomplexe Produkte, welche ebenso komplexe Produktionsprozesse bedingen. Deren Fertigung erfolgt in Werkshallen mit einer Länge von bis zu einem Kilometer. Dort werden Teile zur Montage angeliefert, vormontiert, zum Endprodukt zusammengebaut und abschließend einer Qualitätssicherung unterzogen.

und vorproduzierten Bauteilen wird durch die Fabrikplanung sichergestellt. Weiterhin zählen der Abtransport und die Qualitätssicherung der produzierten Güter sowie die Entsorgung der Rest-, Abfallstoffe und Abwässer zu deren Aufgabenbereich. Insbesondere muss die Fabrikplanung spätestens zum geplanten Produktionsstart neuer Produkte oder Produktreihen sicherstellen, dass alle notwendigen Ressourcen zu einem bestimmten Zeitpunkt an den richtigen Orten verfügbar sind und die Prozesse reibungslos funktionieren.

Die Fabrikplanung umfasst dabei mehrere Bereiche. Zum einen ist diese für die Gebäudearchitektur zuständig, zum anderen auch für die Infrastruktur inklusive der Maschinenstandorte. Auch die Versorgung mit Roh- und Betriebsstoffen

Die Softwarewerkzeuge im Umfeld der digitalen Fabrikplanung müssen für eine holistische Visualisierung aller Daten der digitalen Fabrik mit dieser Komplexität umgehen können. Die Visualisierung der 3D-Daten eröffnet den Planern vielfältige

242

Keywords: /// Digitale Fabrik /// Fabrikplanung /// Hedonische Qualität /// Joy of Use /// User Experience

Möglichkeiten hinsichtlich der Validierung von Planungsständen von Fabrik- und Anlagenmodellen, sowie dem damit verbundenen Erkenntnisgewinn über räumliche Gegebenheiten und Einschränkungen. Die Daimler-Forschung entwickelt neue Methoden und Technologien zur Absicherung der digitalen Fabrikplanung. Eines der eigens dazu entwickelten Systeme ist das Softwarewerkzeug „VEO“, welches zur Visualisierung der aktuellen Planungsstände der digitalen Fabrikplanung verwendet wird. Aufgrund der Komplexität und der Menge der Daten wurden in der Vergangenheit zumeist einfach zu berechnende Visualisierungsformen verwendet um interaktive oder echtzeitfähige Bildwiederholraten


Usability Professionals 2011 Wirtschaft und Wissenschaft

Abb. 1. „VEO Classic“, OpenGL Lighting

Abb. 2. „VEO Lighting“ (Peschel et al. 2011), plausible interaktive Beleuchtungssimulation

erreichen zu können. In jüngster Zeit wurde jedoch das System „VEO“ um eine Komponente zur optisch plausiblen Visualisierung („VEO Lighting“; Peschel et al. 2010, Peschel et al. 2011) der digitalen Fabrik erweitert, anhand derer eine für die menschliche Wahrnehmung hohe Übereinstimmung mit den Beleuchtungssituationen in einer realen Fabrikhalle erreicht wird. Die dadurch erzielten Ergebnisse hinsichtlich der hedonischen Qualität wurden mittels der in (Hassenzahl et al., 2003) vorgestellten Fragebogen-basierten

Evalutationsmethode AttrakDiff ermittelt und werden nachfolgend vorgestellt. 2. Das System „VEO“

Verwendung von Mixed-Reality (MR) Technologien zum Soll-Ist Abgleich von Fabrikhallen eingesetzt. Generell stellt „VEO“ ein Hilfswerkzeug zur Validierung von Planungsständen und deren Optimierung dar.

Die Anwendung „VEO“ ist eine Eigenentwicklung der Daimler AG und findet dort in verschiedenen Planungsbereichen und zu unterschiedlichen Planungsphasen vielfache Verwendung. Neben der reinen Visualisierung von 3D-Daten von Fabriken und Anlagen bzw. anderen Fabrikplanungsdaten wird das System beispielsweise unter

„VEO“ zeichnet sich durch eine äußerst performante Visualisierung von immens großen Datenmengen aus. Ein 3D-Modell einer Fabrikhalle beispielsweise erreicht schnell eine Größe von mehreren Gigabyte. „VEO“ ist aufgrund einer verwendeten Visibility Guided Rendering Technologie (Kasik et al. 2007) in Kombination mit

243


einem Kamerastandort-basierten Streaming der Geometriedaten in der Lage, Szenen mit einer theoretisch unbegrenzten Anzahl von Polygonen interaktiv zu visualisieren. Gerade bei den verschiedenen Planungsdisziplinen der Fabrikplanung ist die Interaktivität der Visualisierung von großer Bedeutung. Um dies erreichen zu können, wurden bislang meist einfach zu berechnende Visualisierungsformen eingesetzt. Deren Darstellungen von Szenen und darin enthaltenen Objekten jedoch sind eher von abstrakter Natur (siehe Abbildung 1 & Abbildung 3), so dass durch den Nutzer eine gedankliche Übertragung auf reale Objekte erfolgt. [Abb. 1]

Beleuchtungssituationen in einer realen Fabrikhalle erreicht wird. [Abb. 2]

3. Joy of Use

Die durch die optisch plausible Visualisierung erzielten qualitativen Verbesserungen sind in Abbildung 3 ersichtlich. Die linke Spalte zeigt zwei verschiedene Szenarien einer 3D-Fabrikvisualisierung unter Verwendung der bisherigen, sogenannten OpenGL Lighting Visualisierung. Die mittlere Spalte zeigt ein Foto der gleichen Szene unter Einhaltung der entsprechenden Perspektive. In der rechten Spalte wurden die identischen 3D-Fabrikdaten zur Visualisierung verwendet, wie bei der vorherig erwähnten OpenGL Lighting Darstellung.

Bei Gebrauchstauglichkeit handelt es sich um ein anerkanntes Qualitätsmerkmal. Nach der DIN EN ISO 9241-11 wird von Gebrauchstauglichkeit gesprochen, wenn es einem Benutzer durch eine Anwendung in einem bestimmten Nutzungskontext ermöglicht wird, Ziele effektiv, effizient und zufriedenstellend zu erreichen.

Bei der bisherigen Entwicklung von „VEO“ stand die pragmatische Qualität im Vordergrund. Mit einer neuen Weiterentwicklung hinsichtlich Visualisierungsqualität wurde eine Möglichkeit gefunden, eine optisch plausible Visualisierung zu realisieren, wodurch eine für die menschliche Wahrnehmung hohe Übereinstimmung mit den

Vergleicht man nun die mittlere Spalte mit den Fotos aus der realen Fabrikhalle mit den Abbildungen in der rechten Spalte, so wird schnell deutlich, dass die optisch plausible Visualisierung ein eindrucksvolles Maß an Realismus erzielt. Besonders anzumerken ist dabei, dass die Interaktivität stets gewahrt bleibt. [Abb. 3]

Abb. 3. Die beiden Visualisierungsformen mit einer Fotodarstellung im Vergleich (Abbildung aus Peschel, 2010).

244

Bei Effizienz und Effektivität handelt es sich um rein objektive Kriterien. Jüngste Studien belegen jedoch, dass neben den objektiven Kriterien auch subjektive Kriterien, wie beispielsweise die Zufriedenheit der Benutzer von Relevanz für die Usability und auch für die Akzeptanz eines Produktes sein können. Unter diesem Gesichtspunkt wurden die Usability Heuristiken von Sarodnick und Brau (2006) überarbeitet und um den Aspekt „Joy of Use“ erweitert.


Usability Professionals 2011 Wirtschaft und Wissenschaft

Kognitive Bewertung Intendierte Qualität

Wahrgenommene Qualität

Pragmatische Qualität z.B. berechenbar

Pragmatische Qualität z.B. berechenbar

Hedonische Qualität z.B. innovativ

Hedonische Qualität z.B. innovativ

Gestalter

Konsequenzen der Bewertung Evaluation

Bewertung der Attraktivität z.B. sympatisch

VerhaltensKonsequenzen z.B. verstärktes Nutzen

Emotionale Konsequenzen z.B. Zufriedenheit

Benutzer

Abb. 4. Modell zur Eindrucksentstehung der Attraktivität beim Benutzer nach (Hassenzahl, 2001)

Mit „Joy of Use“ wird das positive, ästhetisch-emotionale Erlebnis des Benutzers beim Arbeiten mit interaktiven Systemen beschrieben. Aus diesem Grund ist Gebrauchstauglichkeit nicht als alleinstehendes Qualitätsmerkmal zu betrachten. Daher versteht sich „Joy of Use“ mittlerweile als Erweiterung der Usability (vgl. Hassenzahl et al., 2000). Zu „Joy of Use“ existieren unterschiedliche theoretische Ansätze und Qualitätskriterien (vgl. Wallace & Press, 2004; Hassenzahl et al., 2000). Der von Hassenzahl et al. (2000) vorgestellte Ansatz unterscheidet zwischen hedonischer und pragmatischer Qualität. Die pragmatische Qualität beschreibt hierbei die Fähigkeit eines Produktes zur Befriedigung der Zielerreichung (z. B. praktisch, handhabbar). Wohingegen sich die hedonische Qualität in zwei Aspekte, Identität und Stimulation, unterteilt. Mit AttrakDiff, einer Fragebogenevaluationsmethode, ist es möglich die Attraktivität eines Produktes anhand definierter Qualitätskriterien zu ermitteln.

4. AttrakDiff AttrakDiff ist ein Messinstrument zur Ermittlung der Attraktivität interaktiver Systeme in Form eines semantischen Differentials. Insgesamt setzt sich AttrakDiff aus 28 siebenstufigen, konträren Begriffspaarungen, wie beispielsweise „sympatisch – unsympatisch“, „technisch - menschlich“ oder auch „außergewöhnlich – üblich“ zusammen. Mit Hilfe des theoretischen Modells, welches der Methode zugrunde liegt (Hassenzahl, 2001; Abbildung ), wird die durch die Probanden wahrgenommene sowie bewertete pragmatische und hedonische Qualität ermittelt und ein subjektiver Eindruck der Attraktivität bestimmt. Das Ergebnis verdeutlicht die Einordnung des evaluierten Produktes bezüglich der Messgrößen hedonische und pragmatische Qualität. [Abb. 4] Die daraus resultierenden Konsequenzen werden zudem in Verhalten und Emotion

unterteilt. Das Modell trennt dabei nach den folgenden vier wesentlichen Aspekten: –– Durch den Gestalter intendierte Produktqualität –– Subjektive Qualitätswahrnehmung und Bewertung –– Voneinander unabhängige pragmatische und hedonische Qualität –– Verhaltens- und emotionale Konsequenzen In der nachfolgend beschriebenen Evaluation lag der Fokus auf der Untersuchung der Aspekte „subjektiven Qualitätswahrnehmung und Bewertung“ sowie der hedonischen Qualität. 5. Evaluation Um die Attraktivität der beiden möglichen Visualisierungsformen, der interaktiven plausiblen Beleuchtungssimulation („VEO Lighting“) sowie der einfachen OpenGL Lighting Beleuchtung („VEO Classic“) zu ermitteln, wurde das Messinstrument

245


Abb. 5. Die aktuelle Kameraposoition und Ausrichtung wird in einem Viewpoint gespeichert (Abbildung aus Peschel et al., 2011).

AttrakDiff verwendet. Beide Visualisierungsformen wurden in einem Testszenario gegenübergestellt. Die Nutzer führten jeweils mit beiden unterschiedlichen Darstellungsoptionen eine Aufgabe durch und bewerteten anschließend unter Verwendung des Onlinefragebogens. Die Aufgabe bestand darin, mit Hilfe einer in „VEO“ vorhandenen Funktion zum Setzen von sogenannten Viewpoints einen möglichst kollisionsfreien und repräsentativen vorzeigbaren Rundflug durch eine Fabrikhalle zu erstellen. Viewpoints besteht aus der aktuellen Position und Ausrichtung der Kamera (siehe Abbildung 5). Die für einen Kameraflug benötigten Positionen und Ausrichtungen der Kamera zwischen zwei Viewpoints werden dabei linear interpoliert. [Abb. 5] Für einen Kameraflug werden die gesetzten Viewpoints dann einfach nacheinander angefahren, wodurch eine flüssige Animation entsteht. Auf diese Weise konnten die Testpersonen die komplexe Fabrikszene explorieren und sich mit ihr vertraut machen, wobei aufgrund der geforderten Repräsentativität des Rundflugs insbesondere Aspekte der hedonische Qualität im Fokus der Evaluation standen.

246

5.1. Teilnehmer An der Studie wurde nahmen insgesamt 20 Probanden teil. Dabei waren Mitarbeiter aus verschiedenen Fachbereichen mit unterschiedlichen Erfahrungswerten im Hinblick auf die Nutzung der Anwendung „VEO“ vertreten. Die Spanne der Expertise reichte hierbei von keiner bis hin zur langjährigen Toolexpertise. Die neue, optisch plausible Visualisierung war den meisten Probanden unbekannt. Ein Großteil der Probanden ist in die Altersgruppe der 20 bis 40-jährigen einzuordnen, lediglich drei der Probanden waren älter als 40 Jahre. Auch die männlichen Probanden dominierten – lediglich vier der teilnehmenden Personen waren weiblich. Nahezu alle Probanden verfügen über einen Hochschuloder vergleichbaren Abschluss. 5.2. Ergebnisportfolio Das Ergebnisportfolio (vgl. Abbildung 6) illustriert die Ausprägungen der hedonischen Qualität (HQ) sowie der pragmatischen Qualität (PQ). Hierbei wird in der Vertikalen die Ausprägung der hedonischen Qualität und in der Horizontalen die

Ausprägung der pragmatischen Qualität dargestellt. Die Ausprägung der hedonischen Qualität ist im rechten Bereich und die Ausprägung der pragmatischen Qualität ist im oberen Bereich am höchsten. Das Produkt wird in Abhängigkeit der Ausprägung seiner beiden Dimensionen in den entsprechenden Bereichen angesiedelt. Weiterhin wird ein Konfidenzrechteck als heller Rahmen dargestellt. Die Größe des Konfidenzrechtecks repräsentiert dabei das Maß an Übereinstimmung der von den Probanden getroffenen Antworten- also deren Varianz, und fällt umso kleiner aus, je höher die Übereinstimmung ist. Da die Konfidenzrechtecke in Abbildung 6 klein ausfallen, sind die Bewertungen recht homogen. Das zeigt, dass sich die Mehrheit der Testpersonen bei der Bewertung einig war und die hier gezeigten und erörterten Ergebnisse auf das Produkt auch wirklich zutreffen. [Abb. 6] „VEO Classic“ wurde hinsichtlich pragmatischer als auch hedonischer Qualität als „neutral“ eingestuft, wenn auch im oberen Drittel angesiedelt. „VEO Lighting“ hingegen liegt im Wertebereich „begehrt“, womit eine Verbesserung der hedonischen als auch der pragmatischen Qualität


Usability Professionals 2011 Wirtschaft und Wissenschaft

Hedonische Qualität (HQ)

zu selbstorientiert

selbstorientiert

begehrt A B

neutral

überflüssig

handlungsorientiert

zu handlungsorientiert

Pragmatische Qualität (PQ)

A

Mittlere Ausprägung der Dimensionen „VEO Lighting“ Konfidenzrechteck

B

Mittlere Ausprägung der Dimensionen „VEO Classic“ Konfidenzrechteck

Abb. 6. Portfolio der durchschnittlichen Ausprägungen der Dimensionen pragmatische Qualität (PQ) und hedonische Qualität (HQ) sowie den Konfidenzrechtecken

in einer gesonderten Studie mit geeigneter Aufgabenstellung zu betrachten. 5.3. Diagramm der Mittelwerte Das Diagramm der Mittelwerte zeigt die mittlere Ausprägung der vier Dimensionen, welche mit Hilfe von AttrakDiff bewertet werden. Da die hedonische Qualität grundsätzlich zwischen Stimulation (HQ-S) und Identität (HQ-I) differenziert, wird diese im Diagramm der Mittelwerte entsprechend aufgeteilt und separat dargestellt. Die Identität zeigt dabei das Ausmaß der Identifikation des Nutzers mit dem Produkt und die Stimulation das Ausmaß der Unterstützung des Bedürfnisses nach persönlicher Weiterentwicklung des Anwenders. Stimulation kann z. B. durch anregende und neuartige Funktionen gesteigert werden. Des Weiteren wird durch das Diagramm die beurteilte Attraktivität dargestellt, welche allgemein für das Produkt wahrgenommen wird. Hedonische und pragmatische Qualität fließen dabei in die Bewertung der wahrgenommene Attraktivität mit ein. [Abb. 7]

„VEO Classic“ erzielt in allen Bereichen durchschnittliche Werte, wohingegen „VEO Lighting“ in allen Bereichen über dem Durchschnitt lag. Mit Ausnahme der pragmatischen Qualität sind die Unterschiede dieser Studie in allen Bereichen signifikant und verdeutlichen, dass eine Steigerung der hedonischen Qualität erreicht werden konnte. 5.4. Profil der Wortpaare Durch das Profil der Wortpaare wird deren mittlere Ausprägung dargestellt. [Abb. 8] Ein besonderes Interesse gilt dabei den Extremwerten sowie den Wortpaaren, die eine größere Abweichung in der Bewertung aufweisen. Die Extremwerte verdeutlichen, welche Aspekte des Produktes besonders gut gelöst oder als kritisch anzusehen sind. Mögliches Handlungspotenzial ist somit leicht zu identifizieren. Die Abweichung zeigen, inwieweit sich das veränderte Produkt positiv oder gegebenenfalls auch negativ gegenüber dem Ausgangsprodukt verändert hat.

aufgezeigt werden kann. „VEO Lighting“ unterscheidet sich dabei signifikant von denen durch „VEO Classic“ erzielten Werten hinsichtlich der hedonischer Qualität. Da bei beiden Teilen der Studie die gleiche Fabrikszene unter gleichen technischen Voraussetzungen verwendet wurde und lediglich die Art der Visualisierung eine andere war, erscheint an dieser Stelle die leichte Steigerung der pragmatischen Qualität ebenfalls interessant. Auch wenn der Unterschied nicht signifikant ausfällt, ist er aufgrund des kleinen Konfidenzrechtecks doch erkennbar. Aussagen der Testpersonen nach dem Absolvieren beider Tests lassen darauf schließen, das mit einer als plausibel empfundenen Beleuchtung insbesondere die Orientierung und damit die Navigation durch die Szene etwas leichter viel. Da die Untersuchung der pragmatischen Qualität in dieser Studie nicht im Fokus stand und die Aufgabenstellung im Testszenario auf die Untersuchung der hedonischen Qualität ausgerichtet war, wäre es interessant, diese Abb. 7. Mittlere Ausprägung der vier Dimensionen des AttrakDiff

247


PQ

Die Dimension „Attraktivität“ (ATT) konnte für „VEO Lighting“ insbesondere hinsichtlich der ästhetischen Wahrnehmung verbessert werden, wobei bereits „VEO Classic“ im positiven Bereich lag. Beide Produkte werden als sehr gut wahrgenommen, „VEO Lighting“ wird jedoch als signifikant angenehmer empfunden und liegt bei allen weiteren Wortpaaren im Bereich ATT leicht vorn.

technisch – menschlich kompliziert – einfach unpraktisch – praktisch umständlich – direkt unberechenbar – voraussagbar verwirrend – übersichtlich widerspenstig – handhabbar

HQ-I

isolierend – verbindend laienhaft – fachmännisch stillos – stilvoll minderwertig – wertvoll ausgrenzend – einbeziehend trennt mich – bringt mich näher nicht vorzeigbar – vorzeigbar

Obwohl die uneindeutiger bewertete pragmatische Qualität (PQ) die Attraktivität (ATT) gegenüber der hedonischen Qualität in etwas gleich beeinflusst, ist die Steigerung der Attraktivität durch „VEO Lighting“ deutlich und signifikant, was darauf schließen lässt, das die hedonische Qualität und die darin enthaltenen ästhetischen Gesichtspunkte für den Nutzer eine nicht unerhebliche Rolle spielen.

konventionell - originell

HQ-S

ATT

phantasielos – kreativ vorsichtig – mutig konservativ – innovativ lahm – fesselnd harmlos – herausfordernd herkömmlich – neuartig unangenehm - angenehm hässlich – schön unsympatisch – sympatisch zurückweisend – einladend schlecht – gut abstoßend – anziehend entmutigend - motivierend

6. Zusammenfassung

„VEO Lighting“ „VEO Classic“ Abb. 8. Mittlere Ausprägung der Wortpaare des AttrakDiff für die Produkte „VEO Classic“ und „VEO Lighting“

Abbildung 8 zeigt, dass bei beiden Visualisierungsformen die meisten Bewertungen der 28 Begriffspaarungen im positiven Bereich liegen. Die Tendenz einer Verbesserung durch „VEO Lighting“ ist in den Bereichen der hedonischen Qualität und Attraktivität klar zu erkennen, wohingegen bei der pragmatischen Qualität eher Uneinigkeit herrscht. Deutlicher ist hier nur erkennbar, dass „VEO Lighting“ mit seiner plausiblen Beleuchtung im Vergleich zu „VEO Classic“ als eher menschlich eingestuft wird, was darauf hindeutet, dass „VEO Lighting“ eine für die Testperson natürlichere Handlungsumgebung darstellt und die Plausibilität der Darstellung unterstreicht. Bei der Dimension „Identität“ (HQ-I) wird „VEO Lighting“ deutlich stilvoller und wertvoller als das Vergleichsprodukt

248

eingestuft. Vorzeigbar erreicht dabei fast den besten Wert. Weitere Wortpaare wie z. B. isolierend – verbindend oder ausgrenzend – einbeziehend liegen nahezu auf dem gleichen Wert. Die Probanden hatten hier Schwierigkeiten, eine Bewertung abzugeben, da die Anwendung diese Aspekte aus ihrer Sicht weniger berührte. Zusammenfassend lässt sich hinsichtlich ästhetischer Gesichtspunkte eine gesteigerte Identifizierung des Nutzers mit dem Produkt „VEO Lighting“ feststellen. Bei der Dimension „Stimulation“ (HQ-S) konnte sich „VEO Lighting“ in fast allen Punkten verbessern. Lediglich die Herausforderung blieb gleich. „VEO Lighting“ unterstützt den Nutzer somit verstärkt in seinem Bedürfnis nach Weiterentwicklung.

Die Evaluation der beiden Visualisierungsformen „VEO Lighting“ und „VEO Classic“ hat gezeigt, dass die hedonische Qualität der implementierten, optisch plausiblen Visualisierung gegenüber der OpenGL Lighting Darstellung deutlich positiver ausgeprägt war und die Attraktivität trotz der nicht eindeutig bewerteten pragmatischen Qualität insgesamt für den Nutzer gesteigert wurde. Die Antworten zu den Fragen nach dem subjektiven Empfinden der Nutzer lassen somit bei „VEO Lighting“ auf eine noch positivere User Experience schließen. Eine von Norman getätigte und häufig zitierte Aussage „use a pleasing design, one that looks good and feels, well, sexy, and the behavior seems to go along more smoothly, more easily, and better” (Norman, 2002) beschreibt hier die Bedeutung der hedonischen Qualität und ihre ästhetischen bzw. emotionalen Aspekte hinsichtlich der Benutzerfreundlichkeit. Eindrucksvolle User Interface Designs und Darstellungen steigern auch die Benutzerfreundlichkeit. Ein Zusammenhang, auf den in dieser Studie die Bewertung des Wortpaares „technisch – menschlich“


Usability Professionals 2011 Wirtschaft und Wissenschaft

im Bereich der pragmatischen Qualität hinweist. Diesen Zusammenhang gilt es für den in diesem Beitrag verwendeten Anwendungsfall durch weitere Studien zu belegen.

11. Peschel, F., Scheer, F. (2011): Plausible

Literatur

12. Peschel, F. (2010): Optisch plausible

Visualization of the Dynamic Digital Factory with Massive Amounts of Lights. 19th WSCG International Conference in Central Europe on Computer Graphics, Visualization and Computer Vision 2011, Czech Republic, Plzen

1. IDO/DIS 9241-210 (2009): „Ergonomics of human-system interaction - Part 210: Human centered design for interactive systems“. International Organization for Standardization. 2. DIN EN ISO 9241-11 (1998): Ergonomic

Beleuchtungssimulation interaktiver MassData-Szenarien, Diplomarbeit. Daimler AG & Universität Koblenz-Landau 13. Sarodnick, F., Brau, H. (2006): Methoden der Usability Evaluation. Bern: Hans Huber Verlag 14. Scheer, F., Keutel, F. (2010): Screen Space

requirements for office work with display

Ambient Occlusion for Virtual and Mixed

terminals (VDTs) – Part 11, Guidance on

Reality Factory Planning. In: Journal of 18th

usability. Genf: International Organization for

International Conference on Computer

Standardization

Graphics, Visualization and Computer Vision

3. Hassenzahl, M., Platz, A., Burmester, M., Lehner, K. (2000): Hedonic and Ergonomic

2010 (WSCG), Vol. 18, No. 1-3 15. Wallace, Jayne S., Press, M. (2004): All This

Quality Aspects Determine a Software’s

Useless Beauty; Finding Beauty through

Appeal. In: Proc. CHI 2000 Conference on

Craft in Digital Technology. Pixel Raiders 2

Human Factors in Computing Systems. New

Conference, Sheffield

York: ACM Press. S. 201-208 4. Hassenzahl, M. (2001): The Effect of Perceived Hedonic Quality on Product Appealingness. In: International Journal of Human-Computer Interaction 13(4), S. 481-499 5. Hassenzahl, M., Burmester, M., Koller, F. (2003): AttrakDiff: Ein Fragebogen zur Messung wahrgenommener hedonischer und pragmatischer Qualität. In: Ziegler, J., Szwillus, G. (Hrsg.): Mensch & Computer 2003, Interaktion in Bewegung. Stuttgart, Leipzig: B.G. Teubner, S.187-196 6. Hatscher, M. (2001): Joy of use – Determinanten der Freude bei der SoftwareNutzung. In: Ergonomics, 46. S. 1273-1293 7. Kasik, D., Brüderlin, B., Heyer M., Pfützner S. (2007): Visibility-guided rendering to accelerate 3D graphics hardware performance. In SIGGRAPH ’07: ACM SIGGRAPH 2007 courses, USA – New York. 8. Norman, D. A. (2002): Emotion and design: Attractive things work better. Interactions Magazine, ix (4), S. 36-42 9. Norman, D. A. (2004): Emotional Design: Why we love (or hate) everyday things. New York: Basic Books 10. Peschel, F., Scheer, F. (2010): Interactive Plausible Illumination for the Digital Factory. Joint Virtual Reality Conference of EuroVR – EGVE – VEC 2010, Stuttgart

249


135

Was Firmen wollen: eine Umfrage zu Usability-Dienstleistungen für klein- und mittelständische Unternehmen Nina Bär TU Chemnitz Professur für Allgemeine und Arbeitspsychologie Wilhelm- Raabe-Straße 43, 09120 Chemnitz nina.baer@psychologie.tu-chemnitz.de

Diana Reich TU Berlin Fakultät Verkehrs- und Maschinensysteme Straße des 17. Juni 135, 10623 Berlin diana.reich@mailbox.tu-berlin.de

Abstract Usability-Consulting ist häufig auf Großunternehmen zugeschnitten. Doch auch kleinund mittelständische Unternehmen (KMU) brauchen bei der Evaluation ihrer Produkte Usability-Expertise. Um Angebote zu optimieren, befasste sich die Online-Studie „Fragebogen User Needs“ (FUN) mit den Bedürfnissen von KMU. Es wurden 41 Unternehmen befragt. Deren aktueller Wissensstand zum Thema Usability fällt recht unterschiedlich aus. Vor allem in der Elektronik- und Technikbranche werden Verfahren zur Produktbewertung eingesetzt, am häufigsten Laboruntersuchungen und Tests durch externe Experten. Länger bestehende Unternehmen nutzen weniger Verfahren, während KMU, die in den vergangenen zehn Jahren gegründet wurden, verstärkt Usability-Tests und Beobachtungen einsetzen. Dies findet meist in frühen Entwicklungsphasen und mit Prototypen statt. Grundsätzlich besteht Akzeptanz von Usability- Dienstleistungen im Mittelstand, die Mehrheit der befragten KMU hält die Anwendung von Usability-Verfahren auch in früheren Entwicklungsstufen für geeignet und wünschenswert. Allerdings werden die eigenen Produkte von mehr als 70% der befragten Unternehmen subjektiv als ausreichend bedienerfreundlich eingeschätzt, der Aufwand für Usability- Maßnahmen soll zukünftig nicht intensiviert werden.

1. Einführung Was halten Klein- und Mittelständler (KMU) von Usability? Nutzen sie Methoden, um ihre Produkte gebrauchstauglicher und damit wettbewerbsfähiger zu machen? Welche Verfahren nutzen sie? Und wo sind sie an zusätzlichen Dienstleistungen von Usability Professionals interessiert? Im Rahmen eines Transferprojekts sollte universitäres Know-How in die Unternehmen der neuen Bundesländer fließen, um diese bei Fragen zur Produktbewertung zu unterstützen. Als erster Schritt wurde eine Anforderungsanalyse durchgeführt, um die aktuelle Situation von kleinen Unternehmen und Mittelständlern zu ermitteln. Ziel war zudem die Erfassung von Kundenwünschen im Bereich Usability, um das spätere Vorgehen im Projekt KiU (Kompetenzinitiative Usability) an die Erfordernisse der Praxis anzupassen. Bei KMU vermuteten wir im Gegensatz zu großen Unternehmen ein geringeres Bewusstsein für die Bedeutsamkeit von Usability.

250

Nicht nur, dass bei den KMU weniger Zeit und finanzielle Ressourcen aufgeboten werden können, um eigene Usability-Tests durchzuführen – auch die Notwendigkeit bzw. die positiven Effekte von Usability Engineering im allgemeinen könnten hier nicht so bekannt und populär sein wie bei großen Konzernen. 2. Umfrage – Konzeption und Durchführung Es wurden ca. 1000 Unternehmen der Branchen Elektronik/Technik, Maschinen-, Metall- und Werkzeugbau sowie Software/IT, die vorwiegend aus dem Raum Sachsen kommen, zur Teilnahme an einer Online-Befragung eingeladen. Die breite Fächerung der Produktgruppen war beabsichtigt, um für alle denkbaren Einsatzfelder von Usability-Verfahren eine Aussage treffen zu können. Auch wenn das Thema Usability besonders mit Software verknüpft ist, bieten sich auch in anderen Bereichen

Keywords: /// Usability /// Methoden /// klein- und mittelständische Unternehmen (KMU) /// Dienstleistung /// Online-Umfrage

Anwendungsmöglichkeiten (Sarodnick & Brau, 2006). Die Schwerpunkte der Befragung gliedern sich in das aktuelle Wissen über Usability, Interesse an der Nutzung von Usability-Dienstleistungen, die bisherige und zukünftige Anwendung von Usability-Verfahren und die subjektiv empfundene Usability der eigenen Produkte. Der Fragebogen bestand aus 59 Items. Es wurden sowohl offene Fragen als auch Mehrfachantwortformate mit einer 5-stufigen Skala verwendet. Die Bearbeitung dauerte etwa 15 Minuten. Zur Erfassung des aktuellen Wissensstands zum Thema Usability gehörte u.a. folgende Frage. [Abb. 1] Können Sie sich unter dem Begriff Usability (Benutzerfreundlichkeit, Gebrauchstauglichtkeit) etwas vorstellen?

gar nicht

wenig

überwiegend

völlig

Abb. 1. Beispielitem mit Antwortformat auf einer 5-stufigen Ratingskala

mittelmäßig


Usability Professionals 2011 Wirtschaft und Wissenschaft

Zum Interesse an der Nutzung von Usability-Dienstleistungen wurde beispielsweise gefragt: „Besteht bei Ihnen Interesse, sich über den Wettbewerbsfaktor Usability ausführlicher informieren zu lassen (z. B. Coaching, Testing)?“. Um herauszufinden, wie zu entwickelnde Produkte aktuell getestet werden, gab es eine entsprechende Frage mit Mehrfachwahlmöglichkeiten und außerdem den Zusatz „Durch wen wird das zu entwickelnde Produkt bewertet?“ Der Fragebogen beinhaltete desweiteren Fragen zur Produktion und zum Marketing, auf die aber an dieser Stelle nicht näher eingegangen werden soll. Trotz eines großen Verteilerkreises über das Technologiezentrum Chemnitz (TCC) und das Technologiezentrum Sachsen (TZS) konnten nur 41 Datensätze ausgewertet werden. 3. Ergebnisse Im Folgenden werden die wichtigsten Ergebnisse der Befragung dargestellt, die sich speziell an klein- und mittelständische Unternehmen richtete. Die 41 Teilnehmer gliedern sich in 24% Kleinstunternehmen mit bis zu zehn Mitarbeitern, 46% Kleinunternehmen mit 11-50 Mitarbeitern, 20% Mittelständler mit 51-250 Mitarbeitern und einem Teilnehmer mit mehr als 250 Mitarbeitern. Etwa die Hälfte aller Firmen hatte ihren Sitz in den drei größten Städten Sachsens (Leipzig, Dresden, Chemnitz), die andere Hälfte war in Kleinstädten ansässig. Die vertretenen Branchen konnten unter Software, Elektrotechnik/Elektronik/ Technologie und Metall-, Maschinen- und Werkzeugbau zusammengefasst werden. 3.1. Aktueller Wissensstand zum Thema Usability Die Ergebnisse zeigen, dass der Begriff „Usability“ der Mehrheit (64%) der befragten Unternehmen bekannt ist (Abbildung 2). Von denjenigen Unternehmen, die mit dem Thema Usability bereits gut vertraut sind, ist ein Großteil im Bereich Software oder elektrische Systeme tätig. Allerdings geben auch 31% der Teilnehmer an, sich gar nichts bzw. nur wenig unter Usability vorstellen zu können. Dies sind vorwiegend

Kleinunternehmen, die beispielsweise Fahrzeugteile herstellen oder im Anlagenbau tätig sind. 42% der in unserer Studie teilnehmenden Unternehmen mit 11- 50 Mitarbeitern wissen eher wenig über Usability. Firmen mit bis zu zehn Mitarbeitern scheinen am besten informiert zu sein. Der Wissenstand zum Thema Usability ist vom Alter des Unternehmens eher unabhängig, es gibt keine Hinweise auf einen Zusammenhang. [Abb. 2]

Abb. 3. Häufigkeiten der eingesetzten Verfahren in Prozent. (Fehlerbalken kennzeichnen Standardfehler).

des Einsatzes spezieller Verfahren sind in Abbildung 3 zu sehen. [Abb. 3]

Abb. 2. Häufigkeiten der Antworten des Items „Können Sie sich unter dem Begriff Usability etwas vorstellen?“ in Prozent (Fehlerbalken kennzeichnen Standardfehler).

Die Auseinandersetzung mit Usability als Wettbewerbsfaktor hingegen fällt weniger eindeutig aus. Die Unternehmen geben hier zu gleichen Teilen an, sich überwiegend bis völlig (36%) und wenig bis gar nicht (36%) mit Usability zu beschäftigen. Je nach Branche unterscheidet sich die Bereitschaft, Usability als wichtiges Qualitätsmerkmal zu berücksichtigen. So findet z. B. im Metallbau recht wenig Beschäftigung mit Usability statt. Unternehmen, denen Usability als Begriff bekannt ist, haben sich auch schon stärker damit auseinander gesetzt und überlegt, wie sie für ihre eigene Wirtschaftlichkeit daraus Vorteile schöpfen können. Das belegt eine signifikante Korrelation der Items zu „Wissen über Usability“ und „Beschäftigung mit Usability“ (r = .822, p < .01). 3.2. Anwendung von Usability- Methoden Der zweite große Bereich betrifft die Anwendung von Usability-Methoden. Immerhin knapp ein Drittel unserer Teilnehmer (27%) setzen zum jetzigen Zeitpunkt keinerlei Tests zur Prüfung der Usability ihrer Produkte ein. Die Häufigkeiten

Am häufigsten werden Laboruntersuchungen (54%) angewendet, gefolgt von Usability-Tests (32%) und Beobachtungen (32%). Vor allem in der Elektronik- und Technikbranche werden vielfältige Verfahren zur Produktbewertung eingesetzt, 43% nutzen drei oder mehr Testverfahren, während im Maschinen- und Werkzeugbau 53% der teilnehmenden Unternehmen überhaupt kein Verfahren angeben. Überraschenderweise wird auch im Softwarebereich nur in einem von fünf Fällen auf Usability getestet. Dies stimmt besonders bedenklich, wenn man beachtet, dass laut Bräutigam (2008) „mehr als 80% der im Einsatz befindlichen Software in Deutschland nicht den Anforderungen entspricht“. Die Unternehmen, die Testverfahren nutzen, lassen ihre Produkte am häufigsten durch externe Experten bewerten (54%). Dem folgen Tests durch spezifische Versuchspersonen (39%), Beurteilungen durch interne Experten (22%) und beliebige Testpersonen (12%). Die Einsatzhäufigkeit von Usability-Verfahren ist bei länger bestehenden und jungen Unternehmen verschieden. Junge KMU, die in den vergangenen zehn Jahren gegründet wurden, setzen im Vergleich zu älteren Unternehmen verstärkt Usability-Tests und Beobachtungen ein. Es wird sowohl in frühen Entwicklungsphasen, während der Umsetzung einer Produktidee, als auch am bestehenden Produkt getestet. Prototypen werden von 77% der Unternehmen, die Usability-Tests durchführen, auf eventuelle Mängel in der Bedienbarkeit geprüft. Auch während des kostspieligen Re-Designs wird von zwei

251


Dritteln der befragten Unternehmen auf Usability-Methoden zurückgegriffen. 3.3. Interesse an Usability-Dienstleistungen Neben konkreten Produkttests für Unternehmen sind als Dienstleistung auch Workshops denkbar, um Mitarbeiter direkt zu qualifizieren. Diese Art der Weiterbildung könnte helfen, den Bedarf für professionelles Usability-Consulting schneller erkennen und adäquat einschätzen zu können. Doch unsere Ergebnisse zeigen, dass Informationen zu Usability- Methoden für die eigene Anwendung eher nicht gefragt sind. Nur 27% der Befragten geben an, an weiteren Informationen interessiert zu sein, 57% lehnen dies eher ab. Gründe hierfür könnten darin liegen, dass die KMU am ehesten durch externe Experten und spezifische Versuchspersonen testen, und dafür selbst keine zusätzliche Expertise benötigen. Grundsätzlich besteht Akzeptanz von Usability- Dienstleistungen im Mittelstand, die Mehrheit der befragten KMU (64%) hält die Anwendung von Usability-Verfahren auf fast allen Entwicklungsstufen für geeignet und wünschenswert. Subjektiv bewerten die Unternehmen die Nutzbarkeit ihrer Produkte als effektiv (74%) und effizient (73%). Sie geben in der Mehrheit an, dass es zudem für Kunden einfach ist, Informationen zum Produkt zu finden (68%) und persönlich in Kontakt mit einem Berater zu treten (60%). Daher wirkt der „Aufwand“, den eine tiefergehende Beschäftigung mit der Einführung von Usability-Methoden im Unternehmen bedeuten würde, eher abschreckend. 4. Schlussfolgerungen Usability spielt auch für KMU in Sachsen eine bedeutende Rolle. Vor allem Firmen aus den Bereichen Elektronik/Elektrotechnik und Software ist das Thema Usability bekannt und wichtig. Es fällt auf, dass bei den kleinen und mittleren Unternehmen Wissen über Usability deutlich im Zusammenhang mit der Bereitschaft einer tiefergehenden Auseinandersetzung damit steht. Vor allem die Unternehmen mit maximal zehn beschäftigten Mitarbeitern

252

scheinen einen wichtigen Markt für Usability Professionals darzustellen. Zumindest unter den Teilnehmern unserer Studie verfügten sie in einem stärkeren Maße über das Bewusstsein für die positiven Auswirkungen von guter Usability als Qualitätsmerkmal. Bestimmte Testverfahren, wie die klassische Laboruntersuchung, werden von allen befragten KMU weitestgehend eingesetzt. Dies entspricht auch der Forschungsliteratur, wo dem UsabilityTest eine besondere praktische Bedeutung beigemessen wird (Nielsen, 1995). Andere Methoden wie Fokusgruppen oder Fragebogen werden nur von einem kleinen Teil der Unternehmen eingesetzt. Es wird also nur ein geringer Teil des Methodenspektrums des Usability Engineering genutzt. Dies mag darin begründet liegen, dass viele Tests mit dem fertigen Produkt stattfinden. Das Prüfen der Usability wird noch nicht als Prozess verstanden, der, je eher während der Produktentwicklung gestartet, erfolgreich aufwendige Neugestaltungen der Produkte vermeiden kann. Dabei sollte neben der Reduktion von Entwicklungszeiten auch die Senkung der Kosten vordergründig von Interesse sein. Um Probleme frühzeitig zu erkennen und zu beseitigen, muss der Entwicklungsprozess am Nutzer ausgerichtet werden (Heinsen & Vogt, 2003). Für einige Unternehmen scheint es problematisch zu sein, die Dringlichkeit von Usability-Untersuchungen einzuschätzen. So zeigt die subjektive Wahrnehmung der befragten Betriebe, dass sie mit der Qualität, genauer gesagt mit der Effektivität und Effizienz, ihrer Produkte zufrieden sind. An dieser Stelle muss allerdings beachtet werden, dass im Rahmen der Umfrage soziale Erwünschtheit eine Rolle gespielt haben könnte und die Beurteilung der eigenen Produkte verzerrt hat. Zudem sind die Hersteller nicht ohne weiteres vergleichbar. Für Unternehmen aus Branchen, die kaum oder wenig Gestaltungsspielraum bei der Produktentwicklung haben, wie zum Beispiel die Autozuliefererindustrie, stellt sich die Notwendigkeit nach Usability-Engineering höchstens bei der Prozessoptimierung. Das trifft in Sachsen auf einige Unternehmen zu, da sie traditionell stark im Automobil- und Maschinenbau verwurzelt sind. Auf Bundesländer mit einer vergleichbaren wirtschaftlichen

Struktur dürften die Ergebnisse weitestgehend übertragbar sein. Neben bewährten Dienstleistungen wie Experten-Reviews durch Usability Professionals sollte bei der Gestaltung von Angeboten für KMU beachtet werden, dass man für den Einsatz umfassender Methoden des Usability Engineering noch stärker sensibilisieren muss. Denn wenn Unternehmen einmal den Zugang zu Usability als Möglichkeit der Verbesserung ihrer Produkte gefunden haben, sind sie den Dienstleistungen gegenüber eher aufgeschlossen. Die Aufgabe der Usability-Community muss auch darauf ausgerichtet werden, den Unternehmen zu helfen, Usability-Probleme als Ursache für schlechte Absatzzahlen zu identifizieren. Als Abhilfe sollten einfache und individuell angepasste Möglichkeiten zur Optimierung der Produktionsabläufe bereit gestellt werden. Literatur 1. Bräutigam, L. (2008). Beurteilung der Software-Ergonomie anhand des ISONORM2. Fragebogens. Onlinequelle von http://www. ergo-online.de 3. Nielsen, J. (1995). Technology Transfer of Heuristic Evaluation and Usability Inspection. In K. Nordby, P. H. Helmersen, D. J. Gilmore & S. A. Arnesen (Hrsg.): Human-computer interaction: Interact ‘95.. Proceedings of INTERACT 95, S.1-2. London, UK: Chapman & Hall. 4. Heinsen, S. & Vogt, P. (2003). Usability praktisch umsetzen: Handbuch für Software, Web Mobile Devices und andere interaktive Produkte. München: Carl Hanser Verlag. 5. Sarodnick, F. & Brau, H. (2006). Methoden der Usability Evaluation: Wissenschaftliche 6. Grundlagen und praktische Anwendungen. Bern: Verlag Hans Huber, Hogrefe AG.


User Experience

253


110

Die Wechselbeziehung zwischen Marke und User Experience Implizite Markenpräferenzen durch User Experience Olde Lorenzen-Schmidt Research Director implicit diagnostics & solutions GmbH Hohe Brücke 1 20459 Hamburg lorenzen-schmidt@implicit.de

Abstract Dieser Beitrag stellt die Bedeutung von User Experience für implizite Markenpräferenzen heraus. Nachdem die Interaktion zwischen Produkt, User Experience und Marke veranschaulicht wird, werden die Grenzen expliziter Befragungen und Test aufgezeigt. Folgend wird den bisherigen, klassischen Methoden die neuropsychologische Sicht von User Experience gegenübergestellt. Nach der Erläuterung, wie etwas für das menschliche Gehirn an impliziter Bedeutung erlangt, als Muster erinnert wird und zukünftige Handlungen beeinflusst, wird am Beispiel einer Pay-TV Studie gezeigt, wie sogenannte implizite Verfahren beim User Experience Testing relativ einfach und unkompliziert zum Einsatz kommen können.

1. Produkt, User Experience und Marke bilden eine Einheit Schon 1975 konnte bei dem berühmt gewordenen Pepsi-Challenge Experiment eindrücklich gezeigt werden, dass es ausreicht, ein Produkt mit einer bekannten Marke zu labeln, um bei den Konsumenten eine signifikant andere Geschmackswahrnehmung zu induzieren, die ohne das Label nicht feststellbar wäre. Dafür wurden Blindverkostungen ohne Markennennungen durchgeführt, bei der Pepsi besser abgeschnitten hat als Coca-Cola. Bei der Verkostung mit Markennennung wandelte sich das Bild und Coca-Cola überflügelte Pepsi deutlich. Dieser Versuch wurde später mehrfach auch mit neuropsychologischen Verfahren erfolgreich wiederholt. Dabei wurden bei Probanden im Kernspintomographen Aktivierungen des Gehirns beobachtet und so ein deutlicher Zusammenhang zwischen Marke und Geschmackswahrnehmung nachgewiesen. Auch ohne Markennennungen, allein durch anregende Verbalkonzepte mit multisensorischen Anteilen, lassen sich ähnliche Effekte erzielen, wie Elder & Krishna (2010) in einer aufwändigen Studie über die Geschmackswahrnehmung bei Chips,

254

Kaugummi und Popcorn herausfanden: „(...) we showed that a simple slogan could affect taste perceptions. Specifically, we showed that a multiple-sense slogan led to higher taste perceptions than a singlesense slogan.“ Menschen konsumieren nicht Produkte oder Produktfeatures im eigentlichen Sinne, sondern vollständige Konzepte, deren Bestandteile weit über die eigentlichen Produkteigenschaften, wie z. B. Geschmack, Geruch oder Usability, hinaus wirken. Der Verhaltensökonom Dan Ariely nennt dies Conceptual Consumption (2009). Die gesamte Produktwahrnehmung und damit alle relevanten Bestandteile eines mentalen Produkt-Konzeptes werden zum größten Teil durch Markenkommunikation beeinflusst, unabhängig davon, ob die Wahrnehmung direkt oder peripher stattgefunden hat. Der konzeptuelle Zusammenhang von Produkt und Marke wird sehr häufig beiläufig gelernt. Beide Elemente sind assoziativ sehr eng miteinander verwoben. Gordon (2001): “The tiny details that do contribute to the brain image, such as the quality of plastic carrier bags, the information on a till receipt, the signage in

Keywords: /// User Experience /// Usability /// Implizite Markenpräferenz /// Neuropsychologie /// Reaktionszeitverfahren

the car park or the references in the local newsletter to bag behavior by company managers, sneak into our brains invisibly. We are usually unable to bring these kinds of experiences to mind when asked. Lowinvolvement processing occurs unnoticed. So does the continued emotional imprinting of the brand.” Es liegt nahe, dass auch die Gestaltung von interaktiven Medien wie Websites über ihre Funktionalität hinaus einen wichtigen Beitrag zur Einstellungsbildung und zum Verhalten der Nutzer leistet. Bereits 2002 weisen Mandel und Johnson in ihrer Studie nach, dass durch eine einfache Variation des Bildschirmhintergrundes Entscheidungen von Nutzern beeinflusst werden, ohne dass diese sich der Ursache bewusst sind. An einem einfachen Beispiel belegen auch Scheier und Heinsen (2005), dass durch das Aussenden von impliziten Signalen ein Bestellprozess auch dann erfolgreich sein kann, wenn der Website eine unbefriedigende Formular-Usability zu Grunde liegt: „(...)Testlogos sind implizite Signale, (...) Sie signalisieren dem Nutzer - auf einer unbewussten, unreflektierten Ebene - Sicherheit, bevor es darum geht, die Anmeldung abzuschließen.“ Der Bestellprozess ist erfolgreich, weil er über einfache Signets


Usability Professionals 2011 User Experience

bzw. Auszeichnungen Vertrauen beim Nutzer erzeugt, ohne dass er sich darüber notwendiger Weise bewusst wird. Sie motivieren ihn jedoch den Prozess abzuschließen. So hat man z. B. festgestellt, dass bereits die Nennung der VISA-Card als mögliches Zahlungsmittel das Vertrauen zu einer eCommerce-Website deutlich erhöhen kann. User Experience Management ist als Handlungsfeld in seiner Vielschichtigkeit bisher noch nicht ganz durchdrungen worden. Wie die Beispiele zeigen, geht User Experience weit über die Usability einer Anwendung oder die Verfügbarkeit von Features hinaus. Sie umfasst die gesamte Interaktion und das Erleben mit einer Anwendung und damit mit einer Marke. User Experience und Markenkommunikation sind folglich bei interaktiven Produkten und Anwendungen untrennbar miteinander verbunden. Das macht es für die UX-Experten, Konzept-Entwickler und Designer nicht einfacher, kann die Relevanz der eigenen Profession aber erheblich steigern. Um den Zusammenhang von interaktivem Medium und Marke soll es hier gehen. 2. Interaktive Anwendungen – Plattformen für das Erleben von Marken Komplexe interaktive Anwendungen bestimmen zunehmend unser Leben. Die Erlebnisse mit diesen Anwendungen, wie etwa dem Online-Banking, erzeugen ein konkretes Wahrnehmen von Marken, ähnlich dem Besuch eines Shops oder eines Events. Nur kann der Verbraucher diese Anwendungen und deren Nutzung zunehmend personalisieren und den eigenen Bedürfnissen anpassen. Damit steigt deren Relevanz und Bedeutung für die Nutzer erheblich. Anwendungen im Gefüge von Social Media Produkten sind zusätzlich noch mit anderen Nutzern gemeinsam erlebbar, das Erlebte kann ausgetauscht und dadurch neue Erlebnisse generiert werden. Hier wird die Tragweite von User Experience unmittelbar klar: Im Zusammenspiel mit der Marke wird sie ein bedeutender Bestandteil der sozialen

Umwelt, weil sie neue Formen der menschlichen Kommunikation fördert. Es entsteht der Dreiklang: Interaktion - User Experience - Marke. Dabei muss eine Marke an sich gar nicht im Vordergrund stehen. Sie kann als schlichtes Konstrukt bereits Markenwirkungen entfalten, wie es z. B. bei open-source Anwendungen der Fall ist. 3. Grenzen expliziter User-Experience Forschung

Veränderung der Pupille von Probanden zu erfassen und auszuwerten. Sie geben Auskunft darüber, welche Bereiche einer Website stärker bzw. schwächer wahrgenommen werden und welchen Blickverlauf eine Anwendung induziert. Die Pupillometrie, also die Messung von Veränderungen des Pupillendurchmessers bei Probanden bei der Interaktion mit einer Anwendung verrät zum Beispiel, welche Elemente positive oder negative emotionale Zustände bewirken.

Der typische Usability-Test im Lab wird in Form von expliziten Einzelinterviews (ein Proband mit einem Interviewer) durchgeführt. Da diese Tests insbesondere den Anspruch haben Nutzungsbarrieren aufzudecken, reicht jedoch die explizite Meinung eines Probanden in der Regel nicht für eine vollständige Analyse aus. In der Erweiterung klassischer Marktforschungsinterviews, bei denen Probanden zur Selbstauskunft aufgefordert werden und Ihre explizite Meinung sagen sollten, werden Usability-Tests entsprechend durch weitere Methoden und Elemente, wie die Aufzeichnung von Verhaltens- und Beobachtungsdaten ergänzt, also Daten, die keiner bewussten oder unbewussten Beeinflussung durch Probanden unterliegen.

Die vollständige Bedeutung, die eine interaktive Anwendungen, über die Nutzung hinaus, für die eigene Wahrnehmung, die emotionale Verarbeitung und das eigene Verhalten haben, können Probanden leider nur schwer bzw. gar nicht in Worte fassen. So führt die Befragung von Probanden im User-Experience Test, z. B. zu Anmutung und Design einer Website, meist nicht zu befriedigenden und vor allem nicht handlungsleitenden Erkenntnissen. Genauso unzuverlässig, wie Menschen konkrete Gründe für Ihren Glauben angeben können, ist es ihnen fast unmöglich, eine vollständige Begründung für die Bevorzugung eines Anbieters gegenüber einem anderen zu benennen. Äußerungen bleiben eher fragmentarisch oder beziehen sich auf einen kleinen Teilaspekt einer Anwendung.

Verhaltensbeobachtungen dienen dazu, critical incidents bei der Nutzung aufzudecken und diese mit den expliziten Äußerungen (z. B. thinking aloud bei taskbasierten Tests) und mit den Bewertungen der Probanden ins Verhältnis zu setzen. Auffällig ist hierbei, dass Probanden ihren Erfolg bzw. die jeweilige Nutzungssequenz im Usability-Test häufig deutlich positiver bewerten als der verantwortliche Studienleiter, der anhand der Beobachtungsdaten erkennen kann, wo in einer realen Nutzungssituation Probleme oder gar Abbrüche zu erwarten wären.

Die Popularität der Apple-Produkte spiegelt dieses Phänomen deutlich wider. Sicherlich sind entscheidungsrelevante Eigenschaften im Produkt (Features, Usability, etc.) angelegt. Als Begründung für Markenpräferenzen reichen sie jedoch bei weitem nicht aus. Es wird deutlich, dass andere Einflussgrößen, die der individuelle Nutzer außer den rein funktionalen Aspekten für sich als belohnend empfindet, eine ebenso große Rolle spielen. Hätte das iPhone die gleiche Bedeutung erlangen können, wenn es nicht Apple sondern ein chinesischer Anbieter auf dem Markt gebracht hätte?

Beim Usability- bzw. User-Experience Testing werden mittlerweile erfolgreich einige implizite, biometrische Verfahren angewendet. Weit verbreitet ist das Eye-Tracking. Die erhobenen Daten ermöglichen es, Blickverläufe, Fixationen und ggf. die

Gordon (2001): “Thoughts are never separate from emotions and emotions never separate from thoughts; this is a neuroscientific fact. Brands are coded in memory on a cognitive (thinking, analytical,

255


considered) and emotional (somatic) basis. These two elements of brand encoding are inextricably linked and it is emotional coding rather than reasoned argument that determines whether or not people take notice of the stimuli related to the brand, such as direct communications.” Explizite Verfahren bei User-Experience Tests, also Verfahren der Selbstauskunft, können daher nur eingeschränkt Erkenntnisse darüber liefern, warum etwas für einen Menschen richtig und wichtig erscheint. Es ist sicherlich weiterhin notwendig, Probanden nach ihrer Einschätzung, nach Likes / Dislikes, message take-out, Anmutung und Design oder Image zu befragen. Allerdings müssen diese reflektierten Äußerungen entsprechend neu eingeordnet und bewertet werden. Das, was unausgesprochen bleibt, also implizit wirkt, muss in Tests auf einem anderen Weg zugänglich gemacht werden. Insofern ergänzen sich explizite und implizite Messungen. [Abb. 1] 4. Die Bedeutung von User Experience aus neuropsychologischer Sicht Wie kommt es dazu, dass Probanden zwar etwas meinen, dies aber nicht mit ihren Handlungen korrespondiert? Was ist für sie bedeutend und für ihre Entscheidungen und Handlungen ausschlaggebend? Die Fragen sind einfach aufzuklären. Bedeutungen im psychologischen, impliziten Sinne entstehen über einen langen Zeitraum, von Kindesbeinen an. Sie sind durch Veranlagung und kulturelle Einflüsse

Abb. 1. Implizite und explizite Messungen ergänzen einander sinnvoll

256

geprägt und schreiben sich über permanente Lernprozesse als Bedeutungsmuster ins menschliche Gehirn ein. Es werden keine Einzelheiten gelernt. Alle Umweltsignale werden automatisch vom Gehirn auf ihren Bedeutungsgehalt für bestehende, erlernte oder neu anzulegende Muster geprüft. Diese vielschichtigen Muster sind das Ergebnis von Lernprozessen. Sie ermöglichen es dem Menschen – auch in komplexen Situationen und unter dem Einfluss vielfältigster, paralleler Informationen – handlungsfähig zu bleiben, ohne über jede einzelne Handlung explizit nachdenken zu müssen (Spitzer 2009). Während die Reflexionskapazität des Gehirns äußerst begrenzt ist, ist seine implizite Verarbeitungsleistung enorm mächtig. Dieser Diskrepanz ist es geschuldet, dass das menschliche Verhalten extrem komplexen Strukturen unterliegt. Aus Sicht der neuropsychologischen Forschung ist dieses nur unzureichend dem bewussten Selbst zugänglich. Prof. Georg Felser (2002) stellt dazu in Hinblick auf Tests fest: „Verlassen Sie sich nicht auf direkte Erinnerungstests (Recall und Recognition), sondern betrachten Sie auch indirekte Maße. Unser alltägliches Verhalten trägt mehr Spuren von früheren Werbekontakten, als wir bei direktem Nachfragen benennen können.“ Der überwiegende Teil unserer Entscheidungen und Handlungen wird deutlich durch „alte“ Hirnregionen beeinflusst, die in ihrer Funktion aus der Entwicklungsgeschichte des Menschen gesehen vorrangig auf das Überleben und die Reproduktion

ausgerichtet sind. Sie sind für automatische Reaktionen und Emotionen verantwortlich und unterliegen zu großen Teilen nicht der bewussten Verarbeitung. Hier kommt dem Hippocampus im limbischen System eine besondere Bedeutung zu, da er sowohl im Zusammenhang mit dem Trieb- und Affektverhalten steht als auch eine wichtige Rolle für das Gedächtnis und das emotionalen Lernen spielt. Unser implizites Gedächtnis ist folglich an allen Entscheidungen und Handlungen wie ein Autopilot beteiligt, sei es bei der Suche nach einem neuen Laufschuh oder beim Surfen in Internet (Scheier & Held 2008). Selbst dort, wo der Mensch meint, besonders reflektiert zu handeln, übt das Implizite einen enormen Einfluss aus. Das führt nicht selten dazu, dass intuitive Entscheidungen nachträglich – quasi bei der inneren Diskussion – durch rationale Argumente legitimiert werden. [Abb. 2] Diese Erkenntnis ist mittlerweile durch vielfältigste Studien aus den Bereichen der Kognitionspsychologie und Gehirnforschung belegt. Sehr viele dieser Entdeckungen sind schon lange Zeit in der Theorie verankert, konnten jedoch erst in den letzten Jahren durch den Fortschritt der bildgebenden, neuropsychologischen Verfahren in der Hirnforschung validiert und vertieft werden. In Deutschland gewinnen diese Erkenntnisse seit etwa drei Jahren in der kommerziellen Forschung deutlich mehr Beachtung. Einerseits stehen marktfähigere und forschungsökonomisch vorteilhaftere Verfahren für die Messung des Impliziten zur Verfügung, andererseits müssen bisher gebräuchliche Aktivierungsmodelle (wie

Abb. 2. Verarbeitungskapazität des Autopiloten / Piloten (nach Scheier & Held 2008)


Usability Professionals 2011 User Experience

AIDA) und Prämissen (wie der rational handelnde Mensch, der Homo oeconomicus) sehr kritisch hinterfragt werden (Scheier & Held 2008 / Poundstone 2010). 5. Das Entstehen von Markenpräferenzen durch Belohnungen Markenpräferenzen entstehen durch das Erlernen von Mustern und den Umstand, dass Marken mehr oder weniger implizite Belohnungen versprechen. Unabhängig davon, wo und wie Verbraucher mit Marken in Berührung kommen, formt sich in den Köpfen über Markenkontakte hinweg (Werbung, Produktnutzung, etc.) ein Markenbild, und damit nichts anderes als ein Muster. Dieses Muster enthält unterschiedliche Bewertungen in Abhängigkeit von der Relevanz und dem Kontext. Es kann sich ändern, je nachdem, ob es den Wesenszügen des Verbrauchers (Traits) oder bestimmten Anlässen (States) entspricht. Ob etwas grundsätzlich als belohnend empfunden wird, hängt davon ab, ob die Marke auf den Motivraum des Menschen ausgerichtet ist, also auf das, was den Menschen im innersten antreibt und so denken und handeln lässt, wie er es tut. Dabei ist die Varianz hinsichtlich dieses Motivraumes und der damit verbundenen motivationalen Zielerreichung trotz all der vielen Menschen weltweit bei weitem nicht so groß, wie man vielleicht annehmen möchte. Vielmehr reduziert sich der menschliche Motivraum auf ein relativ homogenes und universell reproduzierbares Maß. Dank dieser wissenschaftlich gesicherten Erkenntnis (Schwartz 2006) sind Motive als das, was unser menschliches Handeln bestimmt, sehr gut als Grundlage für User Experience Studien geeignet. Franzen & Bauwman (2001): „Brands are present in our memory in the form of an associative network. This consists of the totality responses connected to the brand (…) superficial characteristics (sensory representations), abstract meanings (propositions), emotions, attitudes and behavioral tendencies“.

Das Gehirn verfügt über ein eigenes Belohnungssystem, das die Umweltsignale auf ihren Belohnungsgehalt prüft und Verhalten beeinflusst (Spitzer 2009). Diese Funktionsweise ist auch dafür verantwortlich, dass sich Glücksgefühle einstellen, wenn sich z. B. ein Umweltreiz als ein unerwartet positiver herausstellt. Damit Produkte und Anwendungen auch in diesem Sinne positiv wirken können und als Belohnung wahrgenommen werden, ist die Gesamtheit der Botschaften für deren Erfolg maßgeblich und sollte bei entsprechenden Studien Berücksichtigung finden. 6. Ansätze zur Erhebung impliziter Daten beim User Research Das neugewonnene Wissen über die Funktionsweise des menschlichen Gehirns erlaubt es, mit der einhergehenden technischen Entwicklung Erkenntnisse über das zu erlangen, was bislang im Verborgenen geblieben ist: Die bei der Verarbeitung von Umwelt-Signalen entstehenden impliziten Assoziationen und Prozesse und das Wirken von Belohnungen können nachvollziehbar gemacht werden. Neuropsychologische, bildgebende Messinstrumente wie das fMRT (funktionelle Magnetresonanztomographie) spielen für die Datenerhebung dabei eine wichtige Rolle. Allerdings zählen diese apparativen Verfahren zu den aufwändigeren und sind aus Kostengründen im Bereich des kommerziellen Researchs kaum anzutreffen. Verbreiteter sind reaktionszeitbasierte Verfahren, die in der psychologischen Forschung eine lange Tradition haben. Sie sind valide und werden durch ihre Marktreife nun seit einigen Jahren auch für die kommerzielle Forschung eingesetzt. Das Ziel direkter oder indirekter Reaktionszeitmessungen im Millisekunden-Bereich ist dabei, die Erfassung impliziter Assoziationen von Probanden in Bezug auf einen Stimulus, wie eine Website oder einen TV-Spot, und die bewusste Vermeidung expliziter Reflexion (Scarabis & Florack 2003). Ranganath, Smith & Nosek (2008): „Messungen, die die Möglichkeit der Anpassung (also Nachdenken) ausschließen – sei

es durch indirekte Messung (z. B. IAT) oder durch das Abgreifen schneller Antworten (z. B. speeded self-report) werden konvergieren, während Messungen, die Gelegenheit zur Anpassung (also Nachdenken) bieten (z. B. Standard-Selbstreport), andere Ergebnisse bringen.“ Ein bewährtes Vorgehen im Rahmen des User Researchs ist ein reaktionszeitbasiertes Verfahren mit zwei Messungen pro Proband. Dabei erfolgt eine erste Messung vor der Interaktion des Nutzers mit der Anwendung. Diese dient als Baseline. Unmittelbar nach der Interaktion erfolgt eine zweite Messung. Die Betrachtung eines Stimulus oder die Interaktion des Nutzers mit einer Anwendung wirkt als sogenanntes Priming und aktiviert oder hemmt bereits bestehende implizite Gedächtnisinhalte. Diese Aktivierung bzw. Hemmung führen bei der zweiten Messung entsprechend zu einer Veränderung der Ergebnisse gegenüber der ersten Messung. Bei einer Fallzahl von mindestens 80 Probanden erlaubt die entsprechende Veränderung statistische Analysen und konkrete Aussagen über die (Marken-) Wirkung der Anwendung auf die Wahrnehmung der Nutzer. [Abb. 3] Fazio (1990): “The faster individuals can respond to the target inquiry (typically adjusted for their general baseline speed of responding on filler trials), the greater the strength of the association between the attitude object and the evaluation. (...) Thus latency measures appear to provide reliable and valid indications of associative strength in memory.” Gegenstand der reaktionszeitbasierten Messungen sind validierte Attribute, die eine Operationalisierung des menschlichen Motiv- und Wertesystems darstellen. Diese ermöglicht präzise Aussagen darüber, ob und wie stark entsprechende Belohnungen mit einer Marke implizit assoziiert werden, oder auch nicht (Schwartz 2006). Soll- und Ist-Zustand können auf dieser Basis verglichen werden. Dieser implizite Brand Fit Test wird aus forschungsökonomischen Gründen gerne

257


kurz gehalten und erfolgt in einem Feldstudio. In Abhängigkeit von Detailtiefe der interaktiven Anwendung (z. B. eine OnlineBestellung, Personalisierung einer Anwendung, etc.) und dem Anteil expliziter Fragestellungen dauert der gesamte Test in etwa 20 Minuten und kann meist ohne aufwändigen Vorlauf bei der Rekrutierung in Feldstudios weltweit durchgeführt werden. Eine Kombination der impliziten Messung mit anderen Verfahren des User Experience Testings ist ohne Einschränkungen möglich. Ein Online-Einsatz dieses reaktionszeitbasierten Verfahrens ist darüber hinaus ebenso üblich. Sei es in Form von OnlinePanel Befragungen oder On-Site direkt auf der Website eines Anbieters. Der Vorteil liegt auf der Hand: es können relativ schnell viele Probanden selektiert werden, so dass die Feldzeit entsprechend kurz bleibt und Studienergebnisse schnell vorliegen. Nachteil der Online-Variante ist die zum Teil eingeschränkte, bzw. technisch anspruchsvollere Nachvollziehbarkeit der Interaktion von Probanden mit der Anwendung.

Befragungsteil, der hier als Selbstausfüller gestaltet war.

einer dritten Phase für eine Längsschnittstudie zu einem Tracking ausgeweitet.

Während der Reaktionszeitmessung wurde darauf geachtet, dass die Probanden das Verfahren vollkommen ungestört durchlaufen konnten. So wird erreicht, dass bei der nachträglichen Bereinigung der Reaktionszeiten keine allzu großen Datenverluste auftreten. [Abb. 4]

Die Wirkung der Pay-TV Website auf die Markenwahrnehmung wurde anhand von Marken- Attributen im impliziten Brand Fit Test ermittelt. Der Test konnte zeigen, dass die Website neben einer guten Usability und einer guten Performance der funktionalen Markenwerte auch eine positive Wirkung in Hinblick auf die emotionalen Markenwerte entfaltet. Andererseits konnte die Pay-TV Website gegenüber der Baseline-Messung bei den Nutzern, in Hinblick auf die Motive Offenheit und Gemeinschaft, nicht die erhoffte Verbesserung erzielen, womit die Richtung für Optimierungen der Kommunikation vorgezeichnet war. Der Einfluss der Website auf

Nach dem Studio-Test wurde die Befragung dann in einer zweiten Phase auf die Website übertragen und mit zufällig ausgewählten Website-Besuchern durchgeführt. Diese Online-Befragung basierte ebenfalls auf der gleichen Reaktionszeitmessung. Nach einem erfolgreichen Online-Piloten wurde die Studie dann in

7. Implizite Brand Fit Tests am Beispiel einer Pay-TV Website Ein führendes, deutsches Dienstleistungsunternehmen untersuchte im Rahmen von impliziten Brand Fit Tests den Zusammenhang von User Experience und Markenimage für eine Pay-TV Website. Im ersten Schritt wurde ein Studiotest mit Reaktionszeitmessungen zur Erfassung impliziter Markenassoziationen durchgeführt. Die Messung ist dabei in eine übliche explizite Befragung eingebunden. Probanden, die der Zielgruppe der Website entsprachen wurden dafür zu Einzelbefragungen ins Studio eingeladen. Nach einer ersten Baseline-Messung mit rund 50 Messpunkten (jedes Attribut bildet einen Messpunkt der Reaktionszeitmessung ab) erfolgte eine taskbasierte Interaktion mit der Website. Unmittelbar darauf erfolgte eine zweite, exakt gleiche Reaktionszeitmessung, gefolgt von einem expliziten

258

Abb. 3. Beispielhafter Ablauf einer Befragung mit integrierter Reaktionszeitmessung

Abb. 4. Typisches Test-Setting für Probanden


Usability Professionals 2011 User Experience

die Markenwahrnehmung wurde folglich deutlich dokumentiert. Die Ergebnisse dieses impliziten Brand Fit Tests ermöglichten Aussagen darüber, welche implizite Wirkung die interaktive Anwendung insgesamt auf das Image des Anbieters hat. Sie sind als Instrument gut geeignet, um unterschiedliche Formen der Markenkommunikation zu kontrollieren und zu steuern. Der Anbieter lernt aus solchen Tests, welche Auswirkung die Markenkommunikation hat, also welche Markenassoziationen mehr oder weniger getriggert werden und wie die Kommunikation und User Experience entsprechend verbessert werden kann, um das Markenerleben zu optimieren. 8. Usability unterstützt die Belohnungskompetenz von Marken Aus neuropsychologischer Sicht haben relevante und involvierende Erfahrungen mit einer Anwendung bedeutende positive oder negative Auswirkungen auf das (Muster-) Lernen und den damit verbundenen Kontext. Es ist menscheitsgeschichtlich nachvollziehbar, dass negative Reize selbst bei einer subliminalen (also unterhalb der Wahrnehmungsgrenze) oder peripheren Präsentation deutlich schneller verarbeitet werden als positive Reize und zu Meidung und „Flucht“ führen. Negative Reize und eine negative Verfassung, wie z. B. ein stockender Flow bei der Navigation, Unübersichtlichkeit oder eine mangelnde Erwartungskonformität führen dazu, dass der Kontext insgesamt schlechter gelernt und implizit negativer bewertet wird. Dieses hat deutliche Auswirkungen auf die Wahrnehmung der Gesamtanwendung und die damit verbundene Markenkommunikation. Positive Reize, wie z. B. bei einer überraschend einfachen Menü-Struktur, führen hingegen dazu, dass auch der Kontext, also die Umgebung und damit die Markenkommunikation mitgelernt werden.

impliziter Wahrnehmung bedienen, um Anmutung, Design und Nutzungsinteresse des Produktes, der Anwendung oder der Marke umfassend untersuchen zu können.

im Vorbeigehen - Verarbeitung von Werbebotschaften ohne Aufmerksamkeit. In Mattenkott, A. & Schimansky, A. (Hrsg.): Werbung: Strategien und Konzepte für die

Gordon (2001): “The challenge to brand owners is to create a set of brand cues that will build a coherent brand in the mind. If the unconscious is forever out of bounds and if most of the messages sent out by brands do not penetrate the barrier of selective perception, then brand owners have to act smarter. They have to be less monolithic and more flexible in the triggers they use to make the brand relevant to ordinary people engaged in the day-to-day business of life.”

Zukunft (506-525). München: Verlag Franz Vahlen. 5. Franzen, G. & Bauwman, M. (2001). The Mental World of Brands: Mind, Memory and Brand Success. World Advertising Research Center, Henley-on-Thames, UK, 3. 6. Gordon, W. (2001). The darkroom of the mind. What does neuropsychology now tell us about brands? Journal of Consumer Behaviour, 1, 3, 280-292. 7. Mandel, N. & Johnson, E.J. (2002). When Web Pages Influence Choice: Effects on Visual Primes on Experts and Novices.

Insgesamt zeigen die aktuellen Erkenntnisse aus den Einsatzbereichen neuropsychologischer bzw. impliziter Verfahren, dass es eine nicht zu vernachlässigende Wechselwirkung zwischen User Experience und Markenwahrnehmung gibt. Die User Experience einerseits wird durch die vielfältigen Formen und Kanäle der Markenkommunikation beeinflusst, während andererseits die Markenwahrnehmung unter einem stetig wachsenden Einfluss der User Experience steht.

Journal of Consumer Research, 29, 235-245. 8. Montague & Read (2004). Neural Correlates of Behavioral Preference for Culturally Familiar Drinks. Neuron: Cell Press, 44, 379–387. 9. Poundstone, W. (2010). Priceless. The Myth of Fair Value (and How to Take Advantage of It). New York: Hill and Wang. 10. Ranganath, K.A., Smith, C.T. & Nosek B.A. (2008). Distinguishing automatic and controlled components of attitudes from direct and indirect measurement methods. Journal of Experimental Social Psychology ,

Die neuropsychologische Forschung sowie die aktuell verfügbaren Tools spielen folglich für User Experience Experten eine zunehmend wichtigere und äußerst spannende Rolle bei der integrierten, mehrdimensionalen Analyse von interaktiven Anwendungen im Nutzungskontext.

44, 386–396. 11. Scarabis, M. & Florack, A. (2003). Was denkt der Konsument wirklich? Reaktionszeitbasierte Verfahren als Instrument der Markenanalyse. Planung & Analyse, 6, 30-35. 12. Scheier, C. & Heinsen, S. (2005). Jeder Klick eine Entscheidung - Den Verkaufserfolg von

Literatur 1. Ariely, D. & Norton, M.I. (2009). How Concepts Affect Consumption. Annual Review of Psychology. Harvard University, 60, 475-499. 2. Elder, R.S. & Krishna, A. (2010). The Effects of Advertising Copy on Sensory Thoughts and Perceived Taste. Journal of Consumer Research, 36, 748-756. 3. Fazio, R. H. (1990). A practical guide to the use of response latency in social

Der User Experience Experte sollte folglich kritisch bewerten, welche expliziten Äußerungen von Probanden Gültigkeit haben. Je nach Kontext sollte er sich zukünftig zusätzlicher Methoden zur Messung

4. Felser, G. (2002). Werbung wirkt auch

Websites optimieren. Research & Results, 6, 36-37. 13. Scheier, C. & Held, D. (2008). Wie Werbung wirkt. Erkenntnisse des Neuromarketing. München: Rudolf Haufe Verlag. 14. Schwartz, S. H. (2006). Basic Human Values: Theory, measurement, and applications. Revue française de sociologie, 42, 249-288. 15. Spitzer, M. (2009). Lernen. Gehirnforschung und die Schule des Lebens. Heidelberg: Spektrum Akademischer Verlag.

psychological research. In Hendrick, C. & Clark, M. S. (Eds.). Review of Personality and Social Psychology, Vol. 11. Research Methods in Personality and Social Psychology (74-97). Newbury Park, CA: Sage Publications.

259


131

Erfassung visueller Ästhetik mit dem VisAWI Meinald T. Thielsch Westfälische Wilhelms-Universität Münster Institut für Psychologie Fliednerstr. 21 48149 Münster thielsch@uni-muenster.de

Morten Moshagen Universität Mannheim Lehrstuhl Psychologie III Schloss, EO238 68165 Mannheim moshagen@uni-mannheim.de

Abstract Ästhetik ist ein bedeutendes Konstrukt der User Experience, sie beeinflusst eine Vielzahl von weiteren Faktoren und Konstrukte wie Usability, Zufriedenheit, Wiederbesuchs- oder Kaufbereitschaft. Dementsprechend wichtig ist, dass Ästhetik adäquat erfasst wird. Hierzu wurde der VisAWI (Visual Aesthetics of Websites Inventory) entwickelt. Dieser erfasst vier zentrale Aspekte der Webästhetik aus Sicht der Nutzer: Einfachheit, Vielfalt, Farbigkeit und Kunstfertigkeit. Die Konstruktion des VisAWI stützt sich auf vier Studien mit insgesamt 1574 Befragten. Die Faktorstruktur wurde dabei mit exploratorischen und konfirmatorischen Faktorenanalysen abgesichert. Konvergente, divergente, diskriminative und konkurrente Validität wurde in drei weiteren Studien mit insgesamt 965 Teilnehmern nachgewiesen. Hierbei wurden zwei experimentelle Validierungen durchgeführt. Es zeigen sich zudem gute bis sehr gute Reliabilitätswerte. Norm- und Benchmarkingwerte liegen für eine Stichprobe von 102 Websites und 2846 Befragte vor. Mit dem VisAWI-S wurde in drei weiteren Studien mit insgesamt 1673 Befragten eine Kurzversion geschaffen. Der VisAWI-S erfasst einen generellen Ästhetik-Faktor und zeichnet sich durch konvergente, divergente und konkurrente Validität aus. Diese 4-Item Kurzversion ist zudem ausreichend reliabel und zeigt hohe Korrelationen zur Langversion.

1. Einleitung Das World Wide Web ist heutzutage ein zentraler Kommunikations- und Marketingkanal. Bei der empirischen Analyse von User Experience im Web hat sich visuelle Ästhetik als bedeutendes Konstrukt gezeigt: Ästhetik erfüllt dabei nicht nur wichtige Grundfunktionen und stellt ein Alleinstellungsmerkmal dar (zur Übersicht siehe Thielsch, 2008, S. 36f.). Ästhetik beeinflusst auch eine Vielzahl von weiteren Faktoren und Konstrukte wie Usability (Moshagen, Musch, & Göritz, 2009; Sonderegger & Sauer, 2010), Zufriedenheit (Cyr, Kindra & Dash, 2008; Lindgaard & Dudek, 2003), Wiederbesuchswahrscheinlichkeit (Mahlke, 2002; Moshagen & Thielsch, 2010; Yoo & Donthu, 2001) und Kaufbereitschaft (Parboteeah, Valacich & Wells, 2009). Dementsprechend wichtig ist, dass Ästhetik adäquat erfasst wird. Die wenigen existierenden Instrumente sind

260

jedoch meist ad hoc Skalen und leiden unter einer fraglichen Validität (BargasAvila et al., 2011). Eine Ausnahme stellt das von Lavie und Tractinsky (2004) entwickelte Instrument dar, welches zwei Faktoren, klassische und expressive visuelle Ästhetik, annimmt. Dieses Instrument zeigt allerdings auch verschiedene Schwächen, etwa die Vermischung von evaluativen und deskriptiven Items sowie die Abwesenheit von zentralen Merkmalen wie Farbe (Lindgaard et al., 2006; Moshagen & Thielsch, 2010). Daher wurde eine neues Instrument namens VisAWI (Visual Aesthetics of Websites Inventory) entwickelt. 2. Definition und Erfassung visueller Ästhetik Ästhetik lässt sich als unmittelbar eintretendes, positiv bewertetes, auf ein Objekt bezogenes Erlebnis verstehen. Ein ästhetischer Eindruck ist nicht das Ergebnis eines

Keywords: /// Ästhetik /// Messung /// User Experience /// Schönheit /// VisAWI

längeren bewussten Verarbeitungsprozesses, sondern tritt unmittelbar auf (vgl. Leder et al., 2004). Ästhetik bereitet Freude und wird daher positiv bewertet. Die klassische Ästhetikforschung spricht von einem „subjektivem Wohlgefallen“. Letztlich bezieht sich eine ästhetische Bewertung immer auf ein externes Objekt. Dem interaktionischen Ansatz entsprechend entsteht ein ästhetischer Eindruck folglich aus dem Zusammenwirken der Eigenschaften eines Objekts und der des Beobachters (vgl. Moshagen & Thielsch, 2010). Zur Erfassung von Usability-Bewertungen finden sich eine Reihe von etablierten Methoden (zur Übersicht siehe bspw. Gediga & Hamborg, 2002; Shneidermann & Plaisant, 2009), hierbei ist eine Trennung zwischen objektiven Merkmalen eines GUIs und subjektiven Eindrücken relativ leicht umsetzbar. Diese Trennung fällt bei der Bewertung von Ästhetik schwer: Die Erkenntnisse zu determinierenden


Usability Professionals 2011 User Experience

Variablen sind bisher nicht ausreichend um objektive Messmethoden aus diesen abzuleiten. Ästhetik bleibt somit sehr über die subjektive Wahrnehmung definiert.

3. Der VisAWI 3.1. Konstruktion und faktorielle Struktur

Dementsprechend werden bei der Bewertung von Ästhetik zumeist die subjektiven Wahrnehmungen und Urteile der Nutzer per Fragebogen erfasst. Weitere Erhebungsverfahren und klassische Methoden wie z. B. Paarvergleich, Cognitive Walkthrough oder Checklisten-Evaluationen sind zwar denkbar, aber bisher nur an wenigen Stellen dokumentiert und wahrscheinlich seltener im Einsatz. Fragebogenmethoden sind beliebt und vergleichsweise leicht umzusetzen. Hierbei ergeben sich drei Vorgehensweisen (für eine detaillierte Übersicht siehe Thielsch, 2008, S. 53 ff.): 1. Einschätzung der Ästhetik über einzelne Fragen, 2. Einschätzung der Ästhetik über Fragebogenskalen, 3. Einschätzung der Ästhetik über standardisierte Fragebogeninstrumente.

Der interaktionischen Definition von Ästhetik folgend, besteht der VisAWI aus subjektiven Einschätzungen auf Basis objektiver Reizmerkmale. Dem Nutzer werden Aussagen zu Gestaltungsmerkmalen einer Website präsentiert (z. B. „Die Farben haben eine angenehme Wirkung.“), welchen der Nutzer dann zustimmen oder ablehnen kann.

Bei der ersten Variante ergeben sich Probleme der Messgenauigkeit (Reliabilität), sind Einzelitemmessungen doch anfällig für Messfehler (siehe Schmidt & Hunter, 1996) und Antwortverzerrungen (z. B. Akquieszenz, also die Tendenz von Probanden inhaltsunabhängig zuzustimmen), erlauben nur eine grobe Messung und erfassen nicht die Komplexität eines Konstruktes – oder werden schlicht von verschiedenen Befragten unterschiedlich verstanden. Diese Probleme können beim Einsatz von Skalen oder standardisierten Fragebogeninstrumenten deutlich verringert werden. Gerade vielen der eingesetzten ad hoc Skalen mangelt es jedoch an einer klaren Konstruktdefinition, einer Prüfung der psychometrischen Eigenschaften und einem Nachweis der inhaltlichen Gültigkeit (der Validität). Besonderes Augenmerk muss jedoch bei der metrischen Erfassung von Website-Ästhetik auf die Bestimmung der Validität gelegt werden, hier finden sich bisher nur wenige Ansätze.

Der VisAWI erfasst vier zentrale Aspekte der Webästhetik aus Sicht der Nutzer: Einfachheit, Vielfalt, Farbigkeit und Kunstfertigkeit. Einfachheit umfasst dabei, wie übersichtlich und strukturiert das Layout der Website gestaltet ist. Auf der Skala Vielfalt werden Originalität und Dynamik des Designs beurteilt, während Farbigkeit nach der ästhetischen Einschätzung von Farbauswahl, -einsatz und -kombination fragt. Die Skala Kunstfertigkeit bezieht sich auf die Aktualität, Gekonntheit und Durchdachtheit des Designs der Website. Zur Interpretation erzielter Werte auf den Skalen ist es wesentlich, den subjektiven Charakter der Bewertungen zu berücksichtigen.

So bedeutet ein hoher Wert beispielsweise auf der Skala Vielfalt nicht, dass das Design übermäßig originell oder dynamisch ist, sondern lediglich, dass das realisierte Maß an Vielfalt positiv bewertet wird. Die Konstruktion des VisAWI stützt sich auf vier Studien mit insgesamt 1574 Befragten (eine detaillierte Darstellung im Detail findet sich bei Moshagen & Thielsch, 2010). Ausgehend auf einer empirischen Definition und Differenzierung des Merkmals „Website-Ästhetik“ wurde unter Einbezug von Webusern und Experten ein Itempool geschaffen. Das initiale Set von 96 Items wurde danach mehrfach überarbeitet und reduziert. Der VisAWI in der finalen Version umfasst insgesamt 18 Items (siehe Tabelle 1), die sich auf die vier Skalen zu jeweils vier bis fünf Items verteilen. Die Faktorstruktur wurde dabei mit exploratorischen und konfirmatorischen Faktorenanalysen bestimmt. Es zeigte sich ein hierarchisches Faktormodell (siehe Abbildung 1), in welchem die vier Facetten Einfachheit, Vielfalt, Farbigkeit und Kunstfertigkeit einem Generalfaktor der allgemeinen visuellen Ästhetik untergeordnet sind. Dieses Modell wurde erfolgreich an zwei unabhängigen Stichproben konfirmiert und somit kreuzvalidiert. [Abb. 1]

Abb. 1. Strukturmodell des VisAWI. Ladungen der Facetten gemäß Moshagen & Thielsch (2010; Studie 3 / Studie 4).

261


3.2. Validierung des VisAWI Die konvergente, divergente, diskriminative und konkurrente Validität wurde in drei Studien mit 965 Teilnehmern nachgewiesen, hierbei wurden zwei experimentelle Validierungen umgesetzt. Dabei zeigten sich moderate bis hohe Korrelationen zu verwandten Konstrukten und ähnlichen Messinstrumenten. So finden sich hohe Korrelationen zum Messinstrument von Lavie und Tractinsky (2004) im Bereich von .52 ≤ r ≤ .82 für die Skala zur klassischen Ästhetik und .36. ≤ .80 für die zur expressiven Ästhetik. Auch die Korrelationen zur Attraktivitätsskala aus dem AttrakDiff 1 (siehe z. B. Hassenzahl, Burmester & Koller, 2003) sind hoch (.60 ≤ .80). Dies spricht für konvergente Validität. Schwächere Korrelationen zeigen sich zu divergenten Konstrukten, wie der Skala zur pragmatischen Qualität aus dem AttrakDiff (.41 ≤ .77), einer Usability-Skala nach Flavián, Guinalíu und Gurrea (2006, .04 ≤ .48) oder dem WWI (.48 ≤ .62), einem Instrument zur Bewertung der Inhaltsqualität (Thielsch 2008). An dieser Stelle fällt auf, dass gerade die Einfachheitsskala des VisAWI hohe Korrelationen zu pragmatischen oder Usability-Aspekten aufzeigt (siehe Moshagen & Thielsch, 2010, S. 700) und das generell teilweise mittlere und hohe Korrelationen zu divergenten Konstrukten vorliegen. Dies könnte verschiedene Gründe haben, werden doch insbesondere die Wechselwirkungen (oder auch Halo-Effekte) zwischen Ästhetik und Konstrukten wie Usability immer wieder diskutiert. Zudem werden Webdesigner versuchen Aspekte wie Inhalt, Usability und Ästhetik in gleichem Maße zu optimieren, so dass diese praktisch nicht vollkommen unabhängig sein können. An dieser Stelle ist jedoch für den VisAWI eine näher gehende, experimentelle Betrachtung notwendig, um die Validität abzusichern. Daher wurden zwei experimentelle Validierungen durchgeführt. Hierbei zeigte sich, dass die Facetten des VisAWI einerseits responsiv für systematische Variation des Layouts einer Website sind,

aber andererseits spezifisch auf bestimmte Manipulationen reagieren. So beeinflusst bspw. eine Änderung des Farbschemas ausschließlich die Bewertungen auf der Farbigkeitsfacette, nicht aber auf den anderen Facetten. Zudem zeigt sich diskriminative Validität: Der VisAWI ist in der Lage auch größere Sets von real existierenden Websites (in diesem Fall ein Pool von 42 Websites aus neun Inhaltsbereichen) signifikant hinsichtlich der Ästhetik zu unterscheiden (in einer MANOVA mit den Websites als UV und dem VisAWI als AV, siehe Moshagen & Thielsch, 2010, S. 700). Ferner konnte die Wiederbesuchswahrscheinlichkeit (als konkurrentes Validitätsmaß) mittels des VisAWI reliabel vorhergesagt werden. Die Korrelation des Gesamtwerts mit einer Skala zur Wiederbesuchsbereitschaft liegt bei .51, die Subskalen des VisAWI korrelieren mit dieser im Bereich von .40 ≤ .48. Ebenso zeigen sich gute bis sehr gute Reliabilitätswerte: Die innere Konsistenz beträgt für alle Skalen α ≥ .85, für den Gesamtwert des VisAWI ist α = .94. (r)

(r)

(r) (r)

(r) (r)

(r) (r)

3.3. Hinweise zur Anwendung des VisAWI Zur Darbietung: In unseren Studien haben wir oft die Einzelitems des VisAWI in einem Frame am oberen Bildrand eingeblendet und im unteren Bereich die zu bewertende Website dargestellt (die Items waren dabei komplett randomisiert). Es sind aber auch andere Darbietungsformen möglich. Insbesondere bei einem (Live-)Nutzertest kann man auch alle Items insgesamt oder auch den Fragebogen als Papierform vorlegen. In einzelnen Projekten wurde der VisAWI zudem genutzt um andere grafische Interfaces als Websites zu beurteilen. Bei Softwarebewertungen wurden hierfür in den Items Wörter wie „Seite“ durch „Software“ ersetzt, um eine bessere Passung der Items zum Gegenstand der Evaluation herzustellen. Entsprechend der dargestellten Struktur (siehe auch Abbildung 1) kann der VisAWI sowohl auf Skalenebene ausgewertet werden als auch als Gesamtfragebogen. Vor

Item Deutsch Item Englisch Einfacheit | Simplicity (α = .89) Das Layout wirkt zu gedrängt. The layout appears too dense. Das Layout ist gut zu erfassen. The layout is easy to grasp. Das Layout erscheint angenehm gegliedert. The layout appears well structured. Die Seite erscheint zu uneinheitlich. The site appears patchy. Auf der Seite passt alles zusammen.* Everything goes together on this site.* Vielseitigkeit | Diversity (α = .87) Die Seitengestaltung ist uninteressant. The design is uninteresting. Das Layout ist originell. The layout is inventive. Die Gestaltung wirkt einfallslos. The design appears uninspired. Das Layout wirkt dynamisch. The layout appears dynamic. Die Seite ist angenehm vielseitig.* The layout is pleasantly varied. * Farbigkeit | Colorfulness (α = .89) Die farbliche Gesamtgestaltung wirkt attraktiv. The color composition is attractive.* * Die Farben passen nicht zueinander. The colors do not match. Der Farbeinsatz ist nicht gelungen. The choice of colors is botched. Die Farben haben eine angenehme Wirkung. The colors are appealing. Kunstfertigkeit | Craftsmanship (α = .85) Das Layout ist professionell. * The layout appears professionally designed.* Das Layout ist nicht zeitgemäß. The layout is not up-to-date. Die Seite erscheint mit Sorgfalt gemacht. The site is designed with care. Das Layout wirkt konzeptlos. The design of the site lacks a concept. Anmerkung: Mit * markiert sind die vier Items des VisAWI-S.

Tab. 1. Items des VisAWI und des VisAWI-S in Deutsch und Englisch.

262

(r) = vor der Bildung des Skalenmittels ist dieses Item umzukodieren. Als Antwortskala dient eine 7-stufige Likert-Skala (von 1 „stimme überhaupt mit zu“ bis 7 „stimme voll zu“).


Usability Professionals 2011 User Experience

der Auswertung sind die negativ gepolten Items (siehe Tabelle 1) umzukodieren, danach können Skalen- und Gesamtmittelwerte gebildet werden. Um konkrete Verbesserungsvorschläge zu erhalten (besonders bei einem formativen Testen), ist das Anhängen spezifischer offener Fragen denkbar. 3.4. Normierung und Benchmarking des VisAWI Zu Normierung und Benchmarking des VisAWI haben wir Daten aus insgesamt fünf Studien kombiniert (drei bisher unpublizierte Arbeiten, sowie je ein Validierungsdatensatz aus unseren Studien zum VisAWI und VisAWI-S). Insgesamt haben hier 2843 Personen (1747 Frauen und 1096 Männer) im Alter von 14 bis 82 Jahren (M = 26,95; SD = 9,68) 102 Websites beurteilt. Bei einem Gegenstand wie visueller Ästhetik würden manche große Geschlechtsund Alterseffekte erwarten. Der VisAWI zeigt sich allerdings weitgehend robust gegenüber solchen Effekten. So beträgt beispielsweise der Unterschied im VisAWIGesamtmittelwert zwischen Männern und Frauen nur 0,11 (MMänner = 4,02; MFrauen = 4,13). Dieser Unterschied wird zwar aufgrund der Stichprobengröße signifikant (F1, = 5,30, p = .02, η2 < .01), eine Effekt2842 größe1 von d = 0,08 zeigt aber an, dass dieser Geschlechtsunterschied praktisch unbedeutend ist. Auf Ebene der Subskala Einfachheit wird der Geschlechtseffekt gar nicht signifikant, bei den anderen drei Skalen zeigen sich ebenfalls nur sehr kleine Effekte (dVielseitigkeit = 0.18; dFarbigkeit = 0,10; dKunstfertigkeit = 0,09). Geschlechtseffekte können damit auch auf Skalenebene vernachlässigt werden. Die Korrelationen zwischen dem VisAWI und dem Alter sind gering aber signifikant (Gesamtwert: r = .10; Einfachheit: r = .12; Vielseitigkeit: r = .08; Farbigkeit: r = .07; Kunstfertigkeit: r = .05). Die Alterseffekte sind zwar in Ihrer Effektgröße als klein anzusehen, insbesondere ältere Befragte kommen aber zu leicht positiveren Urteilen. Dieses mag in manchen Projekten von

Relevanz sein – eine nach sechs Altersgruppen klassierte Normierung findet sich daher im Appendix in Tabelle 2. Teilweise sehr große Effekte finden sich, wenn man die bewerteten Websites nach Kategorien sortiert und diese vergleicht. Hierfür haben wir die 102 Websites, die von der Normierungsstichprobe bewertet wurden, in zehn Kategorien eingeteilt (Informationen zum Kategorisierungsschema finden sich bei Thielsch, 2008, S. 86f.) Sowohl für den Gesamtwert (F9, 2831 = 50,44, p < .01, η2 = .14) als auch für die Subskalen (F36, 11324 = 22,77, p < .01, η2 = .07) ergeben sich bedeutende Unterschiede (Effekte von Alter und Geschlecht waren hierbei kontrolliert). Eine entsprechende Darstellung der Benchmarkingwerte findet sich im Appendix in Tabelle 3. 4. Kurzform VisAWI-S Obgleich der VisAWI eine reliable und valide Einschätzung verschiedener Facetten der visuellen Ästhetik erlaubt, mag es Situationen geben, in denen man nur kurz eine generelle Ästhetik-Einschätzung erfragen möchte. Sei es, das andere Konstrukte im Vordergrund stehen oder insgesamt nur wenige Fragen gestellt werden können. In solchen Kontexten erscheint der VisAWI mit seinen 18 Items übermäßig lang. Daher wurde in einer Serie von drei weiteren Studien mit insgesamt 1673 Befragten eine 4-Item Kurzversion (siehe Tabelle1) entwickelt und validiert (Moshagen & Thielsch, under review). 4.1. Konstruktion und faktorielle Struktur Der VisAWI-S erfasst lediglich den generellen Ästhetik-Faktor. Ziel war allerdings dabei jede Facette des VisAWI mit zumindest einem Item zu repräsentieren, daher wurde Items entsprechend inhaltlicher Kriterien und anhand der Faktorladung im Original-VisAWI ausgewählt. Eine konfirmatorische Faktorenanalyse mit den vier Items zeigt eine hervorragende Modellpassung und damit, dass diese Items

den latenten g-Faktor Website-Ästhetik repräsentieren. 4.2. Validierung des VisAWI-S Die Kurzversion zeichnet sich ebenso wie die Langversion durch konvergente, divergente und konkurrente Validität aus. Wie zuvor beim VisAWI finden sich hohe Korrelationen zur Attraktivitätsskala aus dem AttrakDiff 1 (r = .72), sowie geringere Korrelationen zu divergenten Maßen wie Usability (r = .54), der Skala zur pragmatischen Qualität aus dem AttrakDiff (r = .53) oder verschiedenen Inhaltsbewertungen aus dem WWI wie Gefallen (r = .49), Verständlichkeit (r = .34) oder Qualität und Nutzen (r = .41). Divergente Validität des VisAWI-S zeigt sich weiterhin dadurch, dass die Stimmung der Befragten (erhoben mittels des MDBF von Steyer et al., 1997) keinerlei signifikanten Einfluss hat. Konkurrente Validität zeigt sich, ebenso wie beim VisAWI, in einer hohen Korrelation zur Wiederbesuchsbereitschaft (r = .52). Letztere ist umso beachtlicher, wenn man bedenkt, dass weitere Faktoren wie insbesondere der Inhalt die Intention eine Website wieder zu besuchen stark beeinflussen sollten. Weiterhin ist die Kurzversion für Gruppenvergleiche ausreichend reliabel (je Studie .76 ≤ r ≤ .81) und zeigt eine hohe Korrelation zur Langversion (r = .91). 4.3. Hinweise zur Anwendung des Vi