Haben Sie sich schon einmal die Frage gestellt, welches Diagramm Sie zu welchem Zweck nutzen sollen, um die aus Ihrer Datenanalyse resultierenden Ergebnisse am besten zu visualisieren, um sie an Ihre Zielgruppe kommunizieren zu können?

Genau dieselbe Frage haben sich die Autoren Bahador Saket, Alex Endert und Çagatay Demiralp in Ihrem Artikel Task-Based Effectiveness of Basic Visualizations, der im IEEE Transactions on Visualization and Computer Graphics, Vol. 25, Nr. 7 im Juli 2019 veröffentlicht wurde, gestellt.

Dabei haben sich die Autoren im ersten Schritt anhand der Recherche von gegenwärtigen Studien und aus aktuell genutzten Taxonomien von Datenvisualisierungstools, auf das Balken-, Kreis-, Linien- und Streudiagramm sowie die Tabelle begrenzt. Im zweiten Schritt haben die Autoren sich für zwei Datensets zu den Themen Fahrzeuge und Filme entschieden. Dann im dritten Schritt haben die Autoren aus den beiden Datensets einen Multiple-Choice Fragebogen mit der Darstellung der Visualisierungen erstellt. Der Multiple Choice Fragebogen ist von 180 Studienteilnehmern auf der Amazon Mechanical Turk Plattform erfolgreich absolviert worden. Von den Teilnehmern hatten 107 Personen Kenntnisse in Excel und fünf Personen hatten bereits Kenntnisse in Tableau.

Abbildung 1: Untersuchte Visualisierungen (in Anlehnung an Saket, B., Endert, A., Demiralp, Ç. 2019, S. 2506)

Abbildung 1: Untersuchte Visualisierungen (in Anlehnung an Saket, B., Endert, A., Demiralp, Ç. 2019, S. 2506)

Um die Qualität der Studie zu sichern, haben die Autoren die verwendeten Datentypen der Datensets benannt und paarweise miteinander kombiniert, sodass unter 50 Datenpunkte innerhalb einer Visualisierung dargestellt worden sind.  Diese Einschränkung war notwendig, da ansonsten eine zu hohe Komplexität für die Studienteilnehmer herrschen würde. Die erhöhte Komplexität würde sowohl zu einer erhöhten Fehlerrate der Fragenbeantwortung als auch zu einer Erhöhung der Bearbeitungszeit der Beantwortung der Fragen innerhalb der Studie führen.

Danach haben die Autoren anhand Ihrer Literatur- und Studienrecherche folgende zehn Analysetätigkeiten abgeleitet:

  1. Anomalien bestimmen
  2. Daten filtern
  3. Daten sortieren
  4. Datenwerte abrufen
  5. Extremwerte bestimmen
  6. Gruppen bestimmen
  7. Korrelationen bestimmen
  8. Messbereiche bestimmen
  9. Verteilung bestimmen
  10. Werte durch berechnete Funktionen ableiten

Zu jeder dieser zehn Analysetätigkeiten haben die Autoren anhand der beiden verwendeten Datensets Fragen und Antwortmöglichkeiten in Form einer Multiple-Choice Liste abgeleitet. Mittels bereitgestellter Visualisierungen konnten die Multiple-Choice-Fragen beantwortet und ein Messystem für die drei zu überprüfenden Kriterien der Genauigkeit, der Bearbeitungszeit und Präferenz des Benutzers für eine Visualisierung abgeleitet werden.


Abbildung 2: Beispiel des Aufbaus der Fragen im Fragebogen (in Anlehnung an Saket, B., Endert, A., Demiralp, Ç. 2019, S. 2508)

Abbildung 2: Beispiel des Aufbaus der Fragen im Fragebogen (in Anlehnung an Saket, B., Endert, A., Demiralp, Ç. 2019, S. 2508)

Folgende Richtlinien konnten die Autoren aus den Studienergebnissen ableiten:

  1. Verwendung von Balken- oder Kreisdiagramme zur Darstellung von Gruppen.
  2. Verwendung von Liniendiagramme zur Darstellung von Korrelationen.
  3. Verwendung von Streudiagrammen zur Darstellung von Anomalien.
  4. Keine Verwendung von Liniendiagramme zur Darstellung von Details.
  5. Keine Verwendung von Tabellen und Kreisdiagrammen zur Darstellung von Korrelationen.

Neben diesen Richtlinien ist den Autoren zusätzlich aufgefallen, dass das Streudiagramm oft zu den drei besten Visualisierungsformen zählt.

Weiterhin besteht eine positive Korrelation zwischen der Genauigkeit der Bearbeitung, einer Analyseaufgabe und der präferierten Visualisierung. Denn die Ergebnisse der Studie zeigten, dass die genaueste Visualisierung sehr häufig für die Studienteilnehmer auch die präferierte Visualisierungsform ist.

Des Weiteren ist eine schwache negative Korrelation zwischen der Bearbeitungszeit und der Benutzerpräferenz der Nutzung einer bestimmten Visualisierung festgestellt worden. Denn die Teilnehmer haben häufig eine längere Zeit zur Bearbeitung einer Aufgabe benötigt, wenn jene nicht die Frage anhand Ihrer präferierten Visualisierung beantworten konnten.

Ebenso haben die Autoren erfasst, dass die tatsächliche Genauigkeit einer Visualisierung nicht immer mit der vorgestellten Genauigkeit eines Teilnehmers im Hinblick auf die präferierte Visualisierung übereinstimmen.

Zuletzt haben die Autoren beobachtet, dass die Teilnehmer die Visualisierungen nach ihrer Arbeitsroutine in eine Rangfolge eingeordnet haben. Beispielsweise haben die Teilnehmer bei Cluster Analysen die Tabelle als zweitbeste Visualisierung präferiert, obwohl die Nutzung einer Tabelle zur Bewältigung von Gruppierungsaufgaben suboptimal ist.


Abbildung 3: Bewertungsmatrix und Rangfolge der Visualisierungen pro Analysetätigkeiten (in Anlehnung an Saket, B., Endert, A., Demiralp, Ç. 2019, S. 2509)

Abbildung 3: Bewertungsmatrix und Rangfolge der Visualisierungen pro Analysetätigkeiten (in Anlehnung an Saket, B., Endert, A., Demiralp, Ç. 2019, S. 2509)

Welche Visualisierungen sollten Sie demzufolge am besten nutzen, um die Ergebnisse Ihrer Datenanalysen darzustellen?

Wenn Sie Daten visualisieren möchten, dann sollten Sie am häufigsten das Balkendiagramm und am seltensten das Liniendiagramm nutzen.

Im Falle der Darstellung von Korrelationen sollten Sie anstelle von Balkendiagrammen jedoch Liniendiagramme einsetzen.

Tabellen sollten vorzugsweise zur Darstellung von Filtern, von Einzelwerten und zur Berechnung von Aggregationen verwendet werden.

Zur Darstellung von Anomalien und Extremwerten, sollte Sie am besten Streudiagramme verwenden.

Um Ihrer Zielgruppe eine schnelle Einschätzungsmöglichkeit der Gruppierung Ihrer Daten zu ermöglichen, verwenden Sie am besten das Kreisdiagramm.

Jetzt teilen auf:

Jetzt kommentieren