Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title Using Visualization to Discover Patterns in Biometric Data
Organization Unit
Authors
  • Hannes Tresch
Supervisors
  • Thomas Fritz
  • Sebastian Müller
Language
  • English
Institution University of Zurich
Faculty Faculty of Economics, Business Administration and Information Technology
Number of Pages 124
Date 2014
Abstract Text The aim of this thesis has been to develop a visualization application that supports the analysis of psycho-physiological data recorded from software developers working on code comprehension tasks. Since psycho-physiological (also known as biometric) measurements, such as electrodermal activity (EDA), or electroencephalography (EEG), can be used as indicators for cognitive states, these data are used to detect the difficulties a developer might have experienced during source code comprehension activities. Using three different visualization approaches, a dataset consisting of EEG, EDA and eye-tracking data was investigated with a special focus on the identification of various kinds of patterns (e.g. code reading patterns or time-related biometric patterns). Based on the results of visual inspection (enabled by the visualizations developed for this purpose), significance tests were conducted to verify the findings. The analysis has confirmed eye movement patterns that had been described in previous research. New insights are made regarding time-related patterns. Metric correlations within task data were found, like the accumulation of eyeblinks with concomitant low values for mental focus (Attention eSense™ values). Additionally, metric differences in task pairs of inherently easier/harder tasks were analyzed and interpreted. For example, it was found that the use of mnemonic variable names instead of generic variable names result in a significant lower number of occurrences of the retrace declaration pattern. Learning how software developers read source code and how they emotionally and physiologically react on reading code comprehension tasks could help to locate problematic code segments. Findings in this research field can be used to develop novel programming support tools that make use of psycho-physiological sensors. Depending on programming difficulties detected on the fly (e.g. by identification of biometric patterns), appropriate interventions could be suggested by a rule engine.
Zusammenfassung Ziel dieser Arbeit ist es, einen Visualisierungsprototypen zu entwickeln, der psycho-physiologische Daten aus Codeverständnisaufgaben geeignet darstellt. Verschiedene Studien der psychologischen Forschung haben gezeigt, dass psycho-physiologische (biometrische) Daten wie EEG, EDA oder Eye-tracking Daten Rückschlüsse auf kognitive Aktivitäten zulassen. Aufgrund dieser Tatsache können psycho-physiologische Sensoren dazu eingesetzt werden, um auf den Schwierigkeitsgrad von bestimmten Codeverständnisaufgaben zu schliessen. Ein Datensatz, bestehend aus EEG, EDA und Eye-tracking Daten, wurde mithilfe der eigens zu diesem Zweck entwickelten Visualisierungen auf Datenmuster und Auffälligkeiten hin untersucht (z.B. zeitbezogene biometrische Muster oder Lesepfadmuster). Die gefundenen Resultate wurden anschliessend Signifikanztests unterzogen. Neben bereits bekannten Muster bzgl. des Code-Lesepfads wurden beispielsweise zeitbezogene Auffälligkeiten entdeckt. So gehen Anhäufungen von Lidschlägen oft einher mit relativ tiefen Messwerten für den mentalen Fokus (Attention eSense™-Werte). Zusätzlich wurden speziell die Messdaten von ähnlich konstruierten Aufgabenpaaren miteinander verglichen und die Resultate interpretiert. Dabei wurde u.a. festgestellt, dass beim Gebrauch von sogenannten mnemonischen Variablennamen signifikant weniger "retrace declaration patterns" (Blickbewegungen zur Variablendeklaration) zu beobachten sind. Die Erkenntnisse darüber, wie Softwareentwickler Quellcode lesen und wie sie auf bestimmte Codeaufgaben reagieren, können dazu beitragen, problematische Codestellen zu identifizieren. Resultate aus diesem Forschungsbereich könnten dazu genutzt werden, neuartige Unterstützungstools zu entwickeln, die aufgrund der identifizierten Datenmuster Codeänderungen oder andersweitige Eingriffe vorschlagen könnten.
PDF File Download
Export BibTeX