Not logged in.

Contribution Details

Type Bachelor's Thesis
Scope Discipline-based scholarship
Title MARG: Automatic Visualization of a Data Science Notebook's Narrative: Further Development of a Prototype
Organization Unit
Authors
  • Daniela Flüeli
Supervisors
  • Dhivyabharathi Ramasamy
  • Abraham Bernstein
Language
  • English
Institution University of Zurich
Faculty Faculty of Business, Economics and Informatics
Date 2020
Abstract Text Computational notebooks' high flexibility concerning code organization and execution optimally supports the generally non-linear and iterative way of data scientists' work and is, therefore, a tool they use frequently. However, the same flexibility makes many notebooks difficult to comprehend. This bachelor thesis presents the Jupyter extension MARG 2.0, a visualization plugin, which aims to improve notebooks' comprehensibility. It offers the user an interactive and dynamic tree diagram that visualizes the notebook cells' workflow structure and allows them to keep track of their exploration. The tree shows additional information for the individual cells, such as their position in the linear cell sequence, their place in the workflow, the type of the data science activity performed in them, their execution numbers, and the code's rationale and intent in them. The visualization facilitates navigating and orientating oneself within a notebook during and after development. The additional information can be entered and modified directly by the user via the MARG user interface, whereupon the tree diagram is updated dynamically. MARG also includes a dashboard that can be used to analyze the development of a computer notebook.
Zusammenfassung Die hohe Flexibilität von Computational-Notebooks hinsichtlich der Organisation und Ausführung von Code unterstützt optimal die im Allgemeinen nichtlineare und iterative Arbeitsweise von Datenwissenschaftlern und wird daher häufig von diesen genutzt. Die gleiche Flexibilität hat jedoch zur Folge, dass viele Notebooks schwierig zu verstehen sind. In dieser Bachelorarbeit wird die Jupyter-Erweiterung MARG 2.0 vorgestellt, ein Visualisierungs-Plugin, mit der die Verständlichkeit von Notebooks verbessert werden soll. Sie bietet dem Benutzer ein interaktives und dynamisches Baumdiagramm, das die Workflow-Struktur der Notebookzellen visualisiert. Dieses Diagramm zeigt zusätzliche Informationen für die einzelnen Zellen, wie z.B. deren Position in der linearen Zellsequenz, deren Platz im Workflow, die darin ausgeführten datenwissenschaftlichen Aktivitäten, deren Ausführungsnummern sowie die Begründung und Absicht deren Zellinhalts. Die Visualisierung erleichtert das Navigieren und Orientieren innerhalb eines Notebooks, während und nach dessen Erstellung. Die zusätzlichen Informationen können direkt vom Benutzer über die MARG-Benutzeroberfläche eingegeben und geändert werden, woraufhin sich das Baumdiagramm dynamisch aktualisiert. MARG umfasst zudem ein Dashboard, anhand dessen die Entwicklung eines Computer-Notebooks analysiert werden kann.
PDF File Download
Export BibTeX