Not logged in.

Contribution Details

Type Bachelor's Thesis
Scope Discipline-based scholarship
Title Implementation of an Information-theoretic Graph Clustering Algorithm for Pathway Data
Organization Unit
  • Remo Hertig
  • Luka Petrovic
  • English
Institution University of Zurich
Faculty Faculty of Business, Economics and Informatics
Number of Pages 96
Date 2019
Abstract Text Standard network science methods assume a first order Markov network, where edges are independent samples. In pathway data this assumption is no longer warranted, because we have explicit higher order dependencies between edges. It is plausible that methods which account for these higher-order dependencies could achieve better performance compared to first order methods. This issue is investigated in this thesis on the problem of community detection in networks, for which Infomap is a well known method. This method is modified and implemented in Python to make use of pathway data. Due to finite pathway samples the use of entropy correction methods is investigated.
Zusammenfassung Standard Methoden der Netzwerkforschung basieren auf der Annahme, dass Ecken als unabhängige Stichproben zu bewerten sind. Es wird ein Markov Netzwerk erster Ordnung angenommen. Dies ist nicht mehr gewährleistet bei der Verwendung von Pfad-Daten, da explizit Abhängigkeiten höherer Ordnung vorhanden sind. Es ist möglich, dass Methoden, welche diese Abhängigkeiten berücksichtigen, besser funktionieren. Dieser Sachverhalt wird anhand des Community Detection Problem untersucht. Dazu wird eine bekannte Methode, «Infomap», modifiziert um mit Pfad-Daten zu operieren. Da nur endliche Stichproben verfügbar sind, werden zusätzlich Methoden untersucht, um den Entropie-Schätzwert zu korrigieren.
PDF File Download
Export BibTeX