Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title MiningHub: a social mining and data sharing platform
Organization Unit
Authors
  • Silvan Troxler
Supervisors
  • Harald Gall
  • Martin Brandtner
Language
  • English
Institution University of Zurich
Faculty Faculty of Economics, Business Administration and Information Technology
Number of Pages 89
Date 2014
Abstract Text The popularity of social coding websites has led to an increasing number of publicly available software repositories over the last years. Researchers extract data sets from such repositories to conduct studies based on them for finding novel insights in the software engineering field. Mining software repositories is often time-consuming and error-prone. In spite of that, published papers usually do not make the used data sets available, which complicates evaluation and replication of those studies. We developed MiningHub, a web-based and extensible mining platform to overcome these limitations. Researchers can add support for arbitrary repositories to MiningHub and use the platform to obtain data from these. In addition, we provided plugins for the social coding website GitHub, bug tracking system JIRA, and discussion board Stack Overflow. These plugins and mined data sets can also be shared among others. The results of the conducted evaluation indicate that by using MiningHub, the time needed to mine software project data from several types of repositories can be reduced for selected studies.
Zusammenfassung Die Popularität von sozialen Programmier-Webseiten hat in den letzten Jahren dazu geführt, dass eine immer grösser werdende Anzahl an Software-Repositories öffentlich zugänglich ist. Forscher extrahieren Daten aus diesen Repositories und führen damit Studien durch, welche häufig neue Erkenntnisse im Bereich der Software-Entwicklung liefern. Das Extrahieren von Daten aus Software-Repositories ist allerdings oft aufwändig und fehleranfällig. Und trotzdem veröffentlichen publizierte Studien nur selten die verwendeten Daten, was sowohl Evaluation als auch Replizierung dieser Studien erschwert. Um diese Probleme zu umgehen haben wir die webbasierte und erweiterbare MiningHub-Plattform entwickelt. Forscher haben die Möglichkeit, MiningHub um die Unterstützung von beliebigen Repositories zu erweitern und anschliessend Daten von diesen zu beziehen. Wir haben bereits Plugins für die soziale Programmier-Plattform GitHub, das Fehlerverwaltungssystem JIRA sowie die Diskussionsforen von Stack Overflow hinzugefügt. Diese Plugins und abgeholte Datensätze können jeweils auch mit anderen geteilt werden. Die durchgeführte Evaluation zeigt, dass durch die Verwendung von MiningHub die benötigte Zeit zur Extrahierung von Daten aus Software-Repositories für einige Studien reduziert werden kann.
PDF File Download
Export BibTeX