Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title Mining Software Repositories - A Semantic Web Approach
Organization Unit
Authors
  • Jonas Tappolet
Supervisors
  • Abraham Bernstein
  • Christoph Kiefer
Institution University of Zurich
Faculty Faculty of Economics, Business Administration and Information Technology
Date 2007
Abstract Text Modern software development has become a complex task. Software systems grow larger and are densely interconnected to other systems making excessive use of large communication frameworks. To cope with this complexity, software developers and project managers need the assistance of tools which extract information about flaws in code as well as general information about the state of a project. In this thesis, we first introduce a data exchange format based on OWL/RDF, the Semantic Web’s format of choice today, able to store data and meta data from the source code, versioning system (i.e. CVS) and bug tracking system (i.e. Bugzilla). In a next step, we present a tool to retrieve the data from the online software repositories and to store it in OWL/RDF. This tool is implemented as a plug-in for the Eclipse IDE and is able to harvest data from projects managed by Eclipse. Finally, we evaluated our data format and tools by applying a set of software metric calculations, pattern detections and similarity measures by using iSPARQL and SimPack. The results of the conducted experiments are promising, and gave a first proof of our approach.
Zusammenfassung Softwareentwicklung wurde über die Zeit immer komplexer. Die Softwaresysteme werden grösser und sind dichter miteinander verwoben, wobei eine vielzahl von Kommunikationsframeworks und Schnittstellen zum Einsatz kommen. Damit Softwareentwickler und Projektverantwortliche den Überblick in diesen komplexen Systemen behalten können, brauchen sie die Hilfe von Werkzeugen, welche Informationen über Schwächen im Code sowie den Zustand eines Softwareprojekts im Allgemeinen liefern können. In der vorliegenden Arbeit stellen wir zuerst ein Datenaustauschformat vor welches auf der OWL/RDF Syntax des Semantic Web’s basiert. Dieses Format kann Daten speichern, welche aus dem Quellcode, Versionierungssystem (CVS) und Bugtrackingsystem (Bugzilla) extrahiert wurden. In einem weiteren Schritt haben wir ein Tool implementiert, welches Daten aus den erwähnten Systemen extrahiert, und diese im OWL/RDF Format speichert. Bei diesem Tool handelt es sich um ein Eclipse Plug-in welches auf die Daten der Projekte zugreifen kann, die von Eclipse verwaltet werden. In einem letzten Schritt evaluieren wir unser Datenformat und usere Tools indem wir einige Software-Metrik Berechnungen, Design-Muster Erkennungen und Ähnlichkeitsberechnungen mithilfe von iSPARQL und SimPack durchführen. Die Resultate dieser Experimente sind vielversprechend und bestätigen unseren Ansatz.
PDF File Download
Export BibTeX