Not logged in.
Quick Search - Contribution
Contribution Details
Type | Master's Thesis |
Scope | Discipline-based scholarship |
Title | Mining Software Repositories - A Semantic Web Approach |
Organization Unit | |
Authors |
|
Supervisors |
|
Institution | University of Zurich |
Faculty | Faculty of Economics, Business Administration and Information Technology |
Date | 2007 |
Abstract Text | Modern software development has become a complex task. Software systems grow larger and are densely interconnected to other systems making excessive use of large communication frameworks. To cope with this complexity, software developers and project managers need the assistance of tools which extract information about flaws in code as well as general information about the state of a project. In this thesis, we first introduce a data exchange format based on OWL/RDF, the Semantic Web’s format of choice today, able to store data and meta data from the source code, versioning system (i.e. CVS) and bug tracking system (i.e. Bugzilla). In a next step, we present a tool to retrieve the data from the online software repositories and to store it in OWL/RDF. This tool is implemented as a plug-in for the Eclipse IDE and is able to harvest data from projects managed by Eclipse. Finally, we evaluated our data format and tools by applying a set of software metric calculations, pattern detections and similarity measures by using iSPARQL and SimPack. The results of the conducted experiments are promising, and gave a first proof of our approach. |
Zusammenfassung | Softwareentwicklung wurde über die Zeit immer komplexer. Die Softwaresysteme werden grösser und sind dichter miteinander verwoben, wobei eine vielzahl von Kommunikationsframeworks und Schnittstellen zum Einsatz kommen. Damit Softwareentwickler und Projektverantwortliche den Überblick in diesen komplexen Systemen behalten können, brauchen sie die Hilfe von Werkzeugen, welche Informationen über Schwächen im Code sowie den Zustand eines Softwareprojekts im Allgemeinen liefern können. In der vorliegenden Arbeit stellen wir zuerst ein Datenaustauschformat vor welches auf der OWL/RDF Syntax des Semantic Web’s basiert. Dieses Format kann Daten speichern, welche aus dem Quellcode, Versionierungssystem (CVS) und Bugtrackingsystem (Bugzilla) extrahiert wurden. In einem weiteren Schritt haben wir ein Tool implementiert, welches Daten aus den erwähnten Systemen extrahiert, und diese im OWL/RDF Format speichert. Bei diesem Tool handelt es sich um ein Eclipse Plug-in welches auf die Daten der Projekte zugreifen kann, die von Eclipse verwaltet werden. In einem letzten Schritt evaluieren wir unser Datenformat und usere Tools indem wir einige Software-Metrik Berechnungen, Design-Muster Erkennungen und Ähnlichkeitsberechnungen mithilfe von iSPARQL und SimPack durchführen. Die Resultate dieser Experimente sind vielversprechend und bestätigen unseren Ansatz. |
PDF File | Download |
Export | BibTeX |