Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title Mining Software Repositories with Relational Data Mining Methods
Organization Unit
Authors
  • Sonja Näf
Supervisors
  • Abraham Bernstein
  • Jonas Tappolet
Institution University of Zurich
Faculty Faculty of Economics, Business Administration and Information Technology
Date 2008
Abstract Text In complex software projects a lot of information about defect, release and source code history is gathered. Researchers figured out that mining these software repositories could provide valuable information about the software development. So far, software repositories were mined with traditional data mining methods which are suitable for propositional data. Propositional data is flat and homogeneous, held in a single-table-database. This thesis compares the traditional approach with relational data mining methods which are able to handle heterogeneous data. First, an introduction about relational data mining is given and then a few relational data mining tools are introduced. In a next step we present the data for our experiments and the necessary data preparations. Finally, we conduct several experiments which show the advantages as well as the weaknesses of the relational approach.
Zusammenfassung In komplexen Software Projekten werden viele Daten über die Bug-, Release- und Source Code History gesammelt. Forscher haben herausgefunden, dass Software Repositories wertvolle Informationen zur Softwareentwicklung enthalten. Bis anhin wurde in Software Repositories mit traditionellen Data Mining Methoden nach Mustern gesucht. Traditionelle Data Mining Methoden sind für propositionale Daten geeignet, die in einer einzigen Tabelle gespeichert werden können und somit flach und homogen sind. Diese Diplomarbeit vergleicht traditionelle Vorgehensweisen mit relationalen Data Mining Methoden, welche mit heterogenen Daten umgehen können. Zu Beginn dieser Arbeit werden das relationale Data Mining sowie Tools vorgestellt. Nachher werden wir die zur Verfügung stehenden Daten beschreiben und die notwendigen Vorkehrungen für unsere Experimente erklären. Zum Schluss werden die durchgeführten Experimente, sowie die Stärken und Schwächen des relationalen Ansatzes diskutiert.
PDF File Download
Export BibTeX