Not logged in.
Quick Search - Contribution
Contribution Details
Type | Master's Thesis |
Scope | Discipline-based scholarship |
Title | Mining Software Repositories with Relational Data Mining Methods |
Organization Unit | |
Authors |
|
Supervisors |
|
Institution | University of Zurich |
Faculty | Faculty of Economics, Business Administration and Information Technology |
Date | 2008 |
Abstract Text | In complex software projects a lot of information about defect, release and source code history is gathered. Researchers figured out that mining these software repositories could provide valuable information about the software development. So far, software repositories were mined with traditional data mining methods which are suitable for propositional data. Propositional data is flat and homogeneous, held in a single-table-database. This thesis compares the traditional approach with relational data mining methods which are able to handle heterogeneous data. First, an introduction about relational data mining is given and then a few relational data mining tools are introduced. In a next step we present the data for our experiments and the necessary data preparations. Finally, we conduct several experiments which show the advantages as well as the weaknesses of the relational approach. |
Zusammenfassung | In komplexen Software Projekten werden viele Daten über die Bug-, Release- und Source Code History gesammelt. Forscher haben herausgefunden, dass Software Repositories wertvolle Informationen zur Softwareentwicklung enthalten. Bis anhin wurde in Software Repositories mit traditionellen Data Mining Methoden nach Mustern gesucht. Traditionelle Data Mining Methoden sind für propositionale Daten geeignet, die in einer einzigen Tabelle gespeichert werden können und somit flach und homogen sind. Diese Diplomarbeit vergleicht traditionelle Vorgehensweisen mit relationalen Data Mining Methoden, welche mit heterogenen Daten umgehen können. Zu Beginn dieser Arbeit werden das relationale Data Mining sowie Tools vorgestellt. Nachher werden wir die zur Verfügung stehenden Daten beschreiben und die notwendigen Vorkehrungen für unsere Experimente erklären. Zum Schluss werden die durchgeführten Experimente, sowie die Stärken und Schwächen des relationalen Ansatzes diskutiert. |
PDF File | Download |
Export | BibTeX |