Not logged in.

Contribution Details

Type Bachelor's Thesis
Scope Discipline-based scholarship
Title Ranking im Vergleich mit Hyperrectangle und Normalisierung als Verfahren zur Klassifizierung von Daten
Organization Unit
Authors
  • Patrick Leibundgut
Supervisors
  • Abraham Bernstein
  • Jörg-Uwe Kietz
Institution University of Zurich
Faculty Faculty of Economics, Business Administration and Information Technology
Date 2010
Abstract Text For the classification of instances you can use different methods. The use of geometric distance or semantic distance for the kNN method provides a different result depending on the distribution of the attributes. The semantic distance is because of its incorrect interpretation of the distance significantly less correct with the classifications and thus proves to be unsuitable for a classification. The comparison of the results of the ranking and the normalization as pre-processing methods shows, that the ranking got better results in the classification as the normalization with skew distributed attributes. The normalisation performs better for attributes, that are not skew distributed.
Zusammenfassung Fu?r die Klassifizierung von Instanzen kann man verschiedene Verfahren anwenden. Die Verwendung von geometrischem Abstand oder semantischem Abstand fu?r das kNN Verfahren liefert in Abhängigkeit von der Verteilung der Attribute unterschiedliche Ergebnisse. Der semantische Abstand ergibt wegen ungeeigneter Betrachtung des Abstandes signifikant schlechtere Klassifizierungen und erweist sich daher als ungeeignet fu?r eine Klassifizierung. Der Vergleich von Ranking und Normalisierung als Preprocessing Methoden ergibt, dass das Ranking bei schief verteilten Attributen bessere Ergebnisse bei der Klassifizierung liefert als bei Normalisierung. Bei nicht schief verteilten Attributen liefert die Normalisierung bessere Resultate.
PDF File Download
Export BibTeX