Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title Entropy-based, Semi-dynamic Regulation of Incremental Algorithms in the case of Instantaneous Concept Drifts
Organization Unit
Authors
  • Iwan Stierli
Supervisors
  • Abraham Bernstein
Institution University of Zurich
Faculty Faculty of Economics, Business Administration and Information Technology
Date 2006
Abstract Text Incremental classifiers build their prediction rules according to the known instances of a continuous data stream. As these algorithms learn from correct and incorrect predictions, their performance improves the more instances their rules are based on. In the case of an instantaneous concept drift, this assumption is no longer valid as the old concepts’ instances falsify the rules which are to be built. Therefore, it would be ideal to forget the instances. In this thesis, it is tried to regulate this forgetting rate accurately by using an adapted form of the entropy term. First, a simple, linear correlation between the entropy and the forgetting rate will be excluded. Furthermore, a second, semi-dynamic and noise-resistant switching strategy will be pursued. It will be tested on a synthetic data set and compared with the applicable benchmarks according to two different quality measures.
Zusammenfassung Inkrementelle Klassifizierer bilden ihre Vorhersageregeln anhand den ihnen bereits bekannten Intstanzen eines kontinuierlichen Datenstromes. Da diese Algorithmen aus richtigen und falschen Voraussagen lernen, werden sie je besser, desto mehr Instanzen sie betrachten. Im Falle einer plo?tzlichen Vera?nderung der Voraussetzungen a?ndert sich diese Regel, Instanzen des alten Datenmodells sollten jetzt vergessen werden, da sie falsche Informationen hinsichtlich des neuen Modells liefern. In dieser Diplomarbeit wird versucht, die Vergessensrate mittels des Informationsgehaltes des Datenstromes mo?glichst genau zu regeln. Als erstes wird eine einfache, lineare Korrelation zwischen Informationsgehalt und Vergessensrate ausgeschlossen. Dann wird eine zweite, quasi-dynamische und noise-resistente Strategie verfolgt. Diese wird mittels zwei verschiedenen Qualita?tsmassen auf einem ku?nstlichen Datensatze getestet und gegen verschiedene Benchmarks verglichen.
PDF File Download
Export BibTeX