Not logged in.
Quick Search - Contribution
Contribution Details
Type | Master's Thesis |
Scope | Discipline-based scholarship |
Title | Entropy-based, Semi-dynamic Regulation of Incremental Algorithms in the case of Instantaneous Concept Drifts |
Organization Unit | |
Authors |
|
Supervisors |
|
Institution | University of Zurich |
Faculty | Faculty of Economics, Business Administration and Information Technology |
Date | 2006 |
Abstract Text | Incremental classifiers build their prediction rules according to the known instances of a continuous data stream. As these algorithms learn from correct and incorrect predictions, their performance improves the more instances their rules are based on. In the case of an instantaneous concept drift, this assumption is no longer valid as the old concepts’ instances falsify the rules which are to be built. Therefore, it would be ideal to forget the instances. In this thesis, it is tried to regulate this forgetting rate accurately by using an adapted form of the entropy term. First, a simple, linear correlation between the entropy and the forgetting rate will be excluded. Furthermore, a second, semi-dynamic and noise-resistant switching strategy will be pursued. It will be tested on a synthetic data set and compared with the applicable benchmarks according to two different quality measures. |
Zusammenfassung | Inkrementelle Klassifizierer bilden ihre Vorhersageregeln anhand den ihnen bereits bekannten Intstanzen eines kontinuierlichen Datenstromes. Da diese Algorithmen aus richtigen und falschen Voraussagen lernen, werden sie je besser, desto mehr Instanzen sie betrachten. Im Falle einer plo?tzlichen Vera?nderung der Voraussetzungen a?ndert sich diese Regel, Instanzen des alten Datenmodells sollten jetzt vergessen werden, da sie falsche Informationen hinsichtlich des neuen Modells liefern. In dieser Diplomarbeit wird versucht, die Vergessensrate mittels des Informationsgehaltes des Datenstromes mo?glichst genau zu regeln. Als erstes wird eine einfache, lineare Korrelation zwischen Informationsgehalt und Vergessensrate ausgeschlossen. Dann wird eine zweite, quasi-dynamische und noise-resistente Strategie verfolgt. Diese wird mittels zwei verschiedenen Qualita?tsmassen auf einem ku?nstlichen Datensatze getestet und gegen verschiedene Benchmarks verglichen. |
PDF File |
![]() |
Export |
![]() |