Not logged in.
Quick Search - Contribution
Contribution Details
Type | Master's Thesis |
Scope | Discipline-based scholarship |
Title | Kundenverhalten in web-basierten sozialen Netzwerken Eine Evaluation von Vorhersagemodellen |
Organization Unit | |
Authors |
|
Supervisors |
|
Institution | University of Zurich |
Faculty | Faculty of Economics, Business Administration and Information Technology |
Date | 2006 |
Abstract Text | In every business, customer data are a big asset. Analyzing them allows you to segment, target and position your offers in terms of prize and channel. Data mining methods as an explorative way to analyze customer data made their way into corporate data warehouses more than ten years ago. Nowadays where web-based social networks offer customer created behavioural network data in real time, the mining community sees new applications of relational data mining approaches that take features of connected member-profiles and relations into their reasoning. Two freely available workbenches that incorporate such relational algorithms are NetKit-SRL and Proximity. Our work applied and compared these two software packages on a data set of 42?044 interconnected member-profiles of a web-based social network with widely used propositional algorithms like C5, Logistic-Regression and Neural Nets. The scope of data has been enriched with ego-net centrality and density measures from the corpus of measures commonly known in the social network analysis (sna) field. It has been shown that the incorporation of sna-measures must not improve the mining results with traditional algorithms as well as with relational ones. Furthermore it can be stated, that relational algorithms on networked data are not in every case superior to traditional algorithms on propositionalized data. Our work names the moderating variables that led to these outcomes. With our key finding in detecting meaningful correlations between sna- and activity- measures we have been able to design the ?social mailing model?, a direct mailing model that could lead to a substantial improvement in conversion rate. A real world experiment would therefore be one of the proposed next steps. |
Zusammenfassung | Kundendaten als Informationsquelle für Marktforschung und Marketing sind für Unternehmen von strategischer Bedeutung. Sie zu analysieren ermöglicht das zielgruppenspezifische und kundensegmentbezogene Positionieren der angebotenen Dienste und Produkte hinsichtlich Preisgestaltung und Distributionskanal. Seit über einem Jahrzehnt setzen Unternehmen für diese Zwecke Methoden des Data Mining ein. Neuerdings generieren Mitglieder von populären, web-basierten sozialen Netzwerken vernetzte Kunden- und Verhaltensdaten in Echtzeit. Werden ebensolche Netzwerkdaten analysiert, verdienen relationale Data Mining Algorithmen, welche die Eigenschaften benachbarter Knoten und Kanten in ihre Vorhersagen mit einbeziehen, sowohl von der Forschung als auch von der Praxis erhöhte Aufmerksamkeit. Zwei frei erhältliche relationale Data Mining Werkzeuge sind NetKit-SRL und Proximity. Vorliegende Arbeit vergleicht die beiden Werkzeuge auf einem Datensatz aus einem web-basierten sozialen Netzwerk mit 42'044 vernetzten Mitgliederprofilen mit herkömmlichen Data Mining Algorithmen wie C5, Logistischer Regression und Neuronalen Netzen. Für dieses Unterfangen sind die vorhandenen Profildaten zusätzlich mit Egonetz-Kennzahlen der sozialen Netzwerkanalyse wie beispielsweise den Zentralitäts- und Dichtemassen ergänzt worden. Die Untersuchung hat gezeigt, dass der Einbezug von Kennzahlen der sozialen Netzwerkanalyse nicht zwingend zu besseren Vorhersageergebnissen sowohl mit propositionalen als auch mit relationalen Mining Algorithmen führt. Weiter wurde ersichtlich, dass relationale Mining Algorithmen auf Netzwerkdaten nicht in jedem Fall bessere Vorhersagen machen als propositionale Algorithmen. Vorliegende Arbeit nennt die für die unterschiedlichen Ergebnisse moderierenden Variablen. Mit der Erkenntnis, dass die Netzwerkvariablen unter den vorhandenen Variablen am stärksten mit den Aktivitätsvariablen korrelieren, liess sich das ?social mailing modell? erstellen - ein ?Direct Marketing Modell?, dessen Anwendung zu höheren Konversionsraten führen kann. Einer der nächsten Schritte wäre demzufolge ein Feldexperiment, das die Praxistauglichkeit des Modells überprüft. |
Export | BibTeX |