Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title Computing Apps Frequently Installed Together over Very Large Amounts of Mobile Devices
Organization Unit
Authors
  • Martin Spielmann
Supervisors
  • Christian Ammendola
  • Michael Hanspeter Böhlen
Language
  • English
Institution University of Zurich
Faculty Faculty of Economics, Business Administration and Information Technology
Number of Pages 60
Date 2015
Abstract Text Knowing Apps frequently installed together is valuable for applications in the field of app recommendations and targeted advertising. In this work, a distributed algorithm based on Apache Spark is developed to find the apps most frequently installed together on a vast amount of mobile devices. The algorithm is optimized by understanding Spark's execution model and the characteristics of the input data. An available input dataset of 500'000 devices was examined by the distribution of its apps and app pairs. Furthermore, the algorithm was tested extensively on different cluster configurations and with differently sized input data to investigate both scalability and affordability.
Zusammenfassung Zur passenden Empfehlung von Apps und zur zielgerichteten Einblendung von Werbung ist es wertvoll zu wissen, welche Apps oft zusammen installiert sind. In dieser Arbeit wurde ein verteilter Algorithmus auf Basis von Apache Spark implementiert, der die am meisten zusammen installierten Apps auf einer grossen Menge von mobilen Geräten findet. Der Algorithmus wurde durch das Verständnis des Ausführungsmodels von Spark und der Eigenschaften der Eingangsdaten bezüglich seiner Leistung optimiert. Dafür wurde ein verfügbares Datenset von über 500'000 Geräten im Bezug auf die Verteilung der Apps und App-Paare untersucht. Des Weiteren zeigen Experimente die Skalierbarkeit des Algorithmus auf unterschiedlichen Clustern und mit unterschiedlich grossen Eingangsdaten.
PDF File Download
Export BibTeX