Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title Design and Implementation of Algorithms and Heuristics to Optimize a Data Generation and Preparation System for Credit Card Fraud Detection
Organization Unit
Authors
  • Dominik Bünzli
Supervisors
  • Eder John Scheid
  • Muriel Figueredo Franco
  • Matthias Schwalbe
Language
  • English
Institution University of Zurich
Faculty Faculty of Business, Economics and Informatics
Date 2021
Abstract Text Due to advancing digitalization, the continuous growth of e-commerce and the increasing acceptance of mobile and contactless payment methods, an increasing number of purchases are being made with credit and debit cards [3]. However, this growth has its downsides. Where there is a lot of money at stake, fraudsters are not far away. The study conducted by [1] mentions that the global annual loss of 28 billion due to fraud will rise to over 35 billion within 5 years. To counter this trend, credit card issuers are investing heavily in credit card fraud detection and prevention systems. In the industry, mainly rule-based systems [2] are currently in operation. There is a strong trend towards machine learning models as they offer a number of advantages over static rules. However, a machine learning model requires extensive and sophisticated data preparation. This is further complicated by the fact that each card usage has to be evaluated within a few milliseconds. Traditional systems reach their limits in this preparation task. Streaming technology could provide a remedy. Accordingly, this thesis deals with the design and implementation of algorithms and heuristics to optimize a streaming system for credit card fraud detection and prevention. Different optimization strategies are introduced to increase the performance of a given system. Thereby, a subdivision into operational state, Input/Output (I/O) and algorithmic optimizations takes place. To the best of the authorís knowledge, the cascading window aggregation and the continuous sliding window algorithm are introduced as two new optimization approaches. With the implemented adjustments, the throughput of the streaming job could be improved from a few 100 to 40í000 events per second. Furthermore, the job is no longer clogged and the status does not longer get bloated. By reducing the number of operators required, the latency could also be significantly reduced.
Zusammenfassung Durch die fortschreitende Digitalisierung, das kontinuierliche Wachstum des Online-Handels sowie der zunehmenden Akzeptanz von mobilen und kontaktlosen Bezahlmöglichkeiten werden Transaktionen immer häufiger mit Kredit- und Debitkarten abgewickelt. Dieses Wachstum hat jedoch auch seine Schattenseiten. Wo viel Geld im Spiel ist, sind auch Betrüger nicht fern. In der Studie von [1] wird erwähnt, dass der weltweite jährliche Verlust durch Betrug von 28 Milliarden Dollar innerhalb von 5 Jahren auf über 35 Milliarden ansteigen wird. Um diesem Trend entgegenzuwirken, investieren Kreditkartenherausgeber vermehrt in die Erkennung und Pävention von Kreditkartenbetrug. In der Industrie sind aktuell hauptsächlich regelbasierte Systeme in Betrieb [2]. Der Trend zeigt aber stark in Richtung von Machine Learning Modellen. Diese bieten eine vielzahl an Vorteilen gegenüber statischen Regelwerken. Ein Machine Learning Model benötigt jedoch eine umfassende und anspruchsvolle Datenaufbereitung. Dies wird erschwert durch den Umstand, dass jede Kartenbenutzung innerhalb weniger Millisekunden bewertet werden muss. Traditionelle Systeme stossen bei dieser Aufbereitungsarbeit an ihre Grenzen. Abhilfe könnte hierbei die Streaming Technologie schaffen. Diese Arbeit beschäftigt sich entsprechend mit dem Design und der Implementierung von Algorithmen und Heuristiken zur Optimierung eines Streaming Systems zur Erkennung und Prävention von Kreditkartenbetrug. Es werden verschiedene Optimierungsstrategien eingeführt um die Performance eines vorliegenden Systems zu erhöhen. Es findet dabei eine Unterteilung in State, Input/Output (I/O) und algorithmische Optimierung statt. Nach bestem Wissen des Authors werden mit den kaskadierenden Fensteraggregationen sowie den kontinuierlich gleitenden Fenstern zwei neue Optimierungsmöglichkeiten eingeführt. Durch die implementierten Anpassungen konnte der Durchsatz des Streamingjobs von wenigen 100 auf 40í000 Events pro Sekunde verbessert werden. Ein verstopfen des Jobs oder aufblähen des Status findet zudem nicht mehr statt. Durch die Reduzierung der benötigten Operatoren konnte zudem die Latenz minimiert werden.
PDF File Download
Export BibTeX