Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title Analytische Betrugserkennung: Evaluation von unbeaufsichtigten, relationalen DataMining-Methoden für die Suche nach Betrugsmustern in den Transaktions- und Kontodaten von Finanzinstituten
Organization Unit
Authors
  • Patrick Reolon
Supervisors
  • Jonas Luell
  • Abraham Bernstein
Institution University of Zurich
Faculty Faculty of Economics, Business Administration and Information Technology
Date 2007
Abstract Text Day by day banking institutes process millions of transactions. When handling such a mass of funds it is easy to find people, who get tempted to illicitally take a piece of the cake. Such cases of fraud, specially when initiated by employees of financial institutes, are particularly severe respecting the loss expenses and loss of reputation. Until a few years ago, fraud detection based only upon the experience of anti-fraud employees and just recently computer systems, build to support the fraud prevention by applying filters on data of monetary transactions, have come up. On the search for further analytic methods to find patterns of fraud, to include these into existing software-systems, TVIS (Transaction Visualization System), a project between the University of Zurich (DDIS group) with a banking institute, has been developed. The goal of this software is to find hotspots algorithmically in the huge amount of data in information systems and to allow a paradigm shift from a case-friven approach to a broader data-monitoring approach. While TVIS uses supervised learning methods, concretely by supporting the visual search for fraud-schemes, which get identified by humans as such, this thesis is dedicated to the analysis of unsupervised methods and how they can support the work of anti-fraud employees. Traditional unsupervised data-mining-based methods require propositional data, while the data used to detect fraud-cases is typically highly relational. The problem-space becomes therefore more complicated, as single objects or attributes acquire their real importance only after analysis of their relations to other objects / entities. This is specially the case in the banking environment, where fraud schemes often encompass a multitude of transactions, accounts, and (unknowing) clients. Traditional approaches cannot deal with such relational data. This forces the search for new practices, which explicitely take relations into account and therefore deal successfully with the present multi-relational data-world. In this work, relational data-mining-methods will be evaluated, where the focus will be set on how good this approaches can be used for the practical search for fraud-patterns. With the inviii sights of this analysis a method will be presented, which shall help to carry out data-mining tasks for fraud-prevention. To prove the validity of this method the aim was to test it in its real environment, a data warehouse, as realistic data-structures and amounts of data are believed to bring more valuable insights than a laboratory environment, where the danger is big that the environment is adapted to the procedure. For this reason an application was developed, which extracts the necessary data from the data warehouse and prepares them for the evaluated algorithms / toolkits (SUBDUE and YALE). The implementation of this software gave already important insights into special peculiarities of the IT-infastructure mada available by the financial institute. Also the first tests with the presented method could be carried out. These have shown, that security aspects and the amount of data proved to make the usage of unsupervised methods in the banking environment rather difficult. It was also experienced that SUBDUE is not suited for the handling of huge amount of data. On the basis of these first experiences, and the insights, recommendations are presented on how the evaluated procedure can be optimized and how relational data-mining-methods and their environment should be designed in future, to be able to successfully accomplish the task of analytic fraud detection within the bank.
Zusammenfassung Tagtäglich fallen bei jeder Bank Millionen von Transaktionen an. Bei einer solchen Menge an Geldern, sind natürlich auch jene nicht fern, die der Versuchung erliegen, sich illegal ein Stück aus dem Kuchen herauszuschneiden. Solche Betrugsfälle, speziell die von Mitarbeitern unternommene, sind im Hinblick auf die Reputation und Schadenskosten einer Bank verheerend. Bis anhin stützte sich die Betrugserkennung einzig auf die Erfahrung der Mitarbeiter, und erst seit kurzem sind erste Computersysteme in Betrieb, die diese Erfahrungen anhand von Filtern implementieren. Auf der Suche nach weiteren analytischen Möglichkeiten, Betrugsmuster zu finden, um diese in die bestehenden Systeme zu integrieren, entstand mit TVIS (Transaction Visualization System) ein Projekt, das aus der Zusammenarbeit zwischen dem Institut für Informatik der Universität Zürich (DDIS Gruppe) mit einem Finanzinstitut resultierte. Das Ziel dieser Software ist es, mit Zuhilfenahme von Algorithmen in der riesigen Datenmenge der Informationssysteme so genannte Hotspots zu finden und somit einen Paradigmenwechsel, weg vom Fallgetriebenen reaktiven Ansatz und hin zu einem breiteren proaktiven Daten- Überwachungs-Ansatz, zu unterstützen. Während der Ansatz von TVIS beaufsichtigte Lernmehthoden zu Hilfe nimmt, konkret in dem die visuelle Suche nach Betrugsmustern, die von Menschen als solche identifiziert werden, unterstützt wird, widmet sich diese Arbeit der Untersuchung, wie weit unbeaufsichtigte Lernmethoden die Arbeit der Betrugsermittler erleichtern können. Traditionelle unbeaufsichtigte DataMining-Verfahren benötigen propositionale Daten, während die für die Entdeckung von auftretenden Betrugsfällen benötigten Daten typischerweise relational vorliegen. Der Problemraum wird daher komplexer, da einzelne Attribute erst durch ihre Relationen zu anderen Entitäten ihre richtige Bedeutung erlangen. Dies trifft speziell auf das Bankenumfeld zu, wo Betrugsschemata oft eine Vielzahl von Transaktionen, Konti und (unwissenden) Kunden miteinbeziehen. Traditionelle Ansätze sind mit solchen relationalen Daten überfordert womit es neuer Verfahren bedarf, die explizit solche Relationen mit einbeziehen, um wirkungsvoll den Ansprüchen der heutigen relationalen Datenwelt gerecht zu werden.
PDF File Download
Export BibTeX