Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title Understanding User Reviews
Other Titles Identifying Clusters of Similar Issues from User Reviews using BERT
Organization Unit
Authors
  • Olajoke Oladipo
Supervisors
  • Harald C. Gall
Language
  • English
Institution University of Zurich
Faculty Faculty of Business, Economics and Informatics
Date 2021
Abstract Text A product development team must continually upgrade their applications by understanding their users' experience and reviews through addressing bug reports and introducing new functionalities. Researchers have devised numerous methods to assist developers in retrieving relevant information from user reviews. These methods include automatic extraction, categorization and the use of crowd-sourcing. Some studies have attempted to cluster user reviews by categorizing each review as a bug report, feature request, enhancement, and more. These strategies use Machine learning (ML) techniques in conjunction with Natural Language Processing (NLP) to extract meaningful information from the reviews. A significant leap remains in effectively understanding the user reviews and their intentions. Transform-based models effectively understand user reviews and aid in the extraction of valuable insights (such as BERT is a pre-trained bidirectional transformer-based model developed by Google). This thesis proposes three unsupervised clustering models combined with BERT to capture in-depth user demands. The thesis aims to determine whether a transformer-based model, particularly BERT, can improve the clustering of user reviews in the absence of a priori information on the number of clusters. Additionally, we leveraged Latent Dirichlet Allocation (LDA) and a text summarization model to derive FURTHER? insights from these clusters.
Zusammenfassung Ein Produktentwicklungsteam muss seine Anwendungen fortlaufend verbessern, indem es sich mit Fehlerberichten befasst und neue Funktionalitäten einführt, wobei es die Erfahrungen und Bewertungen der Nutzer verstehen muss. Forscher haben zahlreiche Methoden entwickelt, um Entwickler dabei zu unterstützen, relevante Informationen aus Nutzerbewertungen zu gewinnen. Zu diesen Methoden gehören die automatische Extraktion, die Kategorisierung und der Einsatz von Crowd-Sourcing. In einigen Studien wurde versucht, Nutzerbewertungen zu clustern, indem jede Bewertung als Fehlerbericht, Funktionswunsch, Verbesserung und dergleichen kategorisiert wurde. Bei diesen Strategien kommen Methoden des maschinellen Lernens (ML) in Verbindung mit der Verarbeitung natürlicher Sprache (NLP) zum Einsatz, um bedeutungsvolle Informationen aus den Rezensionen zu extrahieren. Die Benutzerrezensionen und deren Absichten effizient zu verstehen, stellt nach wie vor eine wesentliche Herausforderung dar. Transformationsbasierte Modelle verstehen Nutzerbewertungen auf effiziente Weise und helfen dabei, wertvolle Erkenntnisse zu gewinnen (wie z. B. BERT, ein von Google entwickeltes vortrainiertes bidirektionales transformationsbasiertes Modell). In dieser Masterarbeit werden drei unüberwachte Clustermodelle in Kombination mit BERT verwendet, um die eingehenden Bedürfnisse der Nutzer zu erfassen. In dieser Arbeit soll untersucht werden, ob ein Transformator-basiertes Modell, insbesondere BERT, die Clusterung von Nutzerbewertungen verbessern kann, wenn a priori keine Informationen über die Anzahl von Clustern vorhanden sind. Zusätzlich wurde die Latent Dirichlet Allocation (LDA) und ein Modell zur Textzusammenfassung eingesetzt, um weitere Erkenntnisse aus diesen Clustern zu gewinnen.
PDF File Download
Export BibTeX