Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title Multi-Domain Media Segmentation
Organization Unit
Authors
  • Amos-Madalin Neculau
Supervisors
  • Luca Rossetto
Language
  • English
Institution University of Zurich
Faculty Faculty of Business, Economics and Informatics
Date 2021
Abstract Text When analyzing multimedia materials, particularly audio and video, it is uncommon for a produced annotation to make reference to the whole content. Frequently, it is much more beneficial to refer to a particular section of the text. Segmentation may take place in a variety of domains, including spatial, temporal, frequency, and any combination thereof. While many segmentation methods are used in isolation for diverse purposes, there is currently no uniform representation that enables the concurrent use and mixing of various segmentation methodologies inside the same application. As a result, the present effort is focused on developing a model that "fits everything". The thesis makes the following contributions: it studies segmentation methods in the context of several modalities (video, audio, multi-modal). Additionally, it provides an abstract segmentation paradigm that is applicable regardless of the modality utilized. Moreover, it offers a new technique of multimedia retrieval, mostly tested on video, that is based on areas of interest identified using a multitude of segmentation algorithms that are explained in detail.
Zusammenfassung Bei der Analyse von Multimedia-Materialien, insbesondere Audio und Video, ist es ungewöhnlich, dass eine produzierte Anmerkung auf den gesamten Inhalt verweist. Häufig ist es viel sinnvoller, auf einen bestimmten Abschnitt des Dokuments zu verweisen. Die Segmentierung kann in einer Vielzahl von Domänen erfolgen, einschliesslich räumlicher, zeitlicher, frequenzbezogener und beliebiger Kombinationen davon. Während viele Segmentierungsmethoden für verschiedene Zwecke isoliert verwendet werden, gibt es derzeit keine einheitliche Darstellung, die die gleichzeitige Verwendung und Mischung verschiedener Segmentierungsmethoden innerhalb derselben Anwendung ermöglicht. Daher konzentrieren sich die gegenwärtigen Bemühungen darauf, ein Modell zu entwickeln, das "für alles passt". Die Arbeit leistet folgende Beiträge: Sie untersucht Segmentierungsmethoden im Kontext mehrerer Modalitäten (Video, Audio, multimodal). Darüber hinaus bietet es ein abstraktes Segmentierungsparadigma, das unabhängig von der verwendeten Modalität anwendbar ist. Darüber hinaus bietet es eine neue, meist auf Video getestete Technik des Multimedia-Retrievals, die auf Interessengebieten basiert, die mit einer Vielzahl von Segmentierungsalgorithmen identifiziert und detailliert erklärt werden.
PDF File Download
Export BibTeX