Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title Konzeption einer Abfragesprache für Pylonix
Organization Unit
Authors
  • Lukas Knauer
Supervisors
  • Klaus R. Dittrich
  • Christian Tilgner
Institution University of Zurich
Faculty Faculty of Economics, Business Administration and Information Technology
Date 2008
Abstract Text Although documents are an important part of everyday business, there is no satisfying solution to manage them. Documents contain information crucial to business. Until today, It is a unsolved challenge to extract desired information from the giant amount of documents produced. In oppisition to documents, other business data is highly structured an can be stored in databases. The storage in a database offers many advantages such as concurrent processing and optimized search. Thus it is desriable to use these features in document management. The new approach Pylonix offers an architecture an a data model to store complex documents in databases. A flexible and powerful query language TXQL (TeXt Query Language) is designed and discussed within the scope of this master thesis. This language is able to query and process all elements, information as well as metadata of documents. It allows complex and comprehensive queries of arbitrary elements of complex documents that are stored in Pylonix. Furthermore TXQL offers facilities to manipulate every Element of such a document.
Zusammenfassung Obwohl Dokumenten in der Geschäftswelt eine entscheidende Rolle zufällt, ist ihre Verwaltung mangelhaft gelöst. Dokumente sind die Träger wichtiger geschäftlicher Informationen. Die richtigen Informationen aus der gewaltigen Menge an produzierten Dokumenten zu gewinnen, ist bis heute eine ungelöste Herausforderung. Im Gegensatz zu Dokumenten sind viele weitere Geschäftsdaten hoch strukturiert und lassen sich in Datenbanken speichern. Die Speicherung in einer Datenbank bietet zahlreiche Vorteile wie nebenläufige Bearbeitung und optimierte Suche. Es ist daher wünschenswert, diese Fähigkeiten auch bei der Verwaltung von Dokumenten zu nutzen. Der neue Ansatz Pylonix bietet eine Architektur und ein Datenmodell, um Dokumente in Datenbanken zu speichern. Im Rahmen dieser Diplomarbeit wird eine flexible und mächtige Abfragesprache TXQL (Text Query Language) konzipiert und diskutiert, welche in der Lage ist, sämtliche Elemente, Informationen sowie Metadaten aus Dokumenten abzufragen und zu bearbeiten. Diese Sprache ermöglicht komplexe und umfangreiche Abfragen beliebiger Elemente von komplexen Dokumenten, welche in Pylonix gespeichert sind. Des Weiteren ist es mittels TXQL m??glich, jedes Element eines solchen Dokuments zu manipulieren.
Export BibTeX