Not logged in.

Contribution Details

Type Dissertation
Scope Discipline-based scholarship
Title Migrating relational databases to object technology
Organization Unit
Authors
  • Andreas Behm
Supervisors
  • Klaus R. Dittrich
  • Clemens H. Cap
Institution University of Zurich
Faculty Faculty of Economics, Business Administration and Information Technology
Date 2001
Abstract Text Tremendous changes have been taking place in information technology for a few decades. Due to the rapid evolution in this area, the demand for innovation in this area is much higher than elsewhere. This requires large efforts of companies to respond quickly to market conditions in order to organize work and conduct business more efficiently. In particular, companies have to reengineer existing information systems in order to take benefit of new key technologies like WWW or E-commerce. A typical scenario in many companies when applying a reengineering process is that on the one hand, a large body of data is captured in relational (or even hierarchical or network) databases, and on the other hand new object-oriented applications have to be developed. Thereby, a new object model is constructed which represents the current state of the companies business processes. However, the new object model and the existing relational database's model usually do not go well together. In other words, a large semantic gap between both models must be bridged. The approach proposed in this thesis is database migration. Basically, this approach comprises two tasks. In the first task, the relational database schema is reengineered. The schema is transformed into a well-designed and intuitively understandable object-oriented schema, which the new applications can adapt. Afterwards, the data are (automatically) migrated into an object-oriented DBMS. Existing approaches for migration do not exploit the full potential of the object-oriented paradigm so that the resulting object-oriented schema still ""looks rather relational"" and retains the drawbacks and weaknesses of the relational schema. Therefore, one of the goals of this approach is to support schema transformation into an adequate object-oriented schema as obtained by forward engineering, rigorously using an object-oriented design method. In the first part of the thesis, the fundamental differences between relational and object-oriented database design are discussed. The results of this part are classified into four categories: specification of object-oriented behaviour, navigational vs. set-oriented data access, object life cycles, and deficiencies of relational database schemas. Each category represents a specific aspect in which relational database design differs principally from object-oriented design. For the implementation of the database migration process an intermediate data model (SOT, Semi Object Types) is proposed which allows to define both, schema transformation and data migration. This data model contains all object-oriented modeling constructs and supports flexible schema transformation. Furthermore, an algebra is proposed for a formal definition of the data migration process. The schema transformation process is subdivided into three sequential phases. In the first phase, the relational schema is transformed (automatically) into an SOT schema. This initial SOT schema is then redesigned resulting in an adequate object-oriented schema. Finally, in the third phase the resulting SOT schema is (again automatically) transformed into an object-oriented schema according to the ODMG standard. The data migration process is generated automatically for each schema transformation phase. In order to implement schema transformation, the concept of the transformation rule is proposed. The transformation rules define elementary restructuring operations within the SOT model. A basic set of transformation rules has been proposed which can be extended. Finally, a prototype has been implemented as a proof of concept.
Zusammenfassung In den vergangenen Jahrzehnten sind in der Informationstechnik wesentliche Fortschritte erzielt worden. Durch den schnellen Wandel der Informationsgesellschaft ist das Verlangen nach innovativen Fortschritten wesentlich höher als in anderen Gebieten. Unternehmen müssen daher hohe Investitionen in Kauf nehmen, um auf die ständig ändernden Marktbedingungen reagieren zu können. Viele Unternehmen, die ihre Informationssysteme erneuern, stehen vor dem Problem, mit neuen objektorientierten Anwendungen auf grosse Datenmengen zugreifen zu müssen, welche in relationalen Datenbanken gespeichert sind. Dabei wird ein neues, objektorientiertes Modell ausgehend von den aktuellen Anwendungsprozessen erstellt. Dieses neue Modell ist jedoch mit dem existierenden relationalen Datenbankschema unverträglich. Das hat zur Folge, dass eine breite semantische Lücke zwischen Objektstruktur und relationalem Datenbankschema überbrückt werden muss. In dieser Arbeit wird der Ansatz der Datenbank-Migration vorgeschlagen, welcher im wesentlichen zwei Schritte beinhaltet. Zunächst wird das relationale Datenbankschema überarbeitet und in ein wohlgeformtes und verständliches objektorientiertes Schema transformiert, welches von den neuen Anwendungen verwendet werden kann. Anschliessend werden die Daten (automatisch) in ein objektorientiertes DBMS migriert. Existierende Ansätze bieten nur wenig Möglichkeiten, objektorientierte Modellierungskonzepte auszunutzen, so dass Schwächen und Mängel relationaler Datenbankschemata nicht eliminiert werden können. Eine der Ziele dieses Ansatzes ist es daher, ein solches objektorientiertes Schema erzeugen zu können, welches man auch durch Anwendung eines vollständig neuen objektorientierten Entwurfsprozesses erzielen könnte. Der erste Schwerpunkt der Arbeit liegt auf einer Analyse der Unterschiede zwischen relationalem und objektorientiertem Entwurf. Dabei wird der Frage nachgegangen, warum bestimmte Szenarien der Anwendungswelt in einem relationalen Schema typischerweise strukturell anders als in einem objektorientierten Schema modelliert werden. Die hier gewonnen Resultate werden in vier Kategorien unterteilt, welche die prinzipiellen Unterschiede beider Paradigmen verdeutlichen: Spezifikation objektspezifischen Verhaltens, navigierender gegenüber mengenorientiertem Datenzugriff, Objekt-Lebenszyklus sowie Mängel des relationalen Datenmodells. In jeder Kategorie werden spezifische Aspekte behandelt, in welchen sich relationaler Datenbankentwurf prinzipiell von objektorientiertem Entwurf unterscheidet. Die hier gewonnenen Ergebnisse stellen die Anforderungen an Flexibilität für den Migrationsprozess dar. Zur Implementierung des Migrationsprozesses wird ein Zwischenmodell (SOT, Semi Object Types) vorgeschlagen, in welcher sowohl Schematransformation als auch Datenmigration dargestellt werden können. Das Modell beinhaltet sämtliche objektorientierte Modellierungskonstrukte und unterstützt flexible Schematransformationsoperatoren. Weiterhin wird eine Algebra vorgeschlagen, durch welche der Datenmigrationsprozess definiert wird. Der Migrationsprozess selbst besteht aus drei Phasen. In der ersten Phase wird das relationale Schema (automatisch) in ein SOT-Schema transformiert. In der zweiten Phase wird das initiale SOT-Schema so lange umgestaltet, bis ein wohlgeformte objektorientiertes Schema erzielt ist. Schliesslich wird in der dritten Phase das resultierende SOT-Schema (ebenfalls automatisch) in ein objektorientiertes Schema gemäss ODMG-Standard transformiert. Der Datenmigrationsprozess wird dabei stets automatisch generiert. Für die Ausführung der Schematransformation wird das Konzept der Transformationsregel vorgestellt, durch welche elementare Restrukturierungsoperationen im SOT-Schema beschrieben werden können. Es wird ein Basissatz an Transformationsregeln vorgeschlagen, der jedoch bei Bedarf erweitert werden kann. Schliesslich wurde ein Prototyp zur Validierung der vorgeschlagenen Konzepte implementiert.
PDF File Download
Export BibTeX
EP3 XML (ZORA)