4.2 Schemaarchitektur

4 Architektur von Verteilten Datenbanksystemen

4.2 Schemaarchitektur

Die Schemaarchitektur eines zentralisierten DBS nach ANSI/SPARC unterstützte physische Datenunabhängigkeit durch Trennung von physischem und konzeptionellen DB-Schema sowie eine begrenzte Form der logischen Datenunabhängigkeit über externe Schemata (Kap. 2.1.2). Bei der Übertragung auf Verteilte DBS ist zusätzlich Verteilungstransparenz zu gewährleisten.

Ein einfacher Ansatz dazu sieht vor, wie im zentralen Fall lediglich ein konzeptionelles und ein internes Schema festzulegen, die von alle Rechnern übernommen werden. In diesem Fall sind sämtliche Verteilungsaspekte Teil des globalen internen Schemas, also insbesondere die Definition der Verteilungseinheiten (Fragmente) sowie ihrer Zuordnung (Allokation) zu Rechnern. Der Nachteil eines solchen Ansatzes liegt darin, daß nahezu keine Knotenautonomie unterstützt wird, da sämtliche Änderungen am konzeptionellen und internen Schema global abzustimmen sind und für alle Rechner Gültigkeit haben. Dies ist besonders in geographisch verteilten Systemen problematisch, da hier lokal unterschiedliche Zugriffsoptimierungen sinnvoll sein können und einzelne Knoten häufiger nicht verfügbar sind.

Abb. 4-3: Schemaarchitektur von Verteilten DBS

Eine Alternative stellt der in Abb. 4-3 gezeigte Ansatz dar [Da86, ÖV91], bei dem durch die Einführung lokaler Schemata ein höherer Grad an Knotenautonomie erreicht wird. Der logische DB-Aufbau ist wiederum durch ein globales konzeptionelles Schema (GKS) festgelegt, das von allen Rechnern unterstützt wird und auf dem die externen Schemata definiert sind. Daneben besitzt jedoch jeder Rechner ein lokales konzeptionelles Schema (LKS) sowie ein lokales internes Schema (LIS). Die LKS ergeben sich durch die Definition der Datenverteilung, die in einem globalen Verteilungsschema (GVS) festgelegt ist. Darin werden vor allem die Angaben zur Fragmentierung von Relationen sowie die Allokation und Replikation von Relationenfragmenten (Kap. 5) geführt. Bei fehlender Replikation stellen die LKS jeweils eine echte Teilmenge des GKS dar; umgekehrt entspricht das GKS der Vereinigung der LKS. Inwieweit Änderungen des LKS, z.B. nach Erzeugung eines neuen Objektes, explizit im System propagiert werden müssen, hängt von der gewählten Katalogarchitektur ab (s.u.). Die LIS erlauben Zugriffspfade und Speicherungsstrukturen auf lokale Erfordernisse abzustimmen und tragen somit ebenfalls zu einer Erhöhung der Knotenautonomie bei.

Dieser Ansatz gewährleistet prinzipiell volle Verteilungstransparenz, da sich sämtliche DB-Operationen auf die externen Schemata bzw. das GKS beziehen. Die Abbildung der Anfragen auf die lokalen Schemata erfolgt automatisch durch die beteiligten DBS unter Zuhilfenahme der im globalen Verteilungsschema gespeicherten Angaben zur Datenverteilung.