3 Klassifikation von Mehrrechner-Datenbanksystemen

3.2 Integrierte vs. föderative Mehrrechner-DBS

Eine weitergehende Klassifizierung ergibt sich durch die Unterscheidung zwischen integrierten und föderativen sowie zwischen homogenen und heterogenen Mehrrechner-DBS (Abb. 3-4). Diese Merkmale sind nur für Architekturen mit mehreren DBVS relevant, also nicht für Shared-Everything.

Abb. 3-4: Weitergehende Klassifikation von Mehrrechner-Datenbanksystemen

Integrierte Mehrrechner-DBS sind dadurch gekennzeichnet, daß sich alle Rechner (DBVS) eine gemeinsame Datenbank teilen, deren Aufbau durch ein einziges konzeptionelles (logisches) Schema beschrieben ist. Da dieses gemeinsame Schema von allen DBVS unterstützt wird, kann den Transaktionsprogrammen (TAP) volle Verteilungstransparenz geboten werden; sie können über das lokale DBVS wie im zentralisierten Fall auf die Datenbank zugreifen (Abb. 3-3). Auf der anderen Seite ist die Autonomie der einzelnen Rechner/DBVS stark eingeschränkt, da Schemaänderungen, Vergabe von Zugriffsrechten etc. global koordiniert werden müssen. Daneben wird vorausgesetzt, daß jede DB-Operation auf allen Rechnern gleichermaßen gestartet werden kann und daß potentiell alle DBVS bei der Abarbeitung einer DB-Operation kooperieren. Diese Randbedingungen erfordern i.d.R., daß die DBVS in allen Rechnern identisch (homogen) sind.

Verteilte Datenbanksysteme sind ein Beispiel solch integrierter Mehrrechner-Datenbanksysteme, wenngleich die Begriffsbildung in der Literatur meist nicht eindeutig ist. Nach unserer in diesem Buch verwendeten Terminologie stellen Verteilte Datenbanksysteme geographisch verteilte, integrierte Shared-Nothing-Mehrrechner-Datenbanksysteme dar. Parallele DBS vom Typ Shared-Disk und Shared-Nothing repräsentieren ebenfalls integrierte Mehrrechner-DBS. Auch bei ihnen liegt in jedem Rechner eine identische DBVS-Version vor; durch Kooperation zwischen den DBVS wird Transaktionsprogrammen sowie Endbenutzern gegenüber eine vollkommene Verteilungstransparenz geboten.

Föderative Mehrrechner-DBS (federated database systems) streben nach größerer Knotenautonomie im Vergleich zu den integrierten Systemen, wobei die beteiligten DBVS entweder homogen oder heterogen sein können. Aufgrund der geforderten Unabhängigkeit der einzelnen Datenbanksysteme und Rechner kommt zur Realisierung dieser Systeme nur eine Partitionierung der Externspeicher in Betracht (Shared-Nothing). Kennzeichnende Eigenschaft der föderativen DBS ist, daß jeder Rechner eine eigene Datenbank verwaltet, die durch ein lokales (privates) konzeptionelles Schema beschrieben ist. Durch eine begrenzte Kooperation der DBVS soll es möglich werden, auf bestimmte Daten anderer Rechner zuzugreifen, falls dies von dem "Besitzer" der Daten zugelassen wird. Die Menge kooperierender DBVS wird auch als Föderation bezeichnet; prinzipiell kann ein DBS an mehreren Föderationen beteiligt sein, falls diese anwendungsbezogen definiert werden. Idealerweise unterstützen föderative Mehrrechner-DBS trotz Unterschieden bei den lokalen DBVS ein einheitliches Datenmodell bzw. bieten eine gemeinsame Anfragesprache "nach außen" an. Insbesondere soll es damit auch möglich werden, innerhalb einer DB-Operation auf Daten verschiedener Datenbanken zuzugreifen sowie einen möglichst hohen Grad an Verteilungstransparenz zu erreichen.

Obwohl bei der Realisierung von föderativen Mehrrechner-DBS auf Techniken von Verteilten DBS zurückgegriffen werden kann, verursachen die Forderungen nach Knotenautonomie sowie Unterstützung heterogener DBVS zusätzliche schwierige Probleme. Insbesondere kann Verteilungstransparenz i.a. nur zum Teil erreicht werden, da ansonsten die lokalen Schemata innerhalb eines globalen Schemas zu integrieren sind. Dies führt jedoch zur Beeinträchtigung von Knotenautonomie und verlangt eine sogenannte Schemaintegration, die vor allem aufgrund semantischer Abbildungsprobleme nur bedingt möglich ist. Weitere Probleme betreffen v.a. die Unterstützung heterogener Datenmodelle und Anfragesprachen sowie die Koordinierung unterschiedlicher Methoden zur Transaktionsverwaltung in den beteiligten Rechnern. Wir behandeln föderative Mehrrechner-Datenbanksysteme in Kap. 12.