5 Datenbankverteilung

5.7 Bestimmung der Datenverteilung

Bei der Bestimmung von Fragmentierung und Allokation gilt es, sowohl eine hohe Leistungsfähigkeit als auch eine hohe Verfügbarkeit (durch Replikation) zu unterstützen. Diese Aufgabe ist sehr komplex, da eine Vielzahl von Abhängigkeiten eingehen, die bestenfalls in grober Annäherung berücksichtigt werden können. Ein grundsätzliches Problem besteht darin, daß die Kosten der Ausführung nicht nur durch die Datenverteilung bestimmt sind, sondern auch von den eingesetzten Verfahren zur Anfrageoptimierung und -Bearbeitung, zur Transaktionsverwaltung und zur Wartung von Replikation. Weiterhin ist die Last, für die eine günstige Datenverteilung zu finden ist, i.a. nur ungenau bekannt; insbesondere kann die Datenverteilung nicht auf die Ausführung von Ad-hoc-Anfragen hin optimiert werden. Aussagen hinsichtlich der Ausfallwahrscheinlichkeit einzelner Knoten oder Kommunikationsverbindungen sind generell nur schwer möglich.

Die Bestimmung der Datenverteilung muß zwangsweise gegensätzliche Anforderungen ausgleichen. Kompromisse müssen v.a. hinsichtlich folgender Kriterien eingegangen werden:

5.7.1 - Festlegung der Fragmentierung
5.7.2 - Festlegung der Allokation