17 Datenverteilung in Parallelen DBS

Übungsaufgaben

Aufgabe 17-1: Bestimmung des Verteilgrades

Für eine Relation von 10 Millionen Tupeln soll der Verteilgrad für ein Shared-Nothing-System mit 100 Knoten bestimmt werden. Es sollen im wesentlichen zwei Typen von Operationen auf der Relation ausgeführt werden: Relationen-Scans (30% der Operationen) sowie Index-Scans mit einer mittleren Selektivität von 1%. Bestimmen Sie den "optimalen" Verteilgrad für die Relation, wenn gilt a = 50 ms, b = 5 ms und c = 0,05 ms (siehe Kap. 17.1 zur Bedeutung von a, b und c).

(Lösung Aufgabe 17-1:)

Aufgabe 17-2: Verteilattribut

Warum empfiehlt sich meist die Wahl des Primärschlüssels als Verteilattribut?

(Lösung Aufgabe 17-2:)

Aufgabe 17-3: Verteilinformationen in Indexstrukturen

Eine Beschränkung der vorgestellten Fragmentierungsalternativen liegt darin, daß nur Anfragen auf den Fragmentierungsattributen auf eine Teilmenge der Rechner eingegrenzt werden kann. Inwieweit wäre es für andere Attribute sinnvoll, die Speicherungsorte der einzelnen Werte in einer erweiterten Indexstruktur zu vermerken, um damit Anfragen bezüglich dieser Attribute auf wenige Knoten beschränken zu können ?

(Lösung Aufgabe 17-3:)

Aufgabe 17-4: Verstreute Replikation

Geben Sie analog zu Abb. 17-7 ein Beispiel zur verstreuten Replikation an mit D=8 und G=4 (zwei Gruppen mit je 4 Rechnern).

(Lösung Aufgabe 17-4:)

Aufgabe 17-5: Verkettete Replikation

Die Daten D1, D2, ... D12 einer Relation seien wie in Abb. 17-7 über vier Knoten verteilt (G=D=4). Wie sieht die Zuordnung der Kopien Di' im Falle der verketteten Replikation aus? Welche Zugriffsverteilung nach Ausfall von Rechner R3 garantiert eine gleichmäßige Lastbalancierung ? Geben Sie dazu für jedes Di bzw. Di' den Rechner an, der die Zugriffe darauf bearbeitet.

(Lösung Aufgabe 17-5:)