Index Table Pattern

Das Index Table Pattern dient zur Performance-Optimierung in Anwendungen,
die mit großen Mengen an persistierten Daten arbeiten.
Da insbesondere Abfragen anhand anderer Werte als des Primärschlüssels
besonders langsam werden können, bietet es die Möglichkeit,
weitere Schlüssel anlegen zu können.
In relationalen Datenbanken kann dieses Verhalten meist mittels
zusätzlicher Index-Spalten gelöst werden.
Das Index Table Pattern dient in anderen Fällen als eine Möglichkeit,
diese Funktionalität nachzubilden.

Bei der Umsetzung gibt es drei unterschliedliche Strategien:

  • Vollständige Duplizierung
    Sämtliche Daten pro zusätzlichem Schlüssel in einer zusätzlichen Tabelle abgelegt. Dabei findet eine vollständige Denormalisierung statt. Problematisch bei häufigen Änderungen und im Bezug zur Speichermenge.
  • Normalisierte Index Tabellen
    Die neuen Tabellen enthalten jeweils nur den zusätzlichen Schlüssel und eine Referenz auf die ürsprüngliche Tabelle, den Fact Table. Problematisch, da in jedem Fall zwei Abfragen erfolgen müssen.
  • Teilnormalisierte Index Tabellen
    Ähnlich den normalisierten Tabellen, allerdings werden häufig verwendete Daten dupliziert und nur für die fehlenden eine Anfrage an den Fact Table benötigt. Durch dieses Vorgehen erreicht man eine Balance zwischen den beiden anderen Fällen.

Darüber hinaus können auch Variationen umgesetzt werden,
wie ein Schlüssel, der aus mehreren Feldern des Fact Table besteht,
ein Ersatz für Composite Keys.
Ein Index Table kann auch verwendet werden, um den Zugriff auf Daten in
Shards zu optimieren. Dabei wird der für das Sharding gehashte
Primär Schlüssel als Referenz auf den geshardeten Fact Table verwendet.
Der Index Table bleibt dabei zusammenhängend.

Probleme und Nachteile dieses Patterns sind zum einen der zusätzliche Aufwand,
die Daten über mehrere Tabelle hinweg konsistent zu halten, bzw. die Notwendigkeit
zweier Abfragen, um einen Datensatz auszulesen; je nach verwendeter Strategie.
Darüber hinaus muss auch bei Datenäderungen Konsistenz gewährleistet sein.

Sinnvoll ist die Anwendung des Patterns, wenn häufig Daten anhand von Nichtsclüssel-Attributen
abgefragt werden. Dabei bestehen allerdings die folgenden Ausnahmen:

  • Häufig ändernde Daten, durch die der Mehraufwand zum Pflegen der Index Tabellen die Performance-Gewinne überschreitet.
  • Kleine Wertemenge als neuer Schlüssel, wie z.B. Geschlechterinformationen (m/w)
  • Unbalancierte Daten, bei denen z.B. in 90% der selbe Wert enthalten ist. Eine Ausnahme dieser Ausnahme ist es, wenn häufig die verbleibenden 10% abgefragt werden.

Verwandte Entwursmuster sind:

results matching ""

    No results matching ""