Die Diplomarbeit beschäftigt sich mit der Bewertung von Kosten- und Kardinalitätsschätzungen im Rahmen der Anfrageoptimierung in relationalen Datenbanksystemen.
Datenbanksysteme verwenden Kostenformeln für die einzelnen Operatoren, um die Kosten und die Kardinalität des Ergebnisses einer Anfrage abzuschätzen. Die Arbeit gibt einen Überblick über verschiedene Verfahren auf dem Gebiet der Kosten- und Kardinalitätsschätzungen.
Die Schätzwerte, die das Datenbanksystem liefert, sind von unterschiedlicher Qualität. Schätzfehler können im Ausführungsplan über mehrere Stufen propagiert werden, was zu Kosten- und Kardinalitätsschätzungen führen kann, die um Größenordnungen von den tatsächlichen Werten abweichen. Verantwortlich dafür sind verschiedene Einflussfaktoren, wie beispielsweise die Komplexität der Anfrage, die Struktur des Ausführungsplans oder Eigenschaften der Daten. Diese Parameter werden beschrieben.
Darauf aufbauend beschäftigt sich diese Arbeit mit Ansätzen zur Bewertung der Verlässlichkeit von Kosten- und Kardinalitätsschätzungen. Wie kann unter Berücksichtigung der Einflussfaktoren eine Aussage über das Fehlerpotenzial der Schätzwerte gemacht werden? Die Arbeit stellt existierende Bewertungsansätze vor und gibt Antworten auf obige Frage.
Die theoretischen Betrachtungen werden durch umfangreiche Messungen überprüft, indem die geschätzten Werte zu Kardinalität und Ausführungszeit ebenso wie die tatsächlichen Werte systematisch erfasst werden. Die Interpretation der Messergebnisse stellt den Zusammenhang zwischen Einflussfaktoren und Qualität der Schätzwerte her.
Mit den gewonnenen Erkenntnissen aus dem Theorieteil sowie aus den Messungen werden die vorgestellten Bewertungsansätze beurteilt und erweitert. Abschließend beschreibt die Arbeit ein Anwendungsszenario für die Bewertung von Kosten- und Kardinalitätsschätzungen. Dafür wird der Optimierungsprozess um eine Bewertungskomponente erweitert.
|