Query Optimization Techniques For Scaling Up To Data Variety

Downloadstatistik des Dokuments (Auswertung nach COUNTER):

Rohde, Philipp D.: Query Optimization Techniques For Scaling Up To Data Variety. Hannover : Gottfried Wilhelm Leibniz Universität, Master Thesis, 2019, IX, 77 S. DOI: https://doi.org/10.15488/5130

Zeitraum, für den die Download-Zahlen angezeigt werden:

Jahr: 
Monat: 

Summe der Downloads: 865




Kleine Vorschau
Zusammenfassung: 
Even though Data Lakes are efficient in terms of data storage, they increase the complexity of query processing; this can lead to expensive query execution. Hence, novel techniques for generating query execution plans are demanded. Those techniques have to be able to exploit the main characteristics of Data Lakes. Ontario is a federated query engine capable of processing queries over heterogeneous data sources. Ontario uses source descriptions based on RDF Molecule Templates, i.e., anabstract description of the properties belonging to the entities in the unified schema of the data in the Data Lake. This thesis proposes new heuristics tailored to the problem of query processing over heterogeneous data sources including heuristics specifically designed for certain data models. The proposed heuristics are integrated into the Ontario query optimizer. Ontario is compared to state-of-the-art RDF query engines in order to study the overhead introduced by considering heterogeneity during query processing. The results of the empirical evaluation suggest that there is no significant overhead when considering heterogeneity. Furthermore, the baseline version of Ontario is compared to two different sets of additional heuristics, i.e., heuristics specifically designed for certain data models and heuristics that do not consider the data model. The analysis of the obtained experimental results shows that source-specific heuristics are able to improve query performance. Ontario optimization techniques are able to generate effective and efficient query plans that can be executed over heterogeneous data sources in a Data Lake.
Lizenzbestimmungen: Es gilt deutsches Urheberrecht. Das Dokument darf zum eigenen Gebrauch kostenfrei genutzt, aber nicht im Internet bereitgestellt oder an Außenstehende weitergegeben werden.
Publikationstyp: MasterThesis
Publikationsstatus: publishedVersion
Erstveröffentlichung: 2019
Die Publikation erscheint in Sammlung(en):Fakultät für Elektrotechnik und Informatik
Zentrale Einrichtungen

Verteilung der Downloads über den gewählten Zeitraum:

Herkunft der Downloads nach Ländern:

Pos. Land Downloads
Anzahl Proz.
1 image of flag of Germany Germany 324 37,46%
2 image of flag of United States United States 160 18,50%
3 image of flag of Spain Spain 33 3,82%
4 image of flag of No geo information available No geo information available 32 3,70%
5 image of flag of Iran, Islamic Republic of Iran, Islamic Republic of 28 3,24%
6 image of flag of Indonesia Indonesia 19 2,20%
7 image of flag of Algeria Algeria 19 2,20%
8 image of flag of Russian Federation Russian Federation 18 2,08%
9 image of flag of Romania Romania 18 2,08%
10 image of flag of China China 15 1,73%
    andere 199 23,01%

Weitere Download-Zahlen und Ranglisten:


Hinweis

Zur Erhebung der Downloadstatistiken kommen entsprechend dem „COUNTER Code of Practice for e-Resources“ international anerkannte Regeln und Normen zur Anwendung. COUNTER ist eine internationale Non-Profit-Organisation, in der Bibliotheksverbände, Datenbankanbieter und Verlage gemeinsam an Standards zur Erhebung, Speicherung und Verarbeitung von Nutzungsdaten elektronischer Ressourcen arbeiten, welche so Objektivität und Vergleichbarkeit gewährleisten sollen. Es werden hierbei ausschließlich Zugriffe auf die entsprechenden Volltexte ausgewertet, keine Aufrufe der Website an sich.