Downloadstatistik des Dokuments (Auswertung nach COUNTER):

Rohde, Philipp D. : Matching von Musikdatenbanken. Hannover : Gottfried Wilhelm Leibniz Universität, Bachelor Thesis, 2016, VIII, 85 S. DOI: https://doi.org/10.15488/5215

Zeitraum, für den die Download-Zahlen angezeigt werden:

Jahr: 
Monat: 

Summe der Downloads: 359




Kleine Vorschau
Zusammenfassung: 
In der heutigen Zeit entsteht in vielen Bereichen des täglichen Lebens, wie bspw. im Onlinehandel und bei Multimediadiensten, eine große Menge an Daten. Diese Daten werden in Datenbanken gespeichert. Jeder Betreiber einer Datenbank hat sein eigenes Datenbankschema, welches genau auf seine Anforderungen zugeschnitten ist. Bei Datenmengen von mehreren Gigabytes bis hin zu Petabytes werden aufgrund der schwierigen Handhabung in der Regel nur Informationen gespeichert, die für den Anwendungsfall von Interesse sind. Ein Teil des Alltagsgeschäfts ist das Zusammenlegen von Projekten und die Fusionierung von Unternehmen. In diesen Fällen müssen die Daten beider Beteiligten ebenfalls vereinigt werden. Da z.B. Multimediadienste einüberschneidendes Angebot an Musik und Filmen haben, werden ähnliche Daten gespeichert. Damit im Datenbestand keine Duplikate entstehen, muss beim Zusammenlegen der Datenbanken eine Identifikation der Einträge vorgenommen werden, die das gleiche Objekt in der Realwelt beschreiben. Dieser Prozess wird Matching genannt.So wie es mehrere Ansatze für den Matching-Prozess gibt, können in einer Datenbank die Daten in verschiedenen Datentypen, wie bspw. Geodaten, Zeichenketten und Zahlen, gespeichert sein. Das SimMatching-Verfahren z.B. wurde für das Matching von Geodaten entwickelt und weicht u.a. durch einen iterativen Ansatz vom klassischen Grundkonzept ab. In dieser Arbeit wird anhand zweier Musikdatenbanken untersucht, ob sich das SimMatching-Verfahren auch für das Matching von String-basierten Daten eignet. Dazu werden im ersten Teil der Arbeit die Grundlagen erläutert und eine Analyse der beiden Datenbanken vorgenommen, um basierend auf den Analyseergebnissen ein Konzept für das Matching nach dem SimMatching-Verfahren zu entwerfen. Im zweiten Teil der Arbeit wird dann die Implementierung des erarbeiteten Konzepts vorgestellt und die Eignung des Verfahrens für den Anwendungsfall von String-basierten Daten bewertet.
Nowadays huge amounts of data are generated in many areas of everyday life, e.g. online business and multimedia services. This data is stored in databases. Each database operator uses his own database schema which fulfills his requirements. Quite often the volume of data reaches from several gigabytes up to petabytes. Working with such data becomes difficult. Therefore in most cases only information of actual interest for the application is stored. As a part of everyday buisness projects are combined or companies get merged. In these cases the data of both parties needs to be merged as well. The data overlaps, because e.g. multimedia services offer the same songs or movies. To avoid duplicate entries it is necessary to identify database entries which represent the same object of the real world. This must be done before the data can be merged. This process is called matching. Just as there are several ways how a matching could be organised, the data in a database could be saved in various types, such as geographical data, strings or numbers. The SimMatching process for example was developed for geographical data. Among other things it differs from the classical approach by using an iterative approach. This bachelor thesis is about checking and testing the SimMatching process on string-based data with two music databases. The basics, the analysis of the databases as well as the development of a concept for the matching are desribed in the first part of the thesis. The second part is about the implementation of the developed concept and the conclusion of using the SimMatching algorithm on string-based data.
Lizenzbestimmungen: Es gilt deutsches Urheberrecht. Das Dokument darf zum eigenen Gebrauch kostenfrei genutzt, aber nicht im Internet bereitgestellt oder an Außenstehende weitergegeben werden.
Publikationstyp: BachelorThesis
Publikationsstatus: publishedVersion
Erstveröffentlichung: 2016-08-18
Die Publikation erscheint in Sammlung(en):Fakultät für Elektrotechnik und Informatik

Verteilung der Downloads über den gewählten Zeitraum:

Herkunft der Downloads nach Ländern:

Pos. Land Downloads
Anzahl Proz.
1 image of flag of Germany Germany 256 71,31%
2 image of flag of United States United States 41 11,42%
3 image of flag of India India 8 2,23%
4 image of flag of Czech Republic Czech Republic 7 1,95%
5 image of flag of China China 7 1,95%
6 image of flag of Russian Federation Russian Federation 6 1,67%
7 image of flag of Austria Austria 6 1,67%
8 image of flag of No geo information available No geo information available 5 1,39%
9 image of flag of Iran, Islamic Republic of Iran, Islamic Republic of 5 1,39%
10 image of flag of Switzerland Switzerland 3 0,84%
    andere 15 4,18%

Weitere Download-Zahlen und Ranglisten:


Hinweis

Zur Erhebung der Downloadstatistiken kommen entsprechend dem „COUNTER Code of Practice for e-Resources“ international anerkannte Regeln und Normen zur Anwendung. COUNTER ist eine internationale Non-Profit-Organisation, in der Bibliotheksverbände, Datenbankanbieter und Verlage gemeinsam an Standards zur Erhebung, Speicherung und Verarbeitung von Nutzungsdaten elektronischer Ressourcen arbeiten, welche so Objektivität und Vergleichbarkeit gewährleisten sollen. Es werden hierbei ausschließlich Zugriffe auf die entsprechenden Volltexte ausgewertet, keine Aufrufe der Website an sich.