Zur Kurzanzeige

dc.identifier.uri http://dx.doi.org/10.15488/5215
dc.identifier.uri https://www.repo.uni-hannover.de/handle/123456789/5262
dc.contributor.author Rohde, Philipp D. ger
dc.date.accessioned 2019-08-21T09:42:51Z
dc.date.available 2019-08-21T09:42:51Z
dc.date.issued 2016-08-18
dc.identifier.citation Rohde, Philipp D. : Matching von Musikdatenbanken. Hannover : Gottfried Wilhelm Leibniz Universität, Bachelor Thesis, 2016, VIII, 85 S. DOI: https://doi.org/10.15488/5215
dc.description.abstract In der heutigen Zeit entsteht in vielen Bereichen des täglichen Lebens, wie bspw. im Onlinehandel und bei Multimediadiensten, eine große Menge an Daten. Diese Daten werden in Datenbanken gespeichert. Jeder Betreiber einer Datenbank hat sein eigenes Datenbankschema, welches genau auf seine Anforderungen zugeschnitten ist. Bei Datenmengen von mehreren Gigabytes bis hin zu Petabytes werden aufgrund der schwierigen Handhabung in der Regel nur Informationen gespeichert, die für den Anwendungsfall von Interesse sind. Ein Teil des Alltagsgeschäfts ist das Zusammenlegen von Projekten und die Fusionierung von Unternehmen. In diesen Fällen müssen die Daten beider Beteiligten ebenfalls vereinigt werden. Da z.B. Multimediadienste einüberschneidendes Angebot an Musik und Filmen haben, werden ähnliche Daten gespeichert. Damit im Datenbestand keine Duplikate entstehen, muss beim Zusammenlegen der Datenbanken eine Identifikation der Einträge vorgenommen werden, die das gleiche Objekt in der Realwelt beschreiben. Dieser Prozess wird Matching genannt.So wie es mehrere Ansatze für den Matching-Prozess gibt, können in einer Datenbank die Daten in verschiedenen Datentypen, wie bspw. Geodaten, Zeichenketten und Zahlen, gespeichert sein. Das SimMatching-Verfahren z.B. wurde für das Matching von Geodaten entwickelt und weicht u.a. durch einen iterativen Ansatz vom klassischen Grundkonzept ab. In dieser Arbeit wird anhand zweier Musikdatenbanken untersucht, ob sich das SimMatching-Verfahren auch für das Matching von String-basierten Daten eignet. Dazu werden im ersten Teil der Arbeit die Grundlagen erläutert und eine Analyse der beiden Datenbanken vorgenommen, um basierend auf den Analyseergebnissen ein Konzept für das Matching nach dem SimMatching-Verfahren zu entwerfen. Im zweiten Teil der Arbeit wird dann die Implementierung des erarbeiteten Konzepts vorgestellt und die Eignung des Verfahrens für den Anwendungsfall von String-basierten Daten bewertet. ger
dc.description.abstract Nowadays huge amounts of data are generated in many areas of everyday life, e.g. online business and multimedia services. This data is stored in databases. Each database operator uses his own database schema which fulfills his requirements. Quite often the volume of data reaches from several gigabytes up to petabytes. Working with such data becomes difficult. Therefore in most cases only information of actual interest for the application is stored. As a part of everyday buisness projects are combined or companies get merged. In these cases the data of both parties needs to be merged as well. The data overlaps, because e.g. multimedia services offer the same songs or movies. To avoid duplicate entries it is necessary to identify database entries which represent the same object of the real world. This must be done before the data can be merged. This process is called matching. Just as there are several ways how a matching could be organised, the data in a database could be saved in various types, such as geographical data, strings or numbers. The SimMatching process for example was developed for geographical data. Among other things it differs from the classical approach by using an iterative approach. This bachelor thesis is about checking and testing the SimMatching process on string-based data with two music databases. The basics, the analysis of the databases as well as the development of a concept for the matching are desribed in the first part of the thesis. The second part is about the implementation of the developed concept and the conclusion of using the SimMatching algorithm on string-based data. eng
dc.language.iso ger ger
dc.publisher Hannover : Fakultät für Elektrotechnik und Informatik der Leibniz Universität Hannover
dc.rights Es gilt deutsches Urheberrecht. Das Dokument darf zum eigenen Gebrauch kostenfrei genutzt, aber nicht im Internet bereitgestellt oder an Außenstehende weitergegeben werden. ger
dc.subject Database eng
dc.subject Matching eng
dc.subject SimMatching eng
dc.subject Datenbank ger
dc.subject Matching ger
dc.subject SimMatching ger
dc.subject.ddc 004 | Informatik ger
dc.title Matching von Musikdatenbanken eng
dc.type BachelorThesis ger
dc.type Text ger
dcterms.extent VIII, 85 S.
dc.description.version publishedVersion ger
tib.accessRights frei zug�nglich ger


Die Publikation erscheint in Sammlung(en):

Zur Kurzanzeige

 

Suche im Repositorium


Durchblättern

Mein Nutzer/innenkonto

Nutzungsstatistiken