Matching von Musikdatenbanken

Rohde, Philipp D.

Startseite
→
Fakultäten
→
Fakultät für Elektrotechnik und Informatik
→
Dokumentanzeige

dc.identifier.uri	http://dx.doi.org/10.15488/5215
dc.identifier.uri	https://www.repo.uni-hannover.de/handle/123456789/5262
dc.contributor.author	Rohde, Philipp D.	ger
dc.date.accessioned	2019-08-21T09:42:51Z
dc.date.available	2019-08-21T09:42:51Z
dc.date.issued	2016-08-18
dc.identifier.citation	Rohde, Philipp D. : Matching von Musikdatenbanken. Hannover : Gottfried Wilhelm Leibniz Universität, Bachelor Thesis, 2016, VIII, 85 S. DOI: https://doi.org/10.15488/5215
dc.description.abstract	In der heutigen Zeit entsteht in vielen Bereichen des täglichen Lebens, wie bspw. im Onlinehandel und bei Multimediadiensten, eine große Menge an Daten. Diese Daten werden in Datenbanken gespeichert. Jeder Betreiber einer Datenbank hat sein eigenes Datenbankschema, welches genau auf seine Anforderungen zugeschnitten ist. Bei Datenmengen von mehreren Gigabytes bis hin zu Petabytes werden aufgrund der schwierigen Handhabung in der Regel nur Informationen gespeichert, die für den Anwendungsfall von Interesse sind. Ein Teil des Alltagsgeschäfts ist das Zusammenlegen von Projekten und die Fusionierung von Unternehmen. In diesen Fällen müssen die Daten beider Beteiligten ebenfalls vereinigt werden. Da z.B. Multimediadienste einüberschneidendes Angebot an Musik und Filmen haben, werden ähnliche Daten gespeichert. Damit im Datenbestand keine Duplikate entstehen, muss beim Zusammenlegen der Datenbanken eine Identifikation der Einträge vorgenommen werden, die das gleiche Objekt in der Realwelt beschreiben. Dieser Prozess wird Matching genannt.So wie es mehrere Ansatze für den Matching-Prozess gibt, können in einer Datenbank die Daten in verschiedenen Datentypen, wie bspw. Geodaten, Zeichenketten und Zahlen, gespeichert sein. Das SimMatching-Verfahren z.B. wurde für das Matching von Geodaten entwickelt und weicht u.a. durch einen iterativen Ansatz vom klassischen Grundkonzept ab. In dieser Arbeit wird anhand zweier Musikdatenbanken untersucht, ob sich das SimMatching-Verfahren auch für das Matching von String-basierten Daten eignet. Dazu werden im ersten Teil der Arbeit die Grundlagen erläutert und eine Analyse der beiden Datenbanken vorgenommen, um basierend auf den Analyseergebnissen ein Konzept für das Matching nach dem SimMatching-Verfahren zu entwerfen. Im zweiten Teil der Arbeit wird dann die Implementierung des erarbeiteten Konzepts vorgestellt und die Eignung des Verfahrens für den Anwendungsfall von String-basierten Daten bewertet.	ger
dc.description.abstract	Nowadays huge amounts of data are generated in many areas of everyday life, e.g. online business and multimedia services. This data is stored in databases. Each database operator uses his own database schema which fulfills his requirements. Quite often the volume of data reaches from several gigabytes up to petabytes. Working with such data becomes difficult. Therefore in most cases only information of actual interest for the application is stored. As a part of everyday buisness projects are combined or companies get merged. In these cases the data of both parties needs to be merged as well. The data overlaps, because e.g. multimedia services offer the same songs or movies. To avoid duplicate entries it is necessary to identify database entries which represent the same object of the real world. This must be done before the data can be merged. This process is called matching. Just as there are several ways how a matching could be organised, the data in a database could be saved in various types, such as geographical data, strings or numbers. The SimMatching process for example was developed for geographical data. Among other things it differs from the classical approach by using an iterative approach. This bachelor thesis is about checking and testing the SimMatching process on string-based data with two music databases. The basics, the analysis of the databases as well as the development of a concept for the matching are desribed in the first part of the thesis. The second part is about the implementation of the developed concept and the conclusion of using the SimMatching algorithm on string-based data.	eng
dc.language.iso	ger	ger
dc.publisher	Hannover : Fakultät für Elektrotechnik und Informatik der Leibniz Universität Hannover
dc.rights	Es gilt deutsches Urheberrecht. Das Dokument darf zum eigenen Gebrauch kostenfrei genutzt, aber nicht im Internet bereitgestellt oder an Außenstehende weitergegeben werden.	ger
dc.subject	Database	eng
dc.subject	Matching	eng
dc.subject	SimMatching	eng
dc.subject	Datenbank	ger
dc.subject	Matching	ger
dc.subject	SimMatching	ger
dc.subject.ddc	004 \| Informatik	ger
dc.title	Matching von Musikdatenbanken	eng
dc.type	BachelorThesis	ger
dc.type	Text	ger
dcterms.extent	VIII, 85 S.
dc.description.version	publishedVersion	ger
tib.accessRights	frei zug�nglich	ger

Name: rohde_philipp_bac ...

Größe: 1.135Mb

Format: PDF

Beschreibung: Bachelor's Thesis ...

Öffnen

Die Publikation erscheint in Sammlung(en):

Fakultät für Elektrotechnik und Informatik
Frei zugängliche Publikationen aus der Fakultät für Elektrotechnik und Informatik

Matching von Musikdatenbanken

Die Publikation erscheint in Sammlung(en):

Suche im Repositorium

Durchblättern

Gesamter Bestand

Diese Sammlung

Mein Nutzer/innenkonto

Nutzungsstatistiken

Matching von Musikdatenbanken

Die Publikation erscheint in Sammlung(en):

Verwandte Dokumente

Suche im Repositorium

Durchblättern

Gesamter Bestand

Diese Sammlung

Mein Nutzer/innenkonto

Nutzungsstatistiken