Leme, L.A.P.P.; Lopes, G.R.; Pereira Nunes, B.; Casanova, M.A.; Dietze, S.: Identifying candidate datasets for data interlinking. In: Daniel, F.; Dolog, P.; Li, Q. (Eds.): Web Engineering. Heidelberg : Springer Verlag, 2013 (Lecture Notes in Computer Science ; 7977), S. 354-366. DOI: https://doi.org/10.1007/978-3-642-39200-9_29
Zusammenfassung: | |
One of the design principles that can stimulate the growth and increase the usefulness of the Web of data is URIs linkage. However, the related URIs are typically in different datasets managed by different publishers. Hence, the designer of a new dataset must be aware of the existing datasets and inspect their content to define sameAs links. This paper proposes a technique based on probabilistic classifiers that, given a datasets S to be published and a set T of known published datasets, ranks each Ti ∈ T according to the probability that links between S and Ti can be found by inspecting the most relevant datasets. Results from our technique show that the search space can be reduced up to 85%, thereby greatly decreasing the computational effort. The final publication is available at Springer via http://dx.doi.org/10.1007/978-3-642-39200-9_29. | |
Lizenzbestimmungen: | Es gilt deutsches Urheberrecht. Das Dokument darf zum eigenen Gebrauch kostenfrei genutzt, aber nicht im Internet bereitgestellt oder an Außenstehende weitergegeben werden. |
Publikationstyp: | BookPart |
Publikationsstatus: | acceptedVersion |
Erstveröffentlichung: | 2013 |
Die Publikation erscheint in Sammlung(en): | Fakultät für Elektrotechnik und Informatik |
Pos. | Land | Downloads | ||
---|---|---|---|---|
Anzahl | Proz. | |||
1 | Germany | 168 | 49,85% | |
2 | United States | 70 | 20,77% | |
3 | Sweden | 19 | 5,64% | |
4 | Greece | 13 | 3,86% | |
5 | Brazil | 9 | 2,67% | |
6 | China | 7 | 2,08% | |
7 | Canada | 7 | 2,08% | |
8 | Denmark | 6 | 1,78% | |
9 | Russian Federation | 5 | 1,48% | |
10 | Ireland | 4 | 1,19% | |
andere | 29 | 8,61% |
Hinweis
Zur Erhebung der Downloadstatistiken kommen entsprechend dem „COUNTER Code of Practice for e-Resources“ international anerkannte Regeln und Normen zur Anwendung. COUNTER ist eine internationale Non-Profit-Organisation, in der Bibliotheksverbände, Datenbankanbieter und Verlage gemeinsam an Standards zur Erhebung, Speicherung und Verarbeitung von Nutzungsdaten elektronischer Ressourcen arbeiten, welche so Objektivität und Vergleichbarkeit gewährleisten sollen. Es werden hierbei ausschließlich Zugriffe auf die entsprechenden Volltexte ausgewertet, keine Aufrufe der Website an sich.