Sawischa, Sammy Fabian: Bias Assessments of Benchmarks for Link Predictions over Knowledge Graphs. Hannover : Gottfried Wilhelm Leibniz Universität, Bachelor Thesis, 2023, X, 59 S. DOI: https://doi.org/10.15488/13600
Zusammenfassung: | |
Link prediction (LP) aims to tackle the challenge of predicting newfacts by reasoning over a knowledge graph (KG). Different machinelearning architectures have been proposed to solve the task of LP,several of them competing for better performance on a few de-factobenchmarks. The problem of this thesis is the characterization of LPdatasets regarding their structural bias properties and their effects onattained performance results. We provide a domain-agnostic frameworkthat assesses the network topology, test leakage bias and sampleselection bias in LP datasets. The framework includes SPARQL queriesthat can be reused in the explorative data analysis of KGs foruncovering unusual patterns. We finally apply our framework tocharacterize 7 common benchmarks used for assessing the task of LP. Inconducted experiments, we use a trained TransE model to show how the twobias types affect prediction results.Our analysis shows problematic patterns in most of the benchmarkdatasets. Especially critical are the findings regarding thestate-of-the-art benchmarks FB15k-237, WN18RR and YAGO3-10. | |
Lizenzbestimmungen: | CC BY 3.0 DE |
Publikationstyp: | BachelorThesis |
Publikationsstatus: | publishedVersion |
Erstveröffentlichung: | 2023-04-26 |
Die Publikation erscheint in Sammlung(en): | Fakultät für Elektrotechnik und Informatik |
Pos. | Land | Downloads | ||
---|---|---|---|---|
Anzahl | Proz. | |||
1 | Germany | 105 | 47,09% | |
2 | United States | 35 | 15,70% | |
3 | United Kingdom | 13 | 5,83% | |
4 | Poland | 8 | 3,59% | |
5 | Netherlands | 6 | 2,69% | |
6 | No geo information available | 5 | 2,24% | |
7 | Russian Federation | 5 | 2,24% | |
8 | China | 5 | 2,24% | |
9 | France | 4 | 1,79% | |
10 | Belgium | 4 | 1,79% | |
andere | 33 | 14,80% |
Hinweis
Zur Erhebung der Downloadstatistiken kommen entsprechend dem „COUNTER Code of Practice for e-Resources“ international anerkannte Regeln und Normen zur Anwendung. COUNTER ist eine internationale Non-Profit-Organisation, in der Bibliotheksverbände, Datenbankanbieter und Verlage gemeinsam an Standards zur Erhebung, Speicherung und Verarbeitung von Nutzungsdaten elektronischer Ressourcen arbeiten, welche so Objektivität und Vergleichbarkeit gewährleisten sollen. Es werden hierbei ausschließlich Zugriffe auf die entsprechenden Volltexte ausgewertet, keine Aufrufe der Website an sich.