Jaradeh, M.Y.; Singh, K.; Stocker, M.; Both, A.; Auer, S.: Better Call the Plumber: Orchestrating Dynamic Information Extraction Pipelines. In: Brambilla, M.; Chbeir, R.; Frasincar, F.; Manolescu, I. (Eds.): Web Engineering. ICWE 2021. New York, NY : Springer, 2021 (Lecture notes in computer science ; 12706), S. 240-254. DOI: https://doi.org/10.1007/978-3-030-74296-6_19
Zusammenfassung: | |
We propose Plumber, the first framework that brings together the research community’s disjoint information extraction (IE) efforts. The Plumber architecture comprises 33 reusable components for various Knowledge Graphs (KG) information extraction subtasks, such as coreference resolution, entity linking, and relation extraction. Using these components, Plumber dynamically generates suitable information extraction pipelines and offers overall 264 distinct pipelines. We study the optimization problem of choosing suitable pipelines based on input sentences. To do so, we train a transformer-based classification model that extracts contextual embeddings from the input and finds an appropriate pipeline. We study the efficacy of Plumber for extracting the KG triples using standard datasets over two KGs: DBpedia, and Open Research Knowledge Graph (ORKG). Our results demonstrate the effectiveness of Plumber in dynamically generating KG information extraction pipelines, outperforming all baselines agnostics of the underlying KG. Furthermore, we provide an analysis of collective failure cases, study the similarities and synergies among integrated components, and discuss their limitations. | |
Lizenzbestimmungen: | This document may be downloaded, read, stored and printed for your own use within the limits of § 53 UrhG but it may not be distributed on other websites via the internet or passed on to external parties. Dieses Dokument darf im Rahmen von § 53 UrhG zum eigenen Gebrauch kostenfrei heruntergeladen, gelesen, gespeichert und ausgedruckt, aber nicht auf anderen Webseiten im Internet bereitgestellt oder an Außenstehende weitergegeben werden. |
Publikationstyp: | BookPart |
Publikationsstatus: | acceptedVersion |
Erstveröffentlichung: | 2021 |
Die Publikation erscheint in Sammlung(en): | Forschungszentren |
Pos. | Land | Downloads | ||
---|---|---|---|---|
Anzahl | Proz. | |||
1 | Germany | 8 | 61,54% | |
2 | United States | 3 | 23,08% | |
3 | Indonesia | 1 | 7,69% | |
4 | France | 1 | 7,69% |
Hinweis
Zur Erhebung der Downloadstatistiken kommen entsprechend dem „COUNTER Code of Practice for e-Resources“ international anerkannte Regeln und Normen zur Anwendung. COUNTER ist eine internationale Non-Profit-Organisation, in der Bibliotheksverbände, Datenbankanbieter und Verlage gemeinsam an Standards zur Erhebung, Speicherung und Verarbeitung von Nutzungsdaten elektronischer Ressourcen arbeiten, welche so Objektivität und Vergleichbarkeit gewährleisten sollen. Es werden hierbei ausschließlich Zugriffe auf die entsprechenden Volltexte ausgewertet, keine Aufrufe der Website an sich.