Fetahu, B.; Pereira Nunes, B.; Dietze, S.: Summaries on the fly: Query-based extraction of structured knowledge from web documents. In: Daniel, F.; Dolog, P.; Li, Q. (Eds.): Web Engineering. Heidelberg : Springer Verlag, 2013 (Lecture Notes in Computer Science ; 7977), S. 249-264. DOI: https://doi.org/10.1007/978-3-642-39200-9_22
Zusammenfassung: | |
A large part of Web resources consists of unstructured textual content. Processing and retrieving relevant content for a particular information need is challenging for both machines and humans. While information retrieval techniques provide methods for detecting suitable resources for a particular query, information extraction techniques enable the extraction of structured data and text summarization allows the detection of important sentences. However, these techniques usually do not consider particular user interests and information needs. In this paper, we present a novel method to automatically generate structured summaries from user queries that uses POS patterns to identify relevant statements and entities in a certain context. Finally, we evaluate our work using the publicly available New York Times corpus, which shows the applicability of our method and the advantages over previous works. The final publication is available at Springer via https://doi.org/10.1007/978-3-642-39200-9_22 | |
Lizenzbestimmungen: | Es gilt deutsches Urheberrecht. Das Dokument darf zum eigenen Gebrauch kostenfrei genutzt, aber nicht im Internet bereitgestellt oder an Außenstehende weitergegeben werden. |
Publikationstyp: | BookPart |
Publikationsstatus: | acceptedVersion |
Erstveröffentlichung: | 2013 |
Die Publikation erscheint in Sammlung(en): | Fakultät für Elektrotechnik und Informatik |
Pos. | Land | Downloads | ||
---|---|---|---|---|
Anzahl | Proz. | |||
1 | Germany | 129 | 54,89% | |
2 | United States | 28 | 11,91% | |
3 | France | 17 | 7,23% | |
4 | Netherlands | 6 | 2,55% | |
5 | Russian Federation | 5 | 2,13% | |
6 | China | 5 | 2,13% | |
7 | No geo information available | 4 | 1,70% | |
8 | Turkey | 4 | 1,70% | |
9 | Ireland | 4 | 1,70% | |
10 | Austria | 4 | 1,70% | |
andere | 29 | 12,34% |
Hinweis
Zur Erhebung der Downloadstatistiken kommen entsprechend dem „COUNTER Code of Practice for e-Resources“ international anerkannte Regeln und Normen zur Anwendung. COUNTER ist eine internationale Non-Profit-Organisation, in der Bibliotheksverbände, Datenbankanbieter und Verlage gemeinsam an Standards zur Erhebung, Speicherung und Verarbeitung von Nutzungsdaten elektronischer Ressourcen arbeiten, welche so Objektivität und Vergleichbarkeit gewährleisten sollen. Es werden hierbei ausschließlich Zugriffe auf die entsprechenden Volltexte ausgewertet, keine Aufrufe der Website an sich.