Crowdsourcing for web genre annotation

Asheghi, Noushin Rezapour; Sharoff, Serge; Markert, Katja

Startseite
→
Forschungseinrichtungen
→
Forschungszentren
→
Dokumentanzeige

Downloadstatistik des Dokuments (Auswertung nach COUNTER):

Asheghi, N.R.; Sharoff, S.; Markert, K.: Crowdsourcing for web genre annotation. In: Language Resources and Evaluation 50 (2016), Nr. 3, S. 603-641. DOI: http://dx.doi.org/10.1007/s10579-015-9331-6

Version im Repositorium

Zum Zitieren der Version im Repositorium verwenden Sie bitte diesen DOI: https://doi.org/10.15488/1030

Zeitraum, für den die Download-Zahlen angezeigt werden:

Summe der Downloads: 686

Verteilung der Downloads über den gewählten Zeitraum
Herkunft der Downloads nach Ländern

zurück zum Einzeltitelnachweis (Ansicht Nutzungsstatistik schließen)

Nameart_10.1007_s1057 ...

Größe864,91 kB

FormatAdobe PDF

Öffnen

Zusammenfassung:
Recently, genre collection and automatic genre identification for the web has attracted much attention. However, currently there is no genre-annotated corpus of web pages where inter-annotator reliability has been established, i.e. the corpora are either not tested for inter-annotator reliability or exhibit low inter-coder agreement. Annotation has also mostly been carried out by a small number of experts, leading to concerns with regard to scalability of these annotation efforts and transferability of the schemes to annotators outside these small expert groups. In this paper, we tackle these problems by using crowd-sourcing for genre annotation, leading to the Leeds Web Genre Corpus—the first web corpus which is, demonstrably reliably annotated for genre and which can be easily and cost-effectively expanded using naive annotators. We also show that the corpus is source and topic diverse. © 2016, The Author(s).
Lizenzbestimmungen:	CC BY 4.0 Unported
Publikationstyp:	Article
Publikationsstatus:	publishedVersion
Erstveröffentlichung:	2016
Die Publikation erscheint in Sammlung(en):	Forschungszentren

nach oben

Verteilung der Downloads über den gewählten Zeitraum:

nach oben

Herkunft der Downloads nach Ländern:

Pos.	Land		Downloads
Pos.	Land		Anzahl	Proz.
1		Germany	153	22,30%
2		United States	114	16,62%
3		France	100	14,58%
4		No geo information available	52	7,58%
5		Russian Federation	37	5,39%
6		United Kingdom	34	4,96%
7		Ukraine	29	4,23%
8		China	26	3,79%
9		Czech Republic	15	2,19%
10		Netherlands	14	2,04%
		andere	112	16,33%

nach oben

Weitere Download-Zahlen und Ranglisten:

Hinweis

Zur Erhebung der Downloadstatistiken kommen entsprechend dem „COUNTER Code of Practice for e-Resources“ international anerkannte Regeln und Normen zur Anwendung. COUNTER ist eine internationale Non-Profit-Organisation, in der Bibliotheksverbände, Datenbankanbieter und Verlage gemeinsam an Standards zur Erhebung, Speicherung und Verarbeitung von Nutzungsdaten elektronischer Ressourcen arbeiten, welche so Objektivität und Vergleichbarkeit gewährleisten sollen. Es werden hierbei ausschließlich Zugriffe auf die entsprechenden Volltexte ausgewertet, keine Aufrufe der Website an sich.

Suche im Repositorium

Durchblättern

Gesamter Bestand
Diese Sammlung

Crowdsourcing for web genre annotation

Downloadstatistik des Dokuments (Auswertung nach COUNTER):

Version im Repositorium

Zeitraum, für den die Download-Zahlen angezeigt werden:

Summe der Downloads: 686

Verteilung der Downloads über den gewählten Zeitraum:

Herkunft der Downloads nach Ländern:

Weitere Download-Zahlen und Ranglisten:

Suche im Repositorium

Durchblättern

Gesamter Bestand

Diese Sammlung