Computer-Aided Analysis of Video Comments for Requirements Analysis

Downloadstatistik des Dokuments (Auswertung nach COUNTER):

Kristo, Eklekta: Computer-Aided Analysis of Video Comments for Requirements Analysis. Hannover : Gottfried Wilhelm Leibniz Universität, Institut für Praktische Informatik, Bachelor Thesis, 2021, 68 S. DOI: http://doi.org/10.15488/11955

Zeitraum, für den die Download-Zahlen angezeigt werden:

Jahr: 
Monat: 

Summe der Downloads: 254




Kleine Vorschau
Zusammenfassung: 
In dieser Arbeit werden Anforderungen für die Anforderungsanalyse aus den Youtube Kommentaren von vision videos extrahiert. Der Prozess der Erstellung und Vorbereitung eines Datensatzes wird beschrieben und die Güte von verschiedenen automatisierten Ansätzen wird evaluiert. Die YouTube API wird benutzt um Kommentare zu extrahieren, diese werden dann in Spam bzw. Ham kategorisiert. Die manuelle Klassifikation ist nötig um die Ergebnisse der automatischen zu verifizieren. Um Einsichten in die relevanten Kommentar zu erhalten und spezifischere Kategorien zu finden werden word clouds benutzt. Die gefundenen Kategorien sind Feature Request, Flaw Report, Safety Related, Efficiency Related und manchmal Questions. Für die automatische Klassifikation in die Kategorien Spam / Ham werden die Algorithmen Random Forest, Support Vector Machine, Linear Regression Classifier, Naive Bayes und ein Voting Classifier welcher die ersten drei kombiniert benutzt. Für die Klassifizierung in spezifische Kategorien wird ebenfalls der Voting Classifier verwendet. Für die Analyse der Stimmung werden TextBlob und SentiStrength, und um die relevanten Kommentare zusammenzufassen wird SumBasic benutzt.
In this thesis requirements suitable for requirements engineering are extracted from comments below vision videos on the platform YouTube. The process of creating and preparing a dataset is described and the performance of different automated approaches is evaluated. The YouTube API is used to extract the comments, that are then classified into the categories Spam / Ham according to their content and sentiment. The manual classification is necessary to evaluate the results of the automated one. Word clouds are used to get an insight into the content of the relevant comments and decide on more specific categories to classify them according to their content. More specifically the categories Feature Request, Flaw Report, Safety Related, Efficiency Related and sometimes Questions are found. For the automated classification into the categories Spam / Ham the algorithms Random Forest, Support Vector Machine, Linear Regression Classifier, Naive Bayes, and a Voting Classifier that combines the first three are used. To classify comments according to their sentiment TextBlob and SentiStrength are used. For the classification into specific categories, the Voting Classifier is used again. The SumBasic algorithm is used to summarize the relevant comments.
Lizenzbestimmungen: CC BY 3.0 DE
Publikationstyp: BachelorThesis
Publikationsstatus: publishedVersion
Erstveröffentlichung: 2021-02-12
Die Publikation erscheint in Sammlung(en):Fakultät für Elektrotechnik und Informatik

Verteilung der Downloads über den gewählten Zeitraum:

Herkunft der Downloads nach Ländern:

Pos. Land Downloads
Anzahl Proz.
1 image of flag of Germany Germany 181 71,26%
2 image of flag of United States United States 16 6,30%
3 image of flag of Netherlands Netherlands 6 2,36%
4 image of flag of Pakistan Pakistan 5 1,97%
5 image of flag of Russian Federation Russian Federation 4 1,57%
6 image of flag of India India 4 1,57%
7 image of flag of United Kingdom United Kingdom 4 1,57%
8 image of flag of Czech Republic Czech Republic 4 1,57%
9 image of flag of China China 4 1,57%
10 image of flag of Canada Canada 4 1,57%
    andere 22 8,66%

Weitere Download-Zahlen und Ranglisten:


Hinweis

Zur Erhebung der Downloadstatistiken kommen entsprechend dem „COUNTER Code of Practice for e-Resources“ international anerkannte Regeln und Normen zur Anwendung. COUNTER ist eine internationale Non-Profit-Organisation, in der Bibliotheksverbände, Datenbankanbieter und Verlage gemeinsam an Standards zur Erhebung, Speicherung und Verarbeitung von Nutzungsdaten elektronischer Ressourcen arbeiten, welche so Objektivität und Vergleichbarkeit gewährleisten sollen. Es werden hierbei ausschließlich Zugriffe auf die entsprechenden Volltexte ausgewertet, keine Aufrufe der Website an sich.