Abstrakti
We introduce XED, a multilingual fine-grained human-annotated emotion dataset. The dataset consists of human-annotated Finnish (25k) and English sentences (30k), as well as projected annotations for 43 additional languages, providing new resources to many low-resource languages. We use Plutchik’s core emotions to annotate the dataset with the addition of neutral. The dataset is carefully evaluated using language-specific BERT to show that XED performs on par with other similar datasets and is therefore a useful tool for sentiment analysis and emotion detection.
Alkuperäiskieli | englanti |
---|---|
Otsikko | Proceedings of the 28th International Conference on Computational Linguistics |
Toimittajat | Donia Scott, Nuria Bel, Chengqing Zong |
Sivumäärä | 11 |
Kustantaja | International Committee on Computational Linguistics |
Julkaisupäivä | 2020 |
Sivut | 6542–6552 |
ISBN (elektroninen) | 978-1-952148-27-9 |
DOI - pysyväislinkit | |
Tila | Julkaistu - 2020 |
OKM-julkaisutyyppi | A4 Artikkeli konferenssijulkaisuussa |
Tapahtuma | International Conference on Computational Linguistics - [Online event] Kesto: 8 jouluk. 2020 → 13 jouluk. 2020 Konferenssinumero: 28 |
Tieteenalat
- 6121 Kielitieteet
- 113 Tietojenkäsittely- ja informaatiotieteet
Tietoaineistot
-
XED
Kajava, K. (Avustaja (contributor)) & Öhman, E. (Luoja), Github, 2020
https://github.com/Helsinki-NLP/XED
Tietoaineisto
-