AaltoNLP at SemEval-2022 Task 11: Ensembling Task-adaptive Pretrained Transformers for Multilingual Complex NER

Aapo Pietiläinen, Shaoxiong Ji

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Abstrakti

This paper presents the system description of team AaltoNLP for SemEval-2022 shared task 11: MultiCoNER. Transformer-based models have produced high scores on standard Named Entity Recognition (NER) tasks. However, accuracy on complex named entities is still low. Complex and ambiguous named entities have been identified as a major error source in NER tasks. The shared task is about multilingual complex named entity recognition. In this paper, we describe an ensemble approach, which increases accuracy across all tested languages. The system ensembles output from multiple same architecture task-adaptive pretrained transformers trained with different random seeds. We notice a large discrepancy between performance on development and test data. Model selection based on limited development data may not yield optimal results on large test data sets.
Alkuperäiskielienglanti
OtsikkoProceedings of the 16th International Workshop on Semantic Evaluation (SemEval-2022)
ToimittajatGuy Emerson, et al.
Sivumäärä6
JulkaisupaikkaStroudsburg
KustantajaThe Association for Computational Linguistics
Julkaisupäiväheinäk. 2022
Sivut1477-1482
ISBN (elektroninen)978-1-955917-80-3
DOI - pysyväislinkit
TilaJulkaistu - heinäk. 2022
Julkaistu ulkoisestiKyllä
OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisuussa
TapahtumaInternational Workshop on Semantic Evaluation - Seattle, United States, Seattle, Yhdysvallat (USA)
Kesto: 14 heinäk. 202215 heinäk. 2022
Konferenssinumero: 16
https://semeval.github.io/SemEval2022/

Tieteenalat

  • 113 Tietojenkäsittely- ja informaatiotieteet

Siteeraa tätä