Naive Bayes-based Experiments in Romanian Dialect Identification

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Abstrakti

This article describes the experiments and systems developed by the SUKI team for the second edition of the Romanian Dialect Identification (RDI) shared task which was organized as part of the 2021 VarDial Evaluation Campaign. We submitted two runs to the shared task and our second submission was the overall best submission by a noticeable margin. Our best submission used a character n-gram based naive Bayes classifier with adaptive language models. We describe our experiments on the development set leading to both submissions.
Alkuperäiskielienglanti
OtsikkoProceedings of the 8th VarDial Workshop on NLP for Similar Languages, Varieties and Dialects
ToimittajatMarcos Zampieri, Preslav Nakov, Nikola Ljubešic, Jörg Tiedemann , Yves Scherrer , Tommi Jauhiainen
Sivumäärä8
JulkaisupaikkaStroudsburg
KustantajaACL Anthology
Julkaisupäivä2021
Sivut76-83
ISBN (elektroninen)978-1-954085-12-1
TilaJulkaistu - 2021
OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisuussa
TapahtumaEight workshop on NLP for similar languages, varieties and dialects (VarDial 2021) - [Virtual event]
Kesto: 20 huhtikuuta 202120 huhtikuuta 2021
Konferenssinumero: 8
https://sites.google.com/view/vardial2021

Tieteenalat

  • 6121 Kielitieteet
  • 113 Tietojenkäsittely- ja informaatiotieteet

Siteeraa tätä