A Free/Open-Source Morphological Analyser and Generator for Sakha

Sardana Ivanova, Jonathan Washington, Francis M. Tyers

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Abstrakti

We present, to our knowledge, the first ever published morphological analyser and generator for Sakha, a marginalised language of Siberia. The transducer, developed using HFST, has coverage of solidly above 90%, and high precision. In the development of the analyser, we have expanded linguistic knowledge about Sakha, and developed strategies for complex grammatical patterns. The transducer is already being used in downstream tasks, including computer assisted language learning applications for linguistic maintenance and computational linguistic shared tasks.
Alkuperäiskielienglanti
OtsikkoLREC 2022, THIRTEEN INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION : LREC 2022 Conference Proceedings
Sivumäärä6
KustantajaEuropean Languages Resources Association (ELRA)
Julkaisupäiväkesäk. 2022
Sivut5137-5142
ISBN (elektroninen)979-10-95546-72-6
TilaJulkaistu - kesäk. 2022
OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisuussa
TapahtumaLanguage Resources and Evaluation Conference - Marseille, Ranska
Kesto: 21 kesäk. 202223 kesäk. 2022
Konferenssinumero: 13
https://lrec2022.lrec-conf.org/en/

Tieteenalat

  • 113 Tietojenkäsittely- ja informaatiotieteet

Siteeraa tätä