Grapheme-Based Cross-Language Forced Alignment: Results with Uralic Languages

Juho Leinonen, Sami Virpioja, Mikko Kurimo

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Abstrakti

Forced alignment is an effective process to speed up linguistic research. However, most forced aligners are language-dependent, and under-resourced languages rarely have enough resources to train an acoustic model for an aligner. We present a new Finnish grapheme-based forced aligner and demonstrate its performance by aligning multiple Uralic languages and English as an unrelated language. We show that even a simple non-expert created grapheme-to-phoneme mapping can result in useful word alignments.
Alkuperäiskielienglanti
OtsikkoProceedings of the 23rd Nordic Conference on Computational Linguistics (NoDaLiDa)
ToimittajatSimon Dobnik, Lilja Øvrelid
Sivumäärä6
JulkaisupaikkaLinköping
KustantajaLinköping University Electronic Press
Julkaisupäivä1 toukokuuta 2021
Sivut345-350
ISBN (elektroninen)978-91-7929-614-8
TilaJulkaistu - 1 toukokuuta 2021
OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisuussa
TapahtumaNordic Conference on Computational Linguistics - [Online event], Reykjavik, Islanti
Kesto: 31 toukokuuta 20212 kesäkuuta 2021
Konferenssinumero: 23
https://nodalida2021.github.io/index.html

Julkaisusarja

NimiLinköping Electronic Conference Proceedings
KustantajaLinköping University Electronic Press
Numero78
ISSN (painettu)1650-3740
ISSN (elektroninen)1650-3686
NimiNEALT Proceedings Series
KustantajaUniversity of Tartu
Numero45
ISSN (painettu)1736-8197
ISSN (elektroninen)1736-6305

Tieteenalat

  • 113 Tietojenkäsittely- ja informaatiotieteet
  • 6121 Kielitieteet

Siteeraa tätä