Part-of-Speech Tagging using Parallel Weighted Finite-State Transducers

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Abstrakti

We use parallel weighted finite-state transducers to implement a part-of-speech tagger, which obtains state-of-the-art accuracy when used to tag the Europarl corpora for Finnish, Swedish and English. Our system consists of a weighted lexicon and a guesser combined with a bigram model factored into two weighted transducers. We use both lemmas and tag sequences in the bigram model, which guarantees reliable bigram estimates.
Alkuperäiskielienglanti
OtsikkoProceedings of IceTAL 2010 : 7th International Conference on Natural Language Processing
Sivumäärä12
JulkaisupaikkaReykjavik
Julkaisupäiväelokuuta 2010
TilaJulkaistu - elokuuta 2010
OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisuussa
TapahtumaIceTal - International Conference on Natural Language Processing - Reykjavik, Islanti
Kesto: 16 elokuuta 201018 elokuuta 2010
Konferenssinumero: 7

Tieteenalat

  • 612 Kielitieteet, kirjallisuus

Projektit

Siteeraa tätä

Silfverberg, M., & Linden, K. (2010). Part-of-Speech Tagging using Parallel Weighted Finite-State Transducers. teoksessa Proceedings of IceTAL 2010: 7th International Conference on Natural Language Processing Reykjavik.