Building and Using Existing Hunspell Dictionaries and TEX Hyphenators as Finite-State Automata

Tommi Pirinen, Krister Linden

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Abstrakti

There are numerous formats for writing spellcheckers for open-source systems and there are many descriptions for languages written in these formats. Similarly, for word hyphenation by computer there are TEX rules for many languages. In this paper we demonstrate a method for converting these spell-checking lexicons and hyphenation rule sets into finite-state automata, and present a new finite-state based system for writer’s tools used in current open-source software such as Firefox, OpenOffice.org and enchant via the spell-checking library voikko.
Alkuperäiskielienglanti
OtsikkoProceedings of International Multiconference on Computer Science and Information Technology : Computational Linguistics—Applications (CLA'10 )
ToimittajatMaria Ganzha, Marcin Paprzycki
Sivumäärä8
Vuosikerta5
JulkaisupaikkaWisla, Poland
Julkaisupäivälokakuuta 2010
Sivut477–484
ISBN (elektroninen)978-83-60810-27-9
TilaJulkaistu - lokakuuta 2010
OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisuussa
TapahtumaInternational Multiconference on Computer Science and Information Technology - Wisła, Puola
Kesto: 18 lokakuuta 201020 lokakuuta 2010
Konferenssinumero: 5

Julkaisusarja

NimiProceedings of the International Multiconference on Computer Science and Information Technology
KustantajaPolskie Towarzystwo Informatyczne Oddział Górnoslaski
ISSN (elektroninen)1896-7094

Lisätietoja


Volume: 5
Proceeding volume: 5

Tieteenalat

  • 113 Tietojenkäsittely- ja informaatiotieteet
  • 612 Kielitieteet, kirjallisuus

Siteeraa tätä