Synchronized Mediawiki based analyzer dictionary development

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Abstrakti

Open-source analyzer dictionary development is being implemented for Skolt Sami, Ingrian, Moksha-Mordvin, etc. in the Helsinki CSC infrastructure; home of the Finnish Kielipankki ’Language Bank’ and Termipankki ’Term Bank’. The proximity of minority-language corpora in need of annotation and the multiple usage of controlled wikimedia-type dictionaries make CSC an attractive site for synchronized transducer dictionary development. The open-source FST develop- ment of Uralic and other minority languages at Giellatekno-Divvun in Tromsø demonstrates a vast potential for reusage of FST-s, only augmented by open- source work in OmorFi, Apertium and Universal Dependency <http://univer- saldependencies.org/#language-urj>. The initial idea is to allow synchronized editing of Giellatekno xml and CSC wiki structures via github. In addition to allowing for simple lexc LEMMA:STEM CONTINUATION_LEXICON ”TRANS- LATION” ; line exports, the parallel dictionaries will provide for documentation of derivation, morpho-syntactic information on valency and government, seman- tics and etymology.
Alkuperäiskielienglanti
Otsikko3rd International Workshop for Computational Linguistics of Uralic Languages (IWCLUL 2017) : St. Petersburg, Russia 23 – 24 January 2017
ToimittajatFrancis M. Tyers, Michael Rießler, Tommi A. Pirinen , Trond Trosterud
Sivumäärä7
JulkaisupaikkaStroudsburg
KustantajaThe Association for Computational Linguistics
Julkaisupäivä2017
Sivut1-7
Artikkeli no2
ISBN (painettu)978-1-5108-3665-5
DOI - pysyväislinkit
TilaJulkaistu - 2017
OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisuussa
TapahtumaInternational Workshop for
Computational Linguistics of Uralic Languages
- St. Petersburg, Venäjä
Kesto: 23 tammikuuta 201724 tammikuuta 2017
Konferenssinumero: 3

Lisätietoja


Volume:
Proceeding volume:

Tieteenalat

  • 6121 Kielitieteet
  • Harmonization of Saami Language Infrastructure 2019

    Trond Trosterud (Puhuja: puheenjohtaja), Jack Rueter (Puhuja: esitelmän pitäjä), Joshua Wilbur (Puhuja: esitelmän pitäjä) & Antonsen, Lene (Puhuja: esitelmän pitäjä)

    4 huhtikuuta 20199 huhtikuuta 2019

    Aktiviteetti: Tapahtumaan osallistumisen ja tapahtuman järjestämisen tyypitKonferensseihin, kursseille ja seminaareihin osallistuminen ja näiden järjestäminen

  • Research Data and Humanities 2019

    Jack Rueter (Puhuja: esitelmän pitäjä), Mika Hämäläinen (Puhuja: esitelmän pitäjä) & Khalid Alnajjar (Puhuja: esitelmän pitäjä)

    14 elokuuta 201916 elokuuta 2019

    Aktiviteetti: Tapahtumaan osallistumisen ja tapahtuman järjestämisen tyypitKonferensseihin, kursseille ja seminaareihin osallistuminen ja näiden järjestäminen

  • Mari FST and Corpus work

    Jack Rueter (Konsultti), Trond Trosterud (Konsultti) & Jeremy Bradley (Konsultti)

    6 tammikuuta 20198 tammikuuta 2019

    Aktiviteetti: KonsultointityypitKonsultointi

Siteeraa tätä