Morfologisten jäsentimien luominen suomalais-ugrilaisille vähemmistökielille

Projektin yksityiskohdat

Kuvaus

Avoimella lähdekoodilla luotavia morfologisia jäsentimiä ja oikeinkirjoitusohjelmia uraalilaisille vähemmistökielille Suomen ulkopuolelle. Projekti hyödyntää Tromssan yliopistossa olevan Giellateknon infrastruktuuraa tuottaakseen hfst-transduktoreita ja sanalistakomponentteja. 20,000 lemmaa suomenkielisine glosseineen jokaisesta pääkohdekielestä ajanjaksolla 2013-2014. Pääkohdekielet ovat: livvinkarjala, vuorimari, mokša, nenets ja liivi. Sivukohdekielet, jotka saavat osittaista tukea projektin ajalla ovat: pohjoishanti, ingrian, veps, ersä, niittymari, võro, komi, udmurt ja nganasani.
TilaPäättynyt
Todellinen alku/loppupvm01/01/201331/12/2014

Tieteenalat

  • 6121 Kielitieteet
  • mokšan kieli
  • vuorimarin kieli
  • livvinkarjalan kieli
  • nenetsin kieli
  • liivin kieli
  • suomen kieli
  • suomen kieli tieteenkielenä
  • Koneen kieliohjelma
  • oikeinkirjoitusohjelmat
  • inkeroisen kieli
  • hantin kieli
  • ersän kieli
  • niittymarin kieli
  • vepsän kieli
  • šokšan kieli
  • morfologia
  • HFST
  • Kielipankki
  • Kirjallisuuspankki
  • avoin lähdekoodi