Morfologisten jäsentimien luominen suomalais-ugrilaisille vähemmistökielille

    Projektin yksityiskohdat

    Kuvaus (abstrakti)

    Avoimella lähdekoodilla luotavia morfologisia jäsentimiä ja oikeinkirjoitusohjelmia uraalilaisille vähemmistökielille Suomen ulkopuolelle. Projekti hyödyntää Tromssan yliopistossa olevan Giellateknon infrastruktuuraa tuottaakseen hfst-transduktoreita ja sanalistakomponentteja. 20,000 lemmaa suomenkielisine glosseineen jokaisesta pääkohdekielestä ajanjaksolla 2013-2014. Pääkohdekielet ovat: livvinkarjala, vuorimari, mokša, nenets ja liivi. Sivukohdekielet, jotka saavat osittaista tukea projektin ajalla ovat: pohjoishanti, ingrian, veps, ersä, niittymari, võro, komi, udmurt ja nganasani.
    TilaPäättynyt
    Todellinen alku/loppupvm01/01/201331/12/2014

    Tieteenalat

    • 6121 Kielitieteet
    • mokšan kieli
    • vuorimarin kieli
    • livvinkarjalan kieli
    • nenetsin kieli
    • liivin kieli
    • suomen kieli
    • suomen kieli tieteenkielenä
    • Koneen kieliohjelma
    • oikeinkirjoitusohjelmat
    • inkeroisen kieli
    • hantin kieli
    • ersän kieli
    • niittymarin kieli
    • vepsän kieli
    • šokšan kieli
    • morfologia
    • HFST
    • Kielipankki
    • Kirjallisuuspankki
    • avoin lähdekoodi