Projekteja vuodessa
Projektin yksityiskohdat
Kuvaus (abstrakti)
The hearts of the European speak 50 - 100 languages that are too important to be ignored in research, content production or education. The current application is concerned with the lack of resources needed when we implement our shared vision of a multilingual society. Due to a similar concern, the EU Commission is funding the preparatory phase of the “Common Lan- guage Resource and Language Technology Research Infrastructure (CLARIN)”, a pan-European initiative that aims to establish an interoperable and integrated research infrastructure.
Finland is one of the main partners of CLARIN, and the current application would form a significant national contribution to its success. The proposed research would be based on two particular strengths of the Finnish research: language-independent finite-state technology and open-source technology.
• Finite-state technology is very useful in natural language processing because with it lin- guistic rules can be compiled into efficient models in computer.
• The use of open source technology ensures the widest applicability of the language tech- nology infrastructure.
The purpose of the proposed basic research is to create a renewed theory of compilation of linguistic knowledge into finite-state models. The commercial grammar formalisms for finite- state morphology are based on complicated 10-20-year old algorithms that have not been adopted in free and open-source software. The applicant’s recent results indicate that more parsimonious computational equipment could improve the elegancy and generality of the modeled linguistic formalisms.
Language resource building needs practical methods. The proposed research would establish new solutions to the long-standing space explosion problem of compilers, and develop descrip- tive means for complex grammatical phenomena. The reduced need for hi-tech equipment means that language-independent modeling formalisms can become freely available, which empowers any language community to build e.g. morphological models for themselves.
Multi-lingual morphological models based on finite-state technology will be in a significant role in CLARIN, and they would enable competitive language research and advanced language technology applications. With the morphological models, computers can have a capability to translate texts from one dialect to another, facilitate reading of foreign language texts, aid in language learning, assist in natural language queries from e.g. internet, and improve the qual- ity of common content production. These applications help multi-lingual education to reduce inequality, poverty and insecurity in the society and can make a better future for our children.
Akronyymi | MORFCOMPILERS |
---|---|
Tila | Päättynyt |
Todellinen alku/loppupvm | 01/01/2009 → 31/12/2011 |
Rahoitus
- Unknown funder: 195 450,00 €
Tieteenalat
- 612 Kielitieteet, kirjallisuus
- äärellistilaiset menetelmät
- laskennallinen morfologia
- reduplikaatio
- kaksitasomorfologia
- kieliopit
- epäkonkatenatiiviset ilmiöt
- 113 Tietojenkäsittely- ja informaatiotieteet
- äärellistilaiset algorithmit
-
YK:n vuosituhatjulistus ja African kieliteknologia. Tiekartta bantukielten resurssien kehittämiseksi
Killian, D. (Osallistuja)
01/01/2010 → …
Projekti: Tutkimusprojekti
-
HFST - Helsinki Finite-State Technology
Linden, K. (Principal Investigator), Koskenniemi, K. (Osallistuja), Yli-Jyrä, A. (Osallistuja), Hulden, M. (Osallistuja), Silfverberg, M. (Osallistuja), Pirinen, T. (Osallistuja), Axelson, E. (Osallistuja), Hardwick, S. (Osallistuja), Niemi, J. (Muu) & Hurskainen, A. (Osallistuja)
01/01/2005 → …
Projekti: Tutkimusprojekti
-
FIELDSYNERGY-TRIAL: Rationalizing Parallel Linguistic Description and Computational Modeling
Yli-Jyrä, A. (Osallistuja)
01/01/2011 → 01/01/2011
Projekti: Tutkimusprojekti
Tutkimustuotos
-
Finite-State Methods and Models in Natural Language Processing
Yli-Jyrä, A. M., Kornai, A. & Sakarovitch, J., 2011, julkaisussa: Natural Language Engineering. 17, 2, s. 141-144 4 SivumääräTutkimustuotos: Artikkelijulkaisu › Katsausartikkeli › vertaisarvioitu
Open accessTiedosto -
Conversions between crisply bipartite and unambiguous automata
Yli-Jyrä, A. M., 3 toukok. 2010, Weighted Automata: Theory and Applications, Leipzig, May 3-7, 2010. Droste, M., Gastin, P., Kuich, W. & Vogler, H. (toim.). Leipzig: Universität Leipzig, 1 SivumääräJulkaisun otsikon käännös :Konversiot erityisellä tavalla kaksiosaisten automaatttien ja yksiselitteisten automaattien välillä Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussa › Konferenssiartikkeli › Tieteellinen
-
Finite-State Methods and Natural Language Processing: 8th International Workshop, FSMNLP 2009, Pretoria, South Africa, July 2009, Revised Selected Papers
Yli-Jyrä, A. M. (Toimittaja), Kornai, A. (Toimittaja), Sakarovitch, J. (Toimittaja) & Watson, B. (Toimittaja), 2010, Berlin Heidelberg: Springer-Verlag. 147 Sivumäärä (Lecture Notes in Artificial Intelligence; Vuosikerta 6062, nro 6062)Julkaisun otsikon käännös :Äärellistilaiset menetelmät ja luonnollisen kielen käsittely: 8. kansainvälinen työpaja, FSMNLP 2009, Pretoria, Etelä-Afrikka, heinäkuu 2009, tarkistetut valikoidut paperit Tutkimustuotos: Kirja/raportti › Kokoomateos tai erikoisnumero › Tieteellinen › vertaisarvioitu
Aktiviteetit
- 1 Väitöskirjan ohjaaja tai sivuohjaaja
-
Supervisor of PhD Thesis in Language Technology
Linden, B. K. J. (Ohjaaja) & Yli-Jyrä, A. (Ohjaaja)
1 tammik. 2010 → 22 lokak. 2016Aktiviteetti: Tutkimustyypit › Väitöskirjan ohjaaja tai sivuohjaaja