Projekteja vuodessa
Abstrakti
The texts are scrambled at the paragraph level.
This new version contains the literature found in the older instance and has grown markedly. While the old version was merely text divided to sentence level, the new version has lemmatization and dependencies. At sentence level contextual translation (English or Finnish translation) may be present, while at word level there is morphological encoding, corresponding to each context. Preliminary morpho-syntactic analysis is carried out using HFST-based transducers and Constraint Grammar disambiguation, function and dependency tagging, which have been developed in the Giellatekno infrastructure of the University of Tromsø.
The grammatical analysis and labeling comply with the practices developed in the Giellatekno infrastructure of the University of Tromsø. These practices are applied in the documentation of several Uralic languages.
Amount of processed material: more than 2.8 million words.
The amount of the processed material is to be increased subsequently. Future versions will strive to improve upon the morphological disambiguation of the corpus texts, the constraint-grammar assignment of functions, and the conversion from CG output to UD-type dependencies.
Alkuperäiskieli | englanti |
---|---|
Julkaisupaikka | Helsinki |
Kustantaja | Kielipankki |
Tuotoksen media | internet |
Koko | 289 735 sentences |
Tila | Julkaistu - maalisk. 2023 |
OKM-julkaisutyyppi | I2 Tieto- ja viestintätekniset sovellukset |
Tieteenalat
- 6121 Kielitieteet
-
Erzya-Moksha shallow-transfer machine translation for measurement of language diversity
Rueter, J. (Projektinjohtaja), Erina, O. (Projektinjohtaja) & Kabaeva, N. (Projektinjohtaja)
26/06/2019 → …
Projekti: Tutkimusprojekti
-
Experimental Treebanking for the Minority Moksha Language and Finite-State Descriptions
Rueter, J. (Projektinjohtaja), Levina, M. (Osallistuja) & Kabaeva, N. (Osallistuja)
07/12/2018 → …
Projekti: Muu projekti
-
Experimental Treebanking for Minority Languages with Finite-State Descriptions
Rueter, J. (Projektinjohtaja), Tyers, F. M. (Osallistuja), Klementeva, J. (Osallistuja) & Erina, O. (Projektinjohtaja)
01/10/2017 → …
Projekti: Muu projekti
Aktiviteetit
-
Acta Linguistica Academica (Lehti)
Rueter, J. (Arvioitsija (reviewer))
marrask. 2024 → jouluk. 2024Aktiviteetti: Julkaisun vertaisarvioinnin ja toimituksellisen työn tyypit › Käsikirjoitusten vertaisarviointi
-
Verbs of ingestion in Erzya, the ablative object?
Rueter, J. (Puhuja)
elok. 2022Aktiviteetti: Puhe- tai esitystyypit › Suullinen esitys
Tiedosto -
University of Turku, Department of Finnish and Finno-Ugric Languages
Rueter, J. (Vieraileva tutkija)
1 elok. 2021 → 31 heinäk. 2022Aktiviteetti: Ulkoisessa instituutiossa vierailun tyypit › Akateeminen vierailu toiseen organisaatioon