On New Text Corpora For Minority Languages On The Helsinki korp.csc.fi Server

Forskningsoutput: KonferensbidragKonferenspapper

Sammanfattning

The korp.csc.fi server in Finland provides text corpora of multiple varieties for numerous languages large and small. The Korp infrastructure is developed by the Swedish Språkbanken in the University and Gothenburg, and the source code is released under MIT license. Open nature of the systems makes it easily transferred into new environments, and there are already numerous Korp installations available. The one we discuss is maintained by the Language Bank of Finland.
Originalspråkengelska
Sidor32–36
Antal sidor5
StatusPublicerad - 20 dec 2019
MoE-publikationstypEj behörig
EvenemangЭлектронная письменность народов Российской Федерации: опыт, проблемы и перспективы - Ufa, Ryssland
Varaktighet: 27 nov 201929 nov 2019

Konferens

KonferensЭлектронная письменность народов Российской Федерации: опыт, проблемы и перспективы
LandRyssland
OrtUfa
Period27/11/201929/11/2019

Vetenskapsgrenar

  • 6121 Språkvetenskaper

Projekt

Experimental Treebanking for the Minority Skolt Sámi Language and Finite-State Descriptions

Rueter, J., Juutinen, M., Pirinen, T. & Tyers, F.

01/06/2020 → …

Projekt: Forskningsprojekt

Experimental Treebanking for the Minority Komi-Permyak Language and Finite-State Descriptions

Rueter, J., Ponomareva, L., Partanen, N., Tyers, F. & Zeman, D.

01/10/2019 → …

Projekt: Forskningsprojekt

Experimental Treebanking for the Minority Moksha Language and Finite-State Descriptions

Rueter, J., Levina, M. & Kabaeva, N.

07/12/2018 → …

Projekt: Annan projekt

Forskningsdatauppsättningar

Universal Dependecies Version 2.5 Komi Permyak-UH

Rueter, J. (Skapad av), Ponomareva, L. (Skapad av), Partanen, N. (Skapad av), Universal Dependencies Consortium, 15 nov 2019

Datauppsättning

Univesal Dependencies version 2.5 Skolt Sami-Giellagas

Rueter, J. (Skapad av), Juutinen, M. (Skapad av), Universal Dependencies Consortium, 15 nov 2019

Datauppsättning

Citera det här

Rueter, J., & Partanen, N. (2019). On New Text Corpora For Minority Languages On The Helsinki korp.csc.fi Server. 32–36. Artikel presenterad vid Электронная письменность народов Российской Федерации: опыт, проблемы и перспективы, Ufa, Ryssland.