Archive Infrastructure and Spoken Language Corpora for Saami Languages in Finland

Marko Jouste, Jukka Mettovaara, Petter Morottaja, Niko Partanen

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Abstrakti

This study presents the results of an Aanaar Saami pilot project in the Saami Culture Archive, University of Oulu. The project has established a set of conventions to transcribe and annotate Aanaar Saami recordings in the archive's collection and created a mechanism through which grammatically annotated but anonymous versions can be imported to the Korp search interface in the Language Bank of Finland. The practices include wide use of Saami language technology, the use of Finnish computational research infrastructure, and they can be extended later to other Saami languages in the archive.

Alkuperäiskielienglanti
OtsikkoProceedings of the 6th Digital Humanities in the Nordic and Baltic Countries Conference (DHNB 2022)
ToimittajatKarl Berglund, Matti La Mela, Inge Zwart
Sivumäärä10
JulkaisupaikkaAachen
KustantajaCEUR-WS.org
Julkaisupäivä2022
Sivut269-278
TilaJulkaistu - 2022
OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisuussa
TapahtumaDigital Humanities in the Nordic and Baltic Countries 6th Conference - Uppsala, Ruotsi
Kesto: 15 maalisk. 202218 maalisk. 2022
Konferenssinumero: 6
https://dhnb.eu/past-conferences/dhnb2022/

Julkaisusarja

NimiCEUR Workshop Proceedings
KustantajaCEUR-WS.org
Vuosikerta3232
ISSN (elektroninen)1613-0073

Lisätietoja

Publisher Copyright:
© 2022 Copyright for this paper by its authors. Use permitted under Creative Commons License Attribution 4.0 International (CC BY 4.0)

Tieteenalat

  • 6121 Kielitieteet
  • 113 Tietojenkäsittely- ja informaatiotieteet

Siteeraa tätä