Universal dependencies for Turkish

Umut Sulubacak, Memduh Gökırmak, Francis Tyers, Çağrı Çöltekin, Joakim Nivre, Gülşen Eryiğit

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Abstrakti

The Universal Dependencies (UD) project was conceived after the substantial recent interest in unifying annotation schemes across languages. With its own annotation principles and abstract inventory for parts of speech, morphosyntactic features and dependency relations, UD aims to facilitate multilingual parser development, cross-lingual learning, and parsing research from a language typology perspective. This paper presents the Turkish IMST-UD Treebank, the first Turkish treebank to be in a UD release. The IMST-UD Treebank was automatically converted from the IMST Treebank, which was also recently released. We describe this conversion procedure in detail, complete with mapping tables. We also present our evaluation of the parsing performances of both versions of the IMST Treebank. Our findings suggest that the UD framework is at least as viable for Turkish as the original annotation framework of the IMST Treebank.
Alkuperäiskielienglanti
OtsikkoProceedings of COLING 2016, the 26th International Conference on Computational Linguistics: Technical Papers
ToimittajatYuji Matsumoto, Rashmi Prasad
Sivumäärä11
JulkaisupaikkaOsaka, Japan
KustantajaThe Association for Computational Linguistics
Julkaisupäiväjoulukuuta 2016
Sivut3444-3454
ISBN (elektroninen)978-4-87974-702-0
TilaJulkaistu - joulukuuta 2016
OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisuussa
TapahtumaInternational Conference on Computational Linguistics - Osaka, Japani
Kesto: 11 joulukuuta 201616 joulukuuta 2016
Konferenssinumero: 26

Tieteenalat

  • 6121 Kielitieteet
  • 113 Tietojenkäsittely- ja informaatiotieteet

Siteeraa tätä