IMST: A Revisited Turkish Dependency Treebank

Umut Sulubacak, Gülşen Eryiğit, Tuğba Pamay

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Abstrakti

In this paper, we present a critical analysis of the dependency annotation framework used in the METU-Sabancı Treebank (MST), and propose new annotation schemes that would alleviate the issues we have identified. Later, we describe our attempt at reannotating the treebank from the ground up using the proposed schemes, and then compare the consistencies of the two versions via cross validation using a dependency parser. According to our experiments, the reannotated version of the original treebank, which we call the ITU-METU-Sabancı Treebank (IMST), demonstrates a labeled attachment score of 75.3% and an unlabeled attachment score of 83.7%, surpassing the corresponding scores of 65.9% and 76.0% for MST by a very large margin.
Alkuperäiskielienglanti
OtsikkoProceedings of TurCLing 2016, the 1st International Conference on Turkic Computational Linguistics
ToimittajatBahar Karaoğlan, Tarık Kışla, Senem Kumova
Sivumäärä6
JulkaisupaikkaKonya, Turkey
KustantajaEGE UNIVERSITY PRESS
Julkaisupäivä9 huhtikuuta 2016
Sivut1-6
ISBN (elektroninen)978-605-66422-0-3
TilaJulkaistu - 9 huhtikuuta 2016
OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisuussa
Tapahtuma1st International Conference on Turkic Computational Linguistics - Mevlana University, Konya, Turkki
Kesto: 3 huhtikuuta 20169 huhtikuuta 2016
https://www.cicling.org/2016/turcling/

Tieteenalat

  • 6121 Kielitieteet
  • 113 Tietojenkäsittely- ja informaatiotieteet

Siteeraa tätä