Automatic Collocation Extraction and Classification of Automatically Obtained Bigrams

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Abstrakti

This paper focuses on automatic determination of the distributional preferences of words in Russian. We present the comparison of six different measures for collocation extraction, part of which are widely known, while others are less prominent or new. For these metrics we evaluate the semantic stability of automatically obtained bigrams beginning with single-token prepositions. Manual annotation of the first 100 bigrams and comparison with the dictionary of multi-word expressions are used as evaluation measures. Finally, in order to present error analysis, two prepositions are investigated in some details.
Alkuperäiskielienglanti
OtsikkoProceedings : Workshop on Computational, Cognitive, and Linguistic Approaches to the Analysis of Complex Words and Collocations (CCLCC 2014)
ToimittajatVerena Henrich, Erhard Hinrichs
Sivumäärä7
JulkaisupaikkaTübingen
KustantajaUniversity of Tübingen
Julkaisupäivä2014
Sivut27-33
TilaJulkaistu - 2014
OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisuussa
TapahtumaWorkshop on Computational, Cognitive, and Linguistic Approaches to the Analysis of Complex Words and Collocations - Tübingen, Saksa
Kesto: 11 elokuuta 201415 elokuuta 2014
Konferenssinumero: CCLCC 2014

Tieteenalat

  • 6121 Kielitieteet

Siteeraa tätä

Kormacheva, D., Pivovarova, L., & Kopotev, M. (2014). Automatic Collocation Extraction and Classification of Automatically Obtained Bigrams. teoksessa V. Henrich, & E. Hinrichs (Toimittajat), Proceedings: Workshop on Computational, Cognitive, and Linguistic Approaches to the Analysis of Complex Words and Collocations (CCLCC 2014) (Sivut 27-33). Tübingen: University of Tübingen.