The University of Helsinki submissions to the WMT19 news translation task

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Abstrakti

In this paper, we present the University of Helsinki submissions to the WMT 2019 shared task on news translation in three language pairs: English-German, English-Finnish and Finnish-English. This year, we focused first on cleaning and filtering the training data using multiple data-filtering approaches, resulting in much smaller and cleaner training sets. For English-German, we trained both sentence-level transformer models and compared different document-level translation approaches. For Finnish-English and English-Finnish we focused on different segmentation approaches, and we also included a rule-based system for English-Finnish.
Alkuperäiskielienglanti
OtsikkoFourth Conference of Conference on Machine Translation (WMT 2019) : Proceedings of the Conference: Volume 2
Sivumäärä12
JulkaisupaikkaStroudsburg
KustantajaThe Association for Computational Linguistics
Julkaisupäivä1 elok. 2019
Sivut412-423
ISBN (elektroninen)978-1-950737-27-7
TilaJulkaistu - 1 elok. 2019
OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisuussa
TapahtumaFourth Conference on Machine Translation: WMT19 - Florence, Italia
Kesto: 1 elok. 20192 elok. 2019
Konferenssinumero: 4

Tieteenalat

  • 6121 Kielitieteet
  • 113 Tietojenkäsittely- ja informaatiotieteet

Siteeraa tätä