From open parallel corpora to public translation tools: The success story of OPUS

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKirjan luku tai artikkeliTieteellinen

Abstrakti

This paper describes the success of OPUS, starting from a small side-project but leading to a full-fledged ecosystem for training and deploying open machine translation systems. We briefly present the current state of the framework focusing on the mission of increasing language coverage and translation quality in public translation models and tools that can easily be integrated in end-user applications and professional workflows. OPUS now provides the biggest hub of freely available parallel data and thousands of open translation models have been released supporting hundreds of languages in various combinations.
Alkuperäiskielienglanti
OtsikkoLIVE and LEARN : Festschrift in honor of Lars Borin
ToimittajatElena Volodina, Dana Dannélls, Aleksandrs Berdicevskis, Markus Forsberg, Shafqat Virk
Sivumäärä6
JulkaisupaikkaGöteborg
KustantajaUniversity of Göteborg
Julkaisupäivämarrask. 2022
Sivut133-138
ISBN (painettu)978-91-87850-82-0
ISBN (elektroninen)978-91-87850-83-7
TilaJulkaistu - marrask. 2022
OKM-julkaisutyyppiB2 Kirjan tai muun kokoomateoksen osa

Julkaisusarja

NimiResearch Reports from the Department of Swedish, Multilingualism, Language Technology
KustantajaUniversity of Göteborg
NumeroGU-ISS-2022-03
ISSN (elektroninen)1401-5919

Tieteenalat

  • 6121 Kielitieteet
  • 113 Tietojenkäsittely- ja informaatiotieteet

Siteeraa tätä