MAMMOTH: Massively Multilingual Modular Open Translation @ Helsinki

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Abstrakti

NLP in the age of monolithic large language models is approaching its limits in terms of size and information that can be handled. The trend goes to modularization, a necessary step into the direction of designing smaller sub-networks and components with specialized functionality. In this paper, we present the MAMMOTH toolkit: a framework designed for training massively multilingual modular machine translation systems at scale, initially derived from OpenNMT-py and then adapted to ensure efficient training across computation clusters.We showcase its efficiency across clusters of A100 and V100 NVIDIA GPUs, and discuss our design philosophy and plans for future information.The toolkit is publicly available online at https://github.com/Helsinki-NLP/mammoth.
Alkuperäiskielienglanti
OtsikkoProceedings of the 18th Conference of the European Chapter of the Association for Computational Linguistics : System Demonstrations
ToimittajatNikolaos Aletras, Orphee De Clercq
Sivumäärä10
JulkaisupaikkaKerrville
KustantajaThe Association for Computational Linguistics
Julkaisupäivä1 maalisk. 2024
Sivut127-136
ISBN (elektroninen)979-8-89176-091-2
TilaJulkaistu - 1 maalisk. 2024
OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisuussa
TapahtumaThe 18th Conference of the European Chapter of the Association for Computational Linguistics - St. Julians, Malta
Kesto: 17 maalisk. 202422 maalisk. 2024
Konferenssinumero: 18

Tieteenalat

  • 6121 Kielitieteet
  • 113 Tietojenkäsittely- ja informaatiotieteet

Siteeraa tätä