I Have an Attention Bridge to Sell You: Generalization Capabilities of Modular Translation Architectures

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Abstrakti

Modularity is a paradigm of machine translation with the potential of bringing forth models that are large at training time and small during inference. Within this field of study, modular approaches, and in particular attention bridges, have been argued to improve the generalization capabilities of models by fostering language-independent representations. In the present paper, we study whether modularity affects translation quality; as well as how well modular architectures generalize across different evaluation scenarios. For a given computational budget, we find non-modular architectures to be always comparable or preferable to all modular designs we study.
Alkuperäiskielienglanti
OtsikkoProceedings of the Fifth Workshop on Insights from Negative Results in NLP
ToimittajatShabnam Tafreshi, Arjun Akula, João Sedoc, Aleksandr Drozd, Anna Rogers, Anna Rumshisky
Sivumäärä7
JulkaisupaikkaKerrville
KustantajaThe Association for Computational Linguistics
Julkaisupäivä1 kesäk. 2024
Sivut34-40
ISBN (elektroninen)979-8-89176-102-5
TilaJulkaistu - 1 kesäk. 2024
OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisuussa
TapahtumaWorkshop on Insights from Negative Results in NLP - Mexico City, Meksiko
Kesto: 20 kesäk. 202420 kesäk. 2024
Konferenssinumero: 5

Tieteenalat

  • 6121 Kielitieteet
  • 113 Tietojenkäsittely- ja informaatiotieteet

Siteeraa tätä