Projekteja vuodessa
Abstrakti
Noisy labels in training data present a challenging issue in classification tasks, misleading a model towards incorrect decisions during training. In this paper, we propose the use of a linear noise model to augment pre-trained language models to account for label noise in fine-tuning. We test our approach in a paraphrase detection task with various levels of noise and five different languages. Our experiments demonstrate the effectiveness of the additional noise model in making the training procedures more robust and stable. Furthermore, we show that this model can be applied without further knowledge about annotation confidence and reliability of individual training examples and we analyse our results in light of data selection and sampling strategies.
Alkuperäiskieli | englanti |
---|---|
Otsikko | Proceedings of the 13th Conference on Language Resources and Evaluation (LREC 2022) |
Toimittajat | Nicoletta Calzolari, Frédéric Béchet, Philippe Blache, et al. |
Sivumäärä | 9 |
Julkaisupaikka | Paris |
Kustantaja | European Language Resources Association (ELRA) |
Julkaisupäivä | 20 kesäk. 2022 |
Sivut | 4324-4332 |
ISBN (elektroninen) | 979-10-95546-72-6 |
Tila | Julkaistu - 20 kesäk. 2022 |
OKM-julkaisutyyppi | A4 Artikkeli konferenssijulkaisuussa |
Tapahtuma | International Conference on Language Resources and Evaluation - Marseille, Ranska Kesto: 20 kesäk. 2022 → 25 kesäk. 2022 Konferenssinumero: 13 https://lr-coordination.eu/node/406 |
Tieteenalat
- 6121 Kielitieteet
- 113 Tietojenkäsittely- ja informaatiotieteet
Projektit
- 1 Aktiivinen
-
Behind the words: Deep neural models of language meaning for industry-grade applciations
Creutz, M., Tiedemann, J., Itkonen, S., Vahtola, T., Creutz, M., Itkonen, S., Sjöblom, E. I. & Vahtola, T.
Academy of Finland, Suomen Akatemia Projektilaskutus
01/01/2021 → 31/12/2023
Projekti: Suomen Akatemia: : Suunnattu akatemiahanke
Aktiviteetit
- 1 Suullinen esitys
-
Modeling Noise in Paraphrase Detection
Teemu Vahtola (Puhuja)
23 kesäk. 2022Aktiviteetti: Puhe- tai esitystyypit › Suullinen esitys