Aktiviteetteja vuodessa
Abstrakti
Texts of different lengths can be difficult to compare using quantitative methods. This is particularly true if many of the texts are extremely short, as is commonly the case with social media comments, where the median text length may be only a few dozen words. In this paper, I explore lengthwise scaling, that is, scaling applied to each text length separately, as a possible approach for getting around some of the statistical problems caused by different text lengths and short texts. I describe two implementations of this family of methods, lengthwise rarity scaling and lengthwise quantile scaling. I show in an exploratory analysis that these scaling methods support earlier results in terms of register differences between Reddit subreddits.
Alkuperäiskieli | englanti |
---|---|
Otsikko | Corpus Approaches to Social Media |
Toimittajat | Sofia Rüdiger, Daria Dayter |
Sivumäärä | 20 |
Julkaisupaikka | Amsterdam |
Kustantaja | John Benjamins |
Julkaisupäivä | 2020 |
Sivut | 111-130 |
Artikkeli no | 5 |
ISBN (painettu) | 978-90-272-0794-4 |
ISBN (elektroninen) | 978-90-272-6049-9 |
DOI - pysyväislinkit | |
Tila | Julkaistu - 2020 |
OKM-julkaisutyyppi | A3 Kirjan tai muun kokoomateoksen osa |
Julkaisusarja
Nimi | Studies in Corpus Linguistics |
---|---|
Kustantaja | John Benjamins |
Numero | 98 |
ISSN (painettu) | 1388-0373 |
Tieteenalat
- 6121 Kielitieteet
Aktiviteetit
- 1 Käsikirjoitusten vertaisarviointi
-
de Gruyter (Kustantaja)
Liimatta, A. (Arvioitsija (reviewer))
jouluk. 2020Aktiviteetti: Julkaisun vertaisarvioinnin ja toimituksellisen työn tyypit › Käsikirjoitusten vertaisarviointi