ArchiMob: Ein multidialektales Korpus schweizerdeutscher Spontansprache

Tutkimustuotos: KonferenssimateriaalitKonferenssiabstraktiTutkimusvertaisarvioitu

Kuvaus

Obwohl der Dialektgebrauch in der Deutschschweiz zum Alltag gehört, sind digitale Ressourcen für die dialektologische und computerlinguistische Forschung nur begrenzt verfügbar. In diesem Beitrag stellen wir ein frei verfügbares multidialektales Korpus schweizerdeutscher Spontansprache vor. Es besteht aus Transkriptionen von Videointerviews mit Zeitzeugen des Zweiten Weltkriegs in der Schweiz, die im Rahmen des ArchiMob-Projekts (http://www.archimob.ch) vor ca. 15 Jahren aufgenommen wurden. Jedes Interview wird mit einer Gewährsperson geführt und dauert zwischen 1 und 2
Stunden. Die erste Version mit 34 transkribierten Interviews (durchschnittlich 15 500 Wörter pro Aufnahme, insgesamt 500 000 Wörter) ist 2016 veröffentlicht worden (Samardžić et al. 2016); eine zweite Version mit 9 zusätzlichen Interviews ist für Sommer 2017 geplant.
Im ersten Teil des Beitrags beschreiben wir, wie die Dokumente transkribiert, segmentiert und mit den Tondaten aligniert wurden, wie wir versuchen, die massive (dialektale, sprecherspezifische und transkriptorenspezifische) Variation mittels einer zusätzlichen Normalisierungsebene zu vereinheitlichen, und wie wir die Daten mit spezifisch angepassten Korpuswerkzeugen zugänglich machen.
Im zweiten Teil des Beitrags möchten wir anhand mehrerer Beispiele illustrieren, wie dieses Korpus computerlinguistische und dialektologische Fragestellungen neu beantworten kann.
Julkaisun otsikon käännösArchiMob: A multidialectal corpus of Swiss German spontaneous speech
Alkuperäiskielisaksa
TilaJulkaistu - 2017
TapahtumaArbeitstagung zur alemannischen Dialektologie - Freiburg, Saksa
Kesto: 11 lokakuuta 201713 lokakuuta 2017
Konferenssinumero: 19

Konferenssi

KonferenssiArbeitstagung zur alemannischen Dialektologie
MaaSaksa
KaupunkiFreiburg
Ajanjakso11/10/201713/10/2017

Tieteenalat

  • 6121 Kielitieteet

Lainaa tätä

Scherrer, Y. (2017). ArchiMob: Ein multidialektales Korpus schweizerdeutscher Spontansprache. Abstraktin lähde: Arbeitstagung zur alemannischen Dialektologie, Freiburg, Saksa.
Scherrer, Yves. / ArchiMob : Ein multidialektales Korpus schweizerdeutscher Spontansprache. Abstraktin lähde: Arbeitstagung zur alemannischen Dialektologie, Freiburg, Saksa.
@conference{ec76b6363db5432191e665721ab01666,
title = "ArchiMob: Ein multidialektales Korpus schweizerdeutscher Spontansprache",
abstract = "Obwohl der Dialektgebrauch in der Deutschschweiz zum Alltag geh{\"o}rt, sind digitale Ressourcen f{\"u}r die dialektologische und computerlinguistische Forschung nur begrenzt verf{\"u}gbar. In diesem Beitrag stellen wir ein frei verf{\"u}gbares multidialektales Korpus schweizerdeutscher Spontansprache vor. Es besteht aus Transkriptionen von Videointerviews mit Zeitzeugen des Zweiten Weltkriegs in der Schweiz, die im Rahmen des ArchiMob-Projekts (http://www.archimob.ch) vor ca. 15 Jahren aufgenommen wurden. Jedes Interview wird mit einer Gew{\"a}hrsperson gef{\"u}hrt und dauert zwischen 1 und 2Stunden. Die erste Version mit 34 transkribierten Interviews (durchschnittlich 15 500 W{\"o}rter pro Aufnahme, insgesamt 500 000 W{\"o}rter) ist 2016 ver{\"o}ffentlicht worden (Samardžić et al. 2016); eine zweite Version mit 9 zus{\"a}tzlichen Interviews ist f{\"u}r Sommer 2017 geplant.Im ersten Teil des Beitrags beschreiben wir, wie die Dokumente transkribiert, segmentiert und mit den Tondaten aligniert wurden, wie wir versuchen, die massive (dialektale, sprecherspezifische und transkriptorenspezifische) Variation mittels einer zus{\"a}tzlichen Normalisierungsebene zu vereinheitlichen, und wie wir die Daten mit spezifisch angepassten Korpuswerkzeugen zug{\"a}nglich machen.Im zweiten Teil des Beitrags m{\"o}chten wir anhand mehrerer Beispiele illustrieren, wie dieses Korpus computerlinguistische und dialektologische Fragestellungen neu beantworten kann.",
keywords = "6121 Spr{\aa}kvetenskaper",
author = "Yves Scherrer",
note = "Volume: Proceeding volume: ; null ; Conference date: 11-10-2017 Through 13-10-2017",
year = "2017",
language = "tyska",

}

Scherrer, Y 2017, 'ArchiMob: Ein multidialektales Korpus schweizerdeutscher Spontansprache' Arbeitstagung zur alemannischen Dialektologie, Freiburg, Saksa, 11/10/2017 - 13/10/2017, .

ArchiMob : Ein multidialektales Korpus schweizerdeutscher Spontansprache. / Scherrer, Yves.

2017. Abstraktin lähde: Arbeitstagung zur alemannischen Dialektologie, Freiburg, Saksa.

Tutkimustuotos: KonferenssimateriaalitKonferenssiabstraktiTutkimusvertaisarvioitu

TY - CONF

T1 - ArchiMob

T2 - Ein multidialektales Korpus schweizerdeutscher Spontansprache

AU - Scherrer, Yves

N1 - Volume: Proceeding volume:

PY - 2017

Y1 - 2017

N2 - Obwohl der Dialektgebrauch in der Deutschschweiz zum Alltag gehört, sind digitale Ressourcen für die dialektologische und computerlinguistische Forschung nur begrenzt verfügbar. In diesem Beitrag stellen wir ein frei verfügbares multidialektales Korpus schweizerdeutscher Spontansprache vor. Es besteht aus Transkriptionen von Videointerviews mit Zeitzeugen des Zweiten Weltkriegs in der Schweiz, die im Rahmen des ArchiMob-Projekts (http://www.archimob.ch) vor ca. 15 Jahren aufgenommen wurden. Jedes Interview wird mit einer Gewährsperson geführt und dauert zwischen 1 und 2Stunden. Die erste Version mit 34 transkribierten Interviews (durchschnittlich 15 500 Wörter pro Aufnahme, insgesamt 500 000 Wörter) ist 2016 veröffentlicht worden (Samardžić et al. 2016); eine zweite Version mit 9 zusätzlichen Interviews ist für Sommer 2017 geplant.Im ersten Teil des Beitrags beschreiben wir, wie die Dokumente transkribiert, segmentiert und mit den Tondaten aligniert wurden, wie wir versuchen, die massive (dialektale, sprecherspezifische und transkriptorenspezifische) Variation mittels einer zusätzlichen Normalisierungsebene zu vereinheitlichen, und wie wir die Daten mit spezifisch angepassten Korpuswerkzeugen zugänglich machen.Im zweiten Teil des Beitrags möchten wir anhand mehrerer Beispiele illustrieren, wie dieses Korpus computerlinguistische und dialektologische Fragestellungen neu beantworten kann.

AB - Obwohl der Dialektgebrauch in der Deutschschweiz zum Alltag gehört, sind digitale Ressourcen für die dialektologische und computerlinguistische Forschung nur begrenzt verfügbar. In diesem Beitrag stellen wir ein frei verfügbares multidialektales Korpus schweizerdeutscher Spontansprache vor. Es besteht aus Transkriptionen von Videointerviews mit Zeitzeugen des Zweiten Weltkriegs in der Schweiz, die im Rahmen des ArchiMob-Projekts (http://www.archimob.ch) vor ca. 15 Jahren aufgenommen wurden. Jedes Interview wird mit einer Gewährsperson geführt und dauert zwischen 1 und 2Stunden. Die erste Version mit 34 transkribierten Interviews (durchschnittlich 15 500 Wörter pro Aufnahme, insgesamt 500 000 Wörter) ist 2016 veröffentlicht worden (Samardžić et al. 2016); eine zweite Version mit 9 zusätzlichen Interviews ist für Sommer 2017 geplant.Im ersten Teil des Beitrags beschreiben wir, wie die Dokumente transkribiert, segmentiert und mit den Tondaten aligniert wurden, wie wir versuchen, die massive (dialektale, sprecherspezifische und transkriptorenspezifische) Variation mittels einer zusätzlichen Normalisierungsebene zu vereinheitlichen, und wie wir die Daten mit spezifisch angepassten Korpuswerkzeugen zugänglich machen.Im zweiten Teil des Beitrags möchten wir anhand mehrerer Beispiele illustrieren, wie dieses Korpus computerlinguistische und dialektologische Fragestellungen neu beantworten kann.

KW - 6121 Språkvetenskaper

M3 - Sammanfattning

ER -

Scherrer Y. ArchiMob: Ein multidialektales Korpus schweizerdeutscher Spontansprache. 2017. Abstraktin lähde: Arbeitstagung zur alemannischen Dialektologie, Freiburg, Saksa.