Kielensisäisen tekstityksen kehittäminen

  • Kurimo, Mikko (Projektledare)
  • Tiittula, Liisa (Ansvarig forskare)
  • Rainó, Päivi (Deltagare)
  • Pöntys, Minna (Deltagare)
  • Mansikkaniemi, Andre (Deltagare)
  • Enarvi, Seppo (Deltagare)

Beskrivning

Automaattisen puheentunnistuksen avulla saavat kuulovammaiset, huonokuuloiset ja suomea opiskelevat puheen lähes viiveettä nähtäville tukemaan kuuntelua. Tässä hankkeessa on tarkoitus saattaa Suomessa automaattinen puheentunnistuksen tutkimuksen parissa tehtävä tutkimustyö hyödyttämään suurta joukkoa, lähes miljoonaa suomalaista, joille puhuttu kielenmuoto ei ole helposti saavutettavissa. Puheentunnistukseen perustuvaa tekstitystä kehitetään niin, että se on käytettävissä esimerkiksi luennoilla, television suorissa lähetyksissä ja teatterissa. Hankkeessa tutkitaan kielensisäisen tekstityksen saavutettavuutta ja automaattisen puheentunnistuksen menetelmiä, joilla olisi mahdollista tuottaa parempaa reaaliaikaista tekstitystä. Tekstityksen tutkimuksessa pääpaino on vastaanottajan näkökulmassa. Tutkimme sitä, millaista tekstin tulisi olla, jotta se on puheen seuraamisen kannalta ymmärrettävää ja riittävää.
Työ toteutetaan Aalto-yliopiston puheentunnistustutkijoiden ja Helsingin yliopiston tekstitystutkijoiden ja Humakin saavutettavuustutkijoiden monitieteisenä hankkeena. Hankkeessa kehitetään Aalto-yliopiston puheentunnistimesta automaattista ja puoliautomaattista tekstitystä tukevia tekstitystyökalun koeversioita, joiden avulla määritetään vastaanottajan kannalta oleelliset puheentunnistuksen kehitystarpeet. Hanke on kolmivuotinen ja siinä tuotetaan käyttäjiä varten vuosittain uudet parannetut koeversiot tekstitystyökalusta.

Puheentunnistuksen valtavirta tutkii vain väärintunnistettujen sanojen lukumäärän minimointia ja vain muutamaa valtakieltä. Kaikki sanat tai sanojen tunnistusvirheet kuitenkaan ole sisällön ymmärtämisen kannalta samanarvoisia. Tämä ristiriita korostuu erityisesti morfologisesti rikkaissa kielissä, joita ovat mm. suomalaisugrilaiset kielet. Tällöin automaattiseen puheentunnistukseen perustuva tekstitys vaatii valtavirrasta poikkeavien puheentunnistusmenetelmien kehittämistä.
StatusSlutfört
Gällande start-/slutdatum01/01/201631/12/2016

Keywords

  • 213 El-, automations- och telekommunikationsteknik, elektronik
  • 6121 Språkvetenskaper