Projekteja vuodessa
Organisaation profiili
Language technology is a multidisciplinary field. It often comes with the label computational linguistics, natural language processing (NLP) or natural language engineering (NLE). In language technology we study methods and develop models and tools for processing human language. This includes models for natural language understanding and human language generation also across languages. In Helsinki we focus on
- Cross-lingual NLP including machine translation
- NLP for languages with a rich morphology
- NLP for low-resource languages and in the humanities
Activities and news from our research group are available at our website.
Tieteenalat
- 113 Tietojenkäsittely- ja informaatiotieteet
- 6121 Kielitieteet
Kansainvälinen ja kotimainen yhteistyö
Henkilöt
-
Mikko Aulamo
- Digitaalisten ihmistieteiden osasto - väitöskirjatutkija
- Kieliteknologia
- Kielentutkimuksen tohtoriohjelma
Henkilö: U1 Opetus- ja tutkimushenkilöstö, Väitöskirjatutkija
-
Hande Celikkanat
- Digitaalisten ihmistieteiden osasto - yliopistotutkija
- Kieliteknologia
Henkilö: U3 Opetus- ja tutkimushenkilöstö
-
Mathias Creutz
- Digitaalisten ihmistieteiden osasto - vanhempi yliopistonlehtori, dosentuuri
- Kieliteknologia
Henkilö: U3 Opetus- ja tutkimushenkilöstö
Laitteet
-
Helsinki Term Bank for the Arts and Sciences, former Bank of Finnish Terminology in Arts and Sciences
Tiina Onikki-Rantajääskö (Johtaja), Antti Olavi Kanner (Operaattori), Niklas Mikael Laxström (Operaattori), Eeva Johanna Enqvist (Muut) & Harri Kettunen (Muut)
Suomalais-ugrilainen ja pohjoismainen osastoLaitteistot/tilat: Laitteet
-
Language Bank of Finland during the period 2005-2008.
Anssi Yli-Jyrä (Johtaja)
KieliteknologiaLaitteistot/tilat: Keskuspalveluyksikkö
-
nVidia GTX Titan X GPU Workstation in the Department of Digital Humanities at Metsätalo
Anssi Yli-Jyrä (Johtaja)
KieliteknologiaLaitteistot/tilat: Laitteet
-
nVidia RTX 2080Ti GPU for a Workstation at the Department of Digital Humanities, Metsätalo
Anssi Yli-Jyrä (Johtaja)
KieliteknologiaLaitteistot/tilat: Laitteet
-
GreenNLP: GreenNLP - Att kontrollera koldioxidavtrycket inom hållbar språkteknologi
Tiedemann, J. & Nieminen, T. J.
Suomen Akatemia Projektilaskutus
01/01/2023 → 31/12/2025
Projekti: Suomen Akatemia: : Suunnattu akatemiahanke
-
Rapporteur to chart the state of the Finnish language
Onikki-Rantajääskö, T. & Kanner, A.
01/11/2022 → 30/04/2024
Projekti: Ministeriön rahoitus
-
High Performance Language Technologies
Tiedemann, J., Aulamo, M., Ji, S. & Virpioja, S. P.
Charles University in Prague Faculty of Science Department of Teaching and Didactics of Biology
01/09/2022 → 31/08/2025
Projekti: EU Horizon Europe: Innovation actions (HORIZON-IA)
-
Uncertainty-aware neural language models
Tiedemann, J., Celikkanat, H., Virpioja, S. P. & Vazquez , R.
Academy of Finland, Suomen Akatemia Projektilaskutus
01/01/2022 → 01/10/2025
Projekti: Tutkimusprojekti
-
Julkaisut
-
A Bipartite Graph is All We Need for Enhancing Emotional Reasoning with Commonsense Knowledge
Yang, K., Zhang, T., Ji, S. & Ananiadou, S., 2023, Proceedings of CIKM.Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussa › Konferenssiartikkeli › Tieteellinen › vertaisarvioitu
-
Automatic detection of place and time for Greek texts in Egypt
Jauhiainen, T., Henriksson, E., Vierros, M. & Jauhiainen, H., 2023.Tutkimustuotos: Konferenssimateriaalit › Posteri › vertaisarvioitu
Open accessTiedosto -
Automatic text simplification of Russian texts using control tokens
Dmitrieva, A., toukok. 2023, Proceedings of the 9th Workshop on Slavic Natural Language Processing 2023 (SlavicNLP 2023). Piskorski, J., Marcińczuk, M. & Nakov, et al., P. (toim.). Stroudsburg: Association for Computational Linguistics (ACL), s. 70-77 8 SivumääräTutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussa › Konferenssiartikkeli › Tieteellinen › vertaisarvioitu
Open accessTiedosto -
Character Alignment Methods for Dialect-to-Standard Normalization
Scherrer, Y., 1 heinäk. 2023, Proceedings of the 20th SIGMORPHON workshop on Computational Research in Phonetics, Phonology, and Morphology. Nicolai, G., Chodroff, E., Mailhot, F. & Çöltekin, Ç. (toim.). Stroudsburg: The Association for Computational Linguistics, s. 110-116 7 SivumääräTutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussa › Konferenssiartikkeli › Tieteellinen › vertaisarvioitu
Open accessTiedosto -
Creating a parallel Finnish—Easy Finnish dataset from news articles
Dmitrieva, A. & Konovalova, A., kesäk. 2023, Proceedings of the 1st Workshop on Open Community-Driven Machine Translation. Esplá-Gomis, M., Forcada, M., Kuzman, T., Ljubešić, N., van Noord, R., Ramírez-Sánchez, G., Tiedemann, J. & Toral, A. (toim.). Universitat d’Alacant, s. 21-26 6 SivumääräTutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussa › Konferenssiartikkeli › Tieteellinen › vertaisarvioitu
Open accessTiedosto
Aktiviteetit
-
Corpus-based computational dialectology - Data, methods and results
Yves Scherrer (Puhuja)
5 kesäk. 2023Aktiviteetti: Puhe- tai esitystyypit › Kutsuesitelmä
Tiedosto -
Digital Humanities in the Nordic and Baltic Countries 2023 (Tapahtuma)
Tommi Jauhiainen (Arvioitsija (reviewer))
2023 → …Aktiviteetti: Julkaisun vertaisarvioinnin ja toimituksellisen työn tyypit › Käsikirjoitusten vertaisarviointi
-
Automatic Language Identification: General Introduction and Applications to Ancient Texts
Tommi Jauhiainen (Puhuja)
8 toukok. 2023Aktiviteetti: Puhe- tai esitystyypit › Suullinen esitys
-
Association for Computational Linguistics (ACL) (Kustantaja)
Shaoxiong Ji (Ohjelmatoimikunnan jäsen)
2023 → …Aktiviteetti: Julkaisun vertaisarvioinnin ja toimituksellisen työn tyypit › Tieteellisen kokooma- tai konferenssiteoksen toimittaja
-
Nature mental health (Lehti)
Shaoxiong Ji (Arvioitsija (reviewer))
2023Aktiviteetti: Julkaisun vertaisarvioinnin ja toimituksellisen työn tyypit › Käsikirjoitusten vertaisarviointi
Palkinnot
-
August Ahlqvistin, Yrjö Wichmannin, Kai Donnerin ja Artturi Kanniston rahastojen väitöskirjapalkinto
Kuparinen, Olli Vilhelm (Vastaanottaja), 14 maalisk. 2022
Palkinto: Palkinnot ja kunnianosoitukset
-
Best paper award at DHN 2020
Mäkelä, Eetu (Vastaanottaja), Lagus, Krista (Vastaanottaja), Lahti, Leo (Vastaanottaja), Säily, Tanja (Vastaanottaja), Tolonen, Mikko (Vastaanottaja), Hämäläinen, Mika (Vastaanottaja), Kaislaniemi, Samuli (Vastaanottaja) & Nevalainen, Terttu (Vastaanottaja), 23 lokak. 2020
Palkinto: Palkinnot ja kunnianosoitukset
-
-
-
Future DigiLeader 2020
Öhman, Emily (Vastaanottaja), 11 marrask. 2020
Palkinto: Palkinnot ja kunnianosoitukset
Tietoaineistot
-
Murreviikko: an Annotated and Normalized Corpus of Dialectal Finnish Tweets
Kuparinen, O. V. (Luoja), Zenodo, 2023
DOI - pysyväislinkki: 10.5281/zenodo.7907535
Tietoaineisto
-
OcWikiAnnot: Annotated Wikipedia Corpus of Occitan
Miletic Haddad, A. (Luoja), Zenodo, 20 huhtik. 2023
DOI - pysyväislinkki: 10.5281/zenodo.7777340, https://doi.org/10.5281/zenodo.7777340
Tietoaineisto
-
OcWikiDisc: a Corpus of Wikipedia Talk Pages in Occitan
Miletic Haddad, A. (Luoja) & Scherrer, Y. (Luoja), Zenodo, 14 syysk. 2022
DOI - pysyväislinkki: 10.5281/zenodo.7079580, https://doi.org/10.5281/zenodo.7079580
Tietoaineisto
-
ANEE Lexical Networks v. 2.0 - the Dataset
Sahala, A. (Luoja), Jauhiainen, H. (Luoja), Alstola, T. (Luoja), Hardwick, S. (Luoja), Bennett, E. R. (Luoja), Jauhiainen, T. (Luoja), Svärd, S. (Luoja) & Linden, K. (Luoja), Zenodo, 29 syysk. 2022
DOI - pysyväislinkki: 10.5281/zenodo.7124351
Tietoaineisto
-
ANEE Lexical Networks v. 2.0
Sahala, A. (Luoja), Jauhiainen, H. (Luoja), Alstola, T. (Luoja), Hardwick, S. (Luoja), Bennett, E. R. (Luoja), Jauhiainen, T. (Luoja), Linden, K. (Luoja) & Svärd, S. (Luoja), University of Helsinki, 29 syysk. 2022
http://urn.fi/urn:nbn:fi:lb-2022100301
Tietoaineisto
Lehtileikkeet
-
-
Språk(teknologi) är nyckeln till intelligens och rättvisa
20/01/2022
1 Median myötävaikutus
Lehdistö/media
-
芬兰研究人员正在教人工智能讲流利的芬兰语方言
Mika Hämäläinen, Khalid Alnajjar, Jack Rueter & Niko Partanen
10/01/2022
1 kohde/ Medianäkyvyys
Lehdistö/media
-
Inteligência artificial identifica 23 dialetos em finlandês
Mika Hämäläinen, Khalid Alnajjar, Jack Rueter & Niko Partanen
17/12/2021
1 kohde/ Medianäkyvyys
Lehdistö/media
-
Researchers teach artificial intelligence to be fluent in Finnish dialects
Mika Hämäläinen, Khalid Alnajjar, Niko Partanen & Jack Rueter
16/12/2021
1 Median myötävaikutus
Lehdistö/media