Projekt per år
Organisationsprofil
Language technology is a multidisciplinary field. It often comes with the label computational linguistics, natural language processing (NLP) or natural language engineering (NLE). In language technology we study methods and develop models and tools for processing human language. This includes models for natural language understanding and human language generation also across languages. In Helsinki we focus on
- Cross-lingual NLP including machine translation
- NLP for languages with a rich morphology
- NLP for low-resource languages and in the humanities
Activities and news from our research group are available at our website.
Vetenskapsgrenar
- 113 Data- och informationsvetenskap
- 6121 Språkvetenskaper
Internationellt och inhemskt samarbete
Personer
-
Hande Celikkanat
- Avdelningen för digital humaniora - universitetsforskare
- Språkteknologi
Person: U3 Undervisnings- och forskningspersonal
-
Mathias Creutz
- Avdelningen för digital humaniora - äldre universitetslektor, Titeln docent
- Språkteknologi
Person: U3 Undervisnings- och forskningspersonal
Utrustning
-
Helsinki Term Bank for the Arts and Sciences, former Bank of Finnish Terminology in Arts and Sciences
Tiina Onikki-Rantajääskö (Chef), Antti Olavi Kanner (Operatör), Niklas Mikael Laxström (Operatör), Eeva Johanna Enqvist (Annat) & Harri Kettunen (Annat)
Finskugriska och nordiska avdelningenUtrustning/facilitet: Utrustning
-
Language Bank of Finland during the period 2005-2008.
Anssi Yli-Jyrä (Chef)
SpråkteknologiUtrustning/facilitet: Central servicefacilitet
-
nVidia GTX Titan X GPU Workstation in the Department of Digital Humanities at Metsätalo
Anssi Yli-Jyrä (Chef)
SpråkteknologiUtrustning/facilitet: Utrustning
-
nVidia RTX 2080Ti GPU for a Workstation at the Department of Digital Humanities, Metsätalo
Anssi Yli-Jyrä (Chef)
SpråkteknologiUtrustning/facilitet: Utrustning
-
GreenNLP: Green NLP - controlling the carbon footprint in sustainable language technology
Tiedemann, J., Attieh, J. & Nieminen, T. J.
Suomen Akatemia Projektilaskutus
01/01/2023 → 31/12/2025
Projekt: Finlands Akademi: Akademiprojekt med särskild inriktning
-
Rapporteur to chart the state of the Finnish language
Onikki-Rantajääskö, T. & Kanner, A.
01/11/2022 → 30/04/2024
Projekt: Ministerium finansiering
-
High Performance Language Technologies
Tiedemann, J., Aulamo, M. & Ji, S.
Charles University in Prague Faculty of Science Department of Teaching and Didactics of Biology
01/09/2022 → 31/08/2025
Projekt: EU Horizon Europe: Innovation actions (HORIZON-IA)
-
Uncertainty-aware neural language models
Tiedemann, J., Celikkanat, H., Virpioja, S. P. & Vazquez , R.
Academy of Finland, Suomen Akatemia Projektilaskutus
01/01/2022 → 01/10/2025
Projekt: Forskningsprojekt
-
-
Automatic text simplification of Russian texts using control tokens
Dmitrieva, A., maj 2023, Proceedings of the 9th Workshop on Slavic Natural Language Processing 2023 (SlavicNLP 2023). Association for Computational Linguistics (ACL), s. 70-77Forskningsoutput: Kapitel i bok/rapport/konferenshandling › Konferensbidrag › Vetenskaplig › Peer review
Öppen tillgångFil -
Detection and attribution of quotes in Finnish news media: BERT vs. rule-based approach
Janicki, M., Kanner, A. & Mäkelä, E., 1 maj 2023, Proceedings of the 24th Nordic Conference on Computational Linguistics (NoDaLiDa). Tórshavn, Faroe Islands: University of Tartu Library, s. 52-59 8 s.Forskningsoutput: Kapitel i bok/rapport/konferenshandling › Konferensbidrag › Vetenskaplig › Peer review
Öppen tillgång -
Dialect Representation Learning with Neural Dialect-to-Standard Normalization
Kuparinen, O. V. & Scherrer, Y., 2023, Proceedings of the Tenth Workshop on NLP for Similar Languages, Varieties and Dialects. s. 200-212Forskningsoutput: Kapitel i bok/rapport/konferenshandling › Konferensbidrag › Vetenskaplig › Peer review
Öppen tillgång -
Exploring the gaps in linguistic accessibility of media: The potential of automated subtitling as a solution
Tuominen, T., Koponen, M., Vitikainen, K., Sulubacak, U. & Tiedemann, J., jan. 2023, I: The Journal of Specialised Translation. 39, s. 77-98 22 s.Forskningsoutput: Tidskriftsbidrag › Artikel › Vetenskaplig › Peer review
Öppen tillgångFil -
FinnSentiment: A Finnish Social Media Corpus for Sentiment Polarity Annotation
Linden, K., Jauhiainen, T. & Hardwick, S., 3 mars 2023, I: Language Resources and Evaluation. 57, s. 581-609 29 s.Forskningsoutput: Tidskriftsbidrag › Artikel › Vetenskaplig › Peer review
Öppen tillgångFil
Aktiviteter
-
The 2023 EACL Student Research Workshop (Evenemang)
Tommi Jauhiainen (Referentgranskare)
2023Aktivitet: Typer för peer review av output och redaktionsarbete › Referentgranskning av manuskript
-
Tenth Workshop on NLP for Similar Languages, Varieties and Dialects (VarDial 2023)
Tommi Jauhiainen (Medlem i organisationskommitté), Yves Scherrer (Ordförande i organisationskommitté) & Jörg Tiedemann (Medlem i organisationskommitté)
2023 → …Aktivitet: Typer för deltagande i eller organisering av evenemang › Arrangemang av och deltagande i konferens/workshop/kurs/seminarium
-
10th International Contrastive Linguistics Conference
Tommi Jauhiainen (Medlem av vetenskaplig kommitté), Marja Etelämäki (Medlem av vetenskaplig kommitté) & Jan Lindström (Medlem av vetenskaplig kommitté)
2023Aktivitet: Typer för deltagande i eller organisering av evenemang › Arrangemang av och deltagande i konferens/workshop/kurs/seminarium
-
Finnish Journal of Linguistics (Tidskrift)
Olli Vilhelm Kuparinen (Referentgranskare)
2023 → …Aktivitet: Typer för peer review av output och redaktionsarbete › Referentgranskning av manuskript
-
Artikkeliväitöskirja, yhteiskirjoittaminen ja monitieteisyys - Kielentutkija trendien vietävänä
Olli Vilhelm Kuparinen (!!Speaker)
23 maj 2022Aktivitet: Typer för tal eller presentation › !!Invited talk
Priser
-
August Ahlqvistin, Yrjö Wichmannin, Kai Donnerin ja Artturi Kanniston rahastojen väitöskirjapalkinto
Kuparinen, Olli Vilhelm (!!Recipient), 14 mars 2022
Pris: Pris och hedersbetygelser
-
Best paper award at DHN 2020
Mäkelä, Eetu (!!Recipient), Lagus, Krista (!!Recipient), Lahti, Leo (!!Recipient), Säily, Tanja (!!Recipient), Tolonen, Mikko (!!Recipient), Hämäläinen, Mika (!!Recipient), Kaislaniemi, Samuli (!!Recipient) & Nevalainen, Terttu (!!Recipient), 23 okt. 2020
Pris: Pris och hedersbetygelser
-
-
-
Tampereen yliopiston tukisäätiön väitöskirjastipendi
Kuparinen, Olli Vilhelm (!!Recipient), 2022
Pris: Pris och hedersbetygelser
Forskningsdatauppsättningar
-
Murreviikko: an Annotated and Normalized Corpus of Dialectal Finnish Tweets
Kuparinen, O. V. (Skapad av), Zenodo, 2023
Datauppsättning
-
OcWikiAnnot: Annotated Wikipedia Corpus of Occitan
Miletic Haddad, A. (Skapad av), Zenodo, 20 apr. 2023
DOI: 10.5281/zenodo.7777340, https://doi.org/10.5281/zenodo.7777340
Datauppsättning
-
OcWikiDisc: a Corpus of Wikipedia Talk Pages in Occitan
Miletic Haddad, A. (Skapad av) & Scherrer, Y. (Skapad av), Zenodo, 14 sep. 2022
DOI: 10.5281/zenodo.7079580, https://doi.org/10.5281/zenodo.7079580
Datauppsättning
-
ANEE Lexical Networks v. 2.0 - the Dataset
Sahala, A. (Skapad av), Jauhiainen, H. (Skapad av), Alstola, T. (Skapad av), Hardwick, S. (Skapad av), Bennett, E. R. (Skapad av), Jauhiainen, T. (Skapad av), Svärd, S. (Skapad av) & Linden, K. (Skapad av), Zenodo, 29 sep. 2022
Datauppsättning
-
ANEE Lexical Networks v. 2.0
Sahala, A. (Skapad av), Jauhiainen, H. (Skapad av), Alstola, T. (Skapad av), Hardwick, S. (Skapad av), Bennett, E. R. (Skapad av), Jauhiainen, T. (Skapad av), Linden, K. (Skapad av) & Svärd, S. (Skapad av), University of Helsinki, 29 sep. 2022
http://urn.fi/urn:nbn:fi:lb-2022100301
Datauppsättning
Tidningsurklipp
-
-
Språk(teknologi) är nyckeln till intelligens och rättvisa
20/01/2022
1 Mediabidrag
Press/media: !!Press / Media
-
芬兰研究人员正在教人工智能讲流利的芬兰语方言
Mika Hämäläinen, Khalid Alnajjar, Jack Rueter & Niko Partanen
10/01/2022
1 objekt av Mediabevakning
Press/media: !!Press / Media
-
Inteligência artificial identifica 23 dialetos em finlandês
Mika Hämäläinen, Khalid Alnajjar, Jack Rueter & Niko Partanen
17/12/2021
1 objekt av Mediabevakning
Press/media: !!Press / Media
-
Researchers teach artificial intelligence to be fluent in Finnish dialects
Mika Hämäläinen, Khalid Alnajjar, Niko Partanen & Jack Rueter
16/12/2021
1 Mediabidrag
Press/media: !!Press / Media