Projekt per år
Organisationsprofil
Language technology is a multidisciplinary field. It often comes with the label computational linguistics, natural language processing (NLP) or natural language engineering (NLE). In language technology we study methods and develop models and tools for processing human language. This includes models for natural language understanding and human language generation also across languages. In Helsinki we focus on
- Cross-lingual NLP including machine translation
- NLP for languages with a rich morphology
- NLP for low-resource languages and in the humanities
Activities and news from our research group are available at our website.
Vetenskapsgrenar
- 113 Data- och informationsvetenskap
- 6121 Språkvetenskaper
Internationellt och inhemskt samarbete
Personer
-
Mikko Aulamo
- Avdelningen för digital humaniora - doktorand, gästforskare
- Språkteknologi
- Doktorandprogrammet i språkforskning
Person: gästforskare, U1 Undervisnings- och forskningspersonal, Doktorand
-
Michele Boggia
- Avdelningen för digital humaniora - forskardoktor
- Språkteknologi
Person: U2 Undervisnings- och forskningspersonal
-
Hande Celikkanat
- Avdelningen för digital humaniora - universitetsforskare
- Språkteknologi
Person: U3 Undervisnings- och forskningspersonal
-
Mathias Creutz
- Avdelningen för digital humaniora - Titeln docent, universitetslektor
- Språkteknologi
Person: U3 Undervisnings- och forskningspersonal
Utrustning
-
Helsinki Term Bank for the Arts and Sciences, former Bank of Finnish Terminology in Arts and Sciences
Tiina Onikki-Rantajääskö (Chef), Antti Olavi Kanner (Operatör), Niklas Mikael Laxström (Operatör) & Eeva Johanna Enqvist (Annat)
Finskugriska och nordiska avdelningenUtrustning/facilitet: Utrustning
-
Language Bank of Finland during the period 2005-2008.
Anssi Yli-Jyrä (Chef)
SpråkteknologiUtrustning/facilitet: Central servicefacilitet
-
nVidia GTX Titan X GPU Workstation in the Department of Digital Humanities at Metsätalo
Anssi Yli-Jyrä (Chef)
SpråkteknologiUtrustning/facilitet: Utrustning
-
nVidia RTX 2080Ti GPU for a Workstation at the Department of Digital Humanities, Metsätalo
Anssi Yli-Jyrä (Chef)
SpråkteknologiUtrustning/facilitet: Utrustning
-
Uncertainty-aware neural language models
Tiedemann, J., Celikkanat, H., Virpioja, S. P. & Vazquez , R.
01/01/2022 → 01/10/2025
Projekt: Forskningsprojekt
-
-
CorCoDial: Corpus-based computational dialectology: exploiting machine translation techniques to extract, visualize and interpret dialectal patterns
01/09/2021 → 31/08/2025
Projekt: Forskningsprojekt
-
-
-
A Social Network of the Prosopography of the Neo-Assyrian Empire
Jauhiainen, H. & Alstola, T., 17 mars 2022, I: Journal of open humanities data. 8, 8 s.Forskningsoutput: Tidskriftsbidrag › Artikel › Vetenskaplig › Peer review
Öppen tillgångFil -
Finnish Parliament on the Semantic Web: Using ParliamentSampo Data Service and Semantic Portal for Studying Political Culture and Language
Hyvönen, E., Sinikallio, L., Leskinen, P., La Mela, M., Tuominen, J., Elo, K., Drobac, S., Koho, M., Ikkala, E., Tamper, M., Leal, R. & Kesäniemi, J., 2 maj 2022, Digital Parliamentary data in Action (DiPaDa 2022), Workshop at the 6th Digital Humanities in Nordic and Baltic Countries Conference, long paper. La Mela, M., Norén, F. & Hyvönen, E. (red.). CEUR, (CEUR Workshop proceedings; vol. 3133).Forskningsoutput: Kapitel i bok/rapport/konferenshandling › Konferensbidrag › Vetenskaplig › Peer review
Öppen tillgångFil -
Multilingual Topic Labelling of News Topics using Ontological Mapping
Zosa, E., Pivovarova, L., Boggia, M. & Ivanova, S., 5 apr. 2022, Advances in Information Retrieval. ECIR 2022. Hagen, M., Verberne, S., Macdonald, C., Seifert, C., Balog, K., Norvag, K. & Setty (red.). Cham: Springer, s. 248–256 9 s. (Lecture Notes in Computer Science; vol. 13186).Forskningsoutput: Kapitel i bok/rapport/konferenshandling › Konferensbidrag › Vetenskaplig › Peer review
Öppen tillgångFil -
Språk(teknologi) är nyckeln till intelligens och rättvisa
Tiedemann, J., 20 jan. 2022, I: Språkbruk.Forskningsoutput: Tidskriftsbidrag › Artikel › Professionell
Öppen tillgång -
¡Qué maravilla! Multimodal Sarcasm Detection in Spanish: a Dataset and a Baseline
Alnajjar, K. & Hämäläinen, M., 2021, Proceedings of the Third Workshop on Multimodal Artificial Intelligence. Zadeh, A., Morency, L-P., Pu Liang, P., Ross, C., Salakhutdinov, R., Poria, S., Cambria, E. & Shi, K. (red.). Stroudsburg: The Association for Computational Linguistics, s. 63-68 6 s.Forskningsoutput: Kapitel i bok/rapport/konferenshandling › Konferensbidrag › Vetenskaplig › Peer review
Öppen tillgångFil
Aktiviteter
-
Human Evaluation of Creative NLG Systems: An Interdisciplinary Survey on Recent Papers
Mika Hämäläinen (!!Speaker) & Khalid Alnajjar (!!Speaker)
20 jan. 2022Aktivitet: Typer för tal eller presentation › !!Oral presentation
-
Journal of Data Mining and Digital Humanities (Tidskrift)
Jack Rueter (Referentgranskare)
mars 2022 → apr. 2022Aktivitet: Typer för peer review av output och redaktionsarbete › Referentgranskning av manuskript
-
Journal of Data Mining and Digital Humanities (Tidskrift)
Mika Hämäläinen (Redaktör)
2022 → …Aktivitet: Typer för peer review av output och redaktionsarbete › Redaktör för specialtemanummer
-
Findings of the VarDial Evaluation Campaign 2021
Tommi Jauhiainen (!!Speaker)
20 apr. 2021Aktivitet: Typer för tal eller presentation › !!Oral presentation
-
Nordic Probabilistic AI school: ProbAI
Raul Vazquez (Närvarande)
13 juni 2021 → 17 juni 2021Aktivitet: Typer för deltagande i eller organisering av evenemang › Arrangemang av och deltagande i konferens/workshop/kurs/seminarium
Priser
-
Best paper award at DHN 2020
Mäkelä, Eetu (!!Recipient), Lagus, Krista (!!Recipient), Lahti, L. (!!Recipient), Säily, Tanja (!!Recipient), Tolonen, Mikko (!!Recipient), Hämäläinen, Mika (!!Recipient), Kaislaniemi, S. (!!Recipient) & Nevalainen, Terttu (!!Recipient), 23 okt. 2020
Pris: Pris och hedersbetygelser
-
-
Forskningsdatauppsättningar
-
Machine-readable Northern Karelian Proper-Livvi bilingual translation dictionary
Rantakaulio, T. (Skapad av), Alnajjar, K. (Skapad av), Hämäläinen, M. (Skapad av), Rueter, J. (Skapad av) & Pirinen, F. (Skapad av), Zenodo, 3 jan. 2022
Datauppsättning
-
Machine-readable Finnish-Livvi bilingual translation dictionary
Rantakaulio, T. (Skapad av), Alnajjar, K. (Skapad av), Hämäläinen, M. (Skapad av), Rueter, J. (Skapad av) & Pirinen, F. (Skapad av), Zenodo, 3 jan. 2022
Datauppsättning
-
Machine-readable Finnish-Karelian bilingual translation dictionary
Rantakaulio, T. (Skapad av), Alnajjar, K. (Skapad av), Hämäläinen, M. (Skapad av), Pirinen, F. (Skapad av) & Rueter, J. (Skapad av), Zenodo, 3 jan. 2022
Datauppsättning
-
Fear in Akkadian Texts
Svärd, S. (Skapad av), Alstola, T. (Skapad av), Jauhiainen, H. (Skapad av), Sahala, A. (Skapad av) & Linden, K. (Skapad av), Zenodo, 2020
Datauppsättning
-
Tidningsurklipp
-
Språk(teknologi) är nyckeln till intelligens och rättvisa
20/01/2022
1 Mediabidrag
Press/media: !!Press / Media
-
芬兰研究人员正在教人工智能讲流利的芬兰语方言
Mika Hämäläinen, Khalid Alnajjar, Jack Rueter & Niko Partanen
10/01/2022
1 objekt av Mediabevakning
Press/media: !!Press / Media
-
Inteligência artificial identifica 23 dialetos em finlandês
Mika Hämäläinen, Khalid Alnajjar, Jack Rueter & Niko Partanen
17/12/2021
1 objekt av Mediabevakning
Press/media: !!Press / Media
-
Researchers teach artificial intelligence to be fluent in Finnish dialects
Mika Hämäläinen, Khalid Alnajjar, Niko Partanen & Jack Rueter
16/12/2021
1 Mediabidrag
Press/media: !!Press / Media
-
Researchers teach computer to be fluent in Finnish dialects
Mika Hämäläinen, Khalid Alnajjar, Niko Partanen & Jack Rueter
15/12/2021
1 objekt av Mediabevakning
Press/media: !!Press / Media