Projekteja vuodessa
Organisaation profiili
Yksikön profiili
Language technology is a multidisciplinary field. It often comes with the label computational linguistics, natural language processing (NLP) or natural language engineering (NLE). In language technology we study methods and develop models and tools for processing human language. This includes models for natural language understanding and human language generation also across languages. In Helsinki we focus on
- Cross-lingual NLP including machine translation
- NLP for languages with a rich morphology
- NLP for low-resource languages and in the humanities
Activities and news from our research group are available at our website.
Tieteenalat
- 113 Tietojenkäsittely- ja informaatiotieteet
- 6121 Kielitieteet
Kansainvälinen ja kotimainen yhteistyö
Henkilöt
-
Mikko Aulamo
- Digitaalisten ihmistieteiden osasto - väitöskirjatutkija
- Kieliteknologia
- Kielentutkimuksen tohtoriohjelma
Henkilö: U1 Opetus- ja tutkimushenkilöstö, Väitöskirjatutkija
-
Mathias Creutz
- Digitaalisten ihmistieteiden osasto - vanhempi yliopistonlehtori, dosentuuri
- Kieliteknologia
Henkilö: U3 Opetus- ja tutkimushenkilöstö
-
Ona De Gibert Bonet, PhD Student
- Digitaalisten ihmistieteiden osasto - väitöskirjatutkija
- Kieliteknologia
- Kielentutkimuksen tohtoriohjelma
Henkilö: U1 Opetus- ja tutkimushenkilöstö, Väitöskirjatutkija
Laitteet
-
HTB Helsinki Term Bank for the Arts and Sciences
Onikki-Rantajääskö, T. (Johtaja), Kanner, A. O. (Operaattori), Laxström, N. M. (Operaattori), Enqvist, E. J. (Muut) & Kettunen, H. (Muut)
Suomalais-ugrilainen ja pohjoismainen osastoLaitteistot/tilat: Database
-
nVidia GTX Titan X GPU Workstation in the Department of Digital Humanities at Metsätalo
Yli-Jyrä, A. (Johtaja)
KieliteknologiaLaitteistot/tilat: Laitteet
-
nVidia RTX 2080Ti GPU for a Workstation
Yli-Jyrä, A. (Johtaja)
KieliteknologiaLaitteistot/tilat: Laitteet
-
Automatic Classification and Analysis of Texts from Egyptian Antiquity
Jauhiainen, T. (Projektinjohtaja), Henriksson, E. (osallistuja), Jauhiainen, H. (osallistuja) & Vierros, M. (osallistuja)
01/01/2024 → 30/11/2029
Projekti: Rahastot ja säätiöt
-
GreenNLP: GreenNLP - Att kontrollera koldioxidavtrycket inom hållbar språkteknologi
Tiedemann, J. (Projektinjohtaja), Attieh, J. (osallistuja), Nieminen, T. J. (osallistuja), Wang, C. (osallistuja) & Štefánik, M. (osallistuja)
Suomen Akatemia Projektilaskutus
01/01/2023 → 31/12/2025
Projekti: Suomen Akatemia: : Suunnattu akatemiahanke
-
High Performance Language Technologies
Tiedemann, J. (Projektinjohtaja), Aulamo, M. (osallistuja), De Gibert Bonet, O. (osallistuja), Grönroos, S.-A. (osallistuja), Ji, S. (osallistuja), Mickus, T. (osallistuja), Vahtola, T. (osallistuja), Vazquez , R. (osallistuja) & Virpioja, S. P. (osallistuja)
Charles University in Prague Faculty of Science Department of Teaching and Didactics of Biology
01/09/2022 → 31/12/2025
Projekti: EU Horizon Europe: Innovation actions (HORIZON-IA)
-
Uncertainty-aware neural language models
Tiedemann, J. (Projektinjohtaja), Celikkanat, H. (Osallistuja), Virpioja, S. P. (Osallistuja) & Vazquez , R. (Osallistuja)
Academy of Finland, Suomen Akatemia Projektilaskutus
01/01/2022 → 01/10/2025
Projekti: Tutkimusprojekti
-
CorCoDial: CorCoDial - Tekstikorpuksiin perustuva laskennallinen murretutkimus: konekäännöstekniikoiden hyödyntäminen murrealueiden ja murrepiirteiden löytämisessä, visualisoinnissa ja tulkitsemisessa
Scherrer, Y. (Projektinjohtaja), Tiedemann, J. (Projektinjohtaja), Mickus, T. (osallistuja), Miletic Haddad, A. (osallistuja), Psaltaki, E. (osallistuja), Roemling, D. (osallistuja), Siewert, J. (osallistuja) & Siewert, J. (osallistuja)
Suomen Akatemia Projektilaskutus
01/09/2021 → 31/08/2025
Projekti: Suomen Akatemia: Akatemiahanke
Julkaisut
-
Analyzing the Effect of Linguistic Instructions on Paraphrase Generation
Vahtola, T., Hu, S., Creutz, M., Vulić, I., Korhonen, A. & Tiedemann, J., maalisk. 2025, Proceedings of the Joint 25th Nordic Conference on Computational Linguistics and 11th Baltic Conference on Human Language Technologies (NoDaLiDa/Baltic-HLT 2025). Johansson, R. & Stymme, S. (toim.). Tartu: University of Tartu Library, s. 755-766 12 Sivumäärä (NEALT proceedings series; nro 57).Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussa › Konferenssiartikkeli › Tieteellinen › vertaisarvioitu
Open accessTiedosto -
Automatic detection of place and time for Greek texts in Egypt
Jauhiainen, T., Henriksson, E., Vierros, M. & Jauhiainen, H., 2025, (Hyväksytty/In press) Proceedings of the Thirteenth International Congress of Egyptologists (ICE XIII). (Egyptologische Uitgaven).Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussa › Konferenssiartikkeli › Tieteellinen › vertaisarvioitu
-
EvaCun 2025 Shared Task: Lemmatization and Token Prediction in Akkadian and Sumerian using LLMs
Gordin, S., Sahala, A., Spencer, S. & Klein, S., 4 toukok. 2025, Proceedings of the Second Workshop on Ancient Language Processing. Anderson, A., Gordin, S., Li, B., Liu, Y., Passarotti, M. C. & Sprugnoli, R. (toim.). Stroudsburg: The Association for Computational Linguistics, s. 164-172 9 SivumääräTutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussa › Konferenssiartikkeli › Tieteellinen › vertaisarvioitu
Open accessTiedosto -
Functional Lexicon in Subword Tokenization
Hopton, Z., Scherrer, Y. & Samardžić, T., 1 huhtik. 2025, Proceedings of the 2025 Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics: Human Language Technologies (Volume 1: Long Papers). Chiruzzo, L., Ritter, A. & Wang, L. (toim.). Kerrville: The Association for Computational Linguistics, s. 7839-7853 15 SivumääräTutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussa › Konferenssiartikkeli › Tieteellinen › vertaisarvioitu
Open accessTiedosto -
How Many Languages Make Good Multilingual Instruction Tuning? A Case Study on BLOOM
Ji, S. & Chen, P., 2025, Proceedings of the 31st International Conference on Computational Linguistics. Rambow, O., Wanner, L., Apidianaki, M., Al-Khalifa, H., Di Eugenio, B. & Schockaert, S. (toim.). Stroudsburg: Association for Computational Linguistics (ACL), s. 2575-2581 7 Sivumäärä (International Conference on Computational Linguistics).Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussa › Konferenssiartikkeli › Tieteellinen › vertaisarvioitu
Open accessTiedosto
Aktiviteetit
-
Neural Models for Lemmatization and POS-Tagging of Earlier and Late Egyptian (Supporting Hieroglyphic Input) and Demotic
Sahala, A. (Puhuja)
4 toukok. 2025Aktiviteetti: Puhe- tai esitystyypit › Suullinen esitys
-
Computational Approaches to Sumerian Unorthographic Texts
Sahala, A. (Puhuja)
10 huhtik. 2025Aktiviteetti: Puhe- tai esitystyypit › Suullinen esitys
-
Machine-Readable Texts in Egyptology: Current State and Challenges
Jauhiainen, H. (Puhuja)
9 heinäk. 2024Aktiviteetti: Puhe- tai esitystyypit › Suullinen esitys
-
Data Sources for Automatic Classification and Analysis of Texts from Egyptian Antiquity
Jauhiainen, T. (Puhuja)
11 jouluk. 2024Aktiviteetti: Puhe- tai esitystyypit › Suullinen esitys
-
Low Saxon corpus-based dialectometry
Siewert, J. (Puhuja)
17 heinäk. 2024Aktiviteetti: Puhe- tai esitystyypit › Suullinen esitys
Tiedosto
Palkinnot
-
August Ahlqvistin, Yrjö Wichmannin, Kai Donnerin ja Artturi Kanniston rahastojen väitöskirjapalkinto
Kuparinen, O. V. (Vastaanottaja), 14 maalisk. 2022
Palkinto: Palkinnot ja kunnianosoitukset
-
Best paper award at DHN 2020
Mäkelä, E. (Vastaanottaja), Lagus, K. (Vastaanottaja), Lahti, L. (Vastaanottaja), Säily, T. (Vastaanottaja), Tolonen, M. (Vastaanottaja), Hämäläinen, M. (Vastaanottaja), Kaislaniemi, S. (Vastaanottaja) & Nevalainen, T. (Vastaanottaja), 23 lokak. 2020
Palkinto: Palkinnot ja kunnianosoitukset
-
-
-
Future DigiLeader 2020
Öhman, E. (Vastaanottaja), 11 marrask. 2020
Palkinto: Palkinnot ja kunnianosoitukset
Tietoaineistot
-
Murreviikko: an Annotated and Normalized Corpus of Dialectal Finnish Tweets
Kuparinen, O. V. (Luoja), Zenodo, 2023
DOI - pysyväislinkki: 10.5281/zenodo.7907535
Tietoaineisto
-
OcWikiAnnot: Annotated Wikipedia Corpus of Occitan
Miletic Haddad, A. (Luoja), Zenodo, 20 huhtik. 2023
DOI - pysyväislinkki: 10.5281/zenodo.7777340, https://doi.org/10.5281/zenodo.7777340
Tietoaineisto
-
OcWikiDisc: a Corpus of Wikipedia Talk Pages in Occitan
Miletic Haddad, A. (Luoja) & Scherrer, Y. (Luoja), Zenodo, 14 syysk. 2022
DOI - pysyväislinkki: 10.5281/zenodo.7079580, https://doi.org/10.5281/zenodo.7079580
Tietoaineisto
-
Machine-readable Northern Karelian Proper-Livvi bilingual translation dictionary
Rantakaulio, T. (Luoja), Alnajjar, K. (Luoja), Hämäläinen, M. (Luoja), Rueter, J. (Luoja) & Pirinen, F. (Luoja), Zenodo, 3 tammik. 2022
DOI - pysyväislinkki: 10.5281/zenodo.5816003
Tietoaineisto
-
Machine-readable Finnish-Karelian bilingual translation dictionary
Rantakaulio, T. (Luoja), Alnajjar, K. (Luoja), Hämäläinen, M. (Luoja), Pirinen, F. (Luoja) & Rueter, J. (Luoja), Zenodo, 3 tammik. 2022
DOI - pysyväislinkki: 10.5281/zenodo.5815863
Tietoaineisto
Lehtileikkeet
-
-
Språk(teknologi) är nyckeln till intelligens och rättvisa
20/01/2022
1 Median myötävaikutus
Lehdistö/media
-
芬兰研究人员正在教人工智能讲流利的芬兰语方言
Hämäläinen, M., Alnajjar, K., Rueter, J. & Partanen, N.
10/01/2022
1 kohde/ Medianäkyvyys
Lehdistö/media
-
Inteligência artificial identifica 23 dialetos em finlandês
Hämäläinen, M., Alnajjar, K., Rueter, J. & Partanen, N.
17/12/2021
1 kohde/ Medianäkyvyys
Lehdistö/media
-
Researchers teach artificial intelligence to be fluent in Finnish dialects
Hämäläinen, M., Alnajjar, K., Partanen, N. & Rueter, J.
16/12/2021
1 Median myötävaikutus
Lehdistö/media