• P.O. Box 24 (Unioninkatu 40 B)

    00014 University of Helsinki

    Suomi

Julkaisut

2020

A Finnish news corpus for named entity recognition

Ruokolainen, T., Kauppinen, P., Silfverberg, M. & Lindén, K., maaliskuuta 2020, julkaisussa : Language Resources and Evaluation. 54, 1, s. 247-272 26 Sivumäärä

Tutkimustuotos: ArtikkelijulkaisuArtikkeliTieteellinenvertaisarvioitu

An Evaluation Benchmark for Testing the Word Sense Disambiguation Capabilities of Machine Translation Systems

Raganato, A., Scherrer, Y. & Tiedemann, J., 1 toukokuuta 2020, Proceedings of The 12th Language Resources and Evaluation Conference. Marseille, France: European Language Resources Association (ELRA), s. 3668-3675 8 Sivumäärä

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

Automated Phonological Transcription of Akkadian Cuneiform Text

Sahala, A., Linden, K., Silfverberg, M. & Arppe, A., 17 toukokuuta 2020, Proc. LREC 2020.

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

BabyFST - Towards a Finite-State Based Computational Model of Ancient Babylonian

Sahala, A., Silfverberg, M., Linden, K. & Arppe, A., 17 toukokuuta 2020, Proc. LREC 2020.

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Challenges in Annotation: Annotator Experiences from a Crowdsourced Emotion Annotation Task

Öhman, E., 2020, Digital Humanities in the Nordic Countries 2020. CEUR Workshop Proceedings

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Tiedosto

Effects of Language Relatedness for Cross-lingual Transfer Learning in Character-Based Language Models

Singh, M., Smit, P., Virpioja, S. & Kurimo, M., 1 toukokuuta 2020, Proceedings of the 1st Joint Workshop on Spoken Language Technologies for Under-resourced languages (SLTU) and Collaboration and Computing for Under-Resourced Languages (CCURL). Marseille, France: European Language Resources Association (ELRA), s. 41-45 5 Sivumäärä

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access

Emotion Preservation in Translation: Evaluating Datasets for Annotation Projection

Kajava, K. S. A., Öhman, E. S., Hui, P. & Tiedemann, J., 2020, Digital Humanities in the Nordic Countries 2020. CEUR Workshop Proceedings

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Tiedosto

Fear in Akkadian Texts: New Digital Perspectives on Lexical Semantics

Svärd, S., Alstola, T., Jauhiainen, H., Sahala, A. & Linden, K., 2020, (Hyväksytty/In press) The Expression of Emotions in Ancient Egypt and Mesopotamia. Hsu, S-W. & Llop-Raduà, J. (toim.). Leiden: Brill

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKirjan luku tai artikkeliTieteellinenvertaisarvioitu

FST Morphology for the Endangered Skolt Sami Language

Rueter, J. & Hämäläinen, M., 2020, Proceedings of the 1st Joint SLTU and CCURL Workshop (SLTU-CCURL 2020). European Language Resources Association (ELRA), s. 250-257

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

HELFI: a Hebrew-Greek-Finnish Parallel Bible Corpus with Cross-Lingual Morpheme Alignment

Yli-Jyrä, A., Purhonen, J., Liljeqvist, M., Antturi, A., Nieminen, P., Räntilä, K. M. & Luoto, V., 16 maaliskuuta 2020, LREC 2020, Eleventh International Conference on Language Resources and Evaluation. European Language Resources Association (ELRA), 8 Sivumäärä

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

LT@Helsinki at SemEval-2020 Task 12: Multilingual or language-specific BERT?

Pàmies, M., Öhman, E., Kajava, K. & Tiedemann, J., 2020, (Hyväksytty/In press) Proceedings of the International Workshop on Semantic Evaluation (SemEval).

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Morfessor EM+Prune: Improved Subword Segmentation with Expectation Maximization and Pruning

Grönroos, S-A., Virpioja, S. & Kurimo, M., 1 toukokuuta 2020, Proceedings of The 12th Language Resources and Evaluation Conference. Marseille, France: European Language Resources Association (ELRA), s. 3944-3953 10 Sivumäärä

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access

Morphological Disambiguation of South Sámi with FSTs and Neural Networks

Hämäläinen, M. & Wiechetek, L., 2020, Proceedings of the 1st Joint SLTU and CCURL Workshop (SLTU-CCURL 2020). European Language Resources Association (ELRA), s. 36-40

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

MT for subtitling: User evaluation of post-editing productivity

Koponen, M., Sulubacak, U., Vitikainen, K. & Tiedemann, J., 10 kesäkuuta 2020, Proceedings of the 22nd Annual Conference of the European Association for Machine Translation (EAMT 2020). Martins, A., Moniz, H., Fumega, S., Martins, B., Batista, F., Coheur, L., Parra, C., Trancoso, I., Turchi, M., Bisazza, A., Moorkens, J., Guerberof, A., Nurminen, M., Marg, L. & Forcada, M. L. (toim.). Lisbon, Portugal: European Association for Machine Translation, Vuosikerta 1. s. 115-124 10 Sivumäärä

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

Multimodal Machine Translation through Visuals and Speech

Sulubacak, U., Caglayan, O., Grönroos, S-A., Rouhe, A., Elliott, D., Specia, L. & Tiedemann, J., 9 maaliskuuta 2020, (Hyväksytty/In press) julkaisussa : Machine Translation. 34 Sivumäärä

Tutkimustuotos: ArtikkelijulkaisuArtikkeliTieteellinenvertaisarvioitu

Tiedosto

On Editing Dictionaries for Uralic Languages in an Online Environment

Alnajjar, K., Hämäläinen, M. & Rueter, J., 2020, Proceedings of the Sixth International Workshop on Computational Linguistics of Uralic Languages. The Association for Computational Linguistics, s. 26–30

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

On Practical Realisation of Autosegmental Representations in Lexical Transducers of Tonal Bantu Languages

Yli-Jyrä, A., 13 tammikuuta 2020, (Jätetty) LT4ALL. UNESCO, 4 Sivumäärä

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

OpusTools and Parallel Corpus Diagnostics

Aulamo, M., Sulubacak, U., Virpioja, S. & Tiedemann, J., 17 toukokuuta 2020, Proceedings of the 12th Language Resource and Evaluation Conference. Calzolari, N., Béchet, F., Blache, P., Choukri, K., Cieri, C., Declerck, T., Goggi, S., Isahara, H., Maegaard, B., Mariani, J., Mazo, H., Moreno, A., Odijk, J. & Piperidis, S. (toim.). Marseille, France: European Language Resources Association (ELRA), s. 3775 3782 Sivumäärä

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

Paraphrase Generation and Evaluation on Colloquial-Style Sentences

Sjöblom, E., Creutz, M. & Scherrer, Y., 1 toukokuuta 2020, Proceedings of The 12th Language Resources and Evaluation Conference. Marseille, France: European Language Resources Association (ELRA), s. 1814-1822 9 Sivumäärä

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access

Raamatun jakeita uralilaisille kielille: , rinnakkaiskorpus, sekoitettu, Korp [tekstikorpus].

Rueter, J. & Axelson, E., helmikuuta 2020

Tutkimustuotos: Ei-tekstimuotoinenOhjelmistoTieteellinen

Skolt Sami, the makings of a pluricentric language, where does it stand?

Rueter, J. & Hämäläinen, M., 2020, European Pluricentric Languages in Contact and Conflict . Muhr, R., Mas Castells, J. A. & Rueter, J. (toim.). Bern: Peter Lang, 12. (Österreichisches Deutsch – Sprache der Gegenwart; nro 21).

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKirjan luku tai artikkeliTieteellinenvertaisarvioitu

TaPaCo: A Corpus of Sentential Paraphrases for 73 Languages

Scherrer, Y., 1 toukokuuta 2020, Proceedings of The 12th Language Resources and Evaluation Conference. Marseille, France: European Language Resources Association (ELRA), s. 6868-6873 6 Sivumäärä

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

The University of Helsinki Submission to the IWSLT2020 Offline Speech Translation Task

Vázquez, R., Aulamo, M., Sulubacak, U. & Tiedemann, J., 24 huhtikuuta 2020, (Jätetty) Proceedings of the 17th International Conference on Spoken Language Translation (IWSLT). Seattle, WA, USA

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Tiedosto

Wrangling with non-standard data

Mäkelä, E., Lagus, K., Lahti, L., Säily, T., Tolonen, M., Hämäläinen, M., Kaislaniemi, S. & Nevalainen, T., 2020, Proceedings of the Digital Humanities in the Nordic Countries 5th Conference. Reinsone, S., Skadiņa, I., Baklāne, A. & Daugavietis, J. (toim.). Aachen: CEUR-WS.org, s. 81-96 (CEUR Workshop Proceedings; Vuosikerta 2612).

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto
2019

A Creative Dialog Generator for Fallout 4

Alnajjar, K. & Hämäläinen, M., 2019, Proceedings of the 14th International Conference on the Foundations of Digital Games. New York: ACM, 4 Sivumäärä 48

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

A Derivational Model of Discontinuous Parsing

Julkaisun otsikon käännös: Epäjatkuvan jäsentämisen derivatiivinen malliYli-Jyrä, A. & Nederhof, M-J., 2019, (Hyväksytty/In press) julkaisussa : Information and Computation.

Tutkimustuotos: ArtikkelijulkaisuArtikkeliTieteellinenvertaisarvioitu

Analysing concatenation approaches to document-level NMT in two different domains

Scherrer, Y., Tiedemann, J. & Loáiciga, S., 1 marraskuuta 2019, The Fourth Workshop on Discourse in Machine Translation: Proceedings of the Workshop. Stroudsburg: The Association for Computational Linguistics, s. 51-61 11 Sivumäärä

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

An Evaluation of Language-Agnostic Inner-Attention-Based Representations in Machine Translation

Raganato, A., Vázquez, R., Creutz, M. & Tiedemann, J., 1 elokuuta 2019, The 4th Workshop on Representation Learning for NLP (RepL4NLP-2019): Proceedings of the Workshop. Augenstein, I., Gella, S., Ruder, S., Kann, K., Can, B., Welbl, J., Conneau, A., Ren, X. & Rei, M. (toim.). Stroudsburg: The Association for Computational Linguistics, s. 27-32 6 Sivumäärä

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

Annotation of subtitle paraphrases using a new web tool

Aulamo, M. J., Creutz, M. J. P. & Sjöblom, E. I., 17 toukokuuta 2019, Digital Humanities in the Nordic Countries: Proceedings of the Digital Humanities in the Nordic Countries 4th Conference. Navarretta, C., Agirrezabal, M. & Maegaard, B. (toim.). Aachen: CEUR-WS.org, s. 33-48 16 Sivumäärä (CEUR Workshop Proceedings ; nro 2364).

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

An Open Online Dictionary for Endangered Uralic Languages

Hämäläinen, M. & Rueter, J., 2019, Electronic lexicography in the 21st century: Proceedings of the eLex 2019 conference. Kosem, I., Zingano Kuhn, T., Correia, M., Ferreira, J. P., Jansen, M., Pereira, I., Kallas, J., Jakubíček, M., Krek, S. & Tiberius, C. (toim.). Brno: Lexical Computing CZ s.r.o., s. 819-830 12 Sivumäärä (Electronic lexicography in the 21st century).

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

ArchiMob: Ein multidialektales Korpus schweizerdeutscher Spontansprache

Scherrer, Y., Samardžić, T. & Glaser, E., 1 marraskuuta 2019, julkaisussa : Linguistik Online. 98, 5, s. 425-454 30 Sivumäärä

Tutkimustuotos: ArtikkelijulkaisuArtikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

A Report on the Third VarDial Evaluation Campaign

Zampieri, M., Malmasi, S., Scherrer, Y., Samardžic, T., Tyers, F., Silfverberg, M. P., Klyueva, N., Pan, T-L., Huang, C-R., Ionescu, R. T., Butnaru, A. & Jauhiainen, T. S., 2019, Proceedings of the . Zampieri, M., Nakov, P., Malmasi, S., Ljubešić, N., Tiedemann, J. & Ali, A. (toim.). Stroudsburg: The Association for Computational Linguistics, s. 1-16 16 Sivumäärä

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinen

Open access
Tiedosto

Aššur and His Friends: A Statistical Analysis of Neo-Assyrian Texts

Alstola, T., Zaia, S., Sahala, A., Jauhiainen, H., Svärd, S. & Linden, K., 2019, julkaisussa : Journal of Cuneiform Studies. 71, s. 159-180 22 Sivumäärä

Tutkimustuotos: ArtikkelijulkaisuArtikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

A Template Based Approach for Training NMT for Low-Resource Uralic Languages - A Pilot with Finnish

Hämäläinen, M. & Alnajjar, K., joulukuuta 2019, ACAI 2019: Proceedings of the 2019 2nd International Conference on Algorithms, Computing and Artificial Intelligence. ACM, s. 520-525

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

Automatic Language Identification in Texts: A Survey

Jauhiainen, T., Lui, M., Zampieri, M., Baldwin, T. & Lindén, K., 25 elokuuta 2019, julkaisussa : Journal of Artificial Intelligence Research. 65, s. 675-782 108 Sivumäärä

Tutkimustuotos: ArtikkelijulkaisuArtikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

Constraint Grammar As a Hand-Crafted Transformer

Julkaisun otsikon käännös: Rajoitekielioppi käsintehtynä Transformer-verkkonaYli-Jyrä, A., 2019.

Tutkimustuotos: KonferenssimateriaalitKonferenssiesitys

Constraint Grammar is a hand-crafted Transformer

Yli-Jyrä, A., 3 joulukuuta 2019, Proceedings of the NoDaLiDa 2019 Workshop on Constraint Grammar - Methods, Tools and Applications, 30 September 2019, Turku, Finland. Bick, E. & Trosterud, T. (toim.). Linköping: Linköping University Electronic Press, s. 45-49 5 Sivumäärä 9. (NEALT Proceedings Series; nro 33)(Linköping Electronic Conference Proceedings; nro 168).

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

Co-Operation as an Asymmetric Form of Human-Computer Creativity. Case: Peace Machine

Hämäläinen, M. & Honkela, T., 2019, Proceedings of the First Workshop on NLP for Conversational AI. Stroudsburg: The Association for Computational Linguistics, s. 42–50 9 Sivumäärä

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

Creative Contextual Dialog Adaptation in an Open World RPG

Hämäläinen, M. & Alnajjar, K., 2019, Proceedings of the 14th International Conference on the Foundations of Digital Games. New York: ACM, 7 Sivumäärä 73

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

Dialect Text Normalization to Normative Standard Finnish

Partanen, N., Hämäläinen, M. & Alnajjar, K., 2019, The Fifth Workshop on Noisy User-generated Text (W-NUT 2019): Proceedings of the Workshop. Xu, W., Ritter, A., Baldwin, T. & Rahimi, A. (toim.). Stroudsburg: The Association for Computational Linguistics, s. 141–146 6 Sivumäärä

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

Digitising Swiss German: how to process and study a polycentric spoken language

Scherrer, Y., Samardžić, T. & Glaser, E., 29 marraskuuta 2019, julkaisussa : Language Resources and Evaluation. 53, 4, s. 735-769 35 Sivumäärä

Tutkimustuotos: ArtikkelijulkaisuArtikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

Discriminating between Mandarin Chinese and Swiss-German varieties using adaptive language models

Jauhiainen, T. S., Jauhiainen, H. A. & Linden, B. K. J., 30 huhtikuuta 2019, Proceedings of the Sixth Workshop on NLP for Similar Languages, Varieties and Dialects (VarDial 2019) . Stroudsburg: The Association for Computational Linguistics, s. 178-187 10 Sivumäärä

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

Emerging Paradigm of Bibliographic Data Science

Vaara, V., Ijaz, A., Tiihonen, I. L. I., Kanner, A., Säily, T. & Lahti, L., 2019.

Tutkimustuotos: KonferenssimateriaalitKonferenssiabstrakti

Open access
Open access
Tiedosto

Finding Sami Cognates with a Character-Based NMT Approach

Hämäläinen, M. & Rueter, J., 2019, Proceedings of the 3rd Workshop on Computational Methods in the Study of Endangered Languages: (Volume 1) Papers. Arppe, A., Good, J., Hulden, M., Lachler, J., Palmer, A., Schwartz, L. & Silfverberg, M. (toim.). Stroudsburg: The Association for Computational Linguistics, s. 39-45 7 Sivumäärä

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

Forgotten Islands of Regularity in Phonology

Yli-Jyrä, A. M., 2019, (Hyväksytty/In press) Festschrift.... 18 Sivumäärä

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKirjan luku tai artikkeliTieteellinenvertaisarvioitu

From the Paft to the Fiiture: a Fully Automatic NMT and Word Embeddings Method for OCR Post-Correction

Hämäläinen, M. & Hengchen, S., 2019, Proceedings of Recent Advances in Natural Language Processing. Angelova, G., Mitkov, R., Nikolova, I. & Temnikova, I. (toim.). Shoumen: INCOMA, s. 432-437 6 Sivumäärä

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

Generating Modern Poetry Automatically in Finnish

Hämäläinen, M. & Alnajjar, K., 2019, 2019 Conference on Empirical Methods in Natural Language Processing and 9th International Joint Conference on Natural Language Processing: Proceedings of the Conference. Inui, K., Jiang, J., Ng, V. & Wan, X. (toim.). Stroudsburg: The Association for Computational Linguistics, s. 6001–6006 6 Sivumäärä

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu

Open access
Tiedosto

Height-Deterministic Target Languages and the Encoder-Decoder Parsing Model (poster on a working paper)

Yli-Jyrä, A., 12 heinäkuuta 2019. 1 Sivumäärä.

Tutkimustuotos: KonferenssimateriaalitPosteri

Tiedosto