Publikationer 1987 2019

2019

A Report on the Third VarDial Evaluation Campaign

Zampieri, M., Malmasi, S., Scherrer, Y., Samardžic, T., Tyers, F., Silfverberg, M. P., Klyueva, N., Pan, T-L., Huang, C-R., Ionescu, R. T., Butnaru, A. & Jauhiainen, T. S., 2019, Proceedings of the Sixth Workshop on NLP for Similar Languages, Varieties and Dialects (VarDial 2019) . Stroudsburg: Association for Computational Linguistics, s. 1-16 16 s.

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Öppen tillgång
Fil

Aššur and His Friends: A Statistical Analysis of Neo-Assyrian Texts

Alstola, T., Zaia, S., Sahala, A., Jauhiainen, H., Svärd, S. & Linden, K., 2019, I : Journal of Cuneiform Studies. 71, s. 159-180 22 s.

Forskningsoutput: TidskriftsbidragArtikelVetenskapligPeer review

Öppen tillgång
Fil

Automatic Language Identification in Texts: A Survey

Jauhiainen, T., Lui, M., Zampieri, M., Baldwin, T. & Lindén, K., 25 aug 2019, I : Journal of Artificial Intelligence Research. 65, s. 675-782 108 s.

Forskningsoutput: TidskriftsbidragArtikelVetenskapligPeer review

Öppen tillgång
Fil

Discriminating between Mandarin Chinese and Swiss-German varieties using adaptive language models

Jauhiainen, T. S., Jauhiainen, H. A. & Linden, B. K. J., 30 apr 2019, Proceedings of the Sixth Workshop on NLP for Similar Languages, Varieties and Dialects (VarDial 2019) . Stroudsburg: Association for Computational Linguistics, s. 178-187 10 s.

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Öppen tillgång
Fil

Language and Dialect Identification of Cuneiform Texts

Jauhiainen, T. S., Jauhiainen, H. A., Alstola, T. & Linden, B. K. J., 30 apr 2019, Proceedings of the Sixth Workshop on NLP for Similar Languages, Varieties and Dialects (VarDial 2019) . Stroudsburg: Association for Computational Linguistics, s. 89-98 10 s.

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Öppen tillgång
Fil

Language Model Adaptation for Language and Dialect Identification of Text

Jauhiainen, T. S., Linden, B. K. J. & Jauhiainen, H. A., 31 jul 2019, I : Natural Language Engineering. 25, 5, s. 561-583 23 s.

Forskningsoutput: TidskriftsbidragArtikelVetenskapligPeer review

Öppen tillgång
Fil

Wanca in Korp: Text corpora for underresourced Uralic languages

Jauhiainen, H., Jauhiainen, T. & Linden, K., 2019, Proceedings of the Research data and humanities (RDHUM) 2019 conference : data, methods and tools. Jantunen, J. H., Brunni, S., Kunnas, N., Palviainen, S. & Västi, K. (red.). Oulu: University of Oulu, s. 21-40 20 s. (Studia Humaniora Ouluensia; nr. 17).

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

2018

HeLI-based Experiments in Discriminating Between Dutch and Flemish Subtitles

Jauhiainen, T. S., Jauhiainen, H. A. & Linden, B. K. J., aug 2018, Proceedings of the Fifth Workshop on NLP for Similar Languages, Varieties and Dialects (VarDial 2018) . Zampieri, M., Nakov, P., Ljubešić, N., Tiedemann, J., Malmasi, S. & Ali, A. (red.). Santa Fe: Association for Computational Linguistics, s. 137-144 8 s.

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Öppen tillgång

HeLI-based Experiments in Swiss German Dialect Identification

Jauhiainen, T. S., Jauhiainen, H. A. & Linden, B. K. J., aug 2018, Proceedings of the Fifth Workshop on NLP for Similar Languages, Varieties and Dialects (VarDial 2018) . Zampieri, M., Nakov, P., Ljubešić, N., Tiedemann, J., Malmasi, S. & Ali, A. (red.). Santa Fe: Association for Computational Linguistics, s. 254-262 9 s.

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Öppen tillgång

Iterative Language Model Adaptation for Indo-Aryan Language Identification

Jauhiainen, T. S., Jauhiainen, H. A. & Linden, B. K. J., aug 2018, Proceedings of the Fifth Workshop on NLP for Similar Languages, Varieties and Dialects (VarDial 2018) . Zampieri, M., Nakov, P., Ljubešić, N., Tiedemann, J., Malmasi, S. & Ali, A. (red.). Santa Fe: Association for Computational Linguistics, s. 66-75 10 s.

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Öppen tillgång

Semantic Domains in Akkadian Text

Svärd, S. S., Jauhiainen, H. A., Linden, B. K. J. & Sahala, A. J. A., 7 aug 2018, CyberResearch on the Ancient Near East and Neighboring Regions: Case Studies on Archaeological Data, Objects, Texts, and Digital Archiving. Juloux, V. B., Gansell, A. R. & di Ludovico, A. (red.). Leiden: Brill, s. 224-256 33 s. (Digital Biblical Studies; nr. 2).

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKapitelVetenskapligPeer review

Öppen tillgång
Fil
2017

Evaluating HeLI with non-linear mappings

Jauhiainen, T. S., Linden, B. K. J. & Jauhiainen, H. A., 2017, Fourth Workshop on NLP for Similar Languages, Varieties and Dialects - Proceedings of the Workshop. Stroudsburg: Association for Computational Linguistics, s. 102-108 7 s.

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Öppen tillgång
Fil

Evaluation of language identification methods using 285 languages

Jauhiainen, T. S., Linden, B. K. J. & Jauhiainen, H. A., 2017, 21st Nordic Conference of Computational Linguistics: Proceedings of the Conference. Tiedemann, J. (red.). Linköping: Linköping University Electronic Press, s. 183-191 9 s. (Linkping Electronic Conference Proceedings; nr. 31).

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Öppen tillgång
Fil
2016

HeLI, a Word-Based Backoff Method for Language Identification

Jauhiainen, T. S., Linden, B. K. J. & Jauhiainen, H. A., 2016, Proceedings of the Third Workshop on NLP for Similar Languages, Varieties and Dialects: VarDial3, Osaka, Japan, December 12 2016. s. 153-162 10 s.

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Öppen tillgång
Fil

Modern Tools for Old Content - in Search of Named Entities in a Finnish OCRed Historical Newspaper Collection 1771-1910

Kettunen, K. T., Mäkelä, E., Kuokkala, J. M., Ruokolainen, T. P. & Niemi, J. A., sep 2016, LWDA 2016 Lernen, Wissen, Daten, Analysen 2016 Proceedings of the Conference "Lernen, Wissen, Daten, Analysen". Aachen: CEUR Workshop Proceedings, (CEUR Workshop Proceedings).

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

2015

Discriminating similar languages with token-based backoff

Jauhiainen, T., Jauhiainen, H. & Linden, K., 2015, Proceedings of the Joint Workshop on Language Technology for Closely Related Languages, Varieties and Dialects. Association for Computational Linguistics, s. 44-51 8 s.

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Öppen tillgång
Fil

Kielipankissa on aarteita sekä humanistille että yhteiskuntatieteilijälle

Bartis, I. & Järvelä, K., 2015, I : Tietoarkisto. 2015, 3, s. 28 1 s.

Forskningsoutput: TidskriftsbidragArtikelAllmänheten

Language Set Identification in Noisy Synthetic Multilingual Documents

Jauhiainen, T. S., Linden, K. & Jauhiainen, H. A., 2015, Computational Linguistics and Intelligent Text Processing. Gelbukh, A. (red.). Springer International Publishing AG, Vol. Part I. s. 633-643 11 s. (Lecture Notes in Computer Science; vol. 9041).

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Öppen tillgång
Fil

The Finno-Ugric Languages and the Internet project

Jauhiainen, H., Jauhiainen, T. & Linden, K., 15 jan 2015, First International Workshop on Computational Linguistics for Uralic Languages: Proceedings of the Workshop. Pirinen, T., Tyers, F. & Trosterud, T. (red.). Tromsø: Septentrio Academic Publishing, Vol. 2. s. 87–98 12 s. (Septentrio Conference Series; vol. 2015, nr. 2).

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Öppen tillgång
Fil
2014

Heuristic Hyper-minimization of Finite State Lexicons

Drobac, S., Linden, K., Pirinen, T. & Silfverberg, M., 26 maj 2014, Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14). Reykjavik, Iceland: European Language Resources Association (ELRA), Vol. 9. 6 s. #784

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Öppen tillgång
Fil

HFST-SweNER – A New NER Resource for Swedish

Kokkinakis, D., Niemi, J., Hardwick, S., Linden, K. & Borin, L., 26 maj 2014, Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14). Calzolari, N., Choukri, K., Declerck, T., Loftsson, H., Maegaard, B., Mariani, J., Moreno, A., Odijk, J. & Piperidis, S. (red.). Reykjavik, Iceland: European Language Resources Association (ELRA), 7 s. #391

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Öppen tillgång
Fil
2013

Baltic and Nordic Parts of the European Linguistic Infrastructure

Skadina, I., Vasiljevs, A., Borin, L., Linden, K., Losnegaard, G., Olsen, S., Pedersen, B., Rozis, R. & De Smedt, K., 20 maj 2013, Proceedings of NODALIDA 2013. Linköping University Electronic Press, 16 s.

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Fil

Finite State Applications with Javascript

Hulden, M., Silfverberg, M. & Francom, J., maj 2013, Proceedings of the 19th Nordic Conference of Computational Linguistics (NODALIDA 2013). Oepen, S., Johannessen, J. B. & Hagen, K. (red.). Linköping: Linköping University Electronic Press

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

HFST—a System for Creating NLP Tools

Linden, K., Axelson, E., Drobac, S., Hardwick, S., Kuokkala, J., Niemi, J., Pirinen, T. & Silfverberg, M., sep 2013, Systems and Frameworks for Computational Morphology: Communications in Computer and Information Science. Mahlow, C. & Piotrowski, M. (red.). Springer-Verlag, s. 53-71 20 s. (Communications in Computer and Information Science).

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKapitelVetenskapligPeer review

Fil

Is It Possible to Create a Very Large WordNet in 100 days? -- an Evaluation

Linden, K. & Niemi, J., 2013, I : Language Resources and Evaluation. 48, 2, s. 191-201 10 s.

Forskningsoutput: TidskriftsbidragArtikelVetenskapligPeer review

Fil

Modeling OOV Words With Letter N-Grams in Statistical Taggers: Preliminary Work in Biomedical Entity Recognition

Ruokolainen, T. & Silfverberg, M., maj 2013, Proceedings of the 19th Nordic Conference of Computational Linguistics (NODALIDA 2013). Oepen, S., Johannessen, J. B. & Hagen, K. (red.). Linköping University Electronic Press

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Nordic and Baltic wordnets aligned and compared through “WordTies”

Pedersen, B., Linden, K., Vider, K., Forsberg, M., Kahusk, N., Niemi, J., Nygaard, L., Seaton, M., Orav, H., Borin, L., Voionmaa, K., Nisbeth, N. & Rögnvaldsson, E., 20 maj 2013, Proceedings of NODALIDA 2013. Linköping University Press, 16 s. (Linköping Electronic Conference Proceedings; nr. 85).

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Fil

Software Newsroom – an approach to automation of news search and editing

Huovelin, J., Gross, O., Solin, O., Linden, K., Maisala, S. P. T., Oittinen, T., Toivonen, H., Niemi, J. & Silfverberg, M., 7 nov 2013, I : Journal of Print Media Technology research. 2, 3, s. 141-156 15 s.

Forskningsoutput: TidskriftsbidragArtikelVetenskapligPeer review

Fil
2012

Building shared language research environments inside the European Union: How to optimize the system based on experiences from real life

Oksanen, V. & Linden, K., 12 sep 2012, Unknown host publication. 12 s.

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Compiling Apertium morphological dictionaries with HFST and using them in HFST applications

Pirinen, T. & Tyers, F., maj 2012, 8. Kieliresurssi- ja -evaluointikonferenssi. De Pauw, G., Sarasola, K. & Tyers, F. (red.). İstanbul: European Language Resources Association (ELRA), Vol. 8. s. 60 4 s.

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Öppen tillgång
Fil

Creating a Dependency Syntactic Treebank: Towards Intuitive Language Modeling

Purtonen, T. K. & Muhonen, K., 2012, I : Studies in Language. Selected Aspects of Dependency Linguistics

Forskningsoutput: TidskriftsbidragArtikelVetenskapligPeer review

Creation of Shared Language Resource Repository in the Nordic and Baltic Countries

Vasiljevs, A., Forsberg, M., Goronstay, T., Hansen, D., Jóhannsdóttir, K., Linden, K., Lyse, G., Offersgaard, L., Olsen, S., Oksanen, V., Pedersen, B., Rögnvaldsson, E., Skadina, I. & de Smedt, K., 23 maj 2012, The eighth international conference on Language Resources and Evaluation (LREC): LREC 2012. Istanbul, Vol. 8. 8 s.

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Fil

Extending and Updating the Finnish Wordnet

Linden, K., Niemi, J. & Hyvärinen, M., 14 aug 2012, Shall We Play the Festschrift Game? Essays on the Occasion of Lauri Carlson's 60th Birthday. Springer-Verlag, s. 67-98 32 s.

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKapitelVetenskapligPeer review

Finding a Location for a New Word in WordNet

Pääkkö, P. & Linden, K., 9 jan 2012, Proceedings of the Global Wordnet Conference. Matsue, Japan, 8 s.

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Fil

FinnTreeBank 2

Voutilainen, A., Purtonen, T. K., Muhonen, K., Hardwick, S. & Linden, K., feb 2012

Forskningsoutput: Icke-textbaserad outputProgramvaraVetenskaplig

HFST - an Environment for Creating Language Technology Applications

Linden, K., Silfverberg, M., Pirinen, T., Hardwick, S., Drobac, S. & Axelson, E., 2012, COMPUTATIONAL LINGUISTICS – APPLICATIONS. Piasecki, M. & Przepiórkowski, A. (red.). Springer-Verlag, 20 s. (Studies in Computational Intelligence).

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKapitelVetenskapligPeer review

Implementation of replace rules using preference operator

Drobac, S., Silfverberg, M. & Yli-Jyrä, A. M., 23 jul 2012, Proceedings of the FSMNLP 2012. ACL Anthology, 5 s.

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Öppen tillgång
Fil

Improving Finite-State Spell-Checker Suggestions with Part of Speech N-Grams

Pirinen, T., Silfverberg, M. & Linden, K., 9 mar 2012, Computational Linguistics and Intelligent Text Processing: 13th International Conference, CICLing 2012. Gelbukh, A. (red.). Delhi, India, 11 s.

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Fil

On Dependency Analysis via Contractions and Weighted FSTs

Yli-Jyrä, A. M., 2012, Shall We Play the Festschrift Game?. Santos, D., Nganga, W. & Lindén, K. (red.). Berlin Heidelberg: Springer-Verlag, Vol. 2012. s. 133-158

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKapitelVetenskapligPeer review

Öppen tillgång
Fil

Outsourcing Parsebanking: The FinnTreeBank Project

Voutilainen, A., Purtonen, T. K. & Muhonen, K., 7 sep 2012, Shall we Play the Festschrift Game?: Essays on the Occasion of Lauri Carlson's 60th Birthday. Sousa, D., Lindén, K. & Nganga, W. (red.). Springer-Verlag

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKapitelVetenskapligPeer review

Predictive Text Entry for Agglutinative Languages Using Unsupervised Morphological Segmentation

Silfverberg, M., Linden, K. & Hyvärinen, M., 9 mar 2012, I : Lecture Notes in Computer Science. 12 s.

Forskningsoutput: TidskriftsbidragKonferensartikelVetenskapligPeer review

Fil

Refining the design of a contracting finite-state dependency parser

Yli-Jyrä, A. M., Piitulainen, J. & Voutilainen, A., 23 jul 2012, Proceedings of FSMNLP 2012. ACL Anthology, Vol. 2012. 8 s.

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Fil

Representing the Translation Relation in a Bilingual Wordnet

Niemi, J. & Linden, K., 23 maj 2012, The eighth international conference on Language Resources and Evaluation (LREC): LREC 2012. Istanbul: European Language Resources Association (ELRA), Vol. 8. 8 s.

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Fil

Rule-Based Detection of Clausal Coordinate Ellipsis

Muhonen, K. & Purtonen, T. K., 23 maj 2012, Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12). Calzolari, N., Choukri, K., Declerck, T., Uğur Doğan, M., Maegaard, B., Mariani, J., Odijk, J. & Piperidis, S. (red.). Paris: European Language Resources Association (ELRA), s. 1955-1959 5 s.

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Specifying a linguistic representation with a grammar definition corpus

Voutilainen, A., Linden, K. & Purtonen, T. K., 2012, Proceedings of the Corpus Linguistics Conference. Birmingham: University of Birmingham

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Specifying Treebanks, Outsourcing Parsebanks: FinnTreeBank 3

Voutilainen, A., Muhonen, K., Purtonen, T. K. & Linden, K., 23 maj 2012, Proceedings of LREC 2012: 8th ELRA Conference on Language Resources and Evaluation. Calzolari, N., Choukri, K., Declerck, T., Dogan, M. U., Maegaard, B., Mariani, J., Odijk, J. & Piperidis, S. (red.). Paris: European Language Resources Association (ELRA), s. 1927-1931 5 s.

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Fil

Transferring Frames: Utilization of Linked Lexical Resources

Borin, L., Forsberg, M., Johansson, R., Muhonen, K., Purtonen, T. K. & Voionmaa, K., 7 jun 2012, The 2012 Conference of the North American Chapter of the Association for Computational Linguistics : Human Language Technologies .

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Using a Bilingual Resource to Add Synonyms to a Wordnet: FinnWordNet and Wikipedia as an Example

Niemi, J., Linden, K. & Hyvärinen, M., 9 jan 2012, Proceedings of the Global Wordnet Conference. Matsue, Japan, s. 227–231 5 s.

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Fil
2011

An Efficient Constraint Grammar Parser based on Inward Deterministic Automata

Bidragets titel på inmatningsspråk: En effektiv Constraint Grammar parser baserat på inåt deterministiska automaterYli-Jyrä, A. M., 17 nov 2011, Proceedings of the NODALIDA 2011 Workshop Constraint Grammar Applications. Bick, E., Hagen, K., Müürisep, K. & Trosterud, T. (red.). Tartu University Library, Tartu, Estonia: Northern European Association for Language Technology , Vol. 14 (2011). s. 50-60 11 s. (NEALT Proceedings Series; vol. 14 (2011)).

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Öppen tillgång
Fil

Combining Statistical Models for POS Tagging using Finite-State Calculus

Silfverberg, M. & Linden, K., 9 maj 2011, Proceedings of the 18th Conference of Computational Linguistics NODALIDA 2011. Pedersen, B. & Skadiņa, I. (red.). Northern European Association for Language Technology , s. 183–190 8 s. (NEALT Proceedings Series; vol. 11).

Forskningsoutput: Kapitel i bok/rapport/konferenshandlingKonferensbidragVetenskapligPeer review

Öppen tillgång
Fil