Centre for Preservation and Digisation

  • Finland

Publications 2006 2018

2018

Omalta koneelta käyttämään tekijänoikeuden alaisia aineistoja

Hakkarainen, J-P., Pääkkönen, T. A. & Rautiainen, J. P., 2018, In : Tietolinja. 2018, 2

Research output: Contribution to journalArticleProfessional

Open Access
2017

Digi.kansalliskirjasto.fi ja digitaaliset palvelut tutkijoille

Pääkkönen, T. A., 20 Jun 2017, Digitaalinen tieto haltuun: Ratkaisuja digitaalisten aineistojen hallintaan ja käyttöön. Mikkeli: Kaakkois-Suomen ammattikorkeakoulu, p. 26-33 7 p. (Xamk Kehittää; vol. 11).

Research output: Chapter in Book/Report/Conference proceedingChapterScientificpeer-review

Open Access

Digitoitujen sanoma- ja aikakauslehtien käyttö yliopistoissa ja korkeakouluissa helpottuu

Rautiainen, J. P., 2017, In : Tietolinja. 2017, 2

Research output: Contribution to journalArticleProfessional

Open Access

Helmikuussa liki kaksi miljoonaa sanomalehtisivua Suomen itsenäistymisen vuosilta avattiin verkkoon

Pääkkönen, T. A. & Kervinen, J., 2 Jun 2017, In : Kansalliskirjasto. 59, p. 20-21 2 p.

Research output: Contribution to journalArticleProfessional

Open Access

Improving Optical Character Recognition of Finnish Historical Newspapers with a Combination of Fraktur & Antiqua Models and Image Preprocessing

Koistinen, J. M. O., Kettunen, K. T. & Pääkkönen, T. A., May 2017, Proceedings of the 21st Nordic Conference on Computational Linguistics, NoDaLiDa, 22-24 May 2017, Gothenburg, Sweden. Tiedeman, J. (ed.). Linköping University Electronic Press, p. 277 283 p. (Linköping Electronic Conference Proceedings; vol. 131)(NEALT Proceedings Series; vol. 29).

Research output: Chapter in Book/Report/Conference proceedingConference contributionScientificpeer-review

Open Access

Kansalliskirjasto Digitalia-hankkeessa

Kettunen, K. T., Koistinen, J. M. O., Ruokolainen, T. P. & Pääkkönen, T. A., Jun 2017, Digitaalinen tieto haltuun : Ratkaisuja digitaalisten aineistojen hallintaan ja käyttöön. Kosonen, M. (ed.). Mikkeli: Kaakkois-Suomen ammattikorkeakoulu, 9 p. (Xamk Kehittää).

Research output: Chapter in Book/Report/Conference proceedingChapterScientificpeer-review

Names, Right or Wrong: Named Entities in an OCRed Historical Finnish Newspaper

Kettunen, K. T. & Ruokolainen, T. P., 1 Jun 2017, Proceedings of the 2nd International Conference on Digital Access to Textual Cultural Heritage. New York: ACM, p. 181-186 6 p.

Research output: Chapter in Book/Report/Conference proceedingConference contributionScientificpeer-review

Open Access

New Multi-language digitised Newspapers and Journals from Finland Available as Data Exports for Nordic Researchers

Pääkkönen, T. A. & Kervinen, J., 14 Mar 2017, DHN 2017 - Digital humaniora i Norden: Digital humanities in the Nordic countries. Brodén, D. (ed.). Göteborg: University of Göteborg, p. 94-96 2 p.

Research output: Chapter in Book/Report/Conference proceedingConference contributionProfessional

Open Access

Tagging Named Entities in 19th Century and Modern Finnish Newspaper Material with a Finnish Semantic Tagger

Kettunen, K. T. & Löfberg, L., May 2017, Proceedings of the 21st Nordic Conference on Computational Linguistics, NoDaLiDa, 22-24 May 2017, Gothenburg, Sweden. Tiedemann, J. (ed.). Linköping: Linköping University Electronic Press, p. 29-36 8 p. (Linköping Electronic Conference Proceedings; vol. 131)(NEALT Proceedings Series; vol. 29).

Research output: Chapter in Book/Report/Conference proceedingConference contributionScientificpeer-review

Open Access
File

Tagging Named Entities in 19th century Finnish Newspaper Material with a Variety of Tools

Kettunen, K. T. & Ruokolainen, T. P., 14 Mar 2017, DHN 2017 - Digital humaniora i Norden: Digital humanities in the Nordic countries. Broden, D. (ed.). Göteborg: University of Göteborg, p. 68-72 4 p.

Research output: Chapter in Book/Report/Conference proceedingConference contributionScientificpeer-review

Open Access
2016

Between Diachrony and Synchrony: Evaluation of Lexical Quality of a Digitized Historical Finnish Newspaper and Journal Collection with Morphological Analyzers

Kettunen, K. T., Pääkkönen, T. A. & Koistinen, J. M. O., 2016, Human Language Technologies – The Baltic Perspective: Proceedings of the 7th International Conference: Human Language Technologies – The Baltic Perspective (Baltic HLT 2016). Amsterdam: IOS PRESS, p. 122-129 8 p. (Frontiers in Artificial Intelligence and Applications; no. 289).

Research output: Chapter in Book/Report/Conference proceedingConference contributionScientificpeer-review

Open Access

Contracts Enabling Collaboration of The National Library of Finland with Media Houses in Electronic Deposit

Karppinen, P., Kaukonen, M., Pääkkönen, T. & Sorjonen, M., 15 Aug 2016, Unknown host publication. 8 p.

Research output: Chapter in Book/Report/Conference proceedingConference contributionProfessional

Open Access

Digitoitujen kulttuuriperintöaineistojen tutkimuskäyttö ja tutkijat

Hölttä, T. M., 15 Mar 2016, (Accepted/In press) 108 p.

Research output: ThesisMaster's thesisTheses

Open Access

Exporting Finnish Digitized Historical Newspaper Contents for Offline Use

Pääkkönen, T. A., Kervinen, J., Nivala, A., Kettunen, K. T. & Mäkelä, E., Jul 2016, In : D-Lib Magazine. 22, 7/8 2016

Research output: Contribution to journalArticleScientificpeer-review

Open Access

Historiallisten digitoitujen sanoma- ja aikakauslehtien avaaminen avoimena datana tutkijoille

Pääkkönen, T. A. & Kervinen, J., Oct 2016, In : Informaatiotutkimus. 35, 3, p. 67-68 2 p.

Research output: Contribution to journalArticleScientific

Open Access
Open Access

Information Retrieval From Historical Newspaper Collections in Highly Inflectional Languages: A Query Expansion Approach

Järvelin, A., Keskustalo, H., Sormunen, E., Saastamoinen, M. & Kettunen, K. T., Nov 2016, In : Journal of the Association for Information Science and Technology. 67, 12, p. 2928–2946 18 p.

Research output: Contribution to journalArticleScientificpeer-review

Kannattaako twiittejä säilöä?

Rautiainen, J. P., 2016, In : Kansalliskirjasto. 2016, 2-3, p. 6-7

Research output: Contribution to journalArticleProfessional

Kansalliskirjaston digitaalisia aineistoja DHH16-hackathonissa

Pääkkönen, T. A., 2 Jun 2016, In : Tietolinja. 2/2016

Research output: Contribution to journalArticleGeneral public

Kansalliskirjaston digitoitu historiallinen lehtiaineisto 1771–1910: sanatason laatu, kokoelmien käyttö ja laadun parantaminen

Kettunen, K. T., Pääkkönen, T. A. & Koistinen, J. M. O., Nov 2016, In : Informaatiotutkimus. 35, 3, p. 3-14 12 p.

Research output: Contribution to journalReview ArticleScientificpeer-review

Open Access

Keep, Change or Delete? Setting up a Low Resource OCR Post-correction Framework for a Digitized Old Finnish Newspaper Collection

Kettunen, K., 2016, Digital Libraries on the Move: 11th Italian Research Conference on Digital Libraries, IRCDL 2015, Bolzano, Italy, January 29-30, 2015, Revised Selected Papers. Calvanese, D., De Nart, D. & Tasso, C. (eds.). Cham : Springer, p. 95-103 9 p. (Communications in Computer and Information Science; vol. 612).

Research output: Chapter in Book/Report/Conference proceedingChapterScientificpeer-review

Measuring Lexical Quality of a Historical Finnish Newspaper Collection – Analysis of Garbled OCR Data with Basic Language Technology Tools and Means

Kettunen, K. T. & Pääkkönen, T. A., May 2016, Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016). European Language Resources Association (ELRA), p. 956-961 6 p.

Research output: Chapter in Book/Report/Conference proceedingConference contributionScientificpeer-review

Open Access

Modern Tools for Old Content - in Search of Named Entities in a Finnish OCRed Historical Newspaper Collection 1771-1910

Kettunen, K. T., Mäkelä, E., Kuokkala, J. M., Ruokolainen, T. P. & Niemi, J. A., Sep 2016, LWDA 2016 Lernen, Wissen, Daten, Analysen 2016 Proceedings of the Conference "Lernen, Wissen, Daten, Analysen". Aachen: CEUR Workshop Proceedings, (CEUR Workshop Proceedings).

Research output: Chapter in Book/Report/Conference proceedingConference contributionScientificpeer-review

2015

Crowdsourcing metrics of digital collections

Pääkkönen, T. A., 4 Dec 2015, In : Liber quarterly. 25, 2, p. 41-55

Research output: Contribution to journalArticleProfessional

Open Access

Digitalkoot - kaikki joukolla poimimaan historiaa

Pääkkönen, T. A., 16 Apr 2015, In : Kansalliskirjasto. 52, 1, p. 23-24 2 p.

Research output: Contribution to journalArticleProfessional

Kuumimmat uutiset! Eurooppalaisen historian aarreaitta auki verkossa

Hölttä, T. M., 1 Jan 2015, In : Kansalliskirjasto. 57 (2015), 1, p. 25–26 2 p.

Research output: Contribution to journalArticleGeneral public

Open Access

Targeted Query Expansions as a Method for Searching: Mixed Quality Digitized Cultural Heritage Documents

Keskustalo, H., Kettunen, K. T., Kumpulainen, S., Ferro, N., Silvello, G., Järvelin, A., Kekäläinen, J., Arvola, P., Saastamoinen, M., Sormunen, E. & Järvelin, K., 2015, iConference 2015 Proceedings. iSchools, 7 p. (iConference).

Research output: Chapter in Book/Report/Conference proceedingConference contributionScientificpeer-review

Open Access
2014

Analyzing and Improving the Quality of a Historical News Collection using Language Technology and Statistical Machine Learning Methods

Kettunen, K., Honkela, T., Linden, K., Kauppinen, P., Pääkkönen, T. & Kervinen, J., 16 Aug 2014, IFLA World Library and Information Congress Proceedings: 80th IFLA General Conference and Assembly. Lyon, France: IFLA, 23 p.

Research output: Chapter in Book/Report/Conference proceedingConference contributionScientificpeer-review

Open Access
File

Can Type-Token Ratio be Used to Show Morphological Complexity of Languages?

Kettunen, K., 2014, In : Journal of Quantitative Linguistics. 21, 3, p. 223–245 22 p.

Research output: Contribution to journalArticleScientificpeer-review

2012

Kyllä mainoksille! Uusi verkkokokoelma avaa suomalaisen arjen historiaa

Hölttä, T. M., 13 Dec 2012, In : Kansalliskirjasto. 54, 4/2012, p. 14-21 8 p.

Research output: Contribution to journalArticleGeneral public

Pienpainatteet osana massadigitointiprosessien uudistamista: - muutosta ja uudistavaa yhdessä oppimista

Hölttä, T. M., 2012, 132 p.

Research output: ThesisMaster's thesisTheses

2008

Complexity of European Union Languages: A Comparative Approach

Sadeniemi, M., Kettunen, K., Lindh-Knuutila, T. & Honkela, T., 2008, In : Journal of Quantitative Linguistics. 15, 2, p. 185-211 27 p.

Research output: Contribution to journalArticleScientificpeer-review

2006

Analysis of EU Languages Through Text Compression

Kettunen, K., Sadeniemi, M., Lindh-Knuutila, T. & Honkela, T., 2006, Unknown host publication. Salakoski, T., Ginter, F., Pyysalo, S. & Pahikkala, T. (eds.). p. 99-109 11 p. (Lecture Notes in Computer Science).

Research output: Chapter in Book/Report/Conference proceedingConference contributionScientificpeer-review