Greedy Shortest Common Superstring Approximation in Compact Space

Tutkimustuotos: Artikkeli kirjassa/raportissa/konferenssijulkaisussaKonferenssiartikkeliTieteellinenvertaisarvioitu


Given a set of strings, the shortest common superstring problem is to find the shortest possible string that contains all the input strings. The problem is NP-hard, but a lot of work has gone into designing approximation algorithms for solving the problem. We present the first time and space efficient implementation of the classic greedy heuristic which merges strings in decreasing order of overlap length. Our implementation works in O(n log σ) time and bits of space, where n is the total length of the input strings in characters, and σσ is the size of the alphabet. After index construction, a practical implementation of our algorithm uses roughly 5n log σ bits of space and reasonable time for a real dataset that consists of DNA fragments.
OtsikkoString Processing and Information Retrieval : 24th International Symposium, SPIRE 2017, Palermo, Italy, September 26-29, 2017, Proceedings
ToimittajatGabriele Fici, Marinella Sciortino, Rosssano Venturini
KustantajaSpringer International Publishing AG
Julkaisupäivä6 syyskuuta 2017
ISBN (painettu)978-3-319-67427-8
ISBN (elektroninen)978-3-319-67428-5
DOI - pysyväislinkit
TilaJulkaistu - 6 syyskuuta 2017
OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisuussa
TapahtumaInternational Symposium on String Processing and Information Retrieval - Palermo, Italia
Kesto: 26 syyskuuta 201729 syyskuuta 2017
Konferenssinumero: 24


NimiLecture Notes in Computer Science
KustantajaSpringer International Publishing AG
ISSN (painettu)0302-9743
ISSN (elektroninen)1161-3349


  • 113 Tietojenkäsittely- ja informaatiotieteet

Siteeraa tätä