Deduplikoinnin suorituskyvystä
Authors
Date
2022Copyright
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Deduplikointi säästää tallennustilaa. Siinä etsitään datasta identtisiä alueita, joista yksi säilytetään ja loput korvataan viitteellä tähän säilytettävään alueeseen. Tässä tutkielmassa käsiteltiin kirjallisuuteen perustuen deduplikoinnin eri osa-alueita. Erityistä huomiota kiinnitettiin deduplikoinnin suorituskykyyn ja sen parantamiseen. Katsauksessa selvisi, että deduplikoinnin moninaisiin sovelluskohteisiin tarvitaan hyvin erilaisia deduplikointijärjestelmiä. Niissä tasapainoillaan suorituskyvyn eri alueiden välillä: yhden alueen parantaminen heikentää usein toista. Työssä toteutettiin myös tietokoneohjelma, joka deduplikoi tiedostoja. Sen suoritusaikoja mitattiin kahden muuttujan eri arvoilla. Mittauksissa löydettiin muuttujille arvot, joilla suoritusaika oli yleisesti pienin. Deduplication saves storage space. In deduplication, data is searched for identical sections. One of these sections is stored and the rest are replaced with a reference pointing to the stored section. In this study, various aspects of deduplication were examined based on the literature. Special attention was given to the performance of deduplication and its improvement. In the review it was found that the diverse applications of deduplication require very different deduplication systems. The systems have to balance between the many aspects of performance: improving one aspect often weakens another. A computer program that deduplicates files was also implemented in this work. Its execution times were measured with different values of two variables. Values were found with which the program's execution times were generally the lowest.
Keywords
Metadata
Show full item recordCollections
- Pro gradu -tutkielmat [28039]
Related items
Showing items with similar title or keywords.
-
Massamuistin korruptoinnin tutkiminen ja sen korjaus
Mironenko, Elena (2023)Tutkielman tavoitteena on avata SSD- ja HDD-kovalevyjen konkreettista toimintaa sekä selvittää datan häviämisen syitä. Aihe on valittu pohjautuen omaan henkilökohtaiseen kokemukseen ja siitä herättäneen mielenkiinnon vuoksi. ... -
Datan tarkistussummia tukevat tiedostojärjestelmät ja niiden edut datan oikeellisuuden tarkistamisessa
Pörhö, Paavo (2023)Tutkielmassa selvitetään datan eheystarkistuksia tukevien tiedostojärjestelmien etuja datan oikeellisuuden tarkistamisessa. Tutkielmassa käydään myös läpi vaihtoehtoisia toteutuksia ja niiden etuja kyseisiin tiedostojärjestelmiin ... -
Mahdollisuudet ja haasteet datan tallentamisessa DNA-ketjuihin
Stadius, Timo (2018)Tämän tutkimuksen tarkoituksena on luoda katsaus mahdollisuuksista ja haasteista, joita datan tallentamiseen DNA-ketjuihin liittyy sekä luoda uutta tietoa tiedeyhteisölle. DNA-ketjujen käyttäminen ulkoisen datan tallentamiseen ... -
Hypervisor-assisted Atomic Memory Acquisition in Modern Systems
Kiperberg, Michael; Leon, Roee; Resh, Amit; Algawi, Asaf; Zaidenberg, Nezer (SCITEPRESS Science And Technology Publications, 2019)Reliable memory acquisition is essential to forensic analysis of a cyber-crime. Various methods of memory acquisition have been proposed, ranging from tools based on a dedicated hardware to software only solutions. Recently, ... -
Single-Event Effects in the Peripheral Circuitry of a Commercial Ferroelectric Random-Access Memory
Bosser, Alexandre; Gupta, V.; Javanainen, Arto; Tsiligiannis, G.; LaLumondiere, S. D.; Brewe, D.; Ferlet-Cavrois, V.; Puchner, H.; Kettunen, Heikki; Gil, T.; Wrobel, F.; Saigné, F.; Virtanen, Ari; Dilillo, L. (Institute of Electrical and Electronics Engineers, 2018)This paper identifies the failure modes of a commercial 130-nm ferroelectric random access memory. The devices were irradiated with heavy-ion and pulsed focused X-ray beams. Various failure modes are observed, which generate ...