Deduplikace
Author
Albert FloresZjednodušené schema deduplikace Deduplikace je speciální technika komprese dat, která zabraňuje ukládání stejných datových bloků na jednom úložišti. Deduplikační jednotka ukládá informace (referenční informace) o datové struktuře a díky tomu je schopná při zpětném čtení deduplikovaných dat zpět obnovit původní, komplexní informaci. Účelem deduplikace je úspora místa na datovém úložišti. Kromě této varianty, tzv. blokové deduplikace, existuje ještě deduplikace na úrovni souborů, kdy je ukládána pouze jedna kopie (instance) souboru/přílohy e-mailu. Příkladem budiž ukládání e-mailových zpráv v systému Microsoft Exchange, nebo Single-instance storage ve Windows.
Metody deduplikace
Podle toho, kdy je spuštěna
Post-procesní deduplikace
Nová data jsou nejprve uložena na cílové úložiště a poté off-line deduplikována. Nevýhodou je nutnost disponovat kapacitou úložiště odpovídající reálnému množství datových bloků. +more Ty jsou ukládány a teprve následně (po skončení procesu ukládání) optimalizovány.
In-line deduplikace
Data jsou deduplikována ještě před uložením na cílové úložiště v reálném čase. Vyhodnocuje se přítomnost datového bloku na úložišti a pokud již existuje, nezapíše se. +more Pouze je vytvořena reference na datový blok v deduplikační jednotce. Nevýhodou je pomalejší „zápis“ na cílové úložiště, který je zpomalen rozhodovacím procesem deduplikační jednotky. V současnosti jsou však nabízena řešení, která se výkonnostně blíží post-procesním deduplikačním systémům.
Podle toho, kde je spuštěna
Zdrojová deduplikace
Zajišťuje deduplikaci na zdroji dat. Často bývá uplatňována v rámci operačního systému. +more Operační systém pravidelně kontroluje hashe vzniklé při tvorbě nových souborů a porovnává je s již existujícími hashi již existujících souborů. Pokud je nalezena shoda, kopie souboru je odstraněna a je vytvořen ukazatel na starý soubor. V praxi je tato metoda upozaďována před cílovou deduplikací z výkonnostních důvodů. U primárního úložiště (DAS serveru apod. ) je většinou kladen důraz na vysoký výkon, který deduplikační proces může negativně ovlivnit.
Cílová deduplikace
Zajišťuje deduplikaci na sekundárním úložišti (např. v disk-to-disk schématu, nebo u VTL - virtuální pásková knihovna). +more Jde o v praxi preferovanější metodu.
Situace na trhu
V současnosti jsou používány deduplikační systémy jako kombinace diskového pole (např. VTL) a deduplikačního softwaru. +more K dispozici jsou řešení společnosti NetApp, IBM, EMC, NortonLifeLock a další.
Reference
Externí odkazy
[url=http://www. ictmanazer. +morecz/2011/11/deduplikace-uspora-mista-je-jen-jednim-z-rady-benefitu]Článek na webu ICT manažer s přehledem všech přínosů deduplikace[/url] * [url=http://www. netapp. com/us/products/platform-os/dedupe. html]Data ONTAP od společnosti NetApp[/url] * [url=http://h71028. www7. hp. com/enterprise/us/en/solutions/storage-data-protection-with-deduplication. html]HP StorOnce od Hewlett-Packard[/url] * [url=https://web. archive. org/web/20100302152146/http://www. acronis. cz/backup-recovery/advanced-server/deduplikace]Softwarová deduplikace Acronis® Backup & Recovery™ 10 Deduplication[/url] * [url=https://web. archive. org/web/20100801104911/http://www. commvault. com/pdf/texas_tech. pdf]Případová studie řešení CommVault Simpana s deduplikačním a archivním modulem, Texaská technická universita[/url] * [url=http://viewer. media. bitpipe. com/1213729922_677/1274725645_471/HP-DedupRep-0133. pdf]Studie návratnosti investice do deduplikační VTL od Silverton Consulting, Inc. [/url] * [url=http://viewer. media. bitpipe. com/1203010409_173/1281981152_9/_files_whitepapers_deduplication-and-vmware-backup-sprawl. pdf]Deduplikace v prostředí zálohování VMware[/url].