Archivace dat

S příchodem informačních a komunikačních technologií vzniká rok od roku více digitálních souborů a formátů různého typu. Tištěné knihy se digitalizují, ale nejen ty, digitalizace se týká obrazových materiálů, hudebních (např. noty), apod. Dokumentům těchto typů říkáme „harvested digital‘‘, jelikož se staly digitálními díky přidruženému procesu. K tomu všemu vznikají dokumenty či soubory čistě digitální – „born digital‘‘, příkladem mohou být výstupy kancelářských balíčků nebo i právě psaní vlastního bloku. Vše co vytváříme (pro veřejné i soukromé účely) je naší digitální prezentací, která ve většině případů stojí za to archivovat. A právě o archivaci dat je dnešní článek.

Proč chránit kulturní dědictví?

V úplném úvodu do problematiky se nabízí otázka „Proč vlastně archivovat stará/nová data?‘‘ Přirozeně je důležité nechat stopy budoucím generacím, a to i těm pro nás zatím hluboce futuristickým. Přece jen, jak by nám bylo, kdybychom nevěděli téměř nic o lidské minulosti. Nebyla by to škoda?

Zároveň je kulturní dědictví součást celé kultury, pokud kulturu nechráníme může to na ní mít neblahý dopad. Každá civilizace, která nebyla schopna svojí kulturu obhájit postupně zanikla – buď byla jinými kulturami asimilována nebo násilnou formou vyhubena.

Ztráta kulturního dědictví dnes neznamená pouze zánik hmotných artefaktů (např. při požáru muzea), ale s příchodem internetu se celý pojem kulturního dědictví rozrůstá i do digitální sféry. Bohužel ztráta obsahu na internetu není ničím málo častým, řeší se prakticky na denní bázi. Připomeňme si například kauzu Twitteru.

Data v digitálních humanitních vědách

V digitálních humanitních vědách (DH) jsou data předmětem i výsledkem zkoumání a jejich charakter je velmi různorodý. Může se jednat o textové korpusy, data tabulek, grafy, obrazová nebo zvuková data a mnoho dalších. Tato obrovská různorodost v DH není nutně výhodou, naopak často interpretuje to, že data jsou velmi zranitelná. Jak tedy data chránit?

Ochrana dat

Data chráníme procesem archivace, ale i při jejich samotném vzniku. Typickým příkladem chránění dat ještě před samotnou archivací činí výběr proprietárního či otevřeného formátu. Prevencí proti absolutní ztrátě dat je několik, pojďme se na ně podívat:

  1. Open source licence -soubory ve formátu ODT (otevřený formát). Použití tohoto standardu znamená, že licence nevlastní žádná velká korporace, která by se mohla rozhodnout, že chce být proprietární. Programy se v případě otevřeného formátu dají znovu napsat.
  2. Omezování formátů
  3. Migrace -přenos staršího formátu do novějšího formátu (ochrana před zastaráváním).
  4. Ochrana technologií – zachováváme na PC původní software a hardware pro přehnání starších dat.
  5. Emulace – je to systém, který umožňuje data přehrát i za několik let. Na nový PC si instalujeme předešlý/zastaralý OS – na něm pak spouštíme systémy a pracujeme s daty. Přesto, že tento postup zní snadně je aplikován pouze výjimečně. Musíme mít schválenou licenci k používání OS, případně musíme umět spravovat celou databázi.
  6. Analogový přístup – nouzové řešení pro případ absolutního selhání technologií. Digitální data nezískáme okamžitě.

Integrita dat

Integrita dat = stav, kdy přečtená data jsou totožná s daty uloženými. Tzn. během přenosu ukládání nedošlo k jeho neočekáváným změnám.

K zjištění integrity dat potřebujeme kontrolní součet souboru, který můžeme získat ze speciálních online kalkulátorů nebo instalačních aplikací např. HashCheck Shell Extension. Celý integrační proces trvá pár minut, v případě přesunu velkých souborů je určitě žádoucí takovou kontrolu provést. Podívejte se na moje video, no není to jednoduché?

Shrnutí

Pokud si z celého textu máte zapamatovat pouhou jednu myšlenku budu ráda, když to bude právě tato: (výzkumná) data (i ta digitální) se stávají a také jsou součástí kulturního dědictví, proto je nezbytné je efektivně archivovat a bojovat proti zastarávání formátů či technologií. Digitální data totiž mají oproti těm hmotným výrazně kratší životnost a našim cílem by mělo být starání se o jejich spustitelnost. Jak pro vědecká, tak i pro naše osobní data platí nejdůležitější pravidlo zálohování. Ať už záloha probíhá jakoukoliv formou, je důležité ji pro ochranu dat do své prevence nepochybně zahrnout.

Zdroje

KONEČNÝ, Michal. Archivace a ukládání dat[přednáška]. Brno: Filozofická fakulta MU. KISK, 29.11.2021.

Napsat komentář