Přejít k hlavnímu obsahu

Principy strategie rozvoje knihoven oblasti dlouhodobé archivace digitálních informací v České republice: stav v roce 2014 a výhled do roku 2019

Tento článek shrnuje návrhy pro další rozvoj dlouhodobé archivace digitálního informačního obsahu v knihovnách v České republice. Vychází z analýz, které vznikly v rámci práce na Koncepci rozvoje knihoven ČR pro léta 2010-2013. V úvodu krátce popisuje situaci posledních cca 5 let a ve druhé části formuluje principy, ke kterým by měl další rozvoj dlouhodobé archivace v knihovnách v ČR směřovat. Od velkých projektů se v současnosti dostáváme do fáze, kdy je podle nás žádoucí diverzifikovat přístupy k dlouhodobé archivaci využítím různých technologií, různých zdrojů financování v různě zacílených projektech. Snižující se bariéry dostupnosti systémů pro zajištění dlouhodobé archivace a ukládacích technologií a zvyšující se dostupnost digitalizačních technologií jsou dva faktory, které lze při realizaci strategie využít. Knihovny zůstanou pro další generace relevantní, jen pokud budou schopny uhájit svou roli poskytovatelů jedinečného informačního obsahu, a budou schopny tento obsah trvale ochránit a zpřístupnit.

Úvod

Průzkumy uživatelů knihoven dnes naznačují[1], že především mladší uživatelé stále častěji do knihovny nikdy nechodí, nebo do ní chodí méně často. Uživatelé se tradičně do knihoven vraceli v pokročilejším věku, ovšem je velmi nejisté, že generace dnešních tabletových teenagerů k tomu bude mít nějakou motivaci nebo předchozí zkušenost. K udržení knihoven jako poskytovatelů jedinečných informací by měla přispět i jejich role v oblasti dlouhodobé archivace digitálního informačního obsahu.

Před pěti lety (2008) byla situace v oblasti dlouhodobé archivace v knihovnách zcela jiná než dnes. V České republice byly plánovány velké projekty jako Národní digitální archiv[2] a Národní digitální knihovna[3]. Technologie masové digitalizace nebyly snadno dostupné a archivace e-born dokumentů probíhala v knihovnách jen v projektu archivace webu - WebArchiv[4]. Finance dostupné pro digitalizaci, pocházely z několika málo zdrojů, většina digitalizace probíhala formou dodávek externími firmami, digitální reprezentace fyzických dokumentů vznikaly společně s mikrofilmovou verzí, používané standardy dat a metadat byly již překonané, stejně jako některé klíčové systémy používané pro vytváření a zpřístupňování těchto dat. Koncept Národní digitální knihovny[5], který v této době vznikl, obsahoval představu centrálního digitálního repozitáře Národní knihovny, který měl ukládat a ochraňovat klíčovou část českého digitálního knihovního dědictví a zdroje uložené mimo tento repozitář v institucionálních, oborových nebo regionálních úložištích. Technologie dostupné k zajištění dlouhodobé archivace byly velmi drahé a neexistovala snadno použitelná volně dostupná řešení, která by bylo možné použít, proto se uvažovalo o zajištění logické ochrany digitálních dat českých knihoven především v centrálním repozitáři v Národní knihovně.

Diverzifikace, snížení bariér a podpora spolupráce

Současná situace (2013/2014) umožňuje již uvažovat o zajištění trvalé ochrany digitálního kulturního dědictví s jiným důrazem. Velké národní projekty probíhají a žijí vlastním životem. Projekt Národní digitální knihovny nastavil především národní standardy pro digitalizaci, což bezpochyby pomůže při budoucí správě dat. V oblasti dlouhodobé archivace mají dnes instituce mnohem více možností, než jen spoléhat na uložení dat v systému Národní knihovny, a úroveň její zralosti není kritická pro schopnost knihoven dlouhodobou ochranu svých digitálních dat zajistit. Odpovídající řešení na logickou dlouhodobou ochranu digitálních dat na centrální úrovni je stále z finančních i organizačních důvodů preferovaná varianta, ale již ne jediná.

Technologie pro zajištění dlouhodobé ochrany digitálního informačního obsahu jsou dnes snáze dostupné, než před pěti lety. Snížení bariér dostupnosti automatických digitalizačních technologií a systémů pro správu digitalizovaného a digitálního obsahu znamená, že se dnes a v následujících letech můžeme soustředit na diverzifikaci projektů v oblasti dlouhodobé archivace digitálních dat. Vedle národních projektů tak mohou vznikat projekty menšího významu, které funkčně mohou odpovídat současným příkladům dobré praxe v oblasti dlouhodobé archivace a mohou usilovat o získání statutu důvěryhodného digitálního úložiště v souladu s mezinárodně uznávanými standardy. Vedle digitalizovaných dat můžeme očekávat, že dál poroste význam e-born dokumentů, a také vědeckých dat, geografických dat nebo dalších speciálních dat. Nové možnosti taktéž přináší rozvoj projektů poskytujících HW ukládací technologie vědecké obci (digitální úložiště CESNETu[6] a další menší projekty), nebo spolupráce v mezinárodních projektech. Díky oběma národním projektům, konferencím a větší osvětě obecně existuje v knihovnické komunitě daleko větší povědomí o problematice dlouhodobé ochrany, než před pěti lety.

Základním doporučením a motivem pro příštích pět let je tak vytvoření podmínek pro snížení bariér a diverzifikaci přístupu k dlouhodobé archivaci. V příštích letech by se manažeři knihovního systému v České republice měli snažit o:

  • systematickou podporu projektů
    zaměřených na archivaci různých druhů materiálu (geografická data, vědecká data, různé typy dat paměťových institucí, audio a audiovizuální dokumenty, e-born data na offline nosičích, e-born data od vydavatelů);
    s různě definovaným rozsahem (geografické omezení, oborové projekty);
    s různě velkými ambicemi (ochrana bitů, replikace bitů mezi více lokalitami, logická ochrana, certifikace existujícího systému, uložení /ochrana jako služba apod.);podporu projektů spolupráce všech typů a velikostí institucí a spolupráce přes hranice resortů a oborové hranice;
  • využití veřejně financovaných a univerzitních výpočetních center a kapacit, optimalizaci meziinstitucionální spolupráce a sdílení zkušeností, využití kapacit vysokých škol, vytvoření organizačních podmínek pro zajištění dlouhodobé archivace na centrální i lokální úrovni;
  • systematickou podporu snižování bariér dostupnosti systémů pro zajištění dlouhodobé archivace třeba formou garantované podpory nějakého volně dostupného řešení, poskytnutí implementačních služeb nebo kastomizace systému, nebo formou poskytnutí nějakého systému jako služby;
  • zajištění dlouhodobého financování, podmínkou přidělení musí být dlouhodobý odhad TCO (Total Cost of Ownership, celkove naklady na provoz) a dodržení standardů;
  • systematickou podporu projektů certifikace podle Evropských doporučení pro certifikaci důvěryhodných digitálních repozitářů a ISO norem;
  • podporu projektů v oblasti vzdělávání a kvalifikace pro dlouhodobou archivaci digitálních dat;
  • pokračování rozvoje a implementace standardů – národní standardy pro ukládání, kvalifikace, certifikace v souladu s mezinárodními standardy.

Principy strategie rozvoje knihoven v oblasti dlouhodobé archivace digitálních dat

Níže shrnujeme doporučení vzešlá z analýz, které vznikly v letech 2012-2013 v rámci výzkumné činnosti Moravské zemské knihovny v Brně. Cílem těchto analýz bylo připravit podklady pro Koncepci rozvoje knihoven ČR na léta 2010 - 2015[7], oblast Digitalizace knihovních fondů, ochrana a zpřístupnění, dílčí cíl č. 2 - Dlouhodobá ochrana dokumentů. Analýzy vzniklé v tomto projektu a také podrobnější specifikace níže uvedených cílů jsou dostupné online na webu pracovní skupiny[8]. Níže uvedené cíle považujeme za rozumně ambiciózní. Abychom byli schopni vyhodnotit, jak se nám nějakou strategii daří naplňovat, je nezbytné ji explicitně formulovat, a doprovodit konkrétními měřitelnými cíli, s jasně danými odpovědnostmi a termíny předpokládaného splnění. K jednotlivým cílům v tabulce v kapitole 8 dokumentu “Analýza dostupných technologií a srovnání národních strategií v oblasti dlouhodobé archivace digitálních informací”[9] lze přidat odpovědné osoby/instituce. Protože zde uvažujeme v časovém horizontu více let, než je pravděpodobná pracovní dráha jednoho zaměstnance knihovny, je nezbytné některé věci formalizovat, standardizovat a formulovat explicitně.

Tento text je pouze podkladem pro Ústřední knihovnickou radu, která by podle našeho názoru měla explicitně formulovat strategii v oblasti dlouhodobé archivace v českých knihovnách. Některé cíle vyžadují určité změny v organizaci systému knihoven a v jejich financování, ve fungování knihoven jako institucí, jiné vyžadují jen dohodu mezi institucemi a konkrétními osobami nebo meziresortní spolupráci. Část cílů se splní sama, takříkajíc odspodu, jednotlivé instituce jsou nebo budou nuceny spolupracovat; chtějí-li certifikovat svoje systémy, budou potřebovat formalizovat svoje procesy. Přesto si myslíme, že je třeba naplnění řady cílů podpořit zavedením mechanismu nebo programu financování, který za určitých podmínek podpoří aktivity institucí v této oblasti a pomůže jim hledat cesty, jak spolupracovat, postupně zlepšovat to, jak se o svá digitální data starají.

Do postupné kultivace oblasti dlouhodobé archivace digitálních dat v knihovnách je také nezbytné zapojit univerzity a další instituce. Vlastní finanční mechanismus by měl otevřít cestu aktivitě knihoven, která byla doposud napřena především na digitalizaci. Dnes už není možné obhájit projekt digitalizace nebo získávání digitálních dokumentů, který nekončí plánem dlouhodobé ochrany digitálních dat, protože bariéry dostupnosti technologií dlouhodobé ochrany postupně klesají. Není možné produkovat nebo shromažďovat data bez plánu a technologie na jejich dlouhodobou ochranu.

Zdá se nám také neefektivní financovat projekty v oblasti dlouhodobé archivace v náhradních programech (NAKI apod.) nebo ad hoc. Nesystematické financování vytváří velký prostor pro plýtvání, nepodporuje spolupráci a neotvírá cestu pro všechny možné typy aktivit a zájmů, které v knihovnách existují. Soustředění se na jeden klíčový projekt (byť třeba projekt kastomizace opensource nebo vytvoření systému pro dlouhodobou ochranu jako službu) považujeme z hlediska potřeby zachovat digitální data dlouhodobě za rizikové. Systematický program financování dlouhodobé archivace by měl vytvořit podmínky pro transparentní praktické i výzkumné projekty a měl by reagovat na potřeby jednotlivých institucí. Spíše než diktovat knihovnám, jak se mají o svá data starat, je třeba jim vytvořit podmínky pro to, aby za ně mohly převzít odpovědnost a měly kapacitu realizovat svoje představy o jejich uložení a zpřístupnění. Ideálně v podmínkách, kde mohou žádat o financování, za předpokladu že jejich projekt nebo řešení vyhoví konkrétních standardům a konceptům (podobně jako VISK7 v oblasti digitalizace).

Oblast 1 – Explicitní a měřitelné plánování

Tato oblast obsahuje dvě linie – jednak explicitní plánování pro systém českých knihoven jako celek a podporu plánování jednotlivých institucí. Na celonárodní úrovni by měla vzniknout explicitní strategie knihoven v oblasti dlouhodobé archivace a měla by být pravidelně aktualizována a vyhodnocována. Součástí strategie by měl být také návrh programu financování, a návrh způsobu hodnocení jednotlivých projektů a hodnocení úspěšnosti programu jako celku. V oblasti podpory plánování jednotlivých institucí by měly mít knihovny k dispozici doporučení, jak postupovat při budování a certifikaci digitálního repozitáře pro dlouhodobou archivaci, a manuály pro hodnocení kvality digitálního obsahu, pro nastavení různých úrovní ochrany digitálního obsahu.

Konkrétní cíle:

  • Vypracovat text strategie knihoven pro oblast dlouhodobé ochrany digitálních dat
  • Navrhnout a probrat možnosti financování s MK ČR, audit současných celkových výdajů na archivaci a hodnocení úrovně kvality služeb
  • Naturalizace normy Data Seal of Approval (dále DSA) a popularizace certifikace DSA (2014), naturalizace OAIS (2014), ISO 16363 (2014)

Oblast 2 – Organizační podmínky

Předpokladem úspěšnosti dlouhodobé archivace je standardizace procesů a zajištění kvality IT a dalších činností v instituci, která digitální data archivuje. Každá instituce by také měla mít jasně definované cíle a odpovědnosti za správu a ochranu dat. K tomuto účelu považujeme za vhodné, aby instituce měly k dispozici doporučení, popis oddělení pro dlouhodobou archivaci a popisy pracovních náplní a kvalifikací jednotlivých pracovníků. K dispozici by měly být i obecné plány (policies) pro jednotlivé oblasti, plán správy dat, nástroj na výpočet nákladů archivace apod. Podobný důraz musí být kladen na dokumentaci procesů okolo digitální archivace v knihovnách. Každá by měla mít sadu popisů procesů, s pravidelnou aktualizací a s tím, že tyto procesy jsou následovány. Posílení dlouhodobé archivace digitálních informací by přispělo také vytvoření instituce pro sdílení a koordinaci informací o dlouhodobé archivaci, která by fungovala také jako poradenské centrum, gestor grantového programu pro tuto oblast. Tato instituce by mohla být partnerem pro mediování komunikace mezi státem (ministerstvy) a jednotlivými institucemi, formulovala by požadavky na změny legislativy, vytvářela doporučení a manuály, a zajišťovala asistenci při self auditu. 

Konkrétní cíle:

  • Vytvoření manuálu pro dlouhodobou archivaci (zásady, vzor organizační jednotky, pracovní profily) pro knihovny
  • Vytvoření vzorů dokumentace (data management plán, procesy, obecné policies)
  • Založení poradenského centra nebo platformy pro sdílení znalostí v oblasti ochrany a správy digitálních dat (jako je DPP nebo DCC), a certifikace
  • Postupné zavedení standardů kvality managementu, dokumentace procesů a standardů informační bezpečnosti v knihovnách
  • návrh plánu organizačních úprav v knihovnách pro podporu procesů dlouhodobé ochrany digitálních dat.

Oblast 3 – Spolupráce a sdílení

Cílem v této oblasti je vytvoření podmínek pro sdílení zkušeností i zdrojů mezi knihovnami a podmínek pro spolupráci s dalšími subjekty – archivy, univerzitami, firmami. Spolupráce s univerzitami je žádoucí při formulaci prakticky orientovaných studijních programů pro oblasti správy digitálního obsahu nebo podpoře self-auditu a certifikace. Zavedení systému pro sdílení informací o archivních balíčcích bude nezbytné s tím, jak budou dostupnější mechanismy replikace balíčků do jiných lokalit/institucí.

Druhým cílem v této oblasti je nastavení podmínek, které umožní praktickou spolupráci při sdílení technologií a infrastruktury. Jednak jde o hledání možností replikace archivních balíčků a ukládání n-tých kopií dat, využívání HW a výpočetních center (CESNET, univerzitní výpočetní centra). A jednak o možnost krátkodobého využití výpočetních kapacit pro realizaci ochranných akcí nebo asistenci pro obnovu po havárii. Ambicióznějším cílem může být snaha o vybudování systému pro zajištění dlouhodobé ochrany digitálních dokumentů, které bude fungovat jako služba dostupná menším institucím (DpaaS - Digital preservation as a service), nebo vybudování vládou garantovaného data centra pro ukládání dat paměťových institucí (IaaS).

Konkrétní cíle:

  • Návrh národního standardu pro knihovny typu DSA (pro účely lokální certifikace) a vytvoření autority pro organizaci auditu
  • Rozšíření registru digitalizace nebo URN resolveru, nebo virtuální depositní knihovny o informace o počtu AIP, místě jejich uložení, a úrovní ochrany
  • Vytvoření podmínek pro sdílení systémů a infrastruktury mezi knihovnami, s využití kapacit mimo knihovny. Formalizace sítě knihoven, které sdílí AIP mezi sebou a například v CESNETu.

Oblast 4 – Snížení bariér

Každá instituce by měla mít přístup k řešení nebo službě pro dlouhodobou archivaci. Pro zachování kulturního dědictví je podstatné, aby i malá regionální knihovna měla možnost bezpečně uložit digitální data, které získá a která jsou zajímavá pouze lokálně. I zde platí potřeba podpory sdílení mezi knihovnami i mimo knihovní oblast. Je žádoucí podpora využití volně dostupných řešení a jejich kastomizace, podpora služeb dlouhodobé archivace a ukládání dat. I větší knihovna, pokud se rozhodne se dlouhodobou archivací nezabývat, by měla mít možnost využít veřejně provozovaný systém jako službu, fungující třeba podobně jako Hathi Trust (DPaaS).

Konkrétní cíle:

  • Popularizace OSS Archivematica/RODA, veřejné demo, integrace na používané systémy, vytvoření české verze (distribuce) s dostupnou technickou podporou
  • Program kontinuity vědeckých a kulturních dat zajistit dlouhodobé úložiště jako službu pro kohokoli
  • Programy ministerstva podpoří jednorázové akce (migrace na nový HW, obnova HW, formátové migrace, revalidace formatů).

Oblast 5 – Financování

Vytvoření udržitelného a kontrolovatelného finančního nástroje pro financování projektů v oblasti dlouhodobé archivace včetně jednorázových akcí. Na základě analýzy nákladů na provozování různých řešení pro archivaci v knihovnách navrhnout finanční mechanismus pro financování projektů v oblasti dlouhodobé ochrany digitálních dokumentů. Mechanismus by měl rozlišit prostý nákup HW, implementaci systémů pro správu dat, jednorázové akce ochrany (migrace z HW na HW, formátové migrace), komplexní logickou dlouhodobou ochranu a výzkumné projekty. Součástí finančního mechanismu by měla být měřitelná kritéria efektivity vynaložených prostředků a pravidelný audit jako podmínka přidělení dalších financí v případě dlouhodobého projektu. Stávající mechanismy (VISK) zaměřené na financování digitalizace by měly být doplněny o povinnost předložit finanční rozvahu zajištění dlouhodobé archivace, a strategii ochrany digitalizovaných dat v požadované struktuře. Žádoucí je také podpora menších projektů akvizice a ukládání born digital dokumentů a webových zdrojů, snížení bariér archivace webu.

Konkrétní cíle:

  • Finanční mechanismus MK ČR, v rámci kterého lze pořídit a provozovat archivní systém (HW, SW); financovat jednorázové akce (migrace ze systému do systému); financovat nákup dlouhodobé ochrany jako služby, a který podporuje explicitně meziinstitucionální spolupráci
  • Manuál pro archivaci webu – snížení bariér archivace webu pro menší instituce a služby uložení e-publikací.

Oblast 6 – Vzdělávání, kvalifikace a výzkum

Cílem je dosažení stavu, kdy všechny existující formální univerzitní obory typu „knihovnictví a informační věda“ a některé v oblasti informačních technologií obsahují studijní programy zaměřené na digital curation a dlouhodobou archivaci podle doporučení DIgCurV nebo ekvivalentního. Je také podle nás žádoucí specifická podpora projektů spolupráce a výzkumu v oblasti dlouhodobé archivace (knihovny+univerzity), systematická podpora studentských stáží. V oblasti celoživotního vzdělávání by měla existovat dostatečná nabídka. České knihovny by měly aktivně spolupracovat se zahraničními institucemi, účastnit se projektů dlouhodobé archivace a prezentovat svoje výsledky na mezinárodních fórech.

Konkrétní cíle:

  • Nabídka programů správy digitálních dat ve formálním VŠ vzdělávání obsahuje digital preservation podle doporučení DIgCurV
  • Zavést finanční program na podporu publikací a studentských stáží a výzkumu (postdoc a doc) definovaný oblastí „digital curation“
  • Podpořit české instituce při účasti na realizaci projektu v oblasti dlouhodobé archivace dat financovaného v EU
  • Hledání cest spolupráce se slovenskými a německými institucemi

Oblast 7 – Standardizace

Naturalizace norem relevantních pro dlouhodobou archivaci dat a zavedení národního mechanismu certifikace důvěryhodného dlouhodobého úložiště pro data v knihovnách, například využitím obdoby DSA nebo Nestor Seal pro knihovny v ČR (sebehodnocení). Vytvoření doporučení pro instituce, jak má vypadat institucionální/sbírková strategie dlouhodobé ochrany, jak postupovat ve snaze dosáhnout statutu důvěryhodného dlouhodobého repozitáře – vzory dokumentace a procesů. Vytvoření standardů kvality pro webové archivy, nebo naturalizace relevantní ISO normy.

Konkrétní cíle:

  • DSA, OAIS, TRAC, ISO 16363 – naturalizace a popularizace, později třeba i návrh národního standardu pro knihovny typu DSA
  • Otestování mechanismu zajištění kvality ve WA – Analýza ISO 14873 normy a dalších nástrojů, zavedení manuálu kvality v oblasti WA.

Oblast 8 – Přesah a advokacie

Pro úspěch dlouhodobé archivace jsou podle nás klíčové jak finanční prostředky, tak odhodlání lidí se touto problematikou zabývat. Dlouhodobá archivace potřebuje trvalou advokacii, obhajobu.  Podpora a obrana projektů přijde především od koncových uživatelů, ale je třeba ji umět získat i u těch, kdo projekty financují a hodnotí. Protože dlouhodobá ochrana je činnost probíhající někde v pozadí, často daleko od každodenního provozu digitální knihovny, je třeba tyto činnosti popularizovat a vysvětlovat jejich význam pro zachování služeb knihoven.

Konkrétní cíle:

  • podpořit vznik pravidelné konference nebo workshopu řešící problematiku digitální ochrany v České republice
  • soustavná spolupráce s archivářskou obcí (Národní archiv, standardy, koncepce, řešení).

Pozn.
Podrobnější popis navrhovaných opatřené v jednotlivých oblastech najde případný zájemce v dokumentu
Analýza dostupných technologií a srovnání národních strategií v oblasti dlouhodobé archivace digitálních informací (PDF, 2013).


[1]Viz http://knihovnam.nkp.cz/docs/ctenari_2013/Cteni_Vyzkum_2013.pdf

[2] http://projekty.osf-mvcr.cz/cz/26/default.aspx

[3] http://ndk.cz/narodni-dk

[4] http://webarchiv.cz/

[5] http://www.digitalpreservationeurope.eu/publications/presentations/KoncepceStav.pdf

[6] https://du.cesnet.cz/wiki/doku.php

[7] Viz http://www.mkcr.cz/assets/literatura-a-knihovny/Koncepce_rozvoje_knihoven_2011-2015.pdf

[8] https://sites.google.com/a/mzk.cz/koncepce-ltp/koncepce-ltp

[9] Jan Hutař, Marek Melichar: Analýza dostupných technologií a srovnání národních strategií v oblasti dlouhodobé archivace digitálních informací (PDF, 2013)

HUTAŘ, Jan; MELICHAR, Marek . Principy strategie rozvoje knihoven oblasti dlouhodobé archivace digitálních informací v České republice: stav v roce 2014 a výhled do roku 2019. Duha: Informace o knihách a knihovnách [online]. 2025, 28(1) [cit. 2025-11-01]. ISSN 1804-4255. Dostupné z: https://duha.mzk.cz/clanky/principy-strategie-rozvoje-knihoven-oblasti-dlouhodobe-archivace-digitalnich-informaci-v

Vaše hodnocení:
Nikdo zatím nehodnotil.