Nacházíte se: Úvod » Archiv čísel » 1/2014 » Principy strategie rozvoje knihoven oblasti dlouhodobé archivace digitálních informací v České republice: stav v roce 2014 a výhled do roku 2019
Tento článek shrnuje návrhy pro další rozvoj dlouhodobé archivace digitálního informačního obsahu v knihovnách v České republice. Vychází z analýz, které vznikly v rámci práce na Koncepci rozvoje knihoven ČR pro léta 2010-2013. V úvodu krátce popisuje situaci posledních cca 5 let a ve druhé části formuluje principy, ke kterým by měl další rozvoj dlouhodobé archivace v knihovnách v ČR směřovat. Od velkých projektů se v současnosti dostáváme do fáze, kdy je podle nás žádoucí diverzifikovat přístupy k dlouhodobé archivaci využítím různých technologií, různých zdrojů financování v různě zacílených projektech. Snižující se bariéry dostupnosti systémů pro zajištění dlouhodobé archivace a ukládacích technologií a zvyšující se dostupnost digitalizačních technologií jsou dva faktory, které lze při realizaci strategie využít. Knihovny zůstanou pro další generace relevantní, jen pokud budou schopny uhájit svou roli poskytovatelů jedinečného informačního obsahu, a budou schopny tento obsah trvale ochránit a zpřístupnit.
Průzkumy uživatelů knihoven dnes naznačují[1], že především mladší uživatelé stále častěji do knihovny nikdy nechodí, nebo do ní chodí méně často. Uživatelé se tradičně do knihoven vraceli v pokročilejším věku, ovšem je velmi nejisté, že generace dnešních tabletových teenagerů k tomu bude mít nějakou motivaci nebo předchozí zkušenost. K udržení knihoven jako poskytovatelů jedinečných informací by měla přispět i jejich role v oblasti dlouhodobé archivace digitálního informačního obsahu.
Před pěti lety (2008) byla situace v oblasti dlouhodobé archivace v knihovnách zcela jiná než dnes. V České republice byly plánovány velké projekty jako Národní digitální archiv[2] a Národní digitální knihovna[3]. Technologie masové digitalizace nebyly snadno dostupné a archivace e-born dokumentů probíhala v knihovnách jen v projektu archivace webu - WebArchiv[4]. Finance dostupné pro digitalizaci, pocházely z několika málo zdrojů, většina digitalizace probíhala formou dodávek externími firmami, digitální reprezentace fyzických dokumentů vznikaly společně s mikrofilmovou verzí, používané standardy dat a metadat byly již překonané, stejně jako některé klíčové systémy používané pro vytváření a zpřístupňování těchto dat. Koncept Národní digitální knihovny[5], který v této době vznikl, obsahoval představu centrálního digitálního repozitáře Národní knihovny, který měl ukládat a ochraňovat klíčovou část českého digitálního knihovního dědictví a zdroje uložené mimo tento repozitář v institucionálních, oborových nebo regionálních úložištích. Technologie dostupné k zajištění dlouhodobé archivace byly velmi drahé a neexistovala snadno použitelná volně dostupná řešení, která by bylo možné použít, proto se uvažovalo o zajištění logické ochrany digitálních dat českých knihoven především v centrálním repozitáři v Národní knihovně.
Současná situace (2013/2014) umožňuje již uvažovat o zajištění trvalé ochrany digitálního kulturního dědictví s jiným důrazem. Velké národní projekty probíhají a žijí vlastním životem. Projekt Národní digitální knihovny nastavil především národní standardy pro digitalizaci, což bezpochyby pomůže při budoucí správě dat. V oblasti dlouhodobé archivace mají dnes instituce mnohem více možností, než jen spoléhat na uložení dat v systému Národní knihovny, a úroveň její zralosti není kritická pro schopnost knihoven dlouhodobou ochranu svých digitálních dat zajistit. Odpovídající řešení na logickou dlouhodobou ochranu digitálních dat na centrální úrovni je stále z finančních i organizačních důvodů preferovaná varianta, ale již ne jediná.
Technologie pro zajištění dlouhodobé ochrany digitálního informačního obsahu jsou dnes snáze dostupné, než před pěti lety. Snížení bariér dostupnosti automatických digitalizačních technologií a systémů pro správu digitalizovaného a digitálního obsahu znamená, že se dnes a v následujících letech můžeme soustředit na diverzifikaci projektů v oblasti dlouhodobé archivace digitálních dat. Vedle národních projektů tak mohou vznikat projekty menšího významu, které funkčně mohou odpovídat současným příkladům dobré praxe v oblasti dlouhodobé archivace a mohou usilovat o získání statutu důvěryhodného digitálního úložiště v souladu s mezinárodně uznávanými standardy. Vedle digitalizovaných dat můžeme očekávat, že dál poroste význam e-born dokumentů, a také vědeckých dat, geografických dat nebo dalších speciálních dat. Nové možnosti taktéž přináší rozvoj projektů poskytujících HW ukládací technologie vědecké obci (digitální úložiště CESNETu[6] a další menší projekty), nebo spolupráce v mezinárodních projektech. Díky oběma národním projektům, konferencím a větší osvětě obecně existuje v knihovnické komunitě daleko větší povědomí o problematice dlouhodobé ochrany, než před pěti lety.
Základním doporučením a motivem pro příštích pět let je tak vytvoření podmínek pro snížení bariér a diverzifikaci přístupu k dlouhodobé archivaci. V příštích letech by se manažeři knihovního systému v České republice měli snažit o:
Níže shrnujeme doporučení vzešlá z analýz, které vznikly v letech 2012-2013 v rámci výzkumné činnosti Moravské zemské knihovny v Brně. Cílem těchto analýz bylo připravit podklady pro Koncepci rozvoje knihoven ČR na léta 2010 - 2015[7], oblast Digitalizace knihovních fondů, ochrana a zpřístupnění, dílčí cíl č. 2 - Dlouhodobá ochrana dokumentů. Analýzy vzniklé v tomto projektu a také podrobnější specifikace níže uvedených cílů jsou dostupné online na webu pracovní skupiny[8]. Níže uvedené cíle považujeme za rozumně ambiciózní. Abychom byli schopni vyhodnotit, jak se nám nějakou strategii daří naplňovat, je nezbytné ji explicitně formulovat, a doprovodit konkrétními měřitelnými cíli, s jasně danými odpovědnostmi a termíny předpokládaného splnění. K jednotlivým cílům v tabulce v kapitole 8 dokumentu “Analýza dostupných technologií a srovnání národních strategií v oblasti dlouhodobé archivace digitálních informací”[9] lze přidat odpovědné osoby/instituce. Protože zde uvažujeme v časovém horizontu více let, než je pravděpodobná pracovní dráha jednoho zaměstnance knihovny, je nezbytné některé věci formalizovat, standardizovat a formulovat explicitně.
Tento text je pouze podkladem pro Ústřední knihovnickou radu, která by podle našeho názoru měla explicitně formulovat strategii v oblasti dlouhodobé archivace v českých knihovnách. Některé cíle vyžadují určité změny v organizaci systému knihoven a v jejich financování, ve fungování knihoven jako institucí, jiné vyžadují jen dohodu mezi institucemi a konkrétními osobami nebo meziresortní spolupráci. Část cílů se splní sama, takříkajíc odspodu, jednotlivé instituce jsou nebo budou nuceny spolupracovat; chtějí-li certifikovat svoje systémy, budou potřebovat formalizovat svoje procesy. Přesto si myslíme, že je třeba naplnění řady cílů podpořit zavedením mechanismu nebo programu financování, který za určitých podmínek podpoří aktivity institucí v této oblasti a pomůže jim hledat cesty, jak spolupracovat, postupně zlepšovat to, jak se o svá digitální data starají.
Do postupné kultivace oblasti dlouhodobé archivace digitálních dat v knihovnách je také nezbytné zapojit univerzity a další instituce. Vlastní finanční mechanismus by měl otevřít cestu aktivitě knihoven, která byla doposud napřena především na digitalizaci. Dnes už není možné obhájit projekt digitalizace nebo získávání digitálních dokumentů, který nekončí plánem dlouhodobé ochrany digitálních dat, protože bariéry dostupnosti technologií dlouhodobé ochrany postupně klesají. Není možné produkovat nebo shromažďovat data bez plánu a technologie na jejich dlouhodobou ochranu.
Zdá se nám také neefektivní financovat projekty v oblasti dlouhodobé archivace v náhradních programech (NAKI apod.) nebo ad hoc. Nesystematické financování vytváří velký prostor pro plýtvání, nepodporuje spolupráci a neotvírá cestu pro všechny možné typy aktivit a zájmů, které v knihovnách existují. Soustředění se na jeden klíčový projekt (byť třeba projekt kastomizace opensource nebo vytvoření systému pro dlouhodobou ochranu jako službu) považujeme z hlediska potřeby zachovat digitální data dlouhodobě za rizikové. Systematický program financování dlouhodobé archivace by měl vytvořit podmínky pro transparentní praktické i výzkumné projekty a měl by reagovat na potřeby jednotlivých institucí. Spíše než diktovat knihovnám, jak se mají o svá data starat, je třeba jim vytvořit podmínky pro to, aby za ně mohly převzít odpovědnost a měly kapacitu realizovat svoje představy o jejich uložení a zpřístupnění. Ideálně v podmínkách, kde mohou žádat o financování, za předpokladu že jejich projekt nebo řešení vyhoví konkrétních standardům a konceptům (podobně jako VISK7 v oblasti digitalizace).
Tato oblast obsahuje dvě linie – jednak explicitní plánování pro systém českých knihoven jako celek a podporu plánování jednotlivých institucí. Na celonárodní úrovni by měla vzniknout explicitní strategie knihoven v oblasti dlouhodobé archivace a měla by být pravidelně aktualizována a vyhodnocována. Součástí strategie by měl být také návrh programu financování, a návrh způsobu hodnocení jednotlivých projektů a hodnocení úspěšnosti programu jako celku. V oblasti podpory plánování jednotlivých institucí by měly mít knihovny k dispozici doporučení, jak postupovat při budování a certifikaci digitálního repozitáře pro dlouhodobou archivaci, a manuály pro hodnocení kvality digitálního obsahu, pro nastavení různých úrovní ochrany digitálního obsahu.
Konkrétní cíle:
Předpokladem úspěšnosti dlouhodobé archivace je standardizace procesů a zajištění kvality IT a dalších činností v instituci, která digitální data archivuje. Každá instituce by také měla mít jasně definované cíle a odpovědnosti za správu a ochranu dat. K tomuto účelu považujeme za vhodné, aby instituce měly k dispozici doporučení, popis oddělení pro dlouhodobou archivaci a popisy pracovních náplní a kvalifikací jednotlivých pracovníků. K dispozici by měly být i obecné plány (policies) pro jednotlivé oblasti, plán správy dat, nástroj na výpočet nákladů archivace apod. Podobný důraz musí být kladen na dokumentaci procesů okolo digitální archivace v knihovnách. Každá by měla mít sadu popisů procesů, s pravidelnou aktualizací a s tím, že tyto procesy jsou následovány. Posílení dlouhodobé archivace digitálních informací by přispělo také vytvoření instituce pro sdílení a koordinaci informací o dlouhodobé archivaci, která by fungovala také jako poradenské centrum, gestor grantového programu pro tuto oblast. Tato instituce by mohla být partnerem pro mediování komunikace mezi státem (ministerstvy) a jednotlivými institucemi, formulovala by požadavky na změny legislativy, vytvářela doporučení a manuály, a zajišťovala asistenci při self auditu.
Konkrétní cíle:
Cílem v této oblasti je vytvoření podmínek pro sdílení zkušeností i zdrojů mezi knihovnami a podmínek pro spolupráci s dalšími subjekty – archivy, univerzitami, firmami. Spolupráce s univerzitami je žádoucí při formulaci prakticky orientovaných studijních programů pro oblasti správy digitálního obsahu nebo podpoře self-auditu a certifikace. Zavedení systému pro sdílení informací o archivních balíčcích bude nezbytné s tím, jak budou dostupnější mechanismy replikace balíčků do jiných lokalit/institucí.
Druhým cílem v této oblasti je nastavení podmínek, které umožní praktickou spolupráci při sdílení technologií a infrastruktury. Jednak jde o hledání možností replikace archivních balíčků a ukládání n-tých kopií dat, využívání HW a výpočetních center (CESNET, univerzitní výpočetní centra). A jednak o možnost krátkodobého využití výpočetních kapacit pro realizaci ochranných akcí nebo asistenci pro obnovu po havárii. Ambicióznějším cílem může být snaha o vybudování systému pro zajištění dlouhodobé ochrany digitálních dokumentů, které bude fungovat jako služba dostupná menším institucím (DpaaS - Digital preservation as a service), nebo vybudování vládou garantovaného data centra pro ukládání dat paměťových institucí (IaaS).
Konkrétní cíle:
Každá instituce by měla mít přístup k řešení nebo službě pro dlouhodobou archivaci. Pro zachování kulturního dědictví je podstatné, aby i malá regionální knihovna měla možnost bezpečně uložit digitální data, které získá a která jsou zajímavá pouze lokálně. I zde platí potřeba podpory sdílení mezi knihovnami i mimo knihovní oblast. Je žádoucí podpora využití volně dostupných řešení a jejich kastomizace, podpora služeb dlouhodobé archivace a ukládání dat. I větší knihovna, pokud se rozhodne se dlouhodobou archivací nezabývat, by měla mít možnost využít veřejně provozovaný systém jako službu, fungující třeba podobně jako Hathi Trust (DPaaS).
Konkrétní cíle:
Vytvoření udržitelného a kontrolovatelného finančního nástroje pro financování projektů v oblasti dlouhodobé archivace včetně jednorázových akcí. Na základě analýzy nákladů na provozování různých řešení pro archivaci v knihovnách navrhnout finanční mechanismus pro financování projektů v oblasti dlouhodobé ochrany digitálních dokumentů. Mechanismus by měl rozlišit prostý nákup HW, implementaci systémů pro správu dat, jednorázové akce ochrany (migrace z HW na HW, formátové migrace), komplexní logickou dlouhodobou ochranu a výzkumné projekty. Součástí finančního mechanismu by měla být měřitelná kritéria efektivity vynaložených prostředků a pravidelný audit jako podmínka přidělení dalších financí v případě dlouhodobého projektu. Stávající mechanismy (VISK) zaměřené na financování digitalizace by měly být doplněny o povinnost předložit finanční rozvahu zajištění dlouhodobé archivace, a strategii ochrany digitalizovaných dat v požadované struktuře. Žádoucí je také podpora menších projektů akvizice a ukládání born digital dokumentů a webových zdrojů, snížení bariér archivace webu.
Konkrétní cíle:
Cílem je dosažení stavu, kdy všechny existující formální univerzitní obory typu „knihovnictví a informační věda“ a některé v oblasti informačních technologií obsahují studijní programy zaměřené na digital curation a dlouhodobou archivaci podle doporučení DIgCurV nebo ekvivalentního. Je také podle nás žádoucí specifická podpora projektů spolupráce a výzkumu v oblasti dlouhodobé archivace (knihovny+univerzity), systematická podpora studentských stáží. V oblasti celoživotního vzdělávání by měla existovat dostatečná nabídka. České knihovny by měly aktivně spolupracovat se zahraničními institucemi, účastnit se projektů dlouhodobé archivace a prezentovat svoje výsledky na mezinárodních fórech.
Konkrétní cíle:
Naturalizace norem relevantních pro dlouhodobou archivaci dat a zavedení národního mechanismu certifikace důvěryhodného dlouhodobého úložiště pro data v knihovnách, například využitím obdoby DSA nebo Nestor Seal pro knihovny v ČR (sebehodnocení). Vytvoření doporučení pro instituce, jak má vypadat institucionální/sbírková strategie dlouhodobé ochrany, jak postupovat ve snaze dosáhnout statutu důvěryhodného dlouhodobého repozitáře – vzory dokumentace a procesů. Vytvoření standardů kvality pro webové archivy, nebo naturalizace relevantní ISO normy.
Konkrétní cíle:
Pro úspěch dlouhodobé archivace jsou podle nás klíčové jak finanční prostředky, tak odhodlání lidí se touto problematikou zabývat. Dlouhodobá archivace potřebuje trvalou advokacii, obhajobu. Podpora a obrana projektů přijde především od koncových uživatelů, ale je třeba ji umět získat i u těch, kdo projekty financují a hodnotí. Protože dlouhodobá ochrana je činnost probíhající někde v pozadí, často daleko od každodenního provozu digitální knihovny, je třeba tyto činnosti popularizovat a vysvětlovat jejich význam pro zachování služeb knihoven.
Konkrétní cíle:
Pozn.
Podrobnější popis navrhovaných opatřené v jednotlivých oblastech najde případný zájemce v dokumentu Analýza dostupných technologií a srovnání národních strategií v oblasti dlouhodobé archivace digitálních informací (PDF, 2013).
[1]Viz http://knihovnam.nkp.cz/docs/ctenari_2013/Cteni_Vyzkum_2013.pdf
[2] http://projekty.osf-mvcr.cz/cz/26/default.aspx
[5] http://www.digitalpreservationeurope.eu/publications/presentations/KoncepceStav.pdf
[6] https://du.cesnet.cz/wiki/doku.php
[7] Viz http://www.mkcr.cz/assets/literatura-a-knihovny/Koncepce_rozvoje_knihoven_2011-2015.pdf
[8] https://sites.google.com/a/mzk.cz/koncepce-ltp/koncepce-ltp
[9] Jan Hutař, Marek Melichar: Analýza dostupných technologií a srovnání národních strategií v oblasti dlouhodobé archivace digitálních informací (PDF, 2013)
HUTAŘ, Jan; MELICHAR, Marek. Principy strategie rozvoje knihoven oblasti dlouhodobé archivace digitálních informací v České republice: stav v roce 2014 a výhled do roku 2019. Duha: Informace o knihách a knihovnách [online]. 2014, 28(1) [cit. 2024-10-15]. ISSN 1804-4255. Dostupné z: http://duha.mzk.cz/clanky/principy-strategie-rozvoje-knihoven-oblasti-dlouhodobe-archivace-digitalnich-informaci-v-cesk
/*
Duha vychází 4× ročně v elektronické i tištěné podobě. Tištěná čísla ve formátu PDF naleznete zde.
|
|