Copyright Duha © 2025, Žádný příspěvek ani jeho část nesmí být reprodukován bez souhlasu autora a bez oznámení redakci.
Text vznikl jako výsledek výzkumné činnosti Moravské zemské knihovny v Brně, kterou je naplňována její Koncepce výzkumu, vývoje a inovací na období 2010–2015. S ohledem na rozsah byl rozdělen na tři části. První část se věnuje tématu Experimentální digitalizace a ukládání dat, Další části – Ochranná selektivní digitalizace a Masová digitalizace; Snaha o nasazení LTP systému; Řešení pro digital born dokumenty najdete v dalších číslech Duhy v rubrice Informace pro knihovny.
Tento příspěvek je zkrácenou verzí originálního textu, který vznikl jako popis výchozího stavu pro strategii rozvoje knihoven v části zaměřené na dlouhodobou archivaci digitálních informací (Koncepce rozvoje knihoven ČR na léta 2011-2015). Popisuje, jak se měnil význam digitálních informací v českých paměťových institucích (knihovny, muzea, archivy a galerie) od poloviny devadesátých let 20. století se zvláštním ohledem na dlouhodobou archivaci digitálních informací. V závěrečné kapitole se pokoušíme odhadnout, kam se bude ubírat budoucí vývoj, s cílem doporučit opatření, která by mohla pomoci zajistit dlouhodobou dostupnost a použitelnost digitálních dat v tomto typu institucí.
Cílem tohoto textu není poskytnout vyčerpávající výčet projektů v českých paměťových institucích. Jde o to ukázat typické rysy dané fáze vývoje vztahu k digitálním datům především s přihlédnutím ke stádiu zralosti managementu a správy digitálních informací. Domníváme se, že české knihovny, galerie, muzea a archivy jsou si v určitém smyslu podobné - všechny tyto instituce prošly třemi fázemi vývoje digitalizace, shromažďování tzv. born-digital[1] dat, správy a ukládání digitální dat.
Každá z těchto fází se liší v tom, jak byly digitalizační projekty chápány, jaká data byla generována, jak byly jednotlivé projekty organizovány a financovány. Proměňuje se také kontext, ve kterém byly a jsou jednotlivé projekty realizovány: mění se vlastní cíl digitalizace, technologie pořizování, prezentace a ukládání dat, mění se očekávání uživatelů i manažerů projektů a mění se i mezinárodní kontext, standardy, objevují se globální nebo evropské projekty. Nás v tomto textu zajímá především oblast ukládání a správy digitálních dat a také chápání a místo dlouhodobé ochrany v projektech digitalizace a shromažďování born-digital dokumentů. Jednotlivé fáze se liší z hlediska toho, jak a zda vůbec je dlouhodobá ochrana digitálních informací definována jako problém, který je třeba řešit.
Jednotlivým fázím jsou věnovány samostatné kapitoly. Hlavním zdrojem dat v prostředí českých paměťových institucí byla a je digitalizace. Tento text je proto převážně o projektech zabývajících se digitalizací.
Časové vymezení: 90. léta do roku 2002 včetně
V této fázi se v různých paměťových institucích objevují první projekty zabývající se digitalizací. Nejpokročilejší byly bezpochyby knihovny, které začaly využívat proces digitalizace jako první, a to jak v Čechách, tak i v zahraničí. Archivy, galerie a muzea v České republice začaly digitalizaci využívat ve velmi omezené míře až na konci devadesátých let. Digitalizace v nich byla spíše účelová, týkala se pouze jednotlivin a snažila se vyhovět žádostem uživatelů. Data často nebyla systematicky uchovávána. Tak tomu bylo např. v Národním technickém muzeu [SCHORGE, 2011]. Objemu dat a dopadu na uživatele, který měly knihovny, se archivy a muzea vyrovnat zdaleka nemohly. Např. NA ČR začal digitalizovat některé jednotliviny až v roce 2003, systematicky pak až v roce 2005 [FARKAS, 2012].
V České republice se digitalizace publikací a sbírkových předmětů začala jako první objevovat v největších centrálních institucích. Projekty byly většinou zaměřené na úzce vymezený soubor publikací nebo významných sbírkových předmětů (prvotisky, staré tisky aj.). Převládal názor, že je potřeba nejdříve zdigitalizovat “to nejcennější” (Manuscriptorium). Až na konci 90. let se více začaly digitalizovat dokumenty reálně ohrožené degradací, např. kyselého papíru (Kramerius). Prvním impulsem k digitalizaci se stala náhrada fyzického dokumentu za kopii digitální, tedy ochrana originálu před manipulací v podobě zpřístupnění. U mnoha dokumentů, které byly v takovém stadiu rozpadu, že se již nezpřístupňovaly, byla digitalizace jedinou cestou k záchraně jejich obsahu. V knihovnách se digitalizační technologie využívaly také při konverzi katalogů do elektronické podoby (viz český KATIF v NK ČR). Roli hrála také propagace instituce. Např. v galeriích byla digitalizace zaměřena na propagaci nejdůležitějších sbírkových předmětů (animace a CD disky propagující jednotlivé výstavní projekty), měla také vzdělávací funkci.
První fáze byla obdobím hledání technických řešení, smyslu digitalizace a místa digitálních informací ve službách paměťových institucí. Obecně byla digitalizace spojena s aktivitou několika málo inovativních jedinců a také podpůrných firem, z hlediska služeb paměťových institucí neměla v první fázi příliš velký dopad. Mj. i díky tomu, že zdigitalizovány byly často speciální fondy s minimální užitnou nebo vypovídající hodnotou pro běžného uživatele. Pořizování digitálních dat v první fázi nebylo na národní úrovni nijak koordinováno, financování bylo roztříštěné a do počtu zdrojů velmi omezené. Technologie digitalizace byly drahé a těžko dostupné, většinou byly k dispozici právě jen velkým institucím nebo institucím, kde působili aktivní jedinci.
Samotný proces digitalizace byl ve všech paměťových institucích věcí výzkumu a vývoje financovaného ad hoc ze zdrojů Ministerstva kultury (případně vnitra), až o něco později stabilněji ze vzniklých grantů na výzkum a vývoj. Bylo to období hledání nebo vývoje standardů pro pořizování dat, metadat i ukládání. První kroky v oblasti knihoven spočívaly v testování skenerů, obrazových formátů, analýzách procesů digitalizace, než se procesy a postupy ustálily (např. vývoj vlastního metadatového schématu založeného na SGML, vlastní aplikace na zpřístupnění v digitalizaci rukopisů v NK ČR apod.). Až v pozdějších letech první fáze byla digitalizace již stabilizovaným procesem, s dostatkem metodik a “best practice” dokumentů z mnoha různých zahraničních i českých institucí. Bylo to i díky aktivitám Evropské unie, která se po roce 2000 začala snažit aktivity okolo digitalizace koordinovat a usměrňovat k využívání standardů pro digitalizaci a tvorbu metadat (Lundský plán 2001 a Parmská charta 2003). V českých knihovnách byl později důraz na sdílení standardů podtržený podmínkami financování přes různé grantové programy, které vyžadovaly dodržování národních standardů. V roce 2000 byl zahájen grantový program Ministerstva kultury pod názvem Veřejné informační služby knihoven (VISK), kde má digitalizace své místo v podprogramech VISK 4, VISK 6 a VISK 7. Tento program byl a stále je největším zdrojem financí pro digitalizaci a uložení dat v oblasti knihoven.
Technologie po celá devadesátá léta neumožňovaly snadné šíření digitalizovaného obsahu on-line, proto jednotlivé projekty vytvářely v prvních letech offline prezentace, většinou na optických médiích. CD-ROM disk obsahoval proprietární aplikaci na prohlížení obrázků a jejich metadat, která se spustila po vložení disku do mechaniky. Tímto způsobem probíhalo zpřístupnění ve studovnách i mimo ně často až do roku 2003[2]. V první fázi se nepředpokládal masový zájem o digitální obsah, očekávanými konzumenty digitálních informací byli především odborníci a specialisté.
Se zvyšujícím se množstvím dokumentů v digitální podobě se začala bouřlivě vyvíjet problematika „digitálních knihoven”, která byla hlavním tématem celých 90. let i let pozdějších. Problematika dlouhodobé ochrany a dostupnosti digitálních informací v použitelné podobě v budoucnu nebyla na pořadu dne. Zatím se hledaly způsoby jak digitální data jednoduše přijmout (archivy) a bezpečně uložit. Data se velmi dlouho ukládala v archivech optických disků (např. NK ČR). Až později se data ukládala na první typy digitálních úložišť, např. páskový robot v NK ČR pořízený v roce 1999. Možnosti správy dat a manipulace s nimi byly minimální.
V devadesátých letech neprobíhaly žádné snahy o zachování born-digital dokumentů. Jediné born-digital dokumenty přicházely do knihoven v podobě CD a DVD disků v rámci povinného výtisku. Ty byly ukládány v archivu optických disků. Archivy ani knihovny born-digital dokumenty běžně nedostávaly, a pokud ano, již jejich samotné přijetí bylo problémem. V roce 2000 vznikl v NK ČR projekt na archivaci českého webu pod názvem WebArchiv, který byl na dlouhou dobu jediným projektem věnujícím se born-digital dokumentům v českých knihovnách. NA ČR, Archivní správa při Ministerstvu vnitra a České vysoké učení technické řešily v letech 2001-2002 grantový úkol Příprava podkladů pro vznik státního pracoviště pro dlouhodobé uchovávání a zpřístupňování dokumentů v digitální podobě s celostátní působností. Jednalo se o jednu z prvních aktivit, která reagovala na nový trend vytváření písemností v elektronické podobě namísto klasického papíru. Do NA ČR od konce 90. let minulého století přicházely digitální dokumenty, které archiváři nebyli schopni standardně zpracovat, bezpečně uložit ani zpřístupnit pro badatele. Šlo např. o výstupy z různých informačních systémů v proprietárních formátech, nebo na historických médiích. Příkladem může být kniha došlé pošty, kterou NA ČR převzal v roce 1999 od Úřadu vlády ČR, který vedl tuto knihu od roku 1998 pouze elektronicky. Dokumenty byly předány na 78 osmipalcových disketách, na kterých byly neznámé formáty dat [CROSSCZECH, [2010], s. 24].
Memoriae Mundi Series Bohemica
První aktivity v oblasti digitalizace v NK ČR začaly v roce 1992, kdy knihovna přistoupila k programu UNESCO Paměť světa (Memory of the World/Memoriae Mundi). NK ČR v dubnu 1993 představila na jednání UNESCO v Paříži první kompletní digitalizovaný rukopis na CD-ROM disku na světě vůbec [KNOLL, 2009, s. 1]. V roce 1995 vznikla česká odnož Paměti světa, tzv. Memoriae Mundi Series Bohemica a byla vyhlášena jako národní program digitalizace historických fondů pod názvem Národní program digitálního zpřístupnění vzácných dokumentů Memoriae Mundi Series Bohemica. Stejného roku vznikly první výstupy, několik rukopisů prezentovaných na off-line CD-ROM. Digitalizace historických dokumentů jako rutinní proces probíhala od roku 1996 [KNOLL, 1998], kdy bylo vybaveno pracoviště digitalizace v NK ČR. První skupinou dokumentů, které se digitalizovaly, byly nejvzácnější rukopisy, později i staré tisky a historické mapy. Tyto typy dokumentů jsou dodnes typické pro digitální knihovnu Manuscriptorium, která na Memorii navazuje.
V té době neexistovaly standardy metadat, které by bylo možno přebrat. Již v roce 1996 tak byl vyvinut popis na základě HTML doplněný o tzv. doplňkové tagy. Pomocí HTML bylo popsáno několik desítek rukopisů. V roce 1997 komise Paměti světa doporučila orientovat se na SGML (Standard Generalized Markup Language). NK ČR (Adolf Knoll) ve spolupráci s AiP Beroun v letech 1996-1998 v rámci VaV projektu Archivace a zpřístupnění vzácných dokumentů s využitím digitální technologie vyvinula schéma DOBM SGML (Digitized Old Books and Manuscript) [KNOLL, 1997]. Z dnešního pohledu šlo o metadatový kontejner pro „zabalení“ dat i metadat do jedné logické entity. V roce 1999 doporučila komise UNESCO Paměť světa schéma DOBM jako mezinárodní standard pro popis rukopisů v programu Paměť světa, což byl výrazný úspěch. Záznamy metadat v DOBM SGML byly v NK ČR tvořeny v letech 1998 až 2002. V této době neexistovaly dnes standardní a běžné standardy založené na XML. Vedle popisu rukopisů a starých tisků vznikly konkrétní specifikace pro novodobá periodika a monografie, zvukové nahrávky a sbírky dokumentů. Technická metadata v DOBM byla minimální a jejich obsah nebyl strukturovaný, tj. více různých údajů bylo v jednom elementu. Hlavním cílem tvorby technických metadat bylo jejich využití pro nastavení a kontrolu kvalitního zobrazení zdigitalizovaných historických dokumentů tak, aby zobrazení odpovídalo předloze. Zpřístupnění digitálních informací z projektu Memoria až do roku 2003, kdy byly zprovozněny webové digitální knihovny Kramerius a Memoria (později Manuscriptorium), probíhalo z CD-ROM disků.
Kramerius
Do roku 1999 v programu Kramerius probíhalo mikrofilmování dokumentů ohrožených kyselostí papíru. Digitální kopie mikrofilmů začaly díky nákupu hybridní kamery vznikat v projektu Digitalizace mikromédií, který NK ČR vedla v letech 1997-1999. Souběžně probíhala digitalizace mikrofilmů a digitalizace fyzických periodik. V roce 2000 bylo v rámci Krameria naskenováno již zhruba 100 000 stránek. V roce 1999 byla vytvořena metadatová schémata DOBM SGML pro popis monografií a periodik, obě vycházela z DOBM pro rukopisy. Metadatový popis periodik i monografií v DOBM byl v podstatě pouze bibliografický, doplněný o tři elementy, které lze považovat za technická metadata. Tyto tři elementy měly spíše informační charakter o technickém řešení, na kterém byly dokumenty digitalizovány.
Digitalizovaná periodika byla dostupná na webu NK ČR od roku 2001 a to přímo z digitálního archivu uloženého na páskovém robotu s on-the-fly konverzí do DjVu [KNOLL, 2011]. Aplikace AIP SAFE umožňovala přístup k digitalizovaným rukopisům i novodobým dokumentům. Ukázalo se ale, že díky odchylkám při vyplňování konkrétních polí a odlišné specifikaci metadat u obou typů dokumentů, nebylo možné do aplikace AIP SAFE valnou většinu historických dokumentů vůbec naimportovat [KNOLL, POLIŠENSKÝ a UHLÍŘ, 2004, s. 32]. Díky odlišnosti dokumentů i jejich potenciálních uživatelů byly v roce 2003 vytvořeny dvě různé aplikace, pro historické dokumenty (Memoria/Manuscriptorium) a pro dokumenty novodobé (Kramerius), obě pracovaly s metadaty v XML. V roce 2000 se programy Memoria a Kramerius staly národními programy podporovanými Ministerstvem kultury ČR v rámci programu VISK.
Microgalerie
Ne všechny projekty v tomto období se dají označit za úspěšné, především pokud měly šířeji vymezené oborové zaměření. Příkladem je projekt Microgalerie v Národní galerii v Praze, který byl budován v devadesátých letech po vzoru stejně pojmenovaného projektu v Národní galerii v Londýně. V rámci projektu bylo postupně naskenováno asi 3 000 děl ze sbírek Národní galerie a kurátoři projektu k němu vytvořili stovky stran doprovodných textů. Původní plán zpřístupnit aplikaci na kioscích v Galerii se ukázal díky šíření Internetu koncem 90. let už zastaralý. Celý projekt skončil pokusem o převod aplikace na Internet, ale problémy s autorskými právy znemožnily data online vystavit. Data jsou dostupná na samostatném PC v budově Národní galerie. Zdrojové naskenované soubory jsou uloženy pouze na CD, bez adekvátní dokumentace, ochrany a bez metadat.
Projekt naprosto opominul potřebu vygenerovaná data dlouhodobě archivovat. Finance, které byly vynaloženy na pořízení digitálních kopií jednotlivých sbírkových předmětů, tak byly v podstatě promrhány a zdrojová data v rozumné kvalitě jsou dnes nedostupná.
Z hlediska dlouhodobé archivace a správy generovaných dat se projekty nacházely v prenatální fázi. Ještě několik let po roce 2000 se ve velké většině pro archivaci používala off-line media, především optické disky. Některé instituce (NK ČR) experimentovaly s kvalitou optických medií a uvažovaly o jejich dlouhodobé udržitelnosti, v jiných projektech nebylo s dlouhodobou archivací vůbec počítáno [KNOLL a PSOHLAVEC, 2002, s. 4 a 13]. V období první fáze se jakékoliv úvahy o dlouhodobé ochraně zabývaly pouze ochranou bitstreamu, tedy zabránění poškození nebo změně originálního souboru pomocí záloh, přesunem mezi různými lokalitami a HW řešeními apod.
Archivářům i knihovníkům bylo jasné, že v budoucnu bude nutné stávající obrazové i jiné soubory převádět na nové formáty, aby byly dále použitelné. V roce 2002 Jiří Polišenský na semináři CASLIN ve svém příspěvku mluví o tom, že: „Digitální dokumenty je na rozdíl od mikrofilmu, mnohem obtížnější uchovat ve zpřístupnitelné podobě v dlouhodobé časové perspektivě, což je dáno vývojem v oblasti výpočetní techniky a … inovačními cykly přinášejícími zásadní změny v technické podpoře platforem, formátů…“ [POLIŠENSKÝ, 2002, s. 57]. Budoucnost se ovšem zdála příliš daleká a v knihovnictví žádné konkrétní aktivity cíleně směřující k logické dlouhodobé ochraně obrazových ani jiných souborů neprobíhaly.
V knihovnách se vyvíjela vlastní schémata metadat, cílem byl bibliografický popis digitalizovaných dokumentů. Přebírání zahraničních standardů neprobíhalo, dnes běžné standardy tehdy neexistovaly (METS, MODS aj.). Tzv. ochranná metadata se začala teprve vyvíjet a to v souvislosti se zveřejněním normy referenčního rámce OAIS na konci 90. let. V DOBM SGML byla informace o technických vlastnostech digitálních obrazů minimální, chyběly např. kontrolní součty apod. V institucích mimo knihovny byla situace podobná, pokud se mluvilo o metadatech, tak pouze o popisných. V archivech probíhala etapa nasazování informačních systémů na správu popisů archiválií (systém BACH aj.), až později archivních pomůcek a spisové služby apod. Archiváři se také začali aktivně zaobírat problematikou příjmu elektronických dokumentů, jejich uložení a archivací - grant Příprava podkladů pro vznik státního pracoviště pro dlouhodobé uchovávání a zpřístupňování dokumentů v digitální podobě s celostátní působností v letech 2001-2002. V rámci projektu sbírali zkušenosti v zahraniční, např. v The National Archive ve Velké Británii [MACEK a WANNER, 2003, s. 3]. Ve světě vznikající specifikace metadat pro archivy (např. EAD XML 1998) nebo např. britské a australské specifikace pro record keeping systémy v ČR ale větší ohlas nezaznamenaly. Podobná situace byla v muzeích a galeriích, zahraniční aktivity a specifikace jako např. VRA Core (Visual Resoucrce Association) a CDWA (Categories for the Descriptions of Works of Art) v oblasti galerií, zůstaly bez odezvy.
Digitální data se v první fázi ukládala na fyzický nosič, který byl v době vzniku digitálních objektů aktuálně dostupný. Zpočátku se jednalo převážně o optické disky, později na sklonku 90. let přišly magnetické pásky, pevné disky nebo disková pole. Často bylo médium nebo celý archiv offline. Pro paměťové instituce byly nové technologie zároveň přínosem i problémem. Možnosti správy velkého množství takto (offline) uložených dat byly velmi omezené a s přibývajícími daty po roce 2000 takřka nezvládnutelné. Zároveň často chyběl typ pracovníků, kteří by tyto problémy dokázali řešit nebo konzultovat. Správa se omezovala výhradně na kontrolu a ochranu bitstreamu na úrovni souborů, a i to byl např. při objemech několika set tisíc naskenovaných stran problém. Řešilo se zálohování a procesy okolo něj. Málokdy probíhaly např. kontroly pomocí kontrolních součtů na úrovni celého archivu.
Situace je níže ilustrována na příkladu NK ČR. Podobné problémy se v menší míře řešily v NA ČR, méně pak již v muzeích a galeriích, které neměly tolik dat. NK ČR v 90. letech musela pro data z digitalizace historických fondů začít řešit jejich vhodné uložení. Vznikl „digitální archiv“ optických disků CD-R. Na konci 90. let šlo o finančně nejdostupnější technologii uložení velkého množství dat [PSOHLAVEC, 2004]. Celý archiv sestával ze systému několika kopií jednotlivých disků. Disky byly ve dvou kopiích na dvou různých lokalitách. Archiv CD-R byl používán nejen pro výstupy digitalizace historických fondů, ale i pro uložení CD-R přicházejících do NK ČR v rámci povinného výtisku. V letech 2000-2001 probíhal v rámci výzkumného projektu VaV Optimalizace archivace a zpřístupnění digitálních dat výzkum stárnutí a uložení optických médií. Pravidelně probíhala kontrola stavu archivu na základě statisticky vybraných vzorků [KNOLL a PSOHLAVEC, 2002, s. 4 a 13]. Je důležité upozornit, že šlo o výjimečný archiv s vhodně nastavenými pravidly a klimatickými podmínkami uložení, který neměl v ČR obdobu. Archivní disky byly před zápisem pečlivě vybírány, kontrolovány, probíhalo měření vzorků jednotlivých šarží i měření kvality zápisu CD-ROM mechanik. Druhá kopie disků, uživatelská, měla pravidla kvality méně striktní. Archiv CD disků byl na svou dobu odpovídajícím řešením schopným za nastavených podmínek zajistit ochranu bit streamu (tj. dat).
Od počátku nového tisíciletí bylo jasné, že optické CD/DVD disky nejsou vhodné médium pro dlouhodobé uložení dat ani pro jejich dlouhodobou ochranu – viz např. [BYERS, 2003, s. 2]. Jsou nestálé a velmi obtížně umožňují správu a údržbu dat. Riziko poruch a ztráty dat je u archivů optických disků vyšší, než u jiných dostupných technologií a přístupů. Také proto optické disky uvolnily místo ve prospěch integrovaných datových repozitářů, které: „Jsou považovány za nejvhodnější pro dlouhodobé uložení i dlouhodobou ochranu dat. Kontrolují automaticky např. integritu dat, data obnovují, mohou je přemísťovat a to vše s minimálním zásahem lidského faktoru. Pokud se nad tuto HW vrstvu posadí vhodný systém na správu repozitáře, umožní přímou správu dat i metadat …“ [BRADLEY, 2006, s. 4].
Vedle optických disků byly na konci 90. let používány k uložení velkého množství dat i magnetické pásky. V prostředí paměťových institucí to nebylo zcela obvyklé. V NK ČR bylo vzhledem k nárůstu množství dat a snižování kvality optických disků rozhodnuto o nákupu robotické magnetopáskové knihovny. Důvodem byl „ … stav rozvoje v ukládání objemných dat v letech 1998-1999, kdy kapacita pásek vysoko převyšovala pevné disky a rovněž jejich spolehlivost z hlediska archivace dat byla v té době nejvyšší …“ [KNOLL, 2004, s. 4]. Páskový robot byl pořízen v roce 1999 a byl používán jak pro uložení dat, tak pro jejich zpřístupnění. Archivní i uživatelské kopie z digitalizace byly ukládány vždy na třech páskách - dvě online a třetí kopie pásky byla uložena offline v jiné budově [KNOLL, 2000, s. 7]. Storage Archive Manager File System dokázal zajistit automatické kompletní obnovování dokumentů mj. tím, že kontroloval expirační lhůty úložných médií (pásky AIT2 a AIT3) a data z těch, které se blížily konci své životnosti, bezpečně přenášel na nová média. Správu dat prováděla aplikace AIP SAFE; dovolovala vytváření, uložení a zpřístupnění digitálních dokumentů. Vytváření dat a metadat a také zpřístupnění pomocí indexace metadat bylo prováděno na discích, které byly součástí celého systému. Metadata uložená na discích měla zálohu pouze databázovou a v rámci zálohy samotných disků. Proto se přistoupilo i k zálohování metadat na CD-ROM disky offline.
Popsaný systém měl různé problémy, např. rychlost odezvy při potřebě vykopírovat data z pásek a poskytnout uživateli; při zpracování a tvorbě metadat; chybějící kontrola konzistence dat (!) apod. [KNOLL, POLIŠENSKÝ a UHLÍŘ, 2004, s. 19 a 30]. Bylo proto rozhodnuto o oddělení výrobní, archivní a zpřístupňující vrstvy, tj. oddělení archivních a uživatelských dat; a v roce 2003 tak vznikly systémy Kramerius a Manuscriptorium.
Použité zdroje
ARTHUR, Kathleen, et al. 2004. Recognizing Digitization as a Preservation Reformatting Method. Chicago: Association of Research Libraries, 2004. 17 s. Dostupné také z: http://old.arl.org/bm~doc/digi_preserv.pdf
BERNAS, Jiří. 2009. Národní digitální archiv. Knihovna [online]. 2009, roč. 20, č. 1, s. 22-29 [cit. 2013-06-16]. ISSN 1802-8772. Dostupné z: http://knihovna.nkp.cz/knihovna91/bernas.htm
BRADLEY, Kevin. 2006. Risks Associated with the Use of Recordable CDs and DVDs as Reliable Storage Media in Archival Collections - Strategies and Alternatives. Paris: UNESCO, 2006. 28 s. Dostupné také z: http://unesdoc.unesco.org/images/0014/001477/147782E.pdf
BYERS, Fred R. 2003. Care and Handling of CDs and DVDs: A Guide for Librarians and Archivists. Washington: Council on Library and Information Resources, National Institute of Standards and Technology, 2003. 42 s. ISBN 1-932326-04-9. Dostupné také z: http://www.clir.org/pubs/reports/pub121/pub121.pdf
COYLE, Karen. 2006. Mass Digitization of Books. Journal of Academic Librarianship. 2006, Vol. 32, Issue 6 Volume 32, p. 641–645. DOI 10.1016/j.acalib.2006.08.002. Dostupné také z: http://www.kcoyle.net/jal-32-6.html
CROSSCZECH. 2010. Národní digitální archiv: studie proveditelnosti. Praha: Národní archiv České republiky, [2010] [cit. 2011-11-27]. 183 s. Dostupné také z: https://web.nacr.cz/zakazky/NDA_projekt_ISNDA/dokumenty/NDA_IS_ZD_priloha1.zip
ČESKÁ GENEALOGICKÁ A HERALDICKÁ SPOLEČNOST V PRAZE. 2011. Digitalizace v archivech [online]. Praha: Česká genealogická a heraldická společnost, 2011 [cit. 2013-01-04]. Dostupné z: http://www.genealogie.cz/aktivity/digitalizace/
ČESKO. MINISTERSTVO FINANCÍ. 2011. Výzva č. 1 - SCHVÁLENÉ PROJEKTY 2007/2006. In: Ministerstvo financí ČR [online]. 11. červen 2011 [cit. 2013-06-21]. Dostupné z: http://web.archive.org/web/20080228031801/http://www.mfcr.cz/cps/rde/xchg/mfcr/xsl/fm_norska_28797.html?
EUROPEAN COMMISSION. 2005a. COM (2005) 465 final – Official Journal C 49 of 28.2.2008 [online]. [Brussels: European Commission], 2005 [cit. 2013-06-11]. Dostupné z: http://europa.eu/legislation_summaries/information_society/strategies/l24226i_en.htm
EUROPEAN COMMISSION. 2006. Commission Recommendation 2006/585/EC of 24 August 2006 on the digitisation and online accessibility of cultural material and digital preservation. In: Official Journal of the European Union [online]. August 2006, Vol. 49, L 236, s. 28-31 [cit. 2013-06-10]. ISSN 1725-2555. Dostupné z: http://eur-lex.europa.eu/JOHtml.do?uri=OJ:L:2006:236:SOM:en:HTML
FARKAS, Pavel. 2012. Digitalizační projekty Národního archivu ČR. Ikaros [online]. 2012, roč. 16, č. 8 [cit. 2013-06-16]. urn:nbn:cz:ik‐007598. ISSN 1212-5075. Dostupné z: http://www.ikaros.cz/node/7598
FOJTŮ, Andrea, Jan HUTAŘ a Marek MELICHAR. 2011. Dlouhodobá ochrana digitálních dokumentů a projekt NDK. In: Knihovny současnosti 2011: Sborník z 19. konference, konané ve dnech 13.-15. září 2011 v Českých Budějovicích. Ostrava: Sdružení knihoven ČR, 2011, s. 73-79. ISBN 978-80-86249-62-9. Dostupné také z: http://www.sdruk.cz/data/xinha/sdruk/ks2011/sbornik_2011.pdf
HANOUSEK, Tomáš. 2010. Projekt záchranné digitalizace Ad fontes v Archivu hlavního města Prahy. In: Digitalizace and konec oslích uší: sborník konference konané v Městské knihovně v Praze 14.-16.6.2010. Praha: Městská knihovna v Praze, 2010, s. 32-35. ISBN 978-80-85041-05-7. Dostupné také z: http://www.ahmp.cz/adfontes/ppt_hanousek.pdf
HUTAŘ, Jan. 2007. WebArchiv – the archive of the Czech web [online]. Praha: Národní knihovna ČR, 2007 [cit. 2013-04-12]. PPT prezentace. 28 slidů. Dostupné z: http://www.webarchiv.cz/file_download/9/hutar_ss_uisk.ppt
HUTAŘ, Jan. 2008. Plnění administrativních metadat [online]. Verze 1.0. Praha: Národní knihovna ČR, 2008 [cit. 2013-06-11]. 21 s. Dostupné z: http://digit.nkp.cz/Kramerius/AdminMetaData/ADMnarodniStandardVerze1_Zapis.pdf
HUTAŘ, Jan a Marek MELICHAR. 2010. Návrh opatření pro prodloužení životnosti obsahu CD a DVD disků ve sbírkách NK [online]. Praha: Národní knihovna ČR 2010 [cit. 2013-05-06]. 10 s. Dostupné z: http://digit.nkp.cz/projekty/VZ-2004_2010/2010/PDF/10_cd-archive_END.pdf
KAHLE, Brewster. 2004. Towards universal access to all knowledge. In: Strategies for a european area of digital cultural resources: towards a continuum of digital heritage. European conference, The Hague, The Netherlands 15-16 September 2004. Haag, 2004, s. 27-34.
KNOLL, Adolf. 1997. Elektronické publikace v Národní knihovně České republiky. In: Automatizace knihovnických procesů 1997, s. 11-21. Dostupné také z: http://digit.nkp.cz/CzechArticles/Elpubl_katedra.html
KNOLL, Adolf. 1998. Memoriae Mundi Series Bohemica: Program digitálního zpřístupnění vzácných fondů. Ikaros [online]. 1998, roč. 2, č. 7 [cit. 2012-12-02]. URN-NBN:cz-ik1175. ISSN 1212-5075. Dostupné z: http://www.ikaros.cz/node/1175
KNOLL, Adolf. 2000. Technical Standards Used by the National Digitization Programmes Initiated by the National Library of the Czech Republic [online]. Praha: Národní knihovna ČR, 2000 [cit. 2013-06-09]. 8 s. Dostupné z: http://digit.nkp.cz/EnglishArticles/Technical_Standards.rtf
KNOLL, Adolf. 2004. Digitální knihovna - produkce, ochrana a zpřístupnění digitálních dokumentů: závěrečná zpráva o řešení výzkumného záměru [online]. Praha: Národní knihovna ČR, 2004 [cit. 2013-06-04]. 15 s. Dostupné z: http://digit.nkp.cz/PROJECTS_WEB/CEZFinal1999-2003.pdf
KNOLL, Adolf. 2009. Projekt ENRICH: budujeme Evropskou digitální knihovnu rukopisů. In: Mezinárodní muzeologická konference Muzeum a změna III [online]. 19. únor 2009 [cit. 2012-11-12]. Dostupné z: http://www.cz-museums.cz/amg/UserFiles/File/muchang%20III/knoll_muchang.doc
KNOLL, Adolf. 2011. Emailová korespondence mezi A. Knollem a J. Hutařem ze dne 20. 4. 2011.
KNOLL, Adolf a Stanislav PSOHLAVEC. 2002. Zpráva o řešení projektu výzkumu a vývoje Optimalizace archivace a zpřístupnění digitálních dat: závěrečná zpráva za léta 2001-2002. Praha: Národní knihovna ČR, 2002. 20 s. Dostupné také z: http://digit.nkp.cz/knihcin/digit/vav23/zpravaweb.doc. V názvu chybně uvedeny roky trvání projektu, má být 2000-2001.
KNOLL, Adolf, Jiří POLIŠENSKÝ a Zdeněk UHLÍŘ. 2004. Vytvoření virtuálního badatelského prostředí pro zpřístupnění a ochranu digitálních dokumentů: Zpráva o řešení výzkumného záměru za rok 2004. Praha: Národní knihovna ČR, 2004. 41 s. Dostupné také z: http://digit.nkp.cz/projekty/VZ-2004_2010/2004/Zprava2004.pdf
KNOLL, Adolf, Jiří POLIŠENSKÝ a Zdeněk UHLÍŘ. 2005. Vytvoření virtuálního badatelského prostředí pro zpřístupnění a ochranu digitálních dokumentů: průběžná zpráva o řešení za rok 2005. Praha: Národní knihovna ČR, 2005. 17 s. Dostupné také z: http://digit.nkp.cz/projekty/VZ-2004_2010/2005/Zprava2005.pdf
KNOLL, Adolf, Jiří POLIŠENSKÝ a Zdeněk UHLÍŘ. 2009. Vytvoření virtuálního badatelského prostředí pro zpřístupnění a ochranu digitálních dokumentů: dílčí zpráva o řešení za r. 2009. Praha: Národní knihovna ČR, 2009. 25 s. Dostupné také z: http://digit.nkp.cz/projekty/VZ-2004_2010/2009/HlavníZpravaWeb.pdf
Koncepce trvalého uchování knihovních sbírek tradičních a elektronických dokumentů v knihovnách ČR do roku 2010. Knihovna - knihovnická revue. 2005, roč. 16, č. 2, s. 9-27. Dostupné také z: http://knihovna.nkp.cz/pdf/0502/050209.pdf
KŘEČKOVÁ, Jitka. 2012. ENArC – European Network on Archival Cooperation. Projekt Monasterium v České republice [online]. 2012 [cit. 2013-01-03], 16 s. Dostupné z: http://www.programculture.cz/media/document/kreckova-narodni-archiv_monasterium.pdf
MACEK, Oskar a Michal WANNER. 2003. Strategie digitálního archivování. Archivní časopis, č. 53, 2003. Zvláštní příloha. 64 s. ISBN 80-86466-03-5.
MĚŘÍNSKÁ, Eva. 2010. Od záchranné digitalizace k elektronickým textům pro uživatele. Duha [online]. 2010-10-25 [cit. 2013-06-23]. ISSN 1804-4255. Dostupné z: http://duha.mzk.cz/clanky/od-zachranne-digitalizace-k-elektronickym-textum-pro-uzivatele
MONASTERIUM. 2012a. Goals [online]. Monasterium Project, 2012 [cit. 2013-02-24]. Dostupné z: http://monasterium.net/pages/en/about-the-project.php
MONASTERIUM. 2012b. How can my institution participate? [online]. Monasterium Project, 2012 [cit. 2013-02-24]. Dostupné z: http://monasterium.net/pages/en/participation/institutions.php
NÁRODNÍ ARCHIV. 2009. Závěrečná zpráva projektu výzkumu a vývoje [online]. Praha: Národní archiv ČR, 2009 [cit. 2012-10-29]. 14 s. Dostupné z: http://www.nacr.cz/Z-files/moznosti_01.pdf
NÁRODNÍ KNIHOVNA ČR. 2009. Pravidla popisu monografií verze 1.5. Praha: Národní knihovna ČR, 2009. 10 s. Dostupné také z: http://kramerius-info.nkp.cz/visk/zadavaci-dokumentace-visk-7-pro-rok-2010/pravidla-popisu-monografii
NÁRODNÍ KNIHOVNA ČR. 2011. Národní kulturní bohatství zachovají nové technologie. Statisíce knih a periodik online [online]. Tisková zpráva z 22. 2. 2011. Praha: Národní knihovna ČR, 2011 [cit. 2013-06-29]. 4 s. Dostupné z: http://www.nkp.cz/soubory/ostatni/tz-ndk-google.pdf/at_download/file
OWENS, Trevor. 2012. NDSA Levels of Digital Preservation: Release Candidate One [online]. In The Signal – Digital Preservation. Washington, DC: Library of Congress, 2012 [cit. 2013-03-12]. Dostupné z: http://blogs.loc.gov/digitalpreservation/2012/11/ndsa-levels-of-digital-preservation-release-candidate-one/ a také z https://docs.google.com/spreadsheet/ccc?key=0Aow9_JA5GUnYdEZvZkRpSFVGU21nSXJKTk1ITktMVUE#gid=0
POLIŠENSKÝ, Jiří. 2002. Konsorcium pro zpřístupňování a archivaci dokumentů pro výzkum a vývoj v České republice. In: CASLIN 2002. Ochrana a sprístupňovanie dokumentov: nové trendy: Zborník z konferencie, konanej 23.- 27. júna 2000 v Pribyline. Martin: Slovenská národná knižnica, 2002, s. 57-63.
PSOHLAVEC, Stanislav. 2004. Projekt MEMORIA, rukopisy a staré tisky na internetu. Národní knihovna: knihovnická revue [online]. 2004, roč. 15, č. 1, s. 40-43 [cit. 2012-10-23]. ISSN 1214-0678. Dostupné z: http://knihovna.nkp.cz/NKKR0401/0401040.html
PSOHLAVEC, Stanislav. 2006. Možnosti intenzivní digitalizace časopisů a knih. In: Archivy, knihovny a muzea v digitálním světě 2005. Praha: Národní technické muzeum v Praze, 2006, s. 39-42. ISBN 80-7037-149-8.
ROSENTHAL, Colin, Asger BLEKINGE-RASMUSSEN a Jan HUTAŘ. 2009. Průvodce plánem důvěryhodného digitálního repozitáře (PLATTER). Praha: Národní knihovna ČR, 2009. 51 s. ISBN 978-80-7050-569-4. Dostupné také z: http://www.ndk.cz/platter-cz
SDRUK. 2007. Zmapování situace digitalizace v ČR [online]. [cit. 2013-06-02]. 18 s. Dostupné z: http://www.sdruk.cz/data/xinha/sdruk/zmapovani_situace_digitalizace_v_cr.pdf
SHENTON, Helen. [2004]. Digital versus print as a preservation format - expert views from international comparator libraries. In: The British Library - The world's knowledge [online]. London: British Library, [2004] [cit. 2012-01-06]. Dostupné z: http://www.bl.uk/aboutus/stratpolprog/ccare/introduction/digital/digitalvprint/index.html
SCHORGE, Walter. 2011. Digitalizace jako součást procesu poskytování informačních služeb v Národním technickém muzeu. Knihovna plus [online]. 2011, č. 1 [cit. 2013-07-07]. ISSN 1801-5948. Dostupný z: http://knihovna.nkp.cz/knihovnaplus111/schorge.htm
SMUTNÁ, Kateřina. 2013. Otevřený dopis k aplikaci "Acta Publica" [online]. Moravský zemský archiv, Brno 2013 [cit. 2013-06-20]. Dostupné z: http://www.mza.cz/otevreny-dopis-k-aplikaci-acta-publica
ŠIMKO, Viliam, Michal MÁŠA a David GIARETTA. 2009. Long-term digital preservation of a new media performance:"Can we re-perform it in 100 years?" In International Preservation News. No. 47, 2009, p. 32-34. ISSN 0890-4960. Dostupné také z: http://www.casparpreserves.eu/Members/metaware/Papers/long-term-digital-preservation-of-a-new-media-performance-can-we-re-perform-it-in-100-years/at_download/file.pdf
WALKER, Alison. 2007. Preservation. In: BOWMAN, J. H. (ed.). British Librarianship and Information Work 2001-2005. Hampshire: Ashgate Publishing Limited, 2007. 18 s. (501-518). ISSN 1752-556X. ISBN 978-0-7546-4778-2. Dostupné také z: http://www.bl.uk/blpac/pdf/bliwb.pdf
WEBARCHIV, 2007. Charakteristika WebArchivu [online]. Praha: Národní knihovna ČR, 2007 [cit. 2013-05-30]. Dostupné z: http://webarchiv.cz/wainfo/
[1] Born-digital dokumenty jsou běžné označení pro dokumenty, data nebo informace, které vznikly v digitální podobě a nemají, nikdy neměly a není plánováno, že by měly fyzickou (např. tištěnou) podobu.
[2] Např. dokumenty z 19. století z českých knihoven byly zpřístupněny online přes systém Kramerius až v roce 2003. Psohlavec uvádí ve svém článku ještě v roce 2004 [PSOHLAVEC, 2004], že CD disky jsou hlavním způsobem zpřístupnění dat z projektu Manuscriptorium.