Nacházíte se: Úvod » Archiv čísel » 1/2014 » České paměťové instituce a digitální data – historický exkurz, současný stav a předpokládaný vývoj II.
Úvodní část textu a literatura k celé práci je dostupná v rubrice Studie/články v Duze číslo 4/2013. Závěrečná třetí část bude zařazena opět do rubriky Informace pro knihovny v Duze číslo 2/2014.
Časové vymezení: od roku 2002 do roku 2011
V druhé fázi se z digitalizace jako aktivity několika inovativních jedinců a projektů stává záležitost širšího významu. Začala býti považována jako po technické a procesní stránce zvládnutý proces s mnoha best practices a později i jako způsob ochrany dokumentů, které jsou ohroženy bezprostřední degradací. Digitální forma dokumentů byla považována za vhodnou pro zpřístupnění, ale jako archivní médium byly digitální objekty považovány za: „nestabilní, nedospělé, nevyzkoušené ve větším množství a nespolehlivé z dlouhodobého hlediska“ [SHENTON, [2004]]. První publikace, která na základě výzkumu uváděla, že digitalizace je odpovídající formou reformátování, stejně jako např. mikrofilmování, byla zpráva americké knihovnické asociace ARL (The Association of Research Libraries) z roku 2004 s názvem Digitization as a preservation reformatting method [ARTHUR, 2004]. Tato zpráva působila jako „urychlovač“ procesu přijetí digitalizace jako formy ochrany. V následujících letech začala být digitální data považována za odpovídající náhradu fyzické předlohy i pro budoucnost [WALKER, 2007, s. 514]. Tento proces byl v českém prostředí urychlen povodněmi v roce 2002. Povodně znamenaly obrovský impuls pro rozvoj digitalizace novodobých periodik a rozvoj infrastruktury, jako způsob záchrany a zpřístupnění poničených fondů.
Internetové prostředí pomalu měnilo očekávání klientů paměťových institucí, ale digitalizace a sklízení digitálního obsahu bylo zatím spíše než na služby masám čtenářů a návštěvníků zaměřeno na úžeji vymezené skupiny badatelů. Selektivní digitalizace v knihovnách i archivech se zaměřovala na nejvíce ohrožené dokumenty – „digitalizace pro ochranu“. Zlomem pro české prostředí bylo vytvoření open source content management systému pro zpřístupnění digitálních dat (digitální knihovny) Kramerius pro novodobé dokumenty. V roce 2003 vznikl i dnešní systém Manuscriptorium, a to jako otevřený katalog historických fondů a posléze i jako digitální knihovna s digitálními dokumenty pod názvem Memoria. Ve druhé fázi působí v oblasti knihoven již více digitalizačních center, digitalizační centrum NK ČR bylo již jedním z mnoha - vedle KNAV, MZK, Moravskoslezské vědecké knihovny v Ostravě apod. Podobně vznikala digitalizační centra v archivech a muzeích.
Hledisko ochrany formou náhrady fyzického dokumentu za digitální rezonovalo v archivech, které přistoupily k digitalizaci velmi využívaných matričních knih. Reálné výsledky přinesla digitalizace až během roku 2008, kdy jako první zveřejnil matriky v digitální podobě Státní oblastní archiv v Třeboni [ČGHSP, 2011]. Systematicky se začalo v archivech digitalizovat oproti knihovnám dost pozdě. Farkas uvádí, že NA ČR měl až do roku 2005 nedostatečné vybavení a v roce 2005 bylo zdigitalizováno 2500 skenů kulturních památek pouze díky darovanému skeneru. Problémy byly i s nedostatkem zkušeného personálu. V roce 2009 se digitalizovaly významné fondy (fotoarchiv K. H. Franka), později např. sčítání a evidence obyvatelstva [FARKAS, 2012]. Na rozdíl od knihoven nefungovala (a nefunguje) v českém archivnictví centralizace financování a procesů digitalizace, možnosti uložení v jedné instituci apod., jako to umožňoval např. VISK 7. I v oblasti muzeí a galerií se začínaly prosazovat elektronické systémy pro správu sbírek, provádělo se bezpečnostní snímkování. Každá publikace výstavního katalogu už znamenala generování řady digitálních obrazů sbírkových předmětů, galerie stále ale nepomýšlely na jejich ukládání ani dlouhodobé uchování.
Zároveň s digitalizačním úsilím se objevovaly nové projekty zabývající se tzv. born-digital dokumenty, tedy dokumenty, které od okamžiku vzniku existují pouze v digitální podobě. Jednalo se o archivaci webu v projektu NK ČR WebArchiv; uložení kvalifikačních prací v digitálních repozitářích na univerzitách; oborové repozitáře a digitální knihovny – např. Národní lékařská knihovna začala shromažďovat články v elektronické podobě od vydavatelů nebo sběrem z Internetu.
Významnou změnou v tomto období procházely archivy. Začaly vznikat projekty směřující k elektronizaci veřejné správy, budovaly se jednotlivé komponenty e-governmentu, stále častěji se mluvilo o bezpapírové státní správě. Země jako Velká Británie, Německo a další dospěly záhy k závěru, že je nutné vytvořit podmínky pro dlouhodobé uložení digitálních dokumentů. Že šlo o nutnost i v českém prostředí bylo jasné z nárůstu počtu digitálních dokumentů ve státní správě, nařízení používání elektronických systémů spisových služeb (novela archivního zákona z roku 2009), využívání datových schránek apod. Pokud státní správa zažívá podobný typ změny, je nutno provést změnu také v koncepci zpracování a uložení nových typů dokumentů tak, aby digitální byl celý životní cyklus dokumentů a plně tak odpovídal životnímu cyklu klasických papírových archiválií. Tuto proměnu se snažil postihnout a řešit NA ČR spolu s Oddělením archivní správy MV ČR.
Ve světových knihovnách se stávala stále více aktuální problematika logické dlouhodobé ochrany, zvláště po roce 2005. Docházelo k reálnému nasazení a rozšíření tzv. ochranných metadat (PREMIS), instituce zároveň začaly dělat opatření ve svých procesech, které měly logické ochraně dat napomoci. Vznikaly první systémy na logickou dlouhodobou ochranu - Národní knihovna Nizozemí měla od roku 2003 funkční systém e-Depot, Národní knihovna Nového Zélandu vytvářela specifikaci systému a vlastní systém Kronos (dnešní Rosetta, zprovozněná roku 2008). Bylo jasné, že novou problematikou je nutno se začít zabývat hlouběji. Vždyť NK ČR byla v té době jednou z mála světových knihoven, která ukládala několik milionů naskenovaných stran. To znamenalo závazek do budoucna a také velké objemy profinancovaných peněz. Přitom záruka použitelnosti těchto informací v budoucnu byla minimální.
Charakteristické jsou pro toto období také mezinárodní projekty. Do evropských projektů se stále častěji zapojovaly i české instituce. Aktivní byly knihovny, které se účastnily projektů věnujících se digitalizaci a později i dlouhodobé ochraně digitálních informací. Archivy a muzea se skoro výlučně zaměřovaly na projekty digitalizace, tedy tvorbu digitálních dat, ne na jejich dlouhodobou ochranu (např. digitalizace středověkých písemností Monasterium). Zpočátku se projekty věnovaly sdílení znalostí a technických řešení, později sdílení dat a metadat. Již prostá účast tak přinášela potřebu ubírat se stejným směrem jako ostatní instituce v jiných státech, tedy adopce standardů jak pro proces digitalizace, tak pro tvorbu metadat. Ukázalo se to například v projektu TEL (The European Library) a později v Europeaně, které mj. agregují metadata ze spolupracujících digitálních knihoven. České knihovny se po roce 2008 začaly více orientovat na využívání běžných standardů metadat (MODS, METS aj.). Podobně archivy a jejich implementace standardů MoReq/MoReq2 a pokusy o využití schématu EAD. V oblasti dlouhodobé ochrany digitálních informací byly pro české instituce určující evropské projekty z FP6 - DigitalPreservationEurope (DPE 2006-2009), Living Web Archives (LiWA 2008-2011) a sesterské projekty PLANETS (2006-2010) a CASPAR (2006-2009). Prvních dvou jmenovaných se účastnila NK ČR, projektu LiWA rovněž MZK a významně přispěly k vývoji problematiky v NK ČR, potažmo v českých knihovnách i archivech.
Financování digitalizace a správy digitálních sbírek se ve druhé fázi částečně centralizovalo, bylo lépe koordinováno a to především v oblasti knihoven a archivů. Primárně z důvodu zabránění duplicitní digitalizace stejných dokumentů v různých projektech, vznikl projekt celonárodní koordinace digitalizace, jehož výstupem je Registr digitalizace (KNAV a NK ČR). V oblasti muzeí vznikala metodická pracoviště jako CITEM, e-Museum nebo Metodické centrum pro muzea výtvarného umění, která se také snažila podporovat projekty digitalizace a ukládání dat, a projekty související s využíváním informačních technologií do administrace sbírek. Jak ukazuje příklad CITEM, byly projekty v oblasti ukládání dat v muzeích vázány na nadšení několika jedinců a při ztrátách těchto zaměstnanců nebyla zachována kontinuita. Výjimkou může být digitalizační pracoviště Národního technického muzea, které fungovalo v běžném provozu s jedním stálým zaměstnancem od roku 2002 [SCHORGE, 2011]. V knihovnách naopak vznikala oddělení, která měla digitalizaci za hlavní úkol.
Financování z českých rozpočtových zdrojů začaly nově doplňovat zahraniční granty, především evropské projekty a později tzv. Norské fondy. Evropská unie začínala podporovat digitalizaci a návazné procesy v projektech jako např. eContent Plus (2005-2008) nebo MINERVAplus, která zahrnovala i nově přistupující země EU. Řady knihoven, které dosáhly na finanční prostředky, za které bylo možno digitalizovat, se tak rozšiřovaly. Instituce si pořizovaly vlastní technologie a skenery, a/nebo využívaly dodavatele z řad soukromých firem. Významným zdrojem financí z ČR byly od roku 2000 čtyři podprogramy VISK. A to i pro knihovny z prostředí muzeí a archivů (např. Knihovna Národního muzea aj.).
Skutečná situace v digitalizaci v oblasti knihoven po roce 2005 ovšem veselá nebyla. Rozpočty na digitalizaci novodobých fondů byly snižovány, což digitalizaci zpomalilo. VISK jako hlavní zdroj podpory digitalizace měl umožnit naopak podstatné zrychlení, počítalo se i se zavedením digitalizace masové. Bohužel z původně plánovaných zdrojů na financování projektů VISK mezi lety 2000-2005 ve výši 777,6 milionů Kč, byly nakonec skutečně dostupné prostředky pouze ve výši 288,6 milionů Kč, tj. pouhých 37 % [Koncepce trvalého uchování…, 2005, s. 17]. V letech 2005-2010 byla situace obdobná, ke konci tohoto období se financí dostávalo stále méně a méně. Digitalizace v NK ČR i obecně v českém prostředí fungovala určitou setrvačností na zastaralých technologiích a v menších objemech, než bylo plánováno a potřeba. I tak byly programy VISK tahouny veškerého snažení v oblasti digitalizace po celé první desetiletí 21. století. Situace se začala zlepšovat až díky externím zdrojům financování (již uvedené Norské fondy). Celkově lze za obrovský úspěch považovat celkem 10 milionů naskenovaných stran novodobých periodik a monografií k roku 2011 v projektu VISK 7, i když možnosti zvyšovat produkci digitalizace zůstaly díky nedostatečnému financování nevyužité. Je to škoda, protože v českých institucích byl dostatek odborníků na tuto problematiku a ČR se díky dobrému začátku v 90. tých letech těšila dobré pověsti v zahraničí. Po roce 2005 nás ale začaly okolní země předbíhat v počtu naskenovaných stran i v podpoře digitalizace. Bylo to i díky pouze částečně naplněným koncepcím jako např. Koncepce trvalého uchování knihovních sbírek tradičních a elektronických dokumentů v knihovnách ČR do roku 2010, kterou vytvořila NK ČR ve spolupráci s Ministerstvem kultury ČR. Odpovídající finanční prostředky a podpora z vlády ČR se nenašly.
Otevřený katalog historických fondů a posléze také digitální knihovna s digitálními dokumenty byla vybudována v roce 2003 pod názvem Memoria. Primární zaměření bylo a stále je na rukopisy, inkunábule, staré tisky, historické mapy. Zpřístupňuje údaje o historických fondech jednotlivých spolupracujících institucí, jejich digitální obrazy i plné texty. Obsah dodává nejen NK ČR, ale také další paměťové instituce – knihovny, muzea, archivy z ČR, které digitalizují v rámci VISK 6.
Hlavní změnou v roce 2003, kterou prošla digitalizace v NK ČR, byl přechod ze SGML na XML metadata v Memorii/Manuscriptoriu a Krameriovi. Manuscriptorium začalo používat standard metadat MASTER+, ve kterém byla archivní metadata historických dokumentů vytvářena až do roku 2011. V roce 2005 se uvažovalo o zavedení schématu METS. Jako vnitřní formát databáze Manuscriptoria byl METS zaveden v roce 2007, ovšem nikdy nebyl používán jako archivní metadatový standard. Díky EU projektu ENRICH se stalo od roku 2007 Manuscriptorium platformou pro zpřístupnění a tedy sdílení dat a metadat z různých digitálních knihoven EU i dalších států. Již na začátku projektu se začalo s vytvářením metadatového standardu postaveného na TEI P5, pozdější ENRICH.DTD. Databáze digitální knihovny Manuscriptorium (archiv zůstal v MASTER+) přešla na standard TEI P5 ENRICH v roce 2009. TEI P5 ENRICH funguje dodnes jako její interní formát i formát pro výměnu dat. METS se tak v Manuscriptoriu používal pouze v letech 2007-2008. Technická metadata v digitalizaci historických dokumentů vznikala, MASTER+ jich měl ale omezené množství.
Manuscriptorium v časovém období 2003-2011 lze popsat jako úzce specializovanou vyspělou digitální knihovnu a to i v zahraničním měřítku. Lze pozorovat snahu používat standardy metadat tak, aby napomohly sdílení a agregaci informací. Určující byla účast v mezinárodních projektech. Způsob uložení dat a digitalizace se v podstatě neměnil - CD archiv stále v NK ČR fungoval a byl doplňován i po zřízení datového úložiště v NK ČR. Kontroly integrity dat nebyly aplikovány, dodavatelská firma AiP nedodávala ani kontrolní součty jednotlivých souborů, které na CD discích do NK dodávala.
Po povodních v roce 2002 začala vznikat open source SW aplikace (content management systém) Kramerius na zpřístupnění digitalizovaných dokumentů na Internetu. Bylo to na popud knihoven, které digitalizovaly v rámci VISK 7 a požadovaly možnost zpřístupnění na lokální síti nebo na Internetu namísto CD-ROM. Kramerius byl a je využíván k prezentaci digitalizovaných sbírek periodik, monografií nebo i fotografií v mnoha českých knihovnách i několika archivech a muzeích. Přímo pro Krameria vznikly v roce 2003 nové specifikace metadat („DTD monografie“ a „DTD periodika“) na bázi XML. Logicky navazovaly na DOBM SGML. Kramerius systém byl od počátku uzpůsoben na práci se zmíněnými XML DTD standardy. To se později ukázalo jeho nevýhodou, kdy byl problém používat jiná schémata nebo standardy, aniž by se muselo sáhnout k podstatné změně systému. Obě DTD se stala povinná pro VISK 7. Všechny dokumenty zdigitalizované ve VISK 7 musely být uloženy na digitálním úložišti NK ČR a také zpřístupněny v instanci Krameria v NK ČR.
Digitalizace v rámci Krameria, tedy vlastně VISK 7, se rozšiřovala díky daným standardům do více knihoven a institucí. Na program VISK 7 se začaly vázat dodavatelské firmy, které externě skenovaly. Program se stal největším zdrojem zdigitalizovaných dat v rámci paměťových institucí v ČR. Vývojem prošla i metadata a standardy obecně.
DTD monografie i periodika obsahovala technická metadata v minimalistické podobě. Cílem bylo uchovat informaci o skeneru a nastavení skenování. Administrativní metadata, ve smyslu kdo, kdy a kde obrazy a metadata vytvořil, chyběla v obou DTD specifikacích zcela. Technická metadata nebyla automatickým výstupem nějakého nástroje, který by je z obrazového souboru vyčetl, šlo o přidané údaje, které někdy nesouhlasily s realitou (nebylo kontrolováno). Technický popis již od verze DTD 1.0 byl obsažen ve třech elementech: 1. ScanningDevice (povinný) – druh digitalizace, typ, model, výrobce skeneru, použitý SW, jeho verze a výrobce; 2. ScanningParameters – rozlišení DPI, barevná hloubka, barevná škála; 3. OtherImagingInformation – verze pravidel popisu [NÁRODNÍ KNIHOVNA ČR, 2009, s. 7]. Během let se tyto elementy plnily různě, od volného textu až po strukturovaný volný text dle pravidel popisu.
Technická a administrativní metadata vytvářená jako podpora logické dlouhodobé ochrany dat, byla přidána v digitalizaci VISK 7 až od roku 2007 [HUTAŘ, 2008]. Použity byly standardy MIX a PREMIS Object. Vznikala také metadata o právech spojených s dokumentem nebo jeho částmi v podobě METS Rights. Nejjednodušší z pohledu Krameria bylo nová metadata uchovávat vedle původního DTD záznamu jako další XML soubor, tj. nerozšiřovat DTD o nové elementy. Takto byla i archivována. XML byla provázána s hlavním DTD, které obsahovalo strukturu a identifikátory. Tato aktivita byla první snahou o tvorbu a následné využití technických a administrativních metadat pro dlouhodobou ochranu v českých knihovnách, a to na dlouhou dobu. Administrativní metadata byla v Krameriovi nakonec využívána pouze na dynamickou tvorbu METS záznamů pro jednotlivé úrovně digitálního dokumentu. Aplikace Kramerius byla od roku 2008 schopna vytvořit na požádání záznam dokumentu ve schématu METS. Administrativní metadata byla od počátku myšlena jako vklad do budoucna, kdy bude potřeba dělat konkrétní operace dlouhodobé ochrany (např. migrace formátů, přesuny dat) nebo emulace na základě administrativních metadat. K tomu nikdy nedošlo.
Projekt Kramerius byl ve své době mimořádným počinem přinejmenším v rámci Evropy, jak z pohledu organizačního (sdílená aplikace zpřístupnění, sdílené standardy, možnost čerpat peníze pro malé knihovny apod.), tak hlavně z pohledu počtu naskenovaných stran. Až do roku 2011 vzniklo v rámci VISK 7 asi 10 milionů naskenovaných stran.
WebArchiv je projekt na archivaci veškerých dokumentů z domény .cz. Webové dokumenty jsou významná součást národního kulturního dědictví, která je velmi pomíjivá. WebArchiv vznikl v roce 2000 v rámci programového projektu výzkumu a vývoje „Registrace, ochrana a zpřístupnění domácích elektronických zdrojů v síti Internet“ (Ministerstvo kultury ČR). Projekt byl až do roku 2010 financován téměř výhradně z grantové podpory. NK ČR musela každoročně žádat o finance a čekat, zda je dostane, a to i přesto, že šlo vlastně o běžný provoz NK ČR zajišťovaný konkrétním oddělením. Spoluřešitelem odpovědným za informační technologie byla zpočátku MZK v Brně, externím spolupracovníkem také ÚVT Masarykovy univerzity v Brně. Od roku 2011 si NK ČR veškeré technické věci obstarává sama.
Úlohou projektu je řešení problematiky archivace národního webu, tj. bohemikálních dokumentů zveřejněných v prostředí sítě Internet – shromažďování webových zdrojů, jejich archivace a ochrana a zajištění dlouhodobého přístupu k těmto dokumentům. Provádí se kompletní archivace, tj. automatický sběr „celého“ českého webu. Souběžně probíhá výběrová archivace (na základě URL nejzajímavějších webových zdrojů vybraných na základě selekčních kritérií) a tematické archivace (určité aktuální téma, např. volby, povodně apod.) [WEBARCHIV, 2007]. Projekt je od počátku plně srovnatelný s podobnými projekty zahraničními. V roce 2006 obdržel projekt WebArchiv cenu INFORUM.
Z technického pohledu je zajímavý nárůst sklizených a archivovaných dat. První pokus o „sklizeň“ české domény .cz nedoběhl do konce, i tak se sklidilo asi 110GB dat ze 3 milionů unikátních URL. Nedokončená sklizeň v roce 2002 obsahovala již 10 milionů URL a 315GB dat. V roce 2004 byla množina sklizených dat 1.2TB [HUTAŘ, 2007], a v roce 2011 již 10TB. V roce 2012 obsahoval archiv dat celkem 65TB dat.
Monasterium je projekt na vytvoření virtuálního archivu středověkých a raně novověkých listin, který vznikl v roce 2002 v Rakousku. Díky zájmu o dokumenty z dalších zemí střední Evropy se projekt rozrostl o okolní země. Instituce do projektu přispívají dokumenty zdigitalizovanými vlastními silami. Pro mnohé české archivy byla účast v projektu Monasterium jedním z důvodů, aby s digitalizací začaly. V současné době má projekt více než 100 institucionálních účastníků z 10 zemí a zpřístupňuje více než 250 tisíc individuálních dokumentů [MONASTERIUM, 2012a].
Z českých archivů se zdaleka nejvíce zapojil NA ČR v Praze, později se přidaly např. Státní oblastní archivy v Plzni, Třeboni, Litoměřicích, Zámrsku, Praze nebo Moravský zemský archiv v Brně, Zemský archiv v Opavě a některé církevní instituce (Arciopatství benediktinů v Břevnově, Cisterciáci z Vyššího Brodu) nebo univerzity (Archiv Univerzity Karlovy). Své dokumenty poskytly také Archiv Pražského hradu a Archiv Národního muzea. V letech 2006-2011 bylo pro potřeby projektu Monasterium v českých archivech zdigitalizováno 25 060 listin, z toho 19 200 v Národním archivu [KŘEČKOVÁ, 2012].
S účastí v projektu se pojí povinnost dodržovat určité standardy digitalizace a tvorby metadat. Metadata jsou postavena na schématech Charters Encoding Initiative (CEI) a EAD. Za obsah a kvalitu zodpovídá dodávající instituce [MONASTERIUM, 2012b]. Projekt poskytl českým archivům možnost konzultovat a porovnávat digitalizační aktivity, standardy, postupy s podobnými zahraničními pracovišti, což bylo a je výrazné pozitivum. Knihovny tento proces prodělaly mnohem dříve. Uložení dat z digitalizace si jednotlivé archivy řešily samy, kooperace ve smyslu sdílení technologií nebo ukládání na jedno centrální úložiště byla minimální. Řešení byla různorodá, od běžných datových úložišť až po uložení dat na externích harddiscích nebo optických discích v malých institucích.
V roce 2004 založily Island, Knížectví Lichtenštejnsko a Norské království Fond Evropského hospodářského prostoru. Norské království založilo i vlastní, Norský fond, na rozvoj spolupráce a výzkum v mnoha odvětvích pro nové členské země EU. Jmenované země nejsou členy EU, neposkytují tedy finance přes evropské programy a dotace. Podpora je rozdělena do 2 období, první v letech 2004-2009, druhé pro léta 2009-2014. V roce 2005 se tak naskytla možnost českým kulturním institucím zpracovat projekt do programu Finančních mechanismů Evropského hospodářského prostoru a Norska v prioritní oblasti „Záchrana evropského kulturního dědictví“. Příležitosti využila např. NK ČR, Městská knihovna v Praze nebo Archiv hlavního města Prahy. Zvláště pro dvě poslední jmenované instituce byly finance z Norských fondů příležitostí vybudovat digitalizační centrum a začít s digitalizací jako s běžnou, ne ad hoc, činností. V NK ČR bylo v letech 2007-2009 díky Norským fondům zdigitalizováno, metadaty opatřeno a zpřístupněno 2,4 milionů stran monografií. Projekt Záchrana neperiodických bohemikálních dokumentů 19. stol. ohrožených degradací papíru dostal finanční dotaci ve výši 999 960 Euro [ČESKO. MINISTERSTVO FINANCÍ, 2011]. Vše probíhalo podle pravidel a standardů VISK 7, výsledné dokumenty tedy byly ihned přístupné v digitální knihovně Kramerius.
Z Norských fondů byl financován také projekt HISPRA (HIStorická PRAgensia, 2007-2010), v rámci kterého v Městské knihovně v Praze probíhala digitalizace pragensií. Celková dotace byla 403 552 Euro [ČESKO. MINISTERSTVO FINANCÍ, 2011]. Knihovna měla zkušenosti s jednotlivinami digitalizovanými v rámci VISK 7 (Pražská bible např.), chybělo ale pracoviště, kde by sama knihovna mohla vlastními silami a ve velkých objemech realizovat digitalizaci dokumentů. Cílem bylo vybudovat a vybavit digitalizační pracoviště, vytipovat a zdigitalizovat dokumenty a také je zpřístupnit veřejnosti. To vše se podařilo, zdigitalizováno bylo asi 450 tisíc stran dokumentů. Digitalizace se soustředila především na svazky poškozené degradací papíru a na dokumenty jedinečné svou povahou [MĚŘÍNSKÁ, 2010]. Data byla ukládána/zálohována pouze ve file systému na 3 různých serverech pro větší bezpečnost. Standardy obrazových dat a metadat odpovídaly až na malé odchylky specifikacím VISK 7. Dnes je digitalizace běžnou součástí chodu knihovny.
Dalším příjemcem financí z Norských fondů byl Archiv hlavního města Prahy a jeho projekt Ad Fontes. Probíhal v letech 2007-2010 a byl dotován částkou 483 591 Euro [ČESKO. MINISTERSTVO FINANCÍ, 2011]. Celkové náklady dosáhly 778 855 Euro, rozdíl byl hrazen magistrátem hl. města Prahy. Cílem byla záchrana nejvzácnějších historických dokumentů města Prahy pomocí digitalizace a jejich zpřístupnění. Bylo vybudováno nové digitalizační centrum, probíhala školení pracovníků a také samotná digitalizace a zpřístupnění na Internetu. Během prvních 3 let bylo digitalizováno asi 230 tisíc stran matrik, rukopisů, listin a fotografií. V projektu byl používán vlastní (proprietární) metadatový standard IDA AMP, který obsahuje popis digitalizace i vlastní archiválie. Vytvářena jsou i technická metadata ve schématu MIX (kontrolní součet, identifikátor, ICC profil, rozměry, barevný model, formát, údaje o skeneru, barevný profil, popis transformací a datum skenování). Uložení dat bylo součástí projektu, využívány byly servery a disková pole a také archivační zařízení na optická média UDO II (WORM disky). Důraz byl kladen na autenticitu dokumentů a jejich integritu, která byla kontrolována pomocí kontrolních součtů, které byly součástí metadat [HANOUSEK, 2010, s. 33-35]. Norské fondy tedy pomohly archivu vybudovat pracoviště digitalizace, vyvinout vlastní postupy digitalizace a stát se referenčním pracovištěm pro další archivy.
Pěknou ukázkou sdíleného projektu na digitalizaci a zpřístupnění matrik v českých archivech může být projekt Acta Publika Moravského zemského archivu v Brně. Webová stránka zpřístupňuje matriky také z oblastních archivů v Praze a Plzni. Projekt se připravoval se od roku 2007 a byl financován jak z EU, tak z rozpočtu archivu. Z prostředků EU bylo financováno diskové pole, záložní páskové mechaniky a úkon skenování matrik. Ostatní provozní náklady byly a jsou po celou dobu hrazeny z vlastních prostředků archivů [SMUTNÁ, 2013]. Podobné systémy na zpřístupnění matrik a jiných archiválií začaly na sklonku prvního desetiletí budovat ve více českých archivech, nejčastěji těch oblastních nebo městských, např. SOA Třeboň a jejich portál.
Až do roku 2005 byl obecně kladen hlavní důraz na zpřístupnění analogových dokumentů pomocí digitalizace. Otázka ochrany vlastních digitálních dat nebyla příliš brána v potaz. O zranitelnosti a problémech s digitálními daty se vědělo a s různými typy poškození, nekompatibilitou formátů apod. se instituce setkávaly. Základní formulaci problémů a zásady pro ochranu digitálních objektů, jako zálohy, kontrola integrity, HW migrace apod., lze najít ve výzkumném záměru VaV Vytvoření virtuálního badatelského prostředí pro zpřístupnění a ochranu digitálních dokumentů, který řešila NK ČR v letech 2004-2010. Byla popsána i rizika vyplývající ze zastarávání SW a HW a možná řešení pro NK ČR. Uvedena byla migrace, emulace a technologické muzeum [KNOLL, POLIŠENSKÝ a UHLÍŘ, 2005, s. 9]. I přesto nebyla problematika dlouhodobého ukládání a ochrany digitálních dat dostatečně akcentována, ve výše uvedeném VaV tato část nebyla nakonec řešena. Finanční prostředky na tuto činnost nebyly dostatečné. I když v NK ČR a NA ČR vznikla specializovaná oddělení, jejich činnost spočívala spíše v popularizaci, přípravě standardů dat i metadat.
Ačkoli se Česká republika připojila k deklaracím směřujícím k budování informační společnosti a na jejich základě vznikaly různé dlouhodobé koncepce, v praxi to v paměťových institucích neznamenalo vyjádření závazku státu pečovat o digitální data a digitální reprezentace sbírek a publikací. Česká republika neměla jasně formulovanou strategii dlouhodobé archivace ani v knihovnách, ani v ostatních paměťových institucích. Stěžejní iniciativou, ke které se ČR prostřednictvím vlády a NK ČR hlásila, byla evropská iniciativa i2010: Digitální knihovny – Evropská informační společnost pro růst a zaměstnanost, představená na jaře 2005. Jedním z cílů i2010 byla dlouhodobá ochrana dat ve smyslu dlouhodobého a časem neomezeného zpřístupnění zdigitalizovaných dokumentů [EUROPEAN COMMISSION, 2005a]. Z této části vycházela i Koncepce trvalého uchování knihovních sbírek tradičních a elektronických dokumentů v knihovnách ČR do roku 2010, publikovaná v roce 2005 Ministerstvem kultury a NK ČR. V koncepci se poprvé mluví o potřebě dlouhodobé ochrany digitálních dokumentů (digital born i zdigitalizovaných) v českém prostředí. Koncepce jasně říká, že v podobě digitálních objektů nám uniká velká část kulturního dědictví, které není nikde fixováno a je tímto ztraceno. Konstatuje se v ní také, že i digitální objekty je nutné ochránit (rozuměj získávat a ukládat). K tomuto účelu bude nutné nakoupit a zprovoznit robustní LTP systém. Centrální datové úložiště bylo v roce 2006 sice v NK ČR vybudováno a dále rozvíjeno, ale vždy z ad-hoc přidělených peněz z Ministerstva kultury, když situace uložení dat v NK ČR začala být kritická. Šlo pouze o HW vrstvu, žádný SW na správu digitálních dat, nebo LTP systém, nad ním neexistoval.
V NK ČR vznikl v roce 2005 v NK ČR Referát pro digitální knihovnu NFS z něhož později vznikl Odbor digitální ochrany s deseti plnými úvazky. Jeho pracovníci se podstatně podíleli na uvádění zásad dlouhodobé ochrany digitálních dat do stávající praxe NK ČR a ostatních knihoven pomocí zavádění procesů, tvorbou standardů, účastí na mezinárodních konferencích a projektech. Odbor se stal do jisté míry knihovnickým metodickým centrem pro oblast „digital preservation“. V archivnictví se řešením nastíněných problémů koncepčně zabýval od roku 2004 NA ČR a Oddělení archivní správy při Ministerstvu vnitra, např. prosazováním technických standardů (formáty, metadata), publikací metodik a také legislativy akcentující proměny a manipulaci s digitálními dokumenty. Pracovníci NA ČR jako jedni z prvních v českém prostředí pojmenovali problém logické dlouhodobé ochrany digitálních dokumentů. První úvahy a výzkumné projekty o digitální archivaci v NA ČR proběhly již mezi lety 2001-2004. Konkrétní podobu pak úvahy dostaly v usnesení vlády č. 11 ze 7. ledna 2004, ve kterém vláda uložila ministru vnitra zpracovat projekt dlouhodobého uchovávání a zpřístupňování dokumentů v digitální podobě. Naléhavost řešení dlouhodobého uchovávání byla zdůrazněna rozvojem e-governmentu, který není bez vyřešení digitální archivace možný. Existenci digitálního archivu předpokládá například Národní plán zavedení elektronického zadávání veřejných zakázek pro období let 2006 až 2010 (viz vládní usnesení č. 500 z 10. května 2006). V roce 2005 vzniklo specializované oddělení při NA ČR [KUNT, 2006, s. 33]. Nově založený tým připravil podklady pro výběrové řízení na zpracovatele projektu digitálního archivu. Vybraná firma ICZ v roce 2008 představila podrobný technologický projekt [BERNAS, 2009]. Tento projekt byl prvním uceleným popisem architektury a funkcionality digitálního archivu pro logickou dlouhodobou ochranu digitálních dat v českém prostředí. Bohužel vlastní výběrové řízení na dodávku digitálního archivu bylo vyhlášeno až v roce 2012 (resp. 2013 opakovaně).
Přístup českých archivů k digitálním datům a jejich dlouhodobé ochraně byl koncepčně stejný, využívání formátů metadat, normy OAIS apod. Rozdíl byl v tom, že NK ČR vždy počítala s tím, že nebude omezovat formáty dat, které do digitálního archivu bude ukládat. Naproti tomu archivy od počátku počítaly a počítají s omezenou množinou formátů, které původci budou moci produkovat a budou se poté do digitálního archivu ukládat. Viz např. Vyhláška č. 191/2009 ze dne 23. června 2009 o podrobnostech výkonu spisové služby. Oba přístupy jsou ve světě běžné. V NK ČR byla v tomto období konsolidována HW rovina archivace, bylo vybudováno virtuální prostředí, nastaveno zálohování, využity páskové knihovny a HSM technologie. Administrátoři obsahu neměli dostatečné nástroje pro management dat archivu, ale bitová rovina ochrany byla zajištěna násobnými zálohami na různých mediích. Přesto docházelo ke ztrátám dat způsobených především neschopností vynutit kvalitní práci dodavatelů služeb nebo nedostatečnou kvalifikací zaměstnanců.
Z pohledu kontroly integrity digitálních objektů je velmi důležité, že od roku 2007 byla data vytvářená v projektu Kramerius (VISK7) standardně obohacována o kontrolní součty (MD5), ty tak byly součástí archivního balíčku. Bylo tak možné při jakémkoliv přesouvání dat automaticky a hromadně kontrolovat integritu souborů před a po přesunu porovnáním původního a dopočítaného kontrolního součtu. Tento přístup lze využít i na pravidelné kontroly uložených dat v úložišti/archivu. Podmínkou je, aby první kontrolní součet byl vygenerován co nejblíže okamžiku vzniku digitálního objektu, na zcela jistě bezchybných souborech a aby tento součet byl součástí buď balíčku dat, nebo byl zapsán v metadatech ke konkrétnímu objektu. Data vytvořená ve VISK 7 do roku 2007 kontrolní součty neměla, součty byly vytvářeny až při okamžiku uložení do archivu. Docházelo tak k situacím, kdy vznikl kontrolní součet pro soubor pro dokument, který byl z přesunu z digitalizace do archivu poškozený. K digitalizovaným historickým dokumentům z projektu Manuscriptorium začala firma AiP Beroun dodávat kontrolní součty po naléhání ze strany NK ČR až v roce 2010.
Ve většině institucí nebyla velká část digitalizovaných dat na archivaci připravena. Chyběly průběžné validace obsahu (prázdné obrazové soubory 0Kb apod.), dokumenty nebyly kompletní (chybějící OCR nebo jednotlivé obrazy), chyběly validace formátů a kompletnosti dat. Data byla mimo kontrolu vlastníků, po dlouhá léta zůstávala v provizorních prostorách pracovních úložišť. Často chyběl základní přehled, co kde je, kdo to tam dal a kdy, v jakém je to stavu. O překvapení a ztráty dat, které vyjdou najevo i po několika měsících, nebyla v tomto prostředí nouze. Jako kritický problém se ukázalo oddělení managementu archivních metadat od metadat v digitálních knihovnách. Správci archivu neměli nástroje na to, aby aktualizovali metadata v archivu stejně, jako byla měněna v digitální knihovně, což byl při až 10 milionech skenovaných stránek velký problém. Existovaly tak dvě verze popisných metadat, nedaly se validovat proti sobě.
Management dat v podstatě neexistoval, byl problém něco najít. Audit procesů, které se se soubory děly, neexistoval taktéž. Nad daty a metadaty ve valné většině případů neexistoval žádný SW na jejich správu. Např. v NK ČR logickou správu dat nahrazovala excelová tabulka. Ta obsahovala identifikátory dokumentů (např. číslo zakázky), jejich lokace, lokaci souvisejících metadat. To umožnilo „najít“ konkrétní dokument. Správa dat v archivu NK ČR byla po celou dobu odkázána pouze na náhradní řešení. Dokumenty byly na páskách „zamrzlé“, ve stavu, v jakém byly před 10 lety uloženy, ačkoli bylo žádoucí obohacovat archivní balíčky o nové informace. Tento způsob archivace dat poskytoval správcům jen velmi omezené možnosti analýzy obsahu úložiště či kontroly kvality dat a metadat [FOJTŮ, HUTAŘ a MELICHAR, 2011, s. 75]. Z tohoto je zřejmé, jakým rizikům byla data v úložišti NK ČR vystavena. Podobná situace byla ve většině českých paměťových institucí.
Situace paradoxně byla rozdílná na mnoha univerzitách, které začaly využívat Digital Asset Management (DAM) systémy jako DSpace, Fedora, DigiTool apod. Tyto systémy jim pomohly se správou dat a metadat, jejich procesním zpracováním, auditem, kontrolou, centrálním vyhledáváním apod. DAM systémy podporují mj. zavedené standardy metadat, komplexní objekty, verzování dokumentů i metadat, možnosti vytváření virtuálních sbírek, správu a sledování přístupů, autorizací apod. Tento přístup bohužel nefungoval v běžných knihovnách nebo archivech, a to ani v národních institucích, které ukládaly miliony obrazových a jiných souborů na diskových polích pouze ve file systému. Jednou z výjimek byla Státní technická knihovna v Praze, která nasadila systém na správu repozitáře Invenio. To vše v době, kdy velké zahraniční instituce měly fázi DAM systémů za sebou a aktivně řešily logickou dlouhodobou ochranu a budování/nákup Long-term preservation systémů. NK ČR a NA ČR chtěly přeskočit „DAM fázi“ a začaly hledat řešení v podobě dospělého LTP systému. Šance na získání se naskytla v projektech Národní digitální knihovna (NDK) a Národní digitální archiv (NDA), které se připravovaly od roku 2008.
Na začátku této fáze byla již patrná snaha přebírat existující standardy metadat, nebo se jimi alespoň inspirovat (MASTER, DIEPER, NISO MIX v Manuscriptoriu v NK ČR). Po roce 2005 se ve světě a později i v digitalizaci v ČR začínaly používat rozšířené mezinárodní standardy metadat (METS, PREMIS, MIX, MODS, případně EAD, TEI P5 aj.). Tato změna byla patrná v prostředí knihoven, méně již v archivech a muzeích. Velká část z těchto nových standardů metadat cílila na dlouhodobou ochranu. V Krameriovi a Manuscriptoriu byla technická a administrativní metadata omezená. Chyběly základní administrativní údaje, jako datum skenování, datum tvorby metadat, odpovědnost za digitalizaci i za tvorbu metadat. Rozsáhlejší, ale stále omezená, množina technických a administrativních metadat ve standardech PREMIS, MIX a METS v digitalizaci novodobých dokumentů (NK ČR a VISK 7) začala vznikat v roce 2008. Záměrem bylo začít vytvářet alespoň základní technická a administrativní metadata, která se posléze využijí v LTP systému, který NK ČR plánovala získat. V této podobě vznikala metadata do roku 2012. Tak jak vznikla v digitalizaci, se pak metadata v nezměněné podobě ukládala v archivu ve file systému. Na vstupu do archivu se žádná metadata nepřidávala, neprobíhaly žádné validace. Díky neexistenci LTP systému, který by s nimi dokázal pracovat a stavět na těchto údajích další procesy, nebyla metadata nijak využívána. Dnešní LTP systémy tento typ metadat automaticky vytvářejí na vstupu do systému. I tak byla tato změna přínosná a otevřela dveře dalšímu vývoji.
Historické fondy v této aktivitě zůstaly bokem a technická a administrativní metadata pro ochranu dat PREMIS, MIX do svých procesů nepřevzaly. Technická a do jisté míry i administrativní metadata vznikala v digitalizaci historických dokumentů sice od roku 2003 (v rámci MASTER+), ovšem s cílem poskytnutí maximálně věrného zobrazení obrazů uživateli. Chyběly tak např. kontrolní součty, velikost jednotlivých souborů aj. V prostředí českých archivů se v zahraničí hojně rozšířené EAD schéma masově neujalo. Od roku 2006 se používá tzv. Standard pro ukládání a zasílání archivních pomůcek druhu inventář a dílčí inventář v digitální podobě. Pro matriky existuje obdoba. V letech 2007-2009 vznikla mj. analýza shody českého standardu pro ukládání archivních pomůcek a EAD a také obsáhlé překlady relevantní k EAD. „Z analýzy vyplynulo, že český technický standard je velmi kvalitní a vzhledem k tomu, že již při jeho vzniku se přihlíželo k standardu EAD, bude možné EAD implementovat.“ [NÁRODNÍ ARCHIV, 2009, s. 2] Český standard bude ponechán a vedle něj paralelně vznikne standard odpovídající EAD.
Přibližně v polovině tohoto období začala EU podporovat projekty zabývající se problémy dlouhodobé ochrany. Projevilo se to v šestém a sedmém rámcovém programu (FP6 a FP7), kde uspěly projekty zaměřené na výzkum (CASPAR, PLANETS, SHAMAN, KEEP, SCAPE) a popularizaci problémů (DigitalPreservationEurope) dlouhodobé ochrany. Zvláště některé z nich znamenaly pro knihovny i pro celou českou komunitu zabývající se ochranou digitálních dokumentů významný posun. Takovým projektem byl DigitalPreservationEurope (DPE, 2006-2009), kterého se účastnila NK ČR. Cílem účasti bylo získat zkušenosti a aplikovat jeden z cílů projektu, tj. zvýšení povědomosti o problému dlouhodobé ochrany, v ČR. Díky DPE se pracovníci NK ČR dostali do komunity odborníků, kteří se logickou ochranou digitálních dat reálně zabývali ve svých institucích. NK ČR tak měla možnost účastnit se řešení aktuálních problémů na mezinárodní scéně. Účast v DPE také vyústila ve spolupráci se dvěma dalšími komunitami okolo evropských projektů CASPAR a PLANETS. V říjnu 2008 proběhl v NK ČR týdenní workshop WePreserve/DRAMBORA, ve spolupráci s odborníky z výše jmenovaných projektů. Workshop měl velký ohlas v komunitě českých paměťových institucí. Během projektu DPE v NK ČR bylo mj. publikováno množství studií v českém jazyce. Vznikla také publikace o plánování digitálních repozitářů PLATTER [ROSENTHAL, BLEKINGE-RASMUSSEN a HUTAŘ, 2009]. V rámci projektu DPE také probíhal vývoj metodiky a nástroje na audit repozitářů DRAMBORA. Vývoje a testování se také účastnili pracovníci NK ČR, jejíž repozitář byl v roce 2007 auditu podroben s výsledkem 65 vážných rizik. Právě díky projektu DPE začala problematika ochrany digitálních dat na půdě NK ČR dostávat pevnější obrysy. Testovaly se nástroje, metodiky a byly zaváděny nové procesy v digitalizaci i digitálním archivu.
Jistou dobu se problematikou dlouhodobé archivace zabývalo české sdružení CIANT (International Centre for Art and New Technologies), které se zaměřilo především na výzkum v oblasti archivace audiovizuálního obsahu a umělecké produkce, nových médií atd. CIANT byl partnerem EU projektu CASPAR. V rámci řešení projektu vznikla aplikace CIANT artistic testbed, jejímž cílem bylo ukázat, že lze pro dlouhodobou archivaci popsat a uchovat umělecké výkony využívající nová média [ŠIMKO, MÁŠA a GIARETTA, 2009].
Období 2003-2011 bylo typické rychlým vývojem v technologiích uložení dat, které české paměťové instituce využívaly různě. Instituce se lišily jak v dostupnosti odborných IT pracovníků, tak v potřebách, které se odvíjely od množství a typů ukládaných dat. Velké instituce se z různých grantů a projektů dostaly k aktuálním technologiím, malé instituce většinou ne. Ani v tomto období se neřešila problematika uložení digitálních dat kulturních institucí koncepčně. Každá instituce si tak budovala vlastní úložiště, svými prostředky, čerpala ze svých zkušeností; spolupráce nebo případná centralizace, které by se nabízely, byly naprosto minimální. Finance na budování digitálních repozitářů nebyly většinou součástí rozpočtů organizací, žádalo se o granty, projekty a ad hoc finance. I velké instituce měly často problémy být odborných partnerem a protějškem komerčním firmám, které jim dodávaly technická řešení a služby. Tento problém vyústil ve zvýšené snahy o vybudování funkčního IT oddělení s relativně dobře zaplacenými odbornými pracovníky, kteří by poskytovali zázemí pro procesy uložení dat, digitalizaci a později dlouhodobé ochrany dat (NK ČR, NA ČR, KNAV, MZK). Problematické to bylo v malých institucích, které nedosáhly na projekty a neměly možnost pracovníky zaplatit. Data tak často existovala pouze v jedné off-line kopii, správa a kontrola dat neprobíhala. V tomto období docházelo ke ztrátám dat, které se nevyhnuly ani velkým institucím.
Došlo k nárůstu kapacit pevných disků a zároveň k poklesu ceny za 1MB úložného prostoru. Velké objemy dat se začaly ukládat na disková pole, na magnetické pásky nebo na kombinaci obou. Vývoj nakonec směřoval k tomu, že disková pole většinou byla (a stále jsou) používána na uložení dat, která je potřeba mít rychle dostupná (např. uživatelské kopie a metadata) a archivní data jsou uložena v páskových knihovnách, např. s technologií LTO. Nevýhodou pásek zůstává delší dostupnost dat, díky sekvenčnímu přistupovaní k datům. Výhodou je kapacita, která se v dnešní době rovná hodnotě 3TB na jednu pásku, a také energetická nenáročnost.
Podobným vývojem prošla i např. NK ČR. Objem dat projektů Manuscriptorium, Kramerius a WebArchiv byl již takový, že nemělo smysl ukládat je odděleně. V roce 2007 bylo zprovozněno nové Centrální datové úložiště. Šlo o systém IBM DS4800 s páskovou knihovnou, který byl umístěn v Hostivaři. V roce 2009 přibyla další pásková knihovna v Klementinu. Všechna data NK ČR tak byla archivována na dvě pásky LTO4 WORM na dvou geograficky vzdálených lokalitách. [KNOLL, POLIŠENSKÝ a UHLÍŘ, 2009, s. 5] Archiv CD disků s daty z digitalizace historických fondů byl v roce 2010 na úložiště převeden. Optické disky přicházející do NK ČR v rámci povinného výtisku byly i nadále archivovány ve fyzickém archivu. Rutinní převod disků z povinného výtisku na datové úložiště probíhal od roku 2007, byl ale často přerušován z nedostatku financí nebo úložného prostoru na úložišti.
Ne všechny instituce ale ukládaly archivní data na online serverech a úložištích. Spousta menších nebo středně velkých institucí stále ukládala data z digitalizace na off-line optická nebo magnetická média. Šlo o finančně nejméně náročnou možnost, média se dala kupovat v případě potřeby. Pěkně je to vidět v průzkumu digitalizace z roku 2009, v jehož rámci bylo osloveno 12 krajských knihoven, 3 městské a 7 specializovaných. Odpovědí se vrátilo 18, tj. 82 %. DVD nebo CD k archivaci dat používalo 9 z oslovených knihoven, pásky nebo externí harddisk 2 knihovny, disková pole pouze 4 knihovny [SDRUK, 2007, s. 9]. Např. NTM mělo archivní data dvakrát na CD, jednou na SDLT pásce. On-line digitální úložiště bylo nasazeno až v roce 2010 (2 kopie na discích, 1 na LTP pásce). Nevýhodou CD archivu byla nulová přístupnost pro uživatele a nutnost neustálých kontrol a kopírování na nová média [SCHORGE, 2011].
Datové úložiště ovšem samo o sobě není zárukou odpovídající správy dokumentů. Dokáže ukládat data do file systému, má základní nástroje na zálohování (např. TSM/HSM). Pokud ale není k dispozici systém na správu dat a metadat s připojenou databází, který by uchovával informace o integritě dat; o lokaci souborů; o změnách; umožnil vyhledávání apod., je to velké ohrožení celé snahy o ochranu dat. Správa je pak v okamžiku, kdy má instituce miliony naskenovaných stran (souborů), v podstatě nemožná.
MELICHAR, Marek; HUTAŘ, Jan. České paměťové instituce a digitální data – historický exkurz, současný stav a předpokládaný vývoj II.. Duha: Informace o knihách a knihovnách [online]. 2014, 28(1) [cit. 2024-10-11]. ISSN 1804-4255. Dostupné z: http://duha.mzk.cz/clanky/ceske-pametove-instituce-digitalni-data-historicky-exkurz-soucasny-stav-predpokladany-vyvoj-0
/*
Duha vychází 4× ročně v elektronické i tištěné podobě. Tištěná čísla ve formátu PDF naleznete zde.
|
|