Publikováno z Duha (https://duha.mzk.cz)

Digitální knihovna Filozofické fakulty Masarykovy univerzity

Od sedlackova

Vytvořeno 2012-03-16 14:27

Autor:

Zdeňka Mácková

Miroslav Bartošek

Rubrika:

Studie/články

Číslo časopisu:

1/2012

Vydáno:

2012-03-21 (All day)

Autoři citace:

MÁCKOVÁ, Zdeňka; BARTOŠEK, Miroslav

Článek poskytuje základní přehled o jednotlivých fázích budování Digitální knihovny Filozofické fakulty Masarykovy univerzity, jako je mapování publikační činnosti FF, příprava dokumentů, vlastní digitalizace, tvorba metadat a zpřístupnění dokumentů uživatelům v systému DSpace. Zachycuje také některé specifické problémy řešené v rámci projektu digitalizace publikací FF MU v jeho prvních letech vývoje. (Text vychází z diplomové práce Z. Máckové Digitální knihovna Filozofické fakulty Masarykovy univerzity obhájené v r. 2011 na FF MU v Brně).

Úvod

Akademické instituce ve světě i u nás řeší problematiku optimálního a otevřeného zpřístupnění publikační činnosti svých akademických pracovníků pro odbornou i širší veřejnost a pro tyto účely budují své institucionální repozitáře či digitální knihovny. K těmto aktivitám se připojila i Filozofická fakulta Masarykovy univerzity. Na základě rostoucí potřeby jednoho centrálního místa pro organizování, uchovávání a zpřístupňování dokumentů FF bylo rozhodnuto o vybudování digitalizačního pracoviště a komplexní digitální knihovny, která bude obsahovat publikace vydávané v historii i současnosti fakulty.

1. Projekt Digitální knihovny FF MU

Základní požadavky na elektronický systém publikací FF (tehdy nazývaný „datový sklad“) byly formulovány již v r. 2006. V něm měly být uchovávány a zpřístupňovány „datové soubory pořizované v rámci vědecké činnosti k účelům sbírkovým a dokumentačním (např. písemnosti a jiné historické prameny, dokumentace vykopávek) či jiným (podle charakteristiky oborů, např. primární materiály v literární vědě) včetně digitalizace stávajících dokumentů; … velké objemy dat různých typů (text, obraz, video, zvuk), … ale také videozáznamy, multimediální prezentace aj.).“[1] Konkrétní praktické kroky k realizaci institucionálního repozitáře se začaly podnikat od r. 2009, kdy – spíše spontánně a neformálně – vznikl interní projekt digitalizace publikací FF. Do řešení projektu se zapojilo několik jednotlivců z FF MU za technické a odborné podpory pracovníků Knihovnicko-informačního centra MU (KIC MU) při Ústavu výpočetní techniky MU (ÚVT MU).

Cílem projektu Digitální knihovny FF (DK FF MU) je:

zdigitalizovat odbornou produkci FF vydanou od vzniku fakulty (1919) do současnosti;
archivovat a zpřístupnit tyto publikace prostřednictvím digitální knihovny odborné veřejnosti;
archivovat a průběžně zpřístupňovat i nově vycházející literaturu FF;
související cíl: zmapovat publikační činnost na FF.

Obsahem DK FF MU by měly být především odborné časopisy a jiná periodika FF (periodické sborníky, sborníky z pokračujících konferencí apod.), monografické edice a monografické publikace vydávané mimo edice. V dalších fázích projektu digitalizace by měla být digitalizována publikační činnosti akademických pracovníků FF vydaná mimo MU a v plánu je digitální knihovnu rozšířit i o další dokumenty vznikající na půdě fakulty (obrazové materiály, videa aj.).

Digitalizace fakultních publikací byla od počátku pojímána jako projekt nízkonákladový. Od tohoto se odvíjelo vše podstatné – jaké budou (mohou být) zvoleny postupy a vlastní řešení, ať již v oblasti vlastního skenování či při tvorbě metadat, jak může být projekt technicky a personálně zajištěn. Práce se nemohly zadat profesionálním firmám či digitalizačním centrům, ani nemohl být zakoupen profesionální software, který používají jiná digitalizační pracoviště v ČR (např. systém Sirius, DigiTool apod.). Bylo nutné tedy jít cestou levných skenovacích zařízení a volně dostupných softwarových řešení. Za této situace bylo nespornou výhodou, že obecně mohl projekt od počátku těžit v maximální možné míře ze zkušeností získaných týmem KIC MU vedeným RNDr. Miroslavem Bartoškem, CSc. při realizaci různých digitalizačních projektů, zejména projektu České digitální matematické knihovny DML-CZ[2] a použít i nástroje v rámci tohoto projektu vytvořené – softwarové řešení pro zpracování naskenovaných dokumentů, pro metadatový popis (metadatový editor) i výsledné zpřístupnění dokumentů v digitální knihovně (upravený systém DSpace). Díky podpoře KIC MU bylo možné reálně s vytvářením digitální knihovny vůbec začít.

Zmíněný „nízkonákladový“ přístup ovlivnil i personální zajištění. (V prvních dvou letech bylo vyhrazeno pouze 0,5 úvazku pro koordinátora projektu, skenování dokumentů a pořizování základních metadat mělo být zajišťováno víceméně studenty; od října 2010 poskytla 0,5 úvazku Ústřední knihovna FF MU jako knihovnickou podporu projektu; od června do konce r. 2011 byla umožněna dohoda o pracovní činnosti pro pracovníka digitalizace.) Knihovna FF pomáhá dále projektu revizemi bibliografických záznamů digitalizovaných publikací v knihovním katalogu a zapůjčováním publikací k digitalizaci.

Přínosem bylo, že činnosti související s knihovnickou stránkou věci a praktickým řešením, „co“ digitalizovat (tj. oblast mapování publikační činnosti), oblast metadatového popisu a jiné související činnosti, byly řešeny v rámci uvedené diplomové práce. Dalším přínosem bylo také zapojení stálého pracovníka (původně studenta), který zajišťoval proces vlastní digitalizace včetně zapracovávání studentů pro skenování dokumentů.

V lednu 2012 došlo k začlenění digitalizačního pracoviště do Centra informačních technologií FF, byla přijata nová koordinátorka digitalizace na celý úvazek a vytvořen pracovní úvazek pro pracovníka digitalizace.

První část Digitální knihovny FF MU byla v beta verzi zpřístupněna pro interní testování v prosinci 2011. V objemu práce a množství dat i v porovnání s ostatními projekty je zřejmé, že se jedná o projekt mnohaletý s následným trvalým udržováním a aktualizací digitální knihovny.

2. Proces tvorby DK FF

Tvorba digitální knihovny FF je komplexní proces sestávající z mnoha dílčích úkonů od výběru publikací, přes jejich digitalizaci, metadatový popis až po import finálních dokumentů do digitálního repozitáře, který digitální objekty zpřístupňuje. Stručně zde jednotlivé kroky znázorněné na obr. 1 popíšeme. Některým z nich se budeme podrobněji věnovat v samostatných částech článku.

1. Na počátku celého procesu je nutné připravit dokumenty k digitalizaci. Je třeba rozhodnout, které dokumenty mají být digitalizovány, tyto tištěné verze dokumentů získat z patřičných zdrojů, a také určit, jak mají být digitální dokumenty organizovány ve výsledné digitální knihovně. Pro tyto účely pomáhají soupisy a přehledy různých druhů publikací FF.

2. Po získání tištěných dokumentů nastává fáze samotné digitalizace, tedy skenování dokumentů a jejich uložení v digitální podobě. Při digitalizaci publikací FF jsou naskenované dokumenty ukládány přímo ve formátu PDF. V této fázi jsou stránky dokumentů uloženy v PDF souborech pouze jako rastrové obrazy. Nelze je tedy ještě využít např. pro fulltextové vyhledávání.

3. Byla-li k digitalizované publikaci dříve vytvořena popisná metadata, je vhodné tato metadata využít pro popis digitálních dokumentů v repozitáři a sklízet je. V současné době se do metadatového editoru (bod 7), ve kterém se položky popisují, získávají bibliografické záznamy monografických publikací z knihovního systému Aleph. Do budoucna lze doufat, že zejména u nových publikací se budou moci metadata získávat i z agendy Publikace v rámci IS MU.

4. Centrálním bodem celého zpracování digitalizovaných dokumentů je metadatový editor, do kterého jsou naskenované dokumenty importovány. Skeny knih jsou do metadatového editoru vkládány jako samostatné PDF dokumenty. V případě časopisů a sborníků tvoří PDF dokumenty jednotlivé články, které se vkládají hromadně v archivním souboru formátu ZIP. Po vložení naskenovaných dokumentů do metadatového editoru jsou volány automaticky externí nástroje pro zlepšení kvality digitálních dokumentů (Scan Tailor) a pro automatické rozpoznání textu (FineReader OCR). (Blíže část 4).

5. V případě nově vycházejících publikací, které vznikají jako digitální dokumenty (tzv. born-digital), jsou příslušné balíčky PDF dokumentů pro import do metadatového editoru získávány přímo ze strany edičního referenta FF, který provádí počítačovou sazbu. Do budoucna se předpokládá získávání e-verzí i od jiných redakcí časopisů či vydavatelů. Ideální varianta předpokládá úpravu redakčních postupů prací tak, aby při přípravě nového časopiseckého čísla pro tisk vznikla automaticky i jeho digitální verze (včetně všech potřebných metadat) připravená k začlenění do DK FF MU.

6. Přibližně od roku 1995 existují některé publikace FF již v digitální podobě. Často jsou ale tyto digitální dokumenty ve velmi rozdílných formách a formátech. Pokud je možné tyto dokumenty využít (digitální podklady jsou úplné a odpovídají tištěné verzi), jsou dle potřeby upraveny, konvertovány do formátu PDF a začleněny do digitální knihovny (tzv. retro-born-digital zpracování).

7. Po vložení naskenovaných a „born-digital“ dokumentů do metadatového editoru musí být tyto dokumenty organizovány do patřičných hierarchických struktur (např. časopisy – ročníky – čísla – články). Pomocí webového uživatelského rozhraní mohou editoři metadat opatřit jednotlivé položky popisnými metadaty (viz část 5).

8. Po zpracování a popisu digitálních objektů v metadatovém editoru jsou tyto objekty spolu s popisnými, strukturálními a administrativními metadaty exportovány do digitálního repozitáře, prostřednictvím kterého jsou tato data zpřístupněna veřejnosti. V případě DK FF je jako digitální repozitář použit systém DSpace (část 6).

9. Výsledné digitální dokumenty se průběžně archivují v externím úložišti na ÚVT MU.

10. Do budoucna se počítá s exportem dat z DK FF MU do jiných systémů, jako je Registr digitalizace ČR nebo mezinárodní registry a repozitáře.

11. Systém DSpace umožňuje generování statistik o využívání repozitáře. Tyto statistiky mohou posloužit jako zajímavá zpětná vazba pro další rozšiřování DK FF a také pro zhodnocení úspěšnosti celého projektu.

3. Mapování publikační činnosti

Při plánování digitální knihovny je třeba definovat, co má být jejím obsahem, jaké druhy dokumentů bude zpřístupňovat, v jakých kolekcích budou organizovány, je nutné tedy poměrně dobře znát, co budeme digitalizovat. Situaci velmi usnadní, pokud je k dispozici přehled či soupis publikací dané instituce, jejíhož fondu se plán digitalizace týká. Na Filozofické fakultě MU je cílem zdigitalizovat veškerou produkci FF, avšak kompletní bibliografický soupis publikací vydaných od počátku vzniku fakulty, tj. od r. 1919, neexistuje a není k dispozici ani úplný archivní fond těchto publikací (ani na FF či v Archivu MU). Jedním z výstupů projektu digitalizace fakultních publikací by tak mělo být i vytvoření pokud možno co nejúplnějšího seznamu publikací FF.

Při mapování publikační činnosti FF můžeme vycházet a získávat data z několika zdrojů, žádný z nich však není úplný. Za zásadní zdroj informací pro knihy a seriály považujeme knihovní katalog Masarykovy univerzity. Předpokládáme, že by měl obsahovat bibliografické záznamy většiny publikací vydaných na FF. Problémem je, že publikace v katalogu nejsou označeny žádným příznakem či heslem, na základě kterého by z něj bylo možné získat úplný seznam publikací přináležejících k určité fakultě. Důležitým zdrojem, ze kterého můžeme čerpat informace o publikacích FF, je také databáze publikační činnosti v rámci Informačního systému Masarykovy univerzity (aplikace „Publikace“ byla zprovozněna v r. 1999). K dalším zdrojům informací patří webové stránky ústavů a kateder FF, bibliografické soupisy publikací kateder a jednotlivých akademických pracovníků, osobní bibliografie zpracovávané samotnými akademickými pracovníky, seznamy publikací vydaných Nakladatelstvím MU od r. 1993 aj. (Podrobněji kap. 2 diplomové práce).

Vzhledem k neexistenci kompletní bibliografie či databáze publikací FF, bylo nutné pro účely projektu digitalizace i budoucí organizaci dokumentů do kolekcí v digitální knihovně vytvářet pomocné pracovní soupisy dokumentů. Práce na soupisech publikací FF v podstatě odpovídají fázím digitalizace. Nejprve byl vytvořen podrobný přehled jednotlivých řad a ročníků Sborníku prací FF MU, navazujících časopisů, seznam edice Spisy Filozofické fakulty Masarykovy univerzity, upraven seznam publikací vydaných Nakladatelstvím MU v letech 1993–2009 a byly vytvořeny přehledy dalších periodik a edičních řad z produkce kateder FF.

Mapování publikační činnosti FF a vypracování přehledů fakultních publikací je prací dlouhodobou. Je třeba v ní průběžně pokračovat a snažit se dospět k co možná k nejúplnější bibliografii publikací FF. Důležité je, aby se data již někde vytvořená (ať již v knihovním katalogu či v Informačním systému MU) sdílela a činnosti se neduplikovaly.

Některá specifika edičních řad FF

Sborník prací filosofické fakulty brněnské university (Studia minora Facultatis philosophicae Universitatis Brunensis), který byl prvním větším zdigitalizovaným celkem, je z pohledu organizace v digitální knihovně poněkud komplikovaným periodikem. SPFFBU začal vycházet v roce 1952. První založenou řadou v rámci SPFFBU byla řada A, jazykovědná, do konce padesátých let přibylo ještě dalších šest řad (B, filozofická; C, historická a další). Celkově v rámci SPFFBU v průběhu let vycházelo 23 oborově zaměřených řad, které na sebe různě navazovaly, dělily se nebo prolínaly. (Schéma řad SPFFBU v příloze.)

V druhé polovině devadesátých let jednotlivé řady postupně přijaly vedle tradičních názvů ještě druhé variantní názvy (Linguistica Brunensia, Theatralia apod.), ovšem s výjimkou tří řad (S, R, L), ve kterých si sborníky nesly názvy Brno Studies in English (BSE), Brünner Beiträge zur Germanistik und Nordistik (BBGN) a Études romanes de Brno (ERB) již od počátku vydávání. Kromě toho, že nám do hry vstupuje více názvů, z nichž v určitém období je za hlavní považován jiný (záleží také na vnímání konkrétní katedry), situaci pro běžného uživatele nečiní přehlednou ani několikeré číslování jednotlivých ročníků a svazků. Specifickými případy jsou zmíněné Brno studies in English, Brünner Beiträge zur Germanistik und Nordistik a Études romanes de Brno, které si držely od počátku své vlastní číslování svazků, které si ponechaly i po přejití do sborníkových řad. (Např. BSE vol. 21 je 44. ročníkem SPFFBU a číslem S1 v rámci řady S, anglistické). Navíc tyto řady zpočátku vycházely v rámci monografické edice Spisy FF, tudíž měly přiděleno i číslo svazku v rámci této edice.

Další související záležitostí, kterou je třeba brát také v úvahu (i při organizování kolekcí v digitální knihovně z pohledu jednotlivých pracovišť), je, že např. v rámci řady K, germanisticko-anglistické vycházela lichá čísla jako anglistická (tj. Brno studies in English) a sudá jako germanistická (tj. Brünner Beiträge zur Germanistik und Nordistik). Podobně tomu bylo i v řadě I, pedagogicko-psychologické. Naproti tomu v řadě E, archeologicko-klasické se obsahově čísla striktně nedělila (tato řada by se tedy měla zobrazit jak z pohledu Ústavu klasických studií, tak z pohledu Ústavu archeologie a muzeologie).

Od r. 2008 a zejména v r. 2009 sborníky postupně přešly v režim recenzovaných odborných časopisů. S přihlédnutím ještě ke změnám a dalším komplikacím v číslování ročníků v souvislosti s přechodem sborníků na časopisy z uvedeného vyplývá, že vypořádat se s těmito specifiky v digitální knihovně k plné spokojenosti všech zájmových skupin není zcela jednoduché.

Při zakládání různých kolekcí publikací FF v digitální knihovně je třeba také brát v úvahu, že i v rámci dalších edičních řad či seriálových titulů vydávaných na FF se míchají různé druhy dokumentů. Např. v rámci určitého časopisu vyjde monografické číslo nebo v edici, která je považována za monografickou (např. Spisy FF MU), vyjde několik čísel určitého periodika či sborníků z pokračujících konferencí apod. Důležité je pamatovat také na to, že některé publikace vyšly jako součást dvou edic nebo se na vydání řady publikací podílí více pracovišť FF.

Samostatným problémem je, že na Filozofické fakultě MU neexistuje ucelená řada archivních výtisků na jednom místě, kterou by bylo možné pro digitalizaci využít, publikace se proto získávají z několika zdrojů – z kateder FF, Ústřední knihovny FF, Nakladatelství MU (do budoucna i z Archivu MU a ev. chybějící výtisky i z jiných knihoven). Elektronické verze novějších publikací získáváme zatím převážně od edičního referenta FF.

4. Skenování a zpracování digitálních dokumentů

Vlastní digitalizaci můžeme rozdělit do dvou fází: první fáze, tj. skenování dokumentů, jejich základní úpravy, vytvoření PDF souborů a jejich uložení do metadatového editoru, druhá fáze – OCR, následné vylepšení kvality skenů a vytvoření finálního dokumentu (post-proccessing).

Pro skenování dokumentů na FF se dosud používaly dva skenery – skener s automatickým podáváním volných listů HP Scanjet 7800 a skener Plustek OpticBook 4600 pro skenování celých svazků knih. Parametry nastavení skenerů se liší dle typů předloh. Bezprostředně po ukončení skenování se v závislosti na použitém skeneru provádějí základní úpravy v programu Adobe Acrobat. Kopie souborů se zálohují na externím lokálním disku na FF a v externím datovém úložišti na ÚVT MU. (Podrobněji v kap. 4 diplomové práce).

Poté je možné digitalizované dokumenty vložit do metadatového editoru, který si podrobněji popíšeme v následující části článku (5). Pokud je již v metadatovém editoru založena struktura pro konkrétní časopis či záznam určité monografie, můžeme digitalizované dokumenty k příslušným záznamům nahrát.

Naskenované soubory jednoho svazku časopisu nebo sborníku (tj. články určitého čísla časopisu či sborníku) se nahrávají do metadatového editoru hromadně. Jednotlivé soubory s články/příspěvky se zkomprimují do jednoho souboru ve formátu zip a nahrají k záznamu konkrétního svazku/čísla v metadatovém editoru. Po nahrání dojde k automatické dekomprimaci a je automaticky vytvořena článková struktura příslušného čísla s počtem článků odpovídajícím počtu očíslovaných souborů.

Úpravy programem Scan Tailor

Po nahrání je soubor v metadatovém editoru automaticky přejmenován na „source.pdf“ (tj. tento soubor odpovídá námi nahranému souboru). V tomto souboru není doposud rozpoznán text (jedná-li se o naskenovaný dokument). Výsledným souborem, se kterým pracuje uživatel v digitální knihovně, je pak „item.pdf“, což je již dvouvrstvé PDF s provedeným rozpoznáním znaků a s vylepšením kvality pomocí softwaru Scan Tailor. Scan Tailor (http://scantailor.sourceforge.net) je open source aplikace, která umožňuje automatizovaně i ručně upravovat jednotlivé stránky naskenovaných dokumentů. Pro potřeby FF byl program upraven tak, aby jej bylo možné používat pro hromadné opravy PDF souborů, a zároveň byly upraveny některé algoritmy, aby lépe vyhovovaly dokumentům FF. Pomocí programu se detekuje obsah (text) na stránce, ořezávají okraje, odstraňují různé šumy, vyrovnává se natočení stran, které byly naskenovány křivě. Dále program dokáže rozpoznat obrázky na stránce, která byla naskenována v odstínech šedi či barevně, ponechá je v příslušném módu, zatímco text je převeden na černá/bílá. Na výstupu jsou strany stejných rozměrů, úpravami je odstraněna nejednotnost a nežádoucí jevy vzniklé při skenování a upravené dokumenty pak poskytují celkově lepší vizuální dojem. Další výhodou je, že následné OCR (Optical Character Recognition), které se provede na takto upravených stranách, dokáže pracovat s větší přesností.

Automatické rozpoznávání textu (OCR)

Následně se provede automatické rozpoznávání textu (OCR) naskenovaných dokumentů, k čemuž se používá komerčního software Abbyy FineReader, který funguje v rámci Informačního systému MU. Pro přesnější rozpoznávání znaků se využívá informace o jazyce textu dokumentu uvedená v metadatech v metadatovém editoru. Vzhledem k množství textů však není možné dělat následnou manuální kontrolu a opravy chybně rozpoznaných znaků.

Po rozpoznání textu se následně programem TeX generuje finální dokument s patřičnými rozměry (dle rozměrů dokumentu zadaných v metadatovém formuláři) a s vloženým a vycentrovaným obsahem dokumentu. Výsledný soubor (item.pdf), se kterým pracuje uživatel, je upravený, vylepšený soubor s vygenerovanou předsádkou, rozpoznanou textovou vrstvou (skrytou pod vrstvou obrazovou), díky které je text možné indexovat, prohledávat, kopírovat atd.

5. Tvorba metadat

Pro uchování a zpřístupnění dokumentů v Digitální knihovně Filozofické fakulty MU byl vybrán systém DSpace, avšak na základě zkušeností získaných při vytváření České digitální matematické knihovny bylo na počátku rozhodnuto, že se jako nástroj pro budování jádra digitální knihovny a metadatový popis digitálních objektů využije externí softwarový nástroj, tzv. metadatový editor, který byl v rámci projektu DML-CZ pro tyto účely vyvinut.

Metadatový editor (ME)

Metadatový editor je základním nástrojem při tvorbě digitální knihovny, který zabezpečuje všechny potřebné kroky a funkce od vložení naskenovaných souborů až po jejich výsledný export s metadaty do digitálního repozitáře. Metadatový editor mj. umožňuje:

zakládat a organizovat digitální dokumenty a vytvářet potřebnou hierarchickou strukturu (např. časopis – ročníky – čísla – články)
vkládat naskenované dokumenty (jednotlivě či hromadně)
spouštět nástroje pro úpravu PDF souborů a OCR
vytvářet a editovat metadata digitálních dokumentů různých hierarchických úrovní (tj. např. pro tituly časopisů, jejich ročníky, čísla a články, monografické edice, jednotlivé monografické publikace a kapitoly)
automatizovaně zadaná metadata kontrolovat
připravit soubory s odpovídajícími metadaty pro export
spouštět nástroj pro dávkový import do digitálního repozitáře (DSpace) aj.

V rámci metadatového editoru pro DML-CZ jsou implementovány různé další pokročilé podpůrné funkce, jako je import metadat z bibliografických databází, automatická detekce hranic článků v naskenovaných časopisech či sbornících, automatická detekce a zpracování bibliografických referencí u článků a jejich prolinkování do zahraničních bibliografických databází, automatická detekce jazyka, automatizovaná verifikace dat apod. Pro použití na FF MU však nebyly některé funkce původní instalace ME používané v rámci DML-CZ zprovozněny, naopak jiné byly přidány a upraveny. (Více informací lze nalézt v kap. 5 diplomové práce.)

Vytvoření struktury dokumentů

V metadatovém editoru jsou dokumenty organizovány do hierarchické struktury, která má následující úrovně v závislosti na typu dokumentů. V případě časopisů jednotlivé úrovně odpovídají časopisu – ročníku – číslu – článku, podobně u Sborníků prací FF BU pak úrovně odpovídají sborníkové řadě – ročníku – číslu – příspěvku ve sborníku. Vytvářet strukturu v ME, a tak zakládat nové publikace, je možné pomocí uživatelského rozhraní ME.

Jednou z nově vytvořených funkcí pro ME FF, která zpřehlednila strukturu generovaného obsahu čísla časopisu, byla možnost jednotlivé články seskupit, resp. přiřadit k určitým sekcím, které odpovídají reálnému rozdělení příspěvků v samotných sbornících a časopisech. Typicky se jedná např. o sekce Studie, Recenze, Jubilea, Informace a zprávy apod.

Metadatový popis digitálních dokumentů

Další důležitou činností přípravné fáze tvorby digitální knihovny, která se děje také prostřednictvím metadatového editoru a následuje po založení základní struktury a nahrání dokumentů, je vlastní metadatový popis digitálních dokumentů. ME umožňuje metadaty opatřit všechny hierarchické úrovně, dokumenty jako celky a jejich části. ME lze snadno konfigurovat a definovat, jaká pole popisných metadat mají být k dispozici pro který typ dokumentu. Pro tento účel byla vyvinuta technologie SForms, kde je pomocí XML souboru popsáno, která pole jsou pro daný typ dokumentu relevantní, jak mají být pole zobrazena, zda jsou volitelná či povinná, zda se mohou opakovat, v jakém formátu má být hodnota daného pole apod. Při definování metadatových schémat je třeba také uvažovat, pro jaké účely se budou hodnoty jednotlivých metadatových prvků používat, např. kde a jaké údaje se budou generovat v uživatelském rozhraní výsledné digitální knihovny. Metadata slouží především k prezentaci, zpřístupnění a vyhledatelnosti dokumentů v digitální knihovně a specifikace zobrazení jednotlivých úrovní v digitální knihovně, které vidí uživatel, se vytváří právě přesně definovanou skladbou metadatových prvků a jejich hodnot.

V metadatovém editoru FF jsou nyní zprovozněny dva moduly pro metadatový popis: pro monografie (Monographs) a seriály (Serials). S určitým modulem jsou svázány také konkrétní formuláře/šablony pro editaci metadat různých hierarchických úrovní, podobně jako např. v knihovním katalogu. V metadatovém editoru jsou však dokumenty napevno sdružovány do určitých kolekcí (např. monografické edice, titul časopisu, sborníková řada), které se zakládají buď v modulu pro monografie, nebo pro seriály. Na FF MU jsou však poměrně časté situace, kdy nejsou čistě monografické nebo čistě sborníkové řady či periodika (např. v edici Spisy FF, která je považována za monografickou edici, se vyskytují sborníky z akcí a dokonce i periodika). Tato problematika se v současnosti řeší pomocí tzv. virtuálních čísel, kdy např. monografické číslo určitého periodika je reálně založeno a popsáno v monografické kolekci, v rámci periodika je vytvořeno virtuální číslo a vzájemně jsou prolinkovány.

Metadatový popis monografických publikací

Metadatové schéma pro popis monografických publikací bylo upraveno tak, aby bylo možné záznamy knih přebírat z knihovního katalogu MU. Přebírání dat přinese urychlení a usnadnění práce, především se zamezí duplicitě činností. Pro účely přebírání záznamů byla vytvořena mapovací tabulka mezi prvky v ME a poli ve formátu MARC 21. Záznamy se stahují ve formátu XML na základě systémových čísel bibliografických záznamů v systému Aleph a jsou převedeny na schéma ME.

U monografických publikací (stejně jako u seriálů) se bude vytvářet analytický popis a monografie budou uživatelům zpřístupňovány popsané a rozdělené do kapitol. Je třeba dořešit, jak podrobná by měla být výsledná struktura a rozdělení PDF souborů, zda se bude jednat jen o popis nejvyšší úrovně kapitol nebo kompletní rozpis dle tištěného obsahu včetně všech podkapitol.

Metadatový popis seriálových publikací

Modul pro seriály slouží v metadatovém editoru pro popis časopisů a jiných periodik (např. pokračujících sborníkových řad). Popis seriálových publikací FF začal periodikem SPFFBU, jehož některá specifika a úskalí jsme naznačili. Do metadat bylo třeba mj. zanést údaje o vzájemných vazbách na předchozí a navazující řady, měnící se názvy i ISSN pro určitá období, vyřešit monografická čísla aj.

Analytický popis (články, příspěvky)

Pro popis článků se používají základní prvky, jako je název, variantní názvy, autor, jazyk, rozsah, typ, u nových čísel časopisů je popis doplňován také o abstrakty a klíčová slova aj.

Při editaci metadat je možné vkládat také odkazy na jiné související dokumenty, jako jsou např. pokračování článku, odkazy na recenzovaná díla apod. ME také umožňuje vytvořit seznam bibliografických referencí uvedených v článku, přičemž je podporováno jejich poloautomatické zpracování. Tato funkce není na FF v současné době využívána, je však možné o rozpisu bibliografických referencí uvažovat v dalších fázích tvorby digitální knihovny FF. Metadatové formuláře obsahují i různé administrativní prvky, např. pro zadání rozměru, původu dokumentu (scan/born-digital), poznámky pro administrátory aj.

Recenze

Specifickým typem článků, kterých se v periodikách FF vyskytuje značné množství, jsou recenze (jen SPFFBU jich obsahuje několik tisíc). Oproti „klasickým“ článkům je třeba do metadat zanést také údaje o recenzovaných dílech. Mezi druhy recenzovaných dokumentů se vyskytují zejména monografické publikace, sborníky, v menší míře také články či časopisy. Ve fakultních časopisech a sbornících se obecně vyskytují tyto typy recenzí: a) recenze s vlastním názvem – na jedno dílo či více děl; b) recenze bez vlastního názvu, opět se může jednat o recenzi na jedno dílo či děl více.

Recenze se samostatným názvem nemají název totožný s názvem recenzovaného díla (např. název recenze je „Barokní poetika a ideologie“, název recenzovaného díla je Sondy do barokovej literatúry). Časté jsou však případy recenzí, které nemají svůj název a začínají přímo bibliografickými údaji recenzovaného díla. V těchto případech vytváříme tzv. umělý název. Názvem článku/recenze se stává název knihy nebo více údajů recenzovaného díla, které se zapisují do hranatých závorek. Bibliografické údaje recenzovaných děl se pak zapisují do pole recenzované dílo (reviewed work). Součástí záznamů by měl být i odkaz na samotné recenzované dílo v digitální knihovně, pokud se v ní vyskytne.

Pokročilé funkce a rozšíření metadatového editoru

V rámci metadatového editoru FF jsou implementovány další pokročilé podpůrné funkce, které usnadňují práci.

Autoritní báze umožňuje snadnou kontrolu správnosti zadaných jmen autorů a jejich opravy. Při vyplňování metadat u článků se stává, že je zadána i jiná forma jména, než je autorova oficiální. Autoritní báze umožňuje uchovat různé formy jmen stejného autora, u nichž lze také určit, která forma je preferovaná a která není. Sloučení všech forem jmen k jednomu záznamu autora tak dovoluje výpis všech děl autora v metadatovém editoru. Autoritní báze umožňuje také pomocí identifikátorů rozlišit autory se shodným jménem. Do záznamu autora je možné doplnit také základní osobní údaje o autorovi.

Pro ME FF byl upraven nástroj pro kontrolu metadat, tzv. „XML search“, který umožňuje snadné dohledání nesprávně zadaných či úplně chybějících údajů v metadatových záznamech. Při vyhledávání lze specifikovat, zda mají vybraná metadatová pole obsahovat či neobsahovat zvolený výraz. Případně lze hledat záznamy, kde jsou vybraná pole prázdná či vyplněná. Vyhledávání lze provádět napříč všemi kolekcemi nebo je možné jej omezit na určité dokumenty podle jejich kategorie, jazyka, vybraného titulu apod. Prohledávají se přímo XML soubory s metadaty uložené na disku. V pravidelných intervalech jsou tyto metadatové soubory procházeny, jejich obsah indexován a ukládá do databáze, ve které se pak provádí vyhledávání.

Systém také udržuje statistiky o všech změnách, na základě kterých je možné získat např. údaje o počtech časopisů, ročníků, čísel a článků v ME již vložených a zpracovaných, o jazycích dokumentů, údaje o editaci konkrétních položek, o uživatelích editujících metadata aj. Uživatelé se do systému hlásí pomocí přihlašovacího jména a hesla, na základě čehož jsou jim garantována práva k provádění jim vymezených úkonů.

6. Zpřístupnění digitální knihovny uživatelům – systém DSpace

V předchozích částech byly představeny určité fáze workflow procesů, ve kterých jsou dokumenty digitalizovány, zpracovány a popsány pomocí metadatového editoru. Na konci celého procesu jsou takto zpracované položky exportovány do digitálního repozitáře, pomocí kterého jsou digitální objekty zpřístupňovány uživatelům. Jako systém pro Digitální knihovnu Filozofické fakulty MU byl vybrán systém DSpace, který je pro účely archivace a zpřístupňování digitálních dokumentů užíván ve světě nejvíce právě akademickými institucemi.

Systém DSpace (v současné době je spravován neziskovou organizací DuraSpace[3]), byl vyvinut jako komplexní systém pro budování a provozování digitálních knihoven či repozitářů. Implementuje funkce pro vkládání, popis a poskytování přístupu k digitálnímu obsahu, stejně jako pro jeho sdílení a dlouhodobé uchovávání, tedy všechny základní úlohy, které musí digitální knihovna zajistit. DSpace může být využit pro zpřístupnění jakéhokoli typu digitálních objektů, jako jsou textové dokumenty, obrázky, audio, video, datové soubory různých formátů apod. DSpace je vyvíjen jako open source software a je distribuován zdarma pod BSD licencí[4], což umožňuje institucím využívajícím tento systém snadno jej modifikovat, přizpůsobit jej vlastním potřebám a podílet se takto na vývoji DSpace. Tato skutečnost také velmi přispěla popularitě a rozšíření DSpace ve světě. Pro DK FF MU byl na jaře 2011 nasazen DSpace verze 1.6.2, který je postupně upravován pro potřeby FF.

Některé funkce systému DSpace

Systém DSpace obsahuje nástroje s uživatelským rozhraním pro proces vkládání dokumentů do systému, jejich schvalování i pro vkládání popisných metadat, tyto nástroje však postrádají potřebnou podporu pro zpracování naskenovaných dokumentů, efektivnější kontrolu metadatového popisu a jiné potřebné funkce. K těmto účelům se používá metadatový editor a pro následný import dat do systému DSpace je využíván vlastní upravený dávkový import. V článku popis standardních funkcí, nástrojů, architekturu systému, možnosti řešení uživatelského rozhraní[5] aj. technické podrobnosti nezmiňujeme (lze je najít v kap. 6 diplomové práce), představíme si jen určité moduly a vlastnosti systému.

Navigace v digitálním repozitáři

Obsah repozitáře je organizován do hierarchické struktury tzv. komunit (communities). Jednotlivé komunity do sebe mohou být hierarchicky zanořeny či rozděleny na komunity nižší úrovně, tzv. pod-komunity (sub-communities), které typicky odpovídají organizačním jednotkám instituce, která daný repozitář provozuje. Je-li takovou institucí například univerzita, mohou komunity nejvyšší úrovně odpovídat jednotlivým fakultám, na další úrovni najdeme ústavy působící na těchto fakultách apod. Kterákoli komunita může obsahovat libovolné množství tzv. kolekcí (collections), které již nelze hierarchicky vnořovat. Kolekce potom obsahuje samotné digitální objekty, kterým se v prostředí DSpace říká jednoduše položky (items). Každá položka náleží do právě jedné kolekce. Položky je však možné mapovat z jedné kolekce do druhé tak, aby mohly být dohledány ve více kolekcích, pro které jsou tyto položky relevantní. Kolekce tvoří již sbírky konkrétních digitálních objektů (např. tematicky zaměřené sbírky dokumentů z různých oblastí výzkumu určitého ústavu, kolekce dle druhů dokumentů či konkrétní ediční řada apod.).

Ve standardním webovém rozhraní DSpace má každá komunita i kolekce svou domovskou stránku, kde lze nalézt její popis a další relevantní informace. Stránka komunity obsahuje seznam odkazů na stránky vnořených pod-komunit a kolekcí, stránka kolekce potom obsahuje seznam odkazů na odpovídající položky. Na stránkách pro jednotlivé položky potom může uživatel najít podrobnější informace o odpovídajícím digitálním dokumentu (metadata) a v případě, že má k tomu oprávnění, může digitální dokument pomocí nabízeného odkazu stáhnout či přímo zobrazit.

Na obrázku 3 vidíme nejčastější způsob využití struktury komunit a kolekcí v institucionálních repozitářích v systému DSpace. Tuto strukturu lze však využít i jiným způsobem, kdy komunita může odpovídat např. titulu konkrétního časopisu a kolekce pak jednotlivým číslům s články, které odpovídají jednotlivým položkám – digitálním objektům. Tohoto přístupu lze dobře využít i v předmětově či oborově orientovaných repozitářích, jak je tomu konkrétně např. v České digitální matematické knihovně. Komunitami jsou zde tituly časopisů nebo monografické edice, pod-komunitami ročníky a kolekcemi pak jednotlivá čísla časopisů, která již obsahují konkrétní články. Stejný způsob organizace byl využit i v Digitální knihovně FF.

Domovská stránka DK FF MU slouží jako přímý rozcestník ke kolekcím dokumentů, které jsou zatím rozděleny do tří základních kategorií (Časopisy, SPFFBU, Monografické edice). Do budoucna přibydou ještě kategorie pro samostatné monografie vydané mimo edice, sborníky z konferencí aj. druhy dokumentů, měl by být vyřešen také přístup ke kolekcím dle jednotlivých kateder a ústavů FF MU.

Kromě navigace přes hierarchii komunit a kolekcí může uživatel obsah repozitáře procházet také podle jména autora, názvu dokumentu, předmětových hesel či klíčových slov nebo chronologicky. Některé uživatelsky přizpůsobené instalace systému DSpace nabízejí i procházení podle určitého klasifikačního schématu (např. DML-CZ, http://dml.cz/MSCSubjects), typu dokumentu (např. repozitář ORBi, Universitè de Liège, http://orbi.ulg.ac.be) aj.

Vyhledávání

Digitální objekty lze také v celém repozitáři vyhledávat pomocí vyhledávacího dotazu. Kromě základního vyhledávání pomocí klíčových slov, které systém bude hledat v základních polí metadatových záznamů, jako je jméno autora, název dokumentu, abstrakt aj., umožňuje DSpace vyhledávání také v plných textech digitálních dokumentů. Díky volně dostupnému vyhledávacímu stroji Apache Lucene[6] použitému v implementaci DSpace je vedle standardních logických operátoru AND, OR a NOT možné také využívat řadu speciálních znaků pro upřesnění vyhledávacího dotazu nebo zadat složitější vyhledávací dotaz. Funkce pokročilého vyhledávání dále umožňuje zadat, jaká slova či fráze se mají vyskytovat v konkrétních polích metadatového záznamu, a opět mezi nimi vyjádřit logické vztahy pomocí operátorů. Vyhledávání lze také omezit na určitou komunitu nebo kolekci.

Nová verze DSpace 1.7 dovoluje nastavit i tzv. fasetové vyhledávání a prohlížení (faceted search/browse), které pomůže uživateli zpřehlednit obsah repozitáře a výsledky vyhledávání rozdělením do určitých faset, které se uživateli zobrazí v bočním menu v části „Discovery“.

Interoperabilita

Interoperabilita mezi systémem DSpace a jinými systémy je zajištěna díky podpoře standardů, pomocí kterých mohou jiné systémy získávat informace o repozitáři, anebo naopak pomocí kterých může systém DSpace využívat služeb jiných systémů, a zpřístupnit tak další informace o položkách v repozitáři. Důležitým modulem je server protokolu pro sklízení metadat OAI-PMH (Open Archive Initiative Protocol for Metadata Harvesting). Prostřednictvím tohoto protokolu se k DSpace mohou po internetu připojit jiné klientské aplikace (např. mezinárodní repozitáře a vyhledávače) a získat informace o obsahu repozitáře. DSpace takto zpřístupňuje pouze metadata o položkách, které jsou veřejně přístupné pro anonymní uživatele, a to standardně ve formátu sady metadatových prvků Dublin Core. Modul je však možné konfigurovat za účelem poskytování i dalších metadatových formátů, jako je například MODS (Metadata Object Description Schema).

Další ze standardů podporovaných DSpace je OpenURL.[7] Jedná se o standardizovaný formát zápisu URL adresy, který definuje, jak do řetězce URL vložit popisná metadata dokumentu. Hlavní myšlenkou OpenURL bylo umožnit jednoduché a flexibilní napojení záznamů z bibliografických databází na plné texty dokumentů, které jsou zpřístupněny na internetu nebo v jiných databázích. OpenURL nemusí být nutně využíváno jen pro dohledávání plných textů dokumentů, ale tato technologie se může využít pro získání dodatečných informací k položkám obsaženým v repozitáři. Linkový server může být například nastaven k tomu, aby dohledával informace o citování daných dokumentů nebo aby nabídl alternativní zdroje uživatelům, kteří nemají přístup k plným textům v daném repozitáři.

Metadatové formáty

Pro metadatový popis digitálních objektů je v systému DSpace jako základní schéma nastaven Dublin Core v jeho kvalifikované formě a úpravě dle MIT Libraries, která vycházela z tzv. „knihovnického aplikačního profilu“ (Library Application Profile) vypracovaného v roce 2002 (revize 2004) jednou z pracovních skupin Dublin Core Metadata Iniciative (DCMI), která se stará o udržování a rozvoj schématu Dublin Core. (Podrobněji se schématu DC věnuje kap. 6.5 diplomové práce).

Schéma Dublin Core samozřejmě nevyhovuje konkrétním potřebám různých uživatelských komunit pro popis různých typů digitálních objektů, které zpřístupňují, proto je běžné, že si jej instituce v rámci své instalace také přizpůsobují a rozšiřují. V rámci vytváření Digitální knihovny FF dojde také ještě k upřesnění mapování mezi prvky v metadatovém editoru a prvky Dublin Core v DSpace.

Systém DSpace umožňuje integrovat vlastní metadatové schéma, musí mít však jednoduchou formu a odpovídat tvaru [schéma].[prvek/pole].[kvalifikátor]. V současné době nepodporuje hierarchicky strukturované schéma. Distribuce DSpace však zahrnuje podporu pro převody do formátu MODS, export a import METS (s metadaty ve formátu MODS a PREMIS). V rámci DSpace jsou však převedeny na interní metadatové schéma.

DSpace v ČR

Deseti lety prověřený systém DSpace se osvědčil jako spolehlivý softwarový nástroj pro tvorbu digitálních knihoven. Jeho popularita a z ní plynoucí široká podpora potvrzují DSpace jako vhodnou volbu při výběru systému repozitáře pro digitální dokumenty.

V České republice v současnosti funguje několik institucionálních repozitářů postavených na DSpace. Většina z nich původně vznikla jako repozitáře pro ukládání a zpřístupňování vysokoškolských kvalifikačních prací (VŠKP) a postupně jsou rozšiřovány také o další typy dokumentů. Provozují je Vysoká škola báňská – Technická univerzita Ostrava, http://dspace.vsb.cz; Univerzita Pardubice, http://dspace.upce.cz; Akademie múzických umění v Praze, https://dspace.amu.cz; Univerzita Tomáše Bati ve Zlíně, http://dspace.knihovna.utb.cz; České vysoké učení technické v Praze, https://dspace.cvut.cz; Ústav formální a aplikované lingvistiky MFF UK, https://ufal-point.mff.cuni.cz; Masarykova univerzita, http://dspace.muni.cz (testovací provoz) a Filozofická fakulta MU (samostatná instalace, testovací provoz). Vhodným představitelem oborového repozitáře je samozřejmě Česká digitální matematická knihovna (DML-CZ), http://dml.cz.

Jako podpora pro českou komunitu uživatelů DSpace a sdílení zkušeností je provozován web DSpace.cz, http://dspace.cz, e-mailová diskuzní skupina a každoročně jsou v prostorách Vysoké školy báňské – Technické univerzity Ostrava pořádána pravidelná setkání a workshopy uživatelů DSpace (pod záštitou Ústřední knihovny VŠB-TUO a Asociace knihoven vysokých škol České republiky).

7. Aktuální stav a výhledy do budoucna

Dosavadní digitalizace publikací FF probíhala v několika víceméně ucelených fázích. Prvním větším celkem, kterým vlastní digitalizace začala, bylo nejrozsáhlejší periodikum FF – Sborník prací filozofické fakulty brněnské univerzity (SPFFBU) s jeho 23 řadami. Poté navázala digitalizace monografické edice Spisy Filozofické fakulty MU, dále se pokračovalo dalšími periodiky, edicemi, sborníky z akcí aj. publikacemi, nejprve vydanými v Nakladatelství MU. V současné době je zdigitalizováno cca 315 000 stran publikací FF, v metadatovém editoru je popsáno cca 15 300 dokumentů.

K aktuálním úkolům patří revize metadatových záznamů, úpravy popisu seriálů, dořešení popisu částí knih a import základního popisu cca 15 000 kapitol edice Spisy FF MU do metadatového editoru, následné doplnění metadat a export do DSpace. Čeká nás založení struktury pro další digitalizovaná periodika FF, stovky dalších zdigitalizovaných monografických publikací, jejich nahrání a vytvoření metadatového popisu. Mezi časově náročnější úkoly patří také pokračování v mapování publikační činnosti a vytvoření co nejúplnějšího soupisu dalších publikací, roztřídění do budoucích kolekcí a další navazující přípravné činnosti.

Celkové dořešení přesné specifikace uživatelského rozhraní DK FF MU pro všechny hierarchické úrovně a různé typy dokumentů je spolu s celkovým dotažením metadatového popisu hlavním úkolem pro nejbližší období. Inspiraci pro další vývoj digitální knihovny lze pak také vzít z řady fungujících zahraničních i domácích digitálních knihoven.

Kromě řešení uvedených aktuálních úkolů je třeba se zabývat i dalšími oblastmi, jako je např. získávání e-verzí nových publikací, získávání dat z agendy Publikace v IS MU, řešit propojení se vznikajícím Repozitářem zaměstnaneckých děl MU. Nutné je samozřejmě paralelně řešit autorsko-právní otázky. Vhodné by samozřejmě bylo poskytovat data do Registru digitalizace ČR, v dalších fázích vývoje digitální knihovny poskytovat data ke sklízení také do významných mezinárodních repozitářů, portálů či vyhledávačů.

Příležitostí k dalšímu rozvoji digitální knihovny i inspirací je celá řada. Jednou z nich by mohlo být vytváření archivů osobností FF či kompletních bibliografií autorů, začlenit již digitalizované Dílo Vladimíra Helferta, zpracovávat a zpřístupňovat v digitální knihovně i jiné typy dokumentů, než jsou textové aj.

Jednou z doposud podrobněji neřešených otázek je také problém věcného popisu dokumentů v DK FF MU (předmětová hesla, klíčová slova, začlenění nějakého klasifikačního schématu nebo oborových tezaurů); případně i propojení dokumentů v digitální knihovně na oborové bibliografické, abstraktové či recenzní databáze a další významné externí zdroje.

Možností je samozřejmě mnohem víc, kromě vylepšování vlastního obsahu digitální knihovny se lze zaměřit v budoucnu i na vylepšování jejích funkcí ve vztahu k uživatelům, stále však ještě stojíme v podstatě na počátku tvorby digitální knihovny.

Závěr

Vytvoření fungující digitální knihovny je dobrou příležitostí pro celou fakultu i jednotlivé akademické pracovníky více se otevřít světu, může přinést vyšší povědomí o vědecké činnosti FF, vyšší viditelnost a využívanost prací autorů na domácí půdě i ze zahraničí. Nesporným přínosem bude i soustředění, přehledná organizace a archivace produkce FF na jednom místě. Digitalizační pracoviště FF by se mělo stát především službou ústavům, katedrám a všem akademickým pracovníkům FF.

Co se týká vlastního probíhajícího projektu, vhodné by bylo do budoucna navázat užší kontakty s jinými institucemi, které budují své repozitáře a získat tak další zkušenosti. Naopak budovaná digitální knihovna, resp. fakultní „institucionální repozitář“, je v tomto rozsahu prvním podobným projektem na MU a zkušenosti zde získané bude možné předat ev. i jiným fakultám MU, budou-li chtít vybudovat také své digitální knihovny.

Digitalizace a zpřístupnění publikací FF vydaných od jejího založení je projektem rozsáhlým. Množství práce se udělalo, mnohem větší však ještě zbývá. Vše chce zdroje – lidi, čas, peníze (a nadšení).

Celkově základní problémy při budování repozitářů vystihují slova Jana Hutaře, který pracoval na projektu Národní digitální knihovny:

... zásadním problémem není zakoupit a rozběhnout technologie k provozování repozitáře. Právě tuto podmínku většina lidí přeceňuje. Zásadním problémem není ani udržovat vše v odpovídajícím chodu. … Vážnějším problémem je organizační stránka instituce, která je oním důležitým jazýčkem na vahách, který může ovlivnit funkčnost a existenci celého repozitáře. Lze říci, že právě organizační, finanční a personální zázemí jsou nejdůležitější pro to, aby repozitář byl schopen plnit svou funkci – tj. uchovávat digitální objekty v dlouhodobém horizontu a zajišťovat k nim odpovídající přístup.[8]

Literatura

ANSI/NISO Z39.88. The OpenURL Framework for Context-Sensitive Services [online]. [cit. 2012-03-10]. Dostupné z: http://www.niso.org/kst/reports/standards?step=2&project_key=d5320409c5160be4697dc046613f71b9a773cd9e.

ARTSIMOVICH, Joseph. Scan Tailor tutorial [online]. Sun, Jun 13, 2010 [cit. 2012-03-08]. Dostupný z: http://vimeo.com/12524529.

Bartošek, M., Kovář, P. a Šárfy, M. DML-CZ Metadata editor: content creation system for digital libraries. In: Sojka, P., ed. DML 2008: towards digital mathematics library: Birmingham, UK, July 27th, 2008. Brno: Masaryk University, 2008, s. 139-151. ISBN 9788021046580. Dostupné také z: http://dml.cz/handle/10338.dmlcz/702537.

Czech Digital Mathematics Library - project: Project 1ET200190513 – funded by the Academy of Sciences of the Czech Republic. Programme "Information Society" (National Research Programme, 2005–2009) [online]. [cit. 2012-03-07]. Dostupné z: http://project.dml.cz.

DCMI Usage Board. DCMI Metadata Terms [online]. Date Issued: 2010-10-11 [cit. 2012-03-07]. Dostupné z: http://dublincore.org/documents/dcmi-terms.

DCMI-Libraries Working Group. Library Application Profile [online]. [cit. 2012-03-07]. Dostupné z: http://dublincore.org/documents/library-application-profile.

DuraSpace. DSpace Manual: Release 1.6.2 [online]. Winchester, MA: DuraSpace, 2010-06-13 08:00:00 EST. [cit. 2012-03-09]. Dostupný z: http://www.dspace.org/1_6_2Documentation/DSpace-Manual.pdf.

Dietz, Peter. DSpace 1.7.1: system documentation [online]. Winchester, MA : DuraSpace, 2011-03-28 [cit. 2012-03-09]. Dostupné z: http://www.dspace.org/1_7_1Documentation/DSpace-Manual.pdf.

DSpace [online]. [cit. 2012-03-09]. Dostupné z: http://www.dspace.org.

Dspace CZ [online]. Poslední aktualizace: 22. červen 2011 15:59:08 [cit. 2012-03-09]. Dostupné z: http://www.dspace.cz.

Dublin Core Metadata Element Set [online]. Version 1.1. Date Issued: 2010-10-11 [cit. 2012-03-09]. Dostupné z: http://dublincore.org/documents/dces.

Hutař, Jan. Proč jsou české digitální repozitáře nespolehlivé? Knihovna [online]. 2008, ročník 19, č. 1, s. 39–53 [cit. 2012-03-09]. Dostupné z: http://knihovna.nkp.cz/knihovna82/82039.htm. ISSN 1801-3252.

Kohút, Luboš. Dspace XMLUI: Manakin Project [prezentace Workshop Manakin, ÚVT MU, Brno, 2. 6. 2010. Dostupný také z: http://hdl.handle.net/10084/78317.

Krejčíř, Vlastimil. Building the Czech Digital Mathematics Library upon DSpace system In: Sojka, P., ed. DML 2008: towards digital mathematics library: Birmingham, UK, July 27th, 2008. Brno: Masaryk University, 2008, s. 117–126. ISBN 9788021046580. Dostupné také z: http://dml.cz/dmlcz/702539.

Krejčíř, Vlastimil. Univerzální digitální repozitář. Brno: Masarykova univerzita, Fakulta informatiky, 2005. 110 s. Vedoucí diplomové práce: RNDr. Miroslav Bartošek, CSc. Dostupný z: http://eprints.rclis.org/archive/00005076/.

Lagoze, Carl a VAN DE Sompel, Herbert. The Open Archives Initiative Protocol for Metadata Harvesting [online]. Protocol Version 2.0 of 2002-06-14, Document Version 2008-12-07. [cit. 2012-03-09]. Dostupné z: http://www.openarchives.org/OAI/openarchivesprotocol.htm.

MÁCKOVÁ, Zdeňka. Digitální knihovna Filozofické fakulty Masarykovy univerzity. Brno: Masarykova univerzita, Filozofická fakulta, Ústav české literatury a knihovnictví, Kabinet informačních studií a knihovnictví, 2011. 217 s., 13 příl. Vedoucí diplomové práce: RNDr. Miroslav Bartošek, CSc. Dostupná v rámci Informačního systému Masarykovy univerzity.

Rambousek, Jiří a Sviták, Zbyněk. Poznámky k datovému skladu. V Brně, 24. 3. 2006. Nepublikováno.

Šárfy, Martin. Metadatový editor pro digitální knihovny. In: Knihovny současnosti 2009, Seč, Česká republika, 2009 [online]. [cit. 2012-03-07]. Dostupný z WWW: http://projekt.dml.cz/docs/sarfy-sec2009.pdf

[1] Rambousek, Jiří a Sviták, Zbyněk. Poznámky k datovému skladu. V Brně, 24. 3. 2006. Nepublikováno.

[2] Czech Digital Mathematics Library, projekt financovaný Akademií věd ČR v letech 2005–2009 v rámci
programu „Informační společnost“. Web projektu: http://projekt.dml.cz, digitální knihovna: http://dml.cz.

[3] DuraSpace, http://www.duraspace.org. Do poloviny r. 2009 byl podporován DSpace Foundation.

[4] BSD License Definition, http://www.linfo.org/bsdlicense.html.

[5] Pro DK FF MU se využívá (stejně jako u DML-CZ) modernější a flexibilnější varianta uživatelského rozhraní DSpace – XMLUI (známé také jako Manakin), díky kterému je vzhled i chování uživatelského rozhraní mnohem snadnější přizpůsobit. Více v kap. 6.3.2 diplomové práce.

[6] Apache Lucene, http://lucene.apache.org

[7] ANSI/NISO Z39.88 – The OpenURL Framework for Context-Sensitive Services,http://www.niso.org/kst/reports/standards?step=2&gid=None&project_key=d5320409c5160be4697dc046613f71b9a773cd9e.

[8] Hutař, Jan. Proč jsou české digitální repozitáře nespolehlivé? Knihovna [online]. 2008, roč. 19, č. 1, s. 39-53. Dostupný z: http://knihovna.nkp.cz/knihovna82/82039.htm. ISSN 1801-3252.

Váha článku:

599

Zdrojové URL: https://duha.mzk.cz/clanky/digitalni-knihovna-filozoficke-fakulty-masarykovy-univerzity