Nacházíte se: Úvod » Archiv čísel » 3/2010 » MEditor – metadatový editor pro digitální knihovnu Kramerius
Vývoj metadatového editoru probíhá v Moravské zemské knihovně od roku 2008. Cílem projektu bylo vytvořit open-source alternativu ke komerčním softwarům, které dokáží zpřístupnit digitální dokumenty v systému Kramerius. Ten je totiž koncipován tak, že dokáže pojmout dokumenty s předem připraveným popisem ve formátu, který v současné době dokáže vyrobit pouze komerční software Sirius. Prakticky to znamená, že menší knihovna, která si naskenuje knihu, ji není schopná v současné verzi Krameria publikovat bez toho, aniž by musela potřebný popis vytvořit ručně, zadat externímu dodavateli nebo si pořídit komerční metadatový editor za ne zrovna malou částku.
Když naskenujeme knihu, získáme tím sice její digitální kopii, ale pro její zpřístupnění potřebujeme ještě další informace – metadata. Základem jsou metadata strukturální – údaje o tom, jak jdou jednotlivé skeny po sobě, který sken odpovídá kterému číslu stránky fyzické předlohy, jak je monografie rozdělena na kapitoly nebo periodikum na ročníky, čísla a články. Tyto informace jsou nezbytné pro listování a prohledávání dokumentu v digitální knihovně. Bibliografická metadata jsou převzatá z knihovního katalogu a upravená pro potřeby digitálního dokumentu. Administrativní metadata popisují mimo jiné právní okolnosti – zda je digitální dokument možno zpřístupnit veřejnosti a za jakých podmínek – a technická metadata určují parametry naskenovaných obrázků, velikost, rozlišení, použité formáty a jejich verze apod.
Obr. 1: Úvodní obrazovka MEditoru po přihlášení
MEditor pracuje nad adresářovou strukturou, do které ukládáme naskenované dokumenty ve formátu tiff, jpeg nebo djvu. Adresář s obrázky, jejichž názvy tvoří vzrůstající číselnou řadu, je pojmenován podle systémového čísla z knihovního systému Aleph nebo čárového kódu dané jednotky. MEditor „vidí“ do takovéto struktury a nabídne automaticky seriály připravené k importu. Stačí jen zaškrtnout políčko u požadovaného dokumentu a kliknout na tlačítko. V té chvíli editor začne kopírovat obrázky k sobě, vytvářet základní strukturální metadata a pokud je napojen na knihovní systém, stahovat bibliografický záznam dané jednotky.
Obr. 2: Import seriálu pojmenovaného systémovým číslem
Obr. 3: Přehled naimportovaných seriálů
Po importu je potřeba upravit strukturu dokumentu, zkontrolovat, zda je dokument kompletní, nechybí či naopak nepřebývá některá strana, ročník seriálu rozdělit na jednotlivá čísla, popsat články, určit typ stránky (např. zda se jedná o titulní list, reklamu, obsah monografie) atd.
Obr. 4: Mapování stránek –
zde určíme, že skenu číslo 0019 ve fyzickém dokumentu odpovídá číslo strany 17
Obr. 5: Přehled stránek a určování jejich typu
Obr. 6: Rozdělení čísla seriálu na články – v jiné sekci potom můžeme u článků dopsat bibliografické údaje
Bibliografické údaje k dokumentu se stahují přes protokol Z39.50 z knihovního katalogu na základě pojmenování adresářů, které mají v názvu čárový kód jednotky nebo systémové číslo knihovního záznamu. Jednotlivé údaje se předvyplní do struktury požadované systémem Kramerius – od názvu dokumentu, přes autora, nakladatele, rok vydání a další „klasické“ knihovní metadata, až k údajům o digitalizovaném dokumentu. Vše je samozřejmě editovatelné a další informace, které nebyly nalezeny v originálním záznamu z katalogu, je možné doplnit ručně.
Obr. 7: Editace bibliografického popisu dokumentu
Když máme dokument optimálně popsaný a zkontrolovaný, můžeme ho zveřejnit. Kliknutím na tlačítko „Publikovat“ se obrázky nakopírují do digitální knihovny Kramerius a zároveň s nimi se importuje i metadatový popis v potřebném formátu.
V letošním roce jsme začali využívat metadatový editor v ostrém provozu v oddělení digitalizace Moravské zemské knihovny. Z rutinního používání vyplynulo mnoho drobných chyb, které souvisí nejčastěji se zpracováním nestandardních dokumentů – např. přívazků nebo dokumentů na pomezí monografie a periodika. Průběžně se pracuje na jejich odstraňování a zároveň jsou doplňovány „vychytávky“, které mají usnadnit a urychlit práci s editorem.
Nově pracujeme na překladu metadatového editoru do češtiny tak, aby vznikla přímo v editoru tabulka, která umožní překlad i do jiných jazyků. Dalšími funkcemi editoru jsou např. možnost volání OCR – automatického rozpoznání textu dokumentu, generování statických html stránek, které mohou být indexované Googlem nebo jiným internetovým vyhledávačem, generování technických a administrativních metadat obsahujících informace o digitalizaci (použitý skener, rozlišení, velikost, formát a barevnost obrázků…) a autorskoprávní záležitosti (kdy bude dokument volně šiřitelný, kdo je vlastníkem digitální kopie a kdo fyzické předlohy apod.). Letošním rokem plánujeme uzavřít vývoj editoru pro Krameria 3 a přesunout pozornost k vývoji obdobného nástroje pro novou verzi Krameria, která byla oficiálně vypuštěna na začátku září.
ŠVÁSTOVÁ, Pavla. MEditor – metadatový editor pro digitální knihovnu Kramerius. Duha: Informace o knihách a knihovnách [online]. 2010, 24(3) [cit. 2025-04-05]. ISSN 1804-4255. Dostupné z: http://duha.mzk.cz/clanky/meditor-metadatovy-editor-pro-digitalni-knihovnu-kramerius
/*
Duha vychází 4× ročně v elektronické i tištěné podobě. Tištěná čísla ve formátu PDF naleznete zde.
|
|