Nacházíte se: Úvod » Blogy » Osobní » Digitalizační workshop v upršeném Haagu
Letos se v Haagu počasí nevydařilo. Po ránu obvykle pršelo tak, že než jsme přeběhli těch 5 metrů k autu, tak jsme byli uplně mokří a odpoledne pršelo horizontálně... Ale jinak pořád obdivuji nizizemskou architekturu a ta šla vidět i v dešti :)
Obecne byla letošní digitalizační konference opravdu vydařená - zaujaly mě především přednášky na téma "user studies" - na něco podobného bychom se totiž měli začít soustředit i u nás. Trošku mě překvapilo, že jako čerstvé téma je probíráno znovuvyužívání metadat knihovnami a dalšími institucemi - z českého prostředí jsem na předávání knihovních záznamů jakoukoliv formou zadarmo zvyklá a nikdy mě nenapadlo, že knihovny své MARCové záznamy mohou prodávat :)
Program konference byl tématicky rozdělen do čtyř sekcí:
Majlis Bremer-Laamanen (The National Library of Finland)
Příspěvek popisoval projekt Finské národní knihovny a firmy Microtask. Cílem projektu je indexovat digitální archivy tak, aby byly vyhledatelné na internetu. Jedním z produktů projektu je počítačová hra, která umožňuje kolaborativní opravy OCR ze starých finských novin. Od února do srpna 2011 hrálo hru na 85.000 navštěvníků, kteří strávili 4000 hodin hraním a opravili přes 5 milionů slov. Informace i hra samotná jsou k nalezení zde: http://www.digitalkoot.fi/en/
Milena Dobreva (University of Portsmouth)
Velice inspirativní příspěvek o problematice „User Studies“ čili průzkumu uživatelů a jejich chování v prostředí digitální knihovny. Mýty o uživatelích: známe je, když něco vyvineme, sami přijdou, kvalita znamená inovace.
Otázky: jak nám “user studies” pomůžou porozumět našim datům a jak je využívat?
Metody výzkumu: kvalitativní a kvantitativní, byly představeny různé metody, jak zkoumat pohyb po digitální knihovně, co uživatele zaujme na první pohled, na co nejčastěji klikají atd.
Autorka příspěvku je také autorkou nové knihy, která obsahuje zkušenosti z výzkumu User studies for Digital Library Development, ISBN 9781856047654.
http://www.facetpublishing.co.uk/title.php?id=7654&category_code=835
http://elag2011.techlib.cz/en/867-03-user-studies-for-digital-libraries-development/
Jasmin Hügi (Haute école de gestion de Genève, Switzerland)
Podobně zaměřená přednáška o tom, jak a zda je vůbec možné změřit užitečnost digitální knihovy, jaké použít prostředky, jaké udělat změny, aby se dalo říct „před a po“. Jaký zaujmout postoj k uživatelům? Co považovat za důležité? Pokusit se pochopit, jak uživatel chápe ze svého pohledu digitální knihovnu.
Zajímavým postřehem bylo, že každá informace by se měla objevit na hlavní stránce v kolonce „News“ - více informací pro uživatele, kteří jsou vesměs líní hledat si informace jinde, čekají všechno v news.
Aubery Escande (Europeana), Marian Lefferts (CERL)
V přednášce byl představen projekt Europeana Libraries, což je dle názvu další projekt z rodiny projektů Europeana. Slibují zpracovat 5miliónů digitálních objektů z 19 vědeckých knihoven z celé Evropy. Chce nabídnout dokumenty jako fotografie ze Španělské občanské války, Ottomanské manuscripty, historické lékařské filmy a tisíce vědeckých prací, časopisů a akademických článků.
Projekt by měl končit na konci roku 2012 s výsledkem:
http://europeana-libraries.eu/
Příspěvek byl zaměřen na řízení vývoje softwarového projektu a projektové řízení obecně. Důraz byl kladen na komunikaci – to, že zadavatel specifikuje požadavek ještě neznamená, že jej dodavatel přesně pochopí a nevyloží si požadavky po svém. To je důležité zejména u psané komunikace – je lepší zadání zopakovat jinými slovy a druhá strana by měla slyšené zopakovat, aby bylo zřejmé, že zadání pochopila. Příspěvek se dále zabýval metodikami řízení softwarového vývoje a srovnával zejména klasické lineární metodiky typu vodopádu a moderní metodiky typu agilního programování. U lineárních metodik vývoj prochází dlouhotrvajícími cykly analýzy požadavků, návrhu systému, implementace, kontroly kvality a nasazení do produkce, což je finančně i časově náročné a může se stát, že systém není nikdy dokončen. Naopak agilní metody jsou levnější díky rozdělení aplikace na menší části, umožňující rychlé úpravy a nasazení drobnějších změn. Agilní metody jsou náročnější na komunikaci zadavatele s dodavatelem, ale přinášejí rychleji výsledky vývoje do produkce. Cyklus agilního vývoje se může opakovat tak dlouho, dokud zadavateli stačí finanční prostředky, je ale menší riziko, že musí být projekt ukončen bez použitelného výsledku.
Hildelies Balk (Koninklijke Bibliotheek - IMPACT)
Přednáška obsahovala čerstvé informace o končícím projektu Impact, proč se zapojit do Impact projektu, jaké jsou podmínky přístupu a jaké výhody může členství nabídnout.
Maria Sorjonen (National Library of Finland), Majlis Bremer-Laamanen (The National Library of Finland)
Co chtějí dělat?
Přednáška na příkladech zdůraznila nutnost nejen data a služby zpřístupňovat na webu, ale nabízet k nim API rozhraní, pomocí nichž je možné propojovat různé systémy – v ideálním případě bez omezení přístupu třetích stran.
Workshop k tématu metadata a reuse
Z odpovědí vyplynulo, že např. ve Finsku nebo v Německu velké knihovny prodávají své MARCové záznamy menším knihovnám nebo dalším zájemcům. Účastníci ze Švýcarska se zmínili, že knihovna v CERNu poskytuje veškerá data i metadata bezplatně, na druhou stranu článek, který si můžete stáhnout zdarma, poskytují za peníze giganti jako Ebsco, ProQuest a další. V podstatě se účastníci rozdělili na dvě skupiny - část má zkušenosti s poskytováním bibliografických záznamů za úplatu, mají na to vybudovanou infrastrukturu a nyní řeší, jak to udělat, aby mohli poskytovat své záznamy zadarmo a druhá (větší) část nechápe, proč by se mělo za bibliografické záznamy platit jiné knihovně, když je vyrobila za peníze daňových poplatníků a jsou tudíž “státní”... Každopádně to vede k závěru, že bychom měli naše metadata nějakým způsobem licencovat.
Christy Henshaw (Wellcome Library)
Co je wellcome library?
http://library.wellcome.ac.uk/
Co digitalizuji?
- archivy, knihy spojené s genetickým výzkumem, early european book, born digital materials - začínají se zpracovávat, ale počet narůstá
Digitalizační strategie:
Digitalizační proces:
...required a higher level of project management....
….goobi....
WL pouziva Intranda verzi, kterou jim komercne dovyvinuli
Různé knihovny používají jako workflow systém cokoli od Excel přes Goobi po DocWorks. Důležité je, o jak velký projekt se jedná. Zatímco několik desítek rukopisů lze ještě řešit ručně, stovky tisíc knih již vyžadují kvalitní nástroj (rakouská NK zjistila, že pro management Google digitalizace nestačí kombinace Excelu a Alephu a hledá lepší nástroj). Byl zmíněn český Registr digitalizace, který je poměrně unikátní.
Workflow systém je nutný zejména pokud na projektu pracuje více lidí. Ideální workflow systém by mělo být možné opakovaně využít ve více projektech různých velikostí. Musí sledovat výkon, podávat statistiky o každém kroku, sledování knih a činností na více lokalitách. Musí umožňovat psát poznámky/tagy a podrobnosti ke každé položce (např. Fyzický stav dokumentu, absence metadat, chyby). Měl by spolupracovat s knihovním systémem.
Workflow systémy by měly navzájem spolupracovat - například přenášet informace centrálním registrům, které by poskytnou celkový pohled na to, co bylo uděláno.
Po skončení digitalizace automaticky vložit dokument do digitální knihovny/LTP systému a odkaz na dokument vložit do knihovního systému.
Systém by měl být škálovatelný ... a pokud možno volně dostupný.
V průběhu služební cesty jsem navštívil také digitalizační centrum KB, kde se digitalizují tisky vydané před rokem 1700 na území Nizozemí nebo v holandštině). Digitalizaci provádí firma Diadeis, která má na místě 2-3 pracovníky provádějící vlastní digitalizaci. Mluvil jsem s p. Thierry Puissegur-Ripet (thierry.puissegur@diageis.com), ředitelem projektů.
Před zahájením digitalizace snímají digitálním fotoaparátem hřbet a ořízku knihy – mj. pro zachycení stavu svazku před zdigitalizováním. Vlastní digitalizace probíhá na strojích ATIZ BookDrive Mini – formát knihy do A4 a Zeutschel – formát knihy do A3. Cílové rozlišení je 400 dpi a plná barva. Před započetím digitalizace se rozhoduje který stroj se pro snímání dané knihy použije. K tomu slouží maketa kolíbky definující úhel a rozměry snímané plochy scanneru ATIZ a plochá deska definující snímací plochu scanneru Zeutschel. Tyto makety se osvědčily v praxi, protože pak nedochází k chybám. Pro naskenování větších dokumentů se používají větší stroje, které jsou na místo přivezeny jen jednou nebo dvakrát za dobu trvání projektu. Provoz je jednosměnný a kopíruje tak otevírací dobu knihovny.
Při skenování bylo zajímavě vyřešeno zachování měřítka při fotografování digitálním fotoaparátem: zároveň se snímanou předlohou se vyfotografuje i pruh bílého papíru se dvěma černými kruhy o průměru cca 1 cm, umístěnými asi 10 cm od sebe. Tento papír je nalepen buď na přítlačném skle, nebo, při snímání hřbetu a vazby na černým sametem potažené krabici sloužící jako podložka knihy. Značky jsou tak vždy umístěny v rovině se snímaným dokumentem. Při dalším automatickém zpracování jsou tyto značky použity pro výpočet dpi a výsledek je vložen do metadat obrázku. Snímání probíhá do TIFFu (scanner) nebo do RAW (u fotoaparátů) a na PC je pak přes DLL Canonu konvertováno do TIFFu a dělá se jen hrubý ořez cca 2 cm zvenčí. Další zpracování pak probíhá v Indickém oceánu (Madagaskar, Mauritius, Reunion), kde má firma cca 500 pracovníků.
Zkušenosti se stojem ATIZ: krycí plexisklo bylo značně poškrábané, mění ho cca každý měsíc. Nekupují originální, ale kupují si čiré plexisklo s antireflexní úpravou (neexistuje antireflexní plexisklo odolné proti poškrábání). Při digitalizaci ale škrábance tolik nevadí, patrné jsou spíše v černém okolí knihy. ATIZ různým způsobem vylepšovali, například vše co šlo uvnitř potáhli černým sametem aby eliminovali odlesky. ATIZ menšího formátu zvolili proto, že do format A4 lze s nepříliš drahými fotoaparáty dosahovat rozlišení 400 dpi a vyšší, u větších formátů už ne. Navíc osvětlení u menšího modelu je kvalitnější (rovnoměrnější) než u modelu Pro.
--------------------------------------------------
Na další prezentace se můžete těšit zanedlouho zde:
Příloha | Velikost |
---|
Příloha | Velikost |
---|---|
haag1.png | 156.23 KB |
Duha vychází 4× ročně v elektronické i tištěné podobě. Tištěná čísla ve formátu PDF naleznete zde.
|
|