Nacházíte se: Úvod » Archiv čísel » 2/2023 » Projekty strojového učení v Moravské zemské knihovně v Brně
Moravská zemská knihovna se v průběhu let stala nedílnou součástí informační a pramenné opory vzdělávání a výzkumu v druhém největším univerzitním centru České republiky. Jako jedna z předních knihovnických institucí rozvíjí přirozenou spolupráci s univerzitami a dalšími vědeckými a akademickými institucemi v republikovém i mezinárodním měřítku. Moravská zemská knihovna je také řešitelkou projektů národních a evropských grantových schémat a je zapojena do celoevropských výzkumných infrastruktur. Ve spolupráci s Národní knihovnou ČR, Knihovnou Akademie věd ČR, Vysokým učením technickým v Brně, Univerzitou Karlovou a Masarykovou univerzitou realizuje několik klíčových knihovnických projektů, které budou spoluutvářet podobu českého knihovnictví a ukazovat směr dalšího jeho vývoje. Knihovnictví nejen v České republice prochází dynamickými změnami, které souvisí s akcelerací společenských proměn, prudkým rozvojem digitálního světa a zvyšujícími se nároky na knihovnické služby. Diskuze o rozvinutí a zpřesnění role knihovnických institucí a jejich služeb v době prudkého rozvoje technosféry bude pokračovat i v následujících letech.
Jedním z klíčových úkolů Moravské zemské knihovny, jako veřejné výzkumné organizace a knihovnické instituce, je úsilí o zpřístupnění archivovaných informací – v současné době mimo jiné i v jejich digitální podobě. V této oblasti navazujeme na dlouhodobé úsilí, jehož cílem je zpřístupnit co možná největší část historického i novodobého kulturního a vědeckého dědictví občanům. Tisíce titulů a sbírkových předmětů v obrazové, textové i zvukové podobě jsou aktuálně přístupné z pohodlí domova a uživatelské nástroje nad digitálními knihovnami výrazně zvyšují nejen pohodlí při vyhledávání, ale mnohdy otevírají rozsáhlé badatelské pole pro studenty a akademické pracovníky. Výzkumná a inovační činnost – implementace nejnovějších technologií, nástrojů a postupů - směřuje především k zvýšení interakčních možností uživatelů a zpřístupnění dat a informací. Toto otevření probíhá směrem ke koncovým uživatelům, ale i pro automatizované nástroje umožňující integrovat tato data do systémů třetích stran za dosažení synergického efektu.
Vzhledem k multioborovosti současného výzkumu a vývoje jsou výsledky projektů, na kterých Moravská zemská knihovna spolupracuje, výsledkem týmové spolupráce. Po pěti letech realizace byly ukončeny projekty financované z Programu na podporu aplikovaného výzkumu a experimentálního vývoje národní a kulturní identity na léta 2016 až 2022. Všech pět dlouholetých projektů, do kterých se Moravská zemská knihovna společně s univerzitními pracovišti zapojila, uspělo a některé z projektů byly hodnoceny jako vynikající s výsledky mezinárodního významu.
Na využití potenciálu výpočetních kapacit algoritmů strojového čtení byl zaměřen projekt „PERO: Pokročilá extrakce a rozpoznávání obsahu tištěných a rukou psaných digitalizátů pro zvýšení jejich přístupnosti a využitelnosti“. Projekt řešila Moravská zemská knihovna ve spolupráci s Vysokým učením technickým v Brně, které garantovalo technologickou část procesu. Několikaleté badatelské úsilí a efektivní spolupráce mezi brněnskými institucemi umožnila vytvoření nástrojů a technologií pro zpřístupnění obsahu digitalizovaných historických dokumentů. Tyto nástroje využívají aktuálních možností vývoje v oblasti počítačového vidění, strojového učení a jazykového modelování. V symbióze se současnými postupy a systémy vyhledávání, prezentace a zveřejňování digitalizátů tyto nástroje nyní umožňují snazší vyhledávání a využití obsahu digitalizátů v případech, kde to dříve nebylo technicky možné.
V rámci projektu byly vytvořeny nástroje pro dosažení co nejvyšší úrovně automatizace v celém řetězci digitalizace a pro rozšíření automatické analýzy obsahu i na dokumenty, které nebylo možné automaticky zpracovat. V loňském roce se například podařilo rozšířit sadu OCR modelů o model pro středověké rukopisy. Nástroje, které v projektu vznikly, umožnily dramatické zlepšení kvality digitalizátů a především zajištění automatického přepisu ručně psaných dokumentů (např. ručně psané legionářské deníky, matriky, obecní kroniky a tak podobně) nebo dalších dokumentů na kterých jiné nástroje selhávaly (např. skeny mikrofilmovaných novin nebo staré typy písem).
"Strojové učení je podoblastí umělé inteligence, zabývající se algoritmy a technikami, které umožňují počítačovému systému 'učit se'. Učením v daném kontextu rozumíme takovou změnu vnitřního stavu systému, která zefektivní schopnost přizpůsobení se změnám okolního prostředí (Wikipedia)".
V oblasti digital humanites pod hlavičkou projektu „DL4DH – Digital Libraries for Digital Humanities“ probíhal vývoj, testování a implementace softwarových nástrojů, které umožňují badatelům v systému Kramerius tagování, selekci a následný export dat do některého z požadovaných formátů umožňujících další strojové zpracování. Vedle vývojových prací byla významným aplikačním výstupem projektu metodika zabývající se přípravou dat z digitálních knihoven pro digital humanities a jejich zprostředkování vědecké komunitě jako takové. Cílem projektu nebylo jen zvýšení pohodlí uživatelů a efektivity vyhledávání a třídění informací, ale i umožnit vědecké obci a studentům účinněji a šířeji využít možnosti digitálního prostoru a nabídnout technologické průvodce, které umožní propojit jak vědní disciplíny a přístupy tak i různé typy digitálních dokumentů.
Úsilí o rozvoj digitálních technologií a nástrojů využívajících strojové učení bude ohniskem spolupráce i v následujících letech. Moravská zemská knihovna spolu s univerzitními partnery uspěla při podávání žádostí o podporu a získala finance na pětiletou realizaci čtyř technologicky klíčových projektů. V březnu tohoto roku jsme zahájili realizaci těchto výzkumných projektů:
Jak vidíme, digitální svět a strojové učení získává stále větší význam i v knihovnickém prostředí. Uživatelé již nemusí fyzicky chodit do knihoven, ale přesto využívají jejich služby v elektronické podobě. Asistence a pomoc při vyhledávání informací a informačních zdrojů pro uspokojování potřeb uživatelů i nadále zůstane jedním z hlavních úkolů knihoven v dalších dekádách. Větší důraz bude zřejmě kladen na kurátorskou roli a také roli průvodce stále více robustním a košatým světem digitálních obrazů a textů. Aplikace výsledků výše zmíněných projektů by měla napomoci nejen efektivnější práci s digitálními zdroji, ale také usnadnit a zpřehlednit uživatelům knihovnických služeb orientaci v rostoucím informačním poli. Moravská zemská knihovna si je vědoma naléhavosti tohoto úkolu a jako aktivní účastník výzkumu a vývoje klade silný důraz na transfer výsledků směrem k praxi, k potenciálním uživatelům, a snaží se výsledky výzkumného úsilí co nejšířeji volně zpřístupnit.
Strojové učení je rychle se rozvíjejícím oborem studia a výzkumu. Letošní rok jednoznačně ukázal, že budoucnost patří „umělé inteligenci”. Technologie strojového učení se stanou běžnou součástí každodenního života a na tuto změnu by měl být ve všech aspektech připraven i svět knihoven. Knihovny jsou přirozenými centry celoživotního vzdělání, jejichž prostřednictvím jsou veřejnosti poskytovány zdroje pro rozvoj vzdělanosti a současně rozvíjeny nástroje pro práci s těmito zdroji. Využití špičkových informačních technologií a přesun aktivit do virtuálního prostoru vytváří tlak na procesy, které definují samotné jádro knihovnických služeb. Inovovaný design knihovnických služeb tak úzce souvisí nejen s technickými možnostmi v oblasti digitálního světa, ale především s tím, jak knihovníci, jako informační specialisté, budou schopni artikulovat a předvídat reálné potřeby uživatelů na pozadí stále se zrychlujícího technologického vývoje. Knihovny jako správci kulturního a znalostního bohatství se tak stávají hybridními institucemi, které poskytují tradiční i digitální fond a fyzický i virtuální prostor. V době, která je označována za postfaktickou, knihovny tak mohou přebírat roli ručitelů objektivity a přesnosti informací a uchovávají kulturní dědictví, přičemž na tomto poslání spolupracují s dalšími paměťovými a univerzitními institucemi.
ŠVEC, Jan. Projekty strojového učení v Moravské zemské knihovně v Brně. Duha: Informace o knihách a knihovnách [online]. 2023, 37(2) [cit. 2024-12-30]. ISSN 1804-4255. Dostupné z: http://duha.mzk.cz/clanky/projekty-strojoveho-uceni-v-moravske-zemske-knihovne-v-brne
/*
Duha vychází 4× ročně v elektronické i tištěné podobě. Tištěná čísla ve formátu PDF naleznete zde.
|
|