Metapodatkovni sistemi portala SIstory – teoretična izhodišča

1Metapodatki so strukturirane informacije, ki opisujejo, razlagajo, locirajo ali kakor koli olajšajo prenos, uporabo in upravljanje informacijskega vira. Metapodatki so pogosto opisani kot »podatki o podatkih«. Ker pa mnogi menijo, da s to ohlapno definicijo prezremo raznolikost in številne naloge, ki jih metapodatki opravljajo, so se razvile še druge definicije. Med najbolj poznane in najpogosteje uporabljene sodi definicija, ki metapodatke opredeljuje kot strukturirane informacije o informacijskem viru, ki omogočajo njegov priklic, uporabo oziroma upravljanje.20

2Metapodatke delimo v tri skupine:

  • Opisni metapodatki opišejo vir za različne namene, kot sta odkrivanje in identifikacija dela. Za to skupino so značilni identifikacijski elementi, na primer naslov, avtor, izvleček, ključne besede itd.
  • Strukturni metapodatki vsebujejo tehnične podatke oziroma podatke o zgradbi dokumenta. Opisujejo, kako so objekti dokumenta sestavljeni, na primer, kako so organizirane njegove strani, da tvorijo neko poglavje itd.
  • Administrativni metapodatki zagotavljajo podatke za upravljanje z virom. Povedo nam, kdaj in kako je bil vir ustvarjen, kakšnega formata je, komu je dostopen itd.

3Poznamo več podskupin administrativnih metapodatkov, pri čemer dve pogosto obravnavamo kot različna tipa metapodatkov. To so metapodatki za upravljanje s pravicami, ki zajemajo pravice intelektualne lastnine, in metapodatki za ohranjanje, ki vsebujejo informacije, potrebne za arhiviranje in shranjevanje vira.21

4Razlog za oblikovanje metapodatkov in njihova primarna naloga sta (čim bolj optimalna) najdljivost relevantnih informacij, ki jih uporabniki iščejo v določenem sistemu. Dobro oblikovani metapodatki pa seveda omogočajo (tudi) organizacijo elektronskih virov, interoperabilnost, identifikacijo virov, trajno hrambo in drugo.22 Primarne funkcije metapodatkov so navedene v nadaljevanju.

5Najdenje virov: Metapodatki se uporabljajo za iskanje vira, podobno kot podatki, ustvarjeni z dobrim katalogiziranjem. Omogočajo iskanje virov po ustreznih kriterijih, pomagajo pri identifikaciji vira, povezujejo podobne vire in jih ločujejo med seboj ter zagotavljajo informacije o njihovi lokaciji.

6Organiziranje elektronskih virov: Eksponentna rast elektronskih virov na spletu zahteva organizacijo povezav virov po ciljnih skupinah ali temah. Sezname povezav je mogoče ustvariti kot statične spletne strani z imeni virov in lokacijami, kodiranimi v HTML. Vendar pa je bolj učinkovito in dinamično ustvarjanje strani z metapodatki, shranjenimi v zbirkah podatkov.

7Danes poznamo tudi vedno več orodij, ki samodejno izvlečejo in oblikujejo informacije za spletne aplikacije.

8Interoperabilnost: Interoperabilnost je zmožnost, da si različni sistemi z različno strojno in programsko opremo izmenjajo informacije ne glede na vmesnik in strukturo informacij, pri čemer je izguba podatkov in funkcionalnosti zanemarljiva. Če vir opišemo z metapodatki, ga lahko razumejo tako človeški deležnik kot tudi različne naprave.

9Digitalna identifikacija: Poleg drugih elementov večina metapodatkovnih shem vključuje tudi edinstveno standardno številko, ki identificira delo ali predmet, na katerega se metapodatki nanašajo, in ga razlikuje od drugih podobnih objektov. Ime datoteke, URL, DOI ali drugi identifikatorji lahko označujejo tudi lokacijo vira. Svetovni splet je zelo fluidno okolje, zato so trajni identifikatorji, ki niso odvisni od lokacije objekta, najboljši način za opis objekta.

10Arhiviranje in ohranjanje: Digitalne informacije so zelo krhke in občutljive na tehnološke spremembe, zato obstaja strah, da v prihodnosti ne bodo več uporabne v trenutni obliki. Metapodatki so ključni za preživetje in dostop do vira ne glede na spremembe vira in njegovega okolja. Hranjenje in arhiviranje zahtevata nekatere elemente, ki omogočajo sledljivost oziroma zgodovino vira, na primer njegov izvor in spremembe, ki jih je bil deležen tekom obstoja. Pomembne so tudi fizične lastnosti in vedenje, ki omogočajo lažje preoblikovanje dela za prihodnjo uporabo.23

11Hitro rast števila internetnih virov in digitalnih zbirk spremlja veliko število metapodatkovnih shem, ki so bile zasnovane na podlagi zahtev posameznih uporabniških skupnosti, (predvidenih) uporabnikov, vrst gradiva, predmetnih področij, potreb projekta, programa itd. Tudi znotraj iste domene (ali celo za isto vrsto virov) pogosto obstaja več različnih metapodatkovnih standardov.24 Kljub temu obstaja verjetnost, da ti metapodatkovni standardi ne zadoščajo specifičnim lastnostim posamezne domene (ali lastnostim gradiva, standardom ustvarjalcev itd.). Ko definiramo lastnosti in domeno, se pogosto pojavijo vprašanja modifikacije obstoječega ali gradnje popolnoma novega metapodatkovnega nabora. Vprašanja lahko variirajo od preprostih, na primer: »Kateri metapodatkovni standard naj uporabimo za opis svojih informacijskih virov?«, do kompleksnejših, kot je vprašanje interoperabilnosti: »Kako prenesti podatke iz obstoječe metapodatkovne sheme v novo metapodatkovno shemo, ki se od prvotne razlikuje?« ali »Kako ukrepati, če obstoječi metapodatkovni standardi morda niso dovolj fleksibilni in ne naslavljajo vseh specifičnih lastnosti objektov, ki jih želimo opisati?«.25Odgovorov in predvsem pristopov pri iskanju ustrezne rešitve je več, kar v večini primerov sproži še več nadaljnjih vprašanj. Se torej lotimo oblikovanja lastne (domenske) metapodatkovne sheme, ki bo te specifičnosti upoštevala? Morda modificiramo obstoječi metapodatkovni standard v aplikacijski profil za to specifično domeno? Odgovori na takšna vprašanja so odvisni od lastnosti gradiva, ki ga želimo opisati, lastnosti informacijskega sistema, v katerega želimo gradivo vključiti, in (raziskovalnega) področja ter njegovih uporabniških skupin.

Aplikacijski profil SIstory

1Cilj aplikacijskega profila je prilagoditev metapodatkovne sheme za uporabo na določenem področju. V primeru aplikacijskega profila SIstory (v nadaljevanju AP SIstory) gre za aplikacijski profil, prilagojen za uporabo na področju zgodovinopisja – na portalu SIstory. Za boljšo ponazoritev strukture aplikacijskega profila SIstory bosta v nadaljevanju najprej opisani metapodatkovni shemi, iz katerih je sestavljen.26

2Metapodatkovna shema HOPE povezuje digitalne zbirke o socialni zgodovini in delavskem gibanju ljudi v Evropi, ki jih deli zainteresiranim javnostim na portalu Europeana.27 Aplikacjski profil HOPE sestavljajo različni elementi metapodatkovnih shem, razvitih za potrebe opisovanja lastnih dokumentov.

Slika 1: Struktura aplikacijskega profila HOPE
Slika 1: Slika 1: Struktura aplikacijskega profila HOPE
Vir: Lemmens et al. (2011). HOPE – Heritage of the People’s Europe – The Common HOPE Metadata Structure, including the Harmonisation Specification. Deliverable 2.2.Technical Report, HOPE – Heritage of the People’s Europe

3V drugem stolpcu (Slika 1) z oznako »domenski profili HOPE« (HOPE Domain Profiles) so prikazani elementi drugih metapodatkovnih shem; te so oblikovane v profile, ki omogočajo opisovanje različnih vrst gradiva. Ti elementi so vključeni v AP SIstory. HOPE tako vsebuje izbrane elemente iz različnih metapodatkovnih shem, ki so:

  • arhivski profil – elementi iz EAD 200228 in ISAD(G),29
  • knjižnični profil (skupina elementov za opis knjižničnega gradiva) – MARC2130 in ISBD31 Consolidated,
  • vizualni profil (slikovno gradivo) – LIDO32 in Spectrum 2.0,33
  • avdiovizualni profil – EFG34 in EN1590735 ter
  • profil Dublin Core – uporabljeni elementi iz profila Dublin Core.

4Druga shema, katere elementi so del AP SIstory, je Dublin Core (DC). Njegovi začetki segajo v marec 1995, ko je v Dublinu na Irskem potekala delavnica na temo metapodatkov pod okriljem Online Computer Library Center (OCLC) in National Center of Supercomputing Applications (NCSA). DC odlikujejo predvsem enostavnost ustvarjanja in vzdrževanja podatkovnih zapisov, splošno razumljiva semantika, mednarodni obseg in razširljivost.

5DC je kot niz osnovnih metapodatkovnih elementov za opis širokega nabora virov odgovor na potrebo po izboljšavi njihovih opisov.36 Potreba po standardu se je pojavila zaradi hitre rasti digitalnega spletnega gradiva, njegov namen pa je bil določiti nekaj elementov in splošnih pravil, s katerimi bi avtorji (brez posebnega znanja) opisovali svoje vire s »ključnimi besedami«. DC vsebuje petnajst elementov brez določenega vrstnega reda, vsi so neobvezni in ponovljivi. Ker so bila med strokovnjaki različna mnenja o stopnji enostavnosti metapodatkovne sheme, obstajata dve različici DC – osnovna in razširjena različica (DCTERMS), ki je danes najpogosteje uporabljena.37 Dublin Core Application Profile (DCAP) predstavlja smernice in okvir (framework) za razvoj in dokumentacijo aplikacijskih profilov. Aplikacijski profil je po DCAP sestavljen iz naslednjih komponent:

  • Funkcionalne zahteve (functional requirements) opisujejo funkcije, ki jih mora aplikacijski profil podpirati, prav tako pa označujejo omejitve aplikacijskega profila (funkcionalne zahteve, ki jih aplikacijski profil zaradi različnih omejitev ne bo podpiral).
  • Konceptualni oziroma domenski model (domain model) definira osnovne entitete in odnose med njimi ter predstavlja osnovni načrt za izgradnjo aplikacijskega profila.
  • Nabor metapodatkovnih elementov (description set profile) pomeni določanje metapodatkovnih elementov in definiranje njihovih omejitev.
  • Smernice za uporabo (usage guidelines) opisujejo, kako implementirati aplikacijski profil, njegove elemente, lastnosti itd.
  • Smernice za definiranje sintakse (encoding syntax guidelines) uporabljamo za kodiranje podatkov in določanje podatkovnih vrednosti.38

6AP SIstory si sposoja elemente in tudi določene lastnosti od obeh metapodatkovnih shem. Če aplikacijski profil HOPE primerjamo z AP SIstory, opazimo določene podobnosti. Prva podrobnost je dejstvo, da gre v obeh primerih za aplikacijski profil. Kot že omenjeno, HOPE uporablja elemente iz petih različnih metapodatkovnih shem in jih združuje v posamezne skupine glede na vrsto gradiva – EAD, MARC21, LIDO, EN15907 in DC. AP SIstory si od HOPE sposoja izbrane prvine iz vsake izmed skupin elementov (oziroma profilov). Tako torej AP SIstory sicer združuje elemente HOPE in DCTERMS, v resnici pa ti izhajajo iz različnih metapodatkovnih shem. AP SIstory je v marsikaterem pogledu zelo podoben AP HOPE, vendar zaradi vključevanja elementov DCTERMS uporablja tudi kvalifikatorje za podrobnejši opis določenih elementov.

7Po HOPE smo povzeli tudi organizacijo elementov v profile. Zadnji štirje sklopi elementov so poimenovani Arhivski elementi, Knjižničarski elementi, Za slikovno gradivo in Za avdio-vizualno gradivo ter vsebujejo določene izbrane elemente, prevzete iz aplikacijskega profila HOPE. Poudariti je treba, da si AP SIstory od HOPE ne izposoja vseh elementov, temveč le določene, ki so potrebni za opisovanje informacijskih virov za različne vrste gradiva (arhivske, knjižnične dokumente, slikovne in avdio-vizualne).

8Čeprav je AP SIstory skupek izbranih elementov med HOPE in DCTERMS, pa za potrebe portala vsebuje tudi določene lastne elemente, ki so predstavljeni v nadaljevanju.

9Načeloma so elementi AP SIstory sorodni elementom DCTERMS, vendar kljub temu ponujajo možnosti za podrobnejše opise. Opozoriti velja, da na zapisu metapodatkov niso prikazani vsi elementi SIstory, nekateri so namreč namenjeni le za rabo v sistemu. Ti elementi so v shemi AP SIstory pridobili imenski prostor SIstory, ki pomeni ločnico od elementov z istim imenom.39

Opombe

20. National Information Standards Organization – NISO. Understanding metadata. NISO Press, 2004, https://www.lter.uaf.edu/metadata_files/UnderstandingMetadata.pdf.

21. National Information Standards Organization – NISO.

22. Ibid.

23. Ibid.

24. Lois Mai Chan in Marcia Lei Zeng, Metadata Interoperability and Standardization. A Study of Methodology Part 1., 2006, http://www.dlib.org/dlib/june06/chan/06chan.html.

25. Marcia Lei Zeng, in Jian Qin, Metadata (London: Facet Publishing, 2008).

26. Več Katja Meden, Implementacija metapodatkov na portalu SIstory (Ljubljana: samozaložba, 2017), https://www.sistory.si/cdn/publikacije/40001-41000/40508/Implementacija_metapodatkov_na_spletnem_portalu_SIstory.pdf.

27. Heritage of People's Europe HOPE, 2013, http://www.peoplesheritage.eu/.

28. Encoded Archival Description je standard za kodiranje pripomočkov za iskanje, ki jih uporabljamo v omrežnem (spletnem) okolju. – Encoded Archival Description (EAD), 2021, https://www2.archivists.org/groups/technical-subcommittee-on-encoded-archival-standards-ts-eas/encoded-archival-description-ead#:~:text=Encoded%20Archival%20Description%20is%20a,Subcommittee%20for%20Encoded%20Archival%20Description.

29. General International Standard Archival Description opredeljuje elemente, ki naj jih vsebuje arhivski iskalni pripomoček. Mednarodni arhivski svet (ICA/CIA) ga je odobril kot mednarodni okvirni standard za registracijo arhivskih dokumentov, ki so jih ustvarile družbe, osebe in družine – ISAD(G) (b. d.), https://en.wikipedia.org/wiki/ISAD(G).

30. Format za bibliografske podatke je integriran format za identifikacijo in opis različnih oblik bibliografskega gradiva. Specifikacije MARC 21 so določene za knjige, serijske publikacije, računalniške datoteke, zemljevide, glasbo, vizualno gradivo in mešano gradivo. – The MARC 21 Formats: Background and Principles, 1996, https://www.loc.gov/marc/96principl.html#:~:text=The%20MARC%2021%20Format%20for,visual%20materials%2C%20and%20mixed%20material.

31. Mednarodni standardni bibliografski opis (ISBD) je glavni standard za spodbujanje univerzalnega bibliografskega nadzora, tj. omogočanje splošne in takojšnje dostopnosti v obliki, ki je mednarodno sprejemljiva, ko gre za osnovne bibliografske podatke za vse objavljene vire v vseh državah. – ISBD: International Standard Bibliographic Description: Consolidated Edition, 2011, https://www.ifla.org/wp-content/uploads/2019/05/assets/cataloguing/isbd/isbd-cons_20110321.pdf.

32. Lightweight Information Describing Objects je XML-shema [1] za opis muzejskih predmetov. Muzeji in podobne institucije uporabljajo LIDO za "razkrivanje, deljenje in povezovanje podatkov na spletu". – LIDO (b. d.), https://en.wikipedia.org/wiki/LIDO.

33. Spectrum je britanski standard za upravljanje muzejskih zbirk. – Introduction to Spectrum (b. d.), https://www.toppr.com/ask/content/concept/introduction-to-spectrum-229164/.

34. European Film Gateway.

35. EN 15907 opredeljuje nabor metapodatkov za celovit opis kinematografskih del, vključno z različnimi inkarnacijami, ki jih lahko prevzame v svojem življenjskem ciklu. – EN 15907, 2011, http://filmstandards.org/fsc/index.php/EN_15907.

36. Zeng in Qin, Metadata.

37. National Information Standards Organization – NISO.

38. Katja Meden, Oblikovanje in implementacija aplikacijskega profila za digitalne znanstvenokritične izdaje v repozitoriju SI-DIH (Ljubljana: samozaložba, 2021), https://repozitorij.uni-lj.si/Dokument.php?id=141559&lang=slv.

39. Meden, Implementacija metapodatkov.