EVSKP-MS

Metadatový soubor pro elektronické vysokoškolské kvalifikační práce v ČR
Návrh
Verze 0.1
2005-11-07
Tato verze
Aktuální verze
Zpracovatelé
Eva Bratková (Eva.Bratková@ff.cuni.cz)
Eva Bulínová (bulinova@ruk.cuni.cz)
Jan Mach (machj@vse.cz)

Obsah

1 Úvod 2 Metadatové prvky a jejich reprezentace 2.1 Metadatové prvky 2.1.1 Název VŠKP 2.1.2 Podnázev VŠKP 2.1.3 Překlad názvu VŠKP 2.1.4 Překlad podnázvu VŠKP 2.1.5 Autor VŠKP 2.1.6 Datum narození autora VŠKP 2.1.7 Předmětový popis VŠKP 2.1.8 Abstrakt VŠKP 2.1.9 Instituce archivující a zpřístupňující VŠKP 2.1.10 Osoby podílející se na vedení VŠKP 2.1.11 Osoby podílející se na oponování VŠKP 2.1.12 Datum vytvoření / odevzdání či podání VŠKP 2.1.13 Datum obhájení VŠKP 2.1.14 Typ VŠKP 2.1.15 Formát VŠKP 2.1.16 Identifikátor VŠKP 2.1.17 Jazyk VŠKP 2.1.18 Práva k využívání VŠKP 2.1.19 Přidělovaný akademický titul 2.1.20 Typ studijního programu 2.1.21 Studijní program a Studijní obor 2.1.22 Instituce přidělující titul 2.2 Reprezentace metadatových prvků 2.2.1 RDF/XML 2.2.2 XML 2.2.3 HTML/XHTML 2.3 Schémata kódování dat 2.3.1 Datum 2.3.2 Jazyk 2.3.3 Formát zdroje 2.3.4 Jména fyzických osob 2.4 Seznamy a číselníky 2.5 Příklad metadatového záznamu 3 Přispěvatelé

1 Úvod

Tento dokument definuje standardní národní metadatový soubor pro popis elektronických vysokoškolských kvalifikačních prací (e-VŠKP) obhájených na vysokých školách v České republice a metody reprezentace zařazených metadatových prvků pro potřeby jejich komunikace v prostředí počítačových sítí.

Některé vysoké školy v ČR, které již v současnosti zpracovávají ve svých lokálních systémech vysokoškolské kvalifikační práce v elektronické formě, připravily buď vlastní lokálně platné specifikace metadat, nebo adaptovaly specifikace z jiných systémů (domácích nebo zahraničních). Lokální specifikace jsou zpravidla definovány tak, aby splňovaly požadavky kladené pedagogickými nebo vědeckovýzkumnými pracovníky dané školy a také jejich vysokoškolskými knihovníky.

Tento dokument není určen k tomu, aby nahradil jednotlivé stávající lokální standardy metadat. Měl by plnit roli závazného národního standardu v jednotném systému národního registru pro sdílení metadat o e-VŠKP.

Předkládaná verze dokumentu (0.1) je prvním návrhem ze dne 7. listopadu 2005. Odbornou komisí pro otázky elektronického zpřístupňování vysokoškolských kvalifikačních prací AKVŠ je předkládána širší odborné veřejnosti k posouzení a připomínkování. Veškeré připomínky, náměty nebo dotazy adresujte pomocí elektronické pošty zpracovatelům návrhu (jejich email adresy viz titulní stránka). Zpracované připomínky budou promítnuty do dalších verzí dokumentu.

2 Metadatové prvky a jejich reprezentace

2.1 Metadatové prvky

V níže uvedeném přehledu je definováno celkem 22 metadatových prvků pro popis VŠKP v elektronické formě. Základní skupina uvedených prvků vychází z aktuální verze standardu Dublin Core (http://dublincore.org/documents/dces/), některé byly převzaty z aktuální verze standardu ETD-MS (http://www.ndltd.org/standards/metadata/current.html), který byl připraven mezinárodním systémem NDLTD (http://www.ndltd.org/index.en.html). Zařazení některých kvalifikátorů definovaných metadatových prvků byl inspirován německým národním standardem METADISS (http://deposit.ddb.de/metadiss.htm). Detailní popisy prvků českého národního standardu však zcela přihlížejí k praxi popisu VŠKP v ČR.

Jednotlivé metadatové prvky jsou uvedeny českým jménem v titulku, v tabulkovém přehledu je postupně prezentováno označení prvku a definované kvalifikátory, následuje informace o možnosti opakovaného výskytu prvku v jednom záznamu a informace o jeho závaznosti (povinný-nepovinný). Popis zahrnuje detailní informaci o prvku včetně jeho zápisu. Připojené příklady syntaxe v kódu XHTML jsou prozatímním doplňkem specifikace – podrobnější informace ke struktuře metadat jsou obsaženy v částech 2.2.-2.3.

2.1.1 Název VŠKP

Označení DC.title
Kvalifikátor lang="[kód jazyka]"
Opakovatelnost Ne
Povinný Ano
Popis Hlavní název VŠKP, který uvádí ve znění z její titulní stránky. Je povinný pro všechny typy VŠKP (viz prvek DC.type). Pomocí kvalifikátoru lang se označuje jazyk hlavního názvu.
Syntax XHTML <meta name="DC.title" xml:lang="[kód jazyka]" content="[Název VŠKP]" />

2.1.2 Podnázev VŠKP

Označení DC.title.alternative
Kvalifikátor lang="[kód jazyka]"
Opakovatelnost Ano
Povinný Ne
Popis Podnázev VŠKP nebo další informace k hlavnímu názvu. Uvádějí se ve znění z titulní stránky. Podnázvů nebo dalších informací k hlavnímu názvu může být více. K podnázvům nepatří formální označení typu VŠKP (uvádí se v rámci prvku DC.type). Pomocí kvalifikátoru lang se označuje jazyk podnázvu.
Syntax XHTML <meta name="DC.title.alternative" xml:lang="[kód jazyka]" content="[Podnázev VŠKP]" />

2.1.3 Překlad názvu VŠKP

Označení DC.title.translated
Kvalifikátor lang="[kód jazyka]"
Opakovatelnost Ano
Povinný Ne
Popis Hlavní název VŠKP přeložený do cizího jazyka, v prvním případě do angličtiny. Překlad hlavního názvu do angličtiny je povinný u disertačních prací. V dalších výskytech překladu hlavního názvu lze uplatnit i další jazyky. Překlad hlavního názvu vytváří autor práce a může být uveden již v odevzdané e-VŠKP. Pomocí kvalifikátoru lang se označuje jazyk překladu hlavního názvu.
Syntax XHTML <meta name="DC.title.translated" xml:lang="[kód jazyka]" content="[Název v cizím jazyce]" />

2.1.4 Překlad podnázvu VŠKP

Označení DC.title.alternative.translated
Kvalifikátor lang="[kód jazyka]"
Opakovatelnost Ano
Povinný Ne
Popis Podnázev nebo další informace k názvu přeložené do cizího jazyka, v prvním případě do angličtiny. Překlad podnázvu do angličtiny je povinný u disertačních prací. V dalších výskytech překladu podnázvu lze uplatnit i další jazyky. Překlad podnázvu vytváří autor práce a může být uveden již v odevzdané e-VŠKP. Pomocí kvalifikátoru lang se označuje jazyk přeloženého podnázvu.
Syntax XHTML <meta name="DC.title.alternative.translated" xml:lang="[kód jazyka]" content="[Podnázev v cizím jazyce]" />

2.1.5 Autor VŠKP

Označení DC.creator
Kvalifikátor
Opakovatelnost Ne
Povinný Ano
Popis Entita (osoba) primárně odpovědná za vytvoření obsahu VŠKP, tj. její autor. Jméno se zapisuje ve formě Příjmení, Křestní jméno. Křestní jméno může být po mezeře následováno dalším jménem (například Kolínský, Jiří František).
Syntax XHTML <meta name="DC.creator" content="[Příjmení, Křestní jméno]" />

2.1.6 Datum narození autora VŠKP

Označení DC.creator.dateofbirth
Kvalifikátor scheme="DCTERMS.W3CDTF"
Opakovatelnost Ne
Povinný Ne
Popis Datum narození autora VŠKP. Údaje zapisuje autor práce a mohou být uvedeny také v jejích prelimináriích. Údaje o datu narození se zapisují v modelech definovaných standardem konsorcia W3C, který zahrnuje také mezinárodní normu ISO 8601 (http://www.w3.org/TR/NOTE-datetime). Uplatněno může být úplné datum narození v modelu RRRR-MM-DD nebo jenom rok narození v modelu RRRR.
Syntax XHTML <meta name="DC.creator.dateofbirth" scheme="DCTERMS.W3CDTF" content="RRRR-MM-DD" />
Schéma <link rel="DCTERMS.W3CDTF" href="http://www.w3.org/TR/NOTE-datetime" />

2.1.7 Předmětový popis VŠKP

Označení DC.subject
Kvalifikátor lang="[kód jazyka]"; scheme="[kód systému]"
Opakovatelnost Ano
Povinný Ne
Popis Téma VŠKP vyjádřené buď ve formě autorských volně tvořených klíčových slov jednoslovných i víceslovných, nebo ve formě termínů z nějakého řízeného předmětového systému (hesláře, tezauru). Kódy vybraných řízených systémů užívaných v ČR jsou uvedeny v autorizovaném číselníku NK ČR (http://www.nkp.cz/pages/page.php3?page=fond_kodovnik.htm). Jednotlivé termíny (klíčová slova, hesla, deskriptory) budou oddělovány od předchozích pomocí středníku. V opakovatelném výskytu lze zapisovat ekvivalenty v cizích jazycích, prioritně v angličtině.
Syntax XHTML <meta name="DC.subject" xml:lang="[kód jazyka]" content="[klíčová slova]" />
<meta name="DC.subject" scheme="[označení řízeného systému]" xml:lang="[kód jazyka]" content="[termíny z řízeného systému]" />

2.1.8 Abstrakt VŠKP

Označení DC.description
Kvalifikátor lang="[kód jazyka]"
Opakovatelnost Ano
Povinný Ano
Popis Textový popis VŠKP, zahrnující detaily vztahující se k tématu, tj. cíle, hypotézy, metody, závěry apod. Text vytváří autor. V dalším výskytu se u disertačních prací zapisuje povinně také abstrakt v angličtině.
Syntax XHTML <meta name="DC.description" xml:lang="[kód jazyka]" content="[Abstrakt VŠKP]" />

2.1.9 Instituce archivující a zpřístupňující VŠKP

Označení DC.publisher
Kvalifikátor
Opakovatelnost Ano
Povinný Ne
Popis Instituce odpovědná za uložení, trvalou archivaci a zejména zpřístupnění VŠKP v elektronické formě. V opakovatelných výskytech lze uvést i více institucí. Zpřístupňující institucí nemusí být instituce (škola), která přidělila akademickou hodnost (titul). Jméno se zapisuje ve formalizované podobě (Univerzita. Fakulta).
Syntax XHTML <meta name="DC.publisher" content="[Jméno instituce]" />

2.1.10 Osoby podílející se na vedení VŠKP

Označení DC.contributor.advisor
Kvalifikátor
Opakovatelnost Ano
Povinný Ne
Popis Entity (osoby) odpovědné za vedení VŠKP. Označení role se v kvalifikující informaci prvku uvádí v anglickém jazyce (advisor). Jména osob se zapisují ve formě: Příjmení, Křestní jméno; doplňující informace. Doplňující informaci lze uvést pro lepší identifikaci entity (rok narození aj.).
Syntax XTML <meta name="DC.contributor.advisor" content="[Příjmení, Křestní jméno]" />

2.1.11 Osoby podílející se na oponování VŠKP

Označení DC.contributor.referee
Kvalifikátor
Opakovatelnost Ano
Povinný Ne
Popis Entity (osoby) odpovědné za oponování VŠKP. Označení rolí se v kvalifikující informaci prvku uvádí v anglickém jazyce (referee). Jména osob se zapisují ve formě Příjmení, Křestní jméno; doplňující informace. Doplňující informaci lze uvést pro lepší identifikaci entity (rok narození aj.).
Syntax XTML <meta name="DC.contributor.referee" content="[Příjmení, Křestní jméno]" />

2.1.12 Datum vytvoření / odevzdání či podání VŠKP

Označení DC.date.created
Kvalifikátor scheme="DCTERMS.W3CDTF"
Opakovatelnost Ne
Povinný Ano
Popis Datum vytvoření VŠKP. Ve většině případů jde zároveň o datum odevzdání práce. Datum se vyskytuje na titulní stránce. Údaje o datu se zapisují v modelech daných standardem konsorcia W3C, který zahrnuje také mezinárodní normu ISO 8601 (http://www.w3.org/TR/NOTE-datetime). Uplatněno může být datum v modelu RRRR-MM-DD, RRRR-MM nebo jen RRRR. Například: 2005-05-12, 2005-05 nebo 2005.
Syntax XHTML <meta name="DC.date.created" scheme="DCTERMS.W3CDTF" content="[RRRR-MM-DD]" />
Schéma <link rel="DCTERMS.W3CDTF" href="http://www.w3.org/TR/NOTE-datetime" />

2.1.13 Datum obhájení VŠKP

Označení DC.date.accepted
Kvalifikátor scheme="DCTERMS.W3CDTF"
Opakovatelnost Ne
Povinný Ne
Popis Datum obhajoby VŠKP. Údaj by měl být v podmínkách ČR zapisován až po obhajobě a měl by být autorizován odpovědným pracovníkem komise pro obhajoby. Zapisuje se přesné datum obhajoby, které je uvedeno také v protokolu obhajoby. Údaje o datu se zapisují v modelech definovaných standardem konsorcia W3C, který zahrnuje také mezinárodní normu ISO 8601 (http://www.w3.org/TR/NOTE-datetime). Uplatněno může být datum v modelu RRRR-MM-DD, RRRR-MM nebo jen RRRR. Například: 2005-05-12, 2005-05 nebo 2005.
Syntax XHTML <meta name="DC.date.accepted" scheme="DCTERMS.W3CDTF" content="[RRRR-MM-DD]" />
Schéma <link rel="DCTERMS.W3CDTF" href="http://www.w3.org/TR/NOTE-datetime" />

2.1.14 Typ VŠKP

Označení DC.type
Kvalifikátor lang="[kód jazyka]" ; scheme="typ EVSKP"
Opakovatelnost Ano
Povinný Ano
Popis Jde o označení povahy, obsahu či žánru VŠKP. Uvádějí se hodnoty podle schématu EVSKP. V opakovatelném výskytu lze zapisovat hodnoty v jiných jazycích.
Syntax XHTML <meta name="DC.type" content="disertační práce" />
<meta name="DC.type" content="text.dissertation" />
<meta name="DC.type" content="text.thesis" />

2.1.15 Formát VŠKP

Označení DC.format
Kvalifikátor scheme="DCTERMS.IMT"
Opakovatelnost Ano
Povinný Ano
Popis Označení datového formátu digitální kopie VŠKP, ve kterém je odevzdávána, ukládána a/nebo zpřístupňována (například RTF, PDF, LaTeX, HTML aj.). Hodnoty budou předdefinovány podle autorizovaného seznamu formátů organizace IANA (Internet Assigned Numbers Authority) (http://www.iana.org/assignments/media-types/). Seznam formátů je připraven na základě standardů MIME (IMT) - RFC 2045 (http://www.isi.edu/in-notes/rfc2045.txt) a RFC 2046 (http://www.isi.edu/in-notes/rfc2046.txt).
Syntax XHTML <meta name="DC.format" scheme="DCTERMS.IMT" CONTENT="[Prvek ze seznamu hodnot]" />
Schéma

<link rel="schema.DCTERMS" href="http://purl.org/dc/terms/" />

2.1.16 Identifikátor VŠKP

Označení DC.identifier
Kvalifikátor scheme="URI"
Opakovatelnost Ano
Povinný Ano
Popis Jednoznačná identifikace e-VŠKP. Může jít o označení místa uložení VŠKP v elektronické formě, z něhož ji uživatel může získat (například URL). URL bude povinně uváděným identifikátorem. Perspektivně je i pro ČR doporučováno zavedení a užívání jedinečných trvalých identifikátorů typu URN, PURL (http://purl.org), Handles (http://handle.net), DOI aj.
Syntax XHTML <meta name="DC.identifier" scheme="URL" content="[URL e-VŠKP]" />
<meta name="DC.identifier" scheme="URN" content="[URN VŠKP]" />
<meta name="DC.identifier" scheme="URN:NBN:CZ" content="[URN v daném jmenném prostoru NBN v rámci NK ČR webarchivu]" />
<meta name="DC.identifier" scheme="DOI" content="[DOI VŠKP]" />

2.1.17 Jazyk VŠKP

Označení DC.language
Kvalifikátor
Opakovatelnost Ano
Povinný Ano
Popis Jazyk intelektuálního obsahu VŠKP. Jde o hlavní jazyk napsání práce. V dalším výskytu lze zaznamenat i jiný jazyk, v němž jsou napsány významné části práce.
Syntax HTML <meta name="DC.language" content="[kód jazyka]" />

2.1.18 Práva k využívání VŠKP

Označení DC.rights
Kvalifikátor Lang="[kód jazyka]"
Opakovatelnost Ano
Povinný Ne
Popis Textová informace o právech k využívání VŠKP; specifikují se podmínky, na základě kterých může být práce distribuována, reprodukována atd.; stanovit lze i dobu, po kterou dané podmínky platí a kontakt na osoby, které se o práva starají.
Syntax XHTML <meta name="DC.rights" xml:lang="[kód jazyka]" content="[Úplný text právního významu]" />

2.1.19 Přidělovaný akademický titul

Označení thesis.degree.name
Kvalifikátor
Opakovatelnost Ne
Povinný Ano
Popis Zkratka akademického titulu přidělovaného vysokou školou (například Ph.D., Doc., JUDr. Mgr., Ing. aj.). Údaje budou přebírány z předdefinovaného seznamu a budou v souladu s platným Zákonem o VŠ/1998 (§ 45-47 a 72).
Syntax HTML <meta name="thesis.degree.name" content="[Zkratka hodnosti]" />

2.1.20 Typ studijního programu

Označení thesis.degree.level
Kvalifikátor
Opakovatelnost Ne
Povinný Ne
Popis Typ studijního programu, v jehož rámci byla připravena VŠKP (doktorský, magisterský, bakalářský aj.). Údaje budou uváděny v souladu s platným Zákonem o VŠ/1998 (§ 45-47 a 72)
Syntax XHTML <meta name="thesis.degree.level" content="[Jméno programu]" />

2.1.21 Studijní program a Studijní obor

Označení Thesis.degree.discipline
Kvalifikátor
Opakovatelnost Ne
Povinný Ano
Popis Studijní program a studijní obor akreditovaný příslušnou komisí MŠMT, v jejichž rámci byla připravena a obhájena VŠKP. Seznam studijních programů akreditovaných v ČR je k dispozici na WWW serveru MŠMT: http://www.msmt.cz/files/xls/CelkovyprehledASpr23082005.xls . Seznamy akreditovaných programů a studijních oborů jsou také k dispozici i na WWW severech jednotlivých škol. Údaje by se měly uvádět přímo v dokumentu na titulní stránce. Jejich registrace je žádoucí z důvodů efektivního online vyhledávání. Doporučuje se zápis dle modelu: Studijní program/Studijní obor

Příklady:
Filozofie/Religionistika
Ekonomie/Ekonomické teorie
Syntax XHTML <meta name="thesis.degree.discipline" content="[Jméno Studijní programu/Studijní oboru]" />

2.1.22 Instituce přidělující titul

Označení thesis.degree.grantor
Kvalifikátor
Opakovatelnost Ne
Povinný Ano
Popis Instituce (škola) garantující přidělení titulu spojeného s vytvořením VŠKP (například Univerzita Karlova v Praze, Vysoká škola ekonomická aj.). Jméno se zapisuje ve formalizované podobě (Univerzita. Fakulta).
Syntax XHTML <meta name="thesis.degree.grantor" content="[Jméno instituce]" />

2.2 Reprezentace metadatových prvků

Pro reprezentaci sady metadatových prvků eVŠKP lze použít několik různých syntaxí zápisu, které jsou uvedeny jako doporučení, příp. návrh doporučení Dublic Core Metadata Initiative (DCMI, viz http://www.dublincore.net/resources/expressions/). Jedná se o syntaxe:

Centrální registr odpovědný za sběr metadat musí na straně importu podporovat všechny výše uvedené syntaxe zápisu. Centrální registr bude dále nabízet webové služby, které umožní jednoduchý převod z jednoho podporovaného formátu do druhého.

Lokální systémy, které exportují data do centrálního registru, musí podporovat alespoň jeden z výše jmenovaných způsobů zápisu na straně exportu. Interní reprezentace metadat v lokálních systémech není nijak předepisována a je plně na tvůrcích každého jednotlivého systému.

Je zapotřebí vypracovat systém ověřování metadatových souborů, pro soubory na bázi XML připadá v úvahu starší systém DTD (nedoporučováno používat) a novější XML Scheme, které má rozšířené možnosti validace dat.

2.2.1 RDF/XML

Výchozí standard Resource Description Framework (RDF) je definován konsorciem W3C (viz http://www.w3.org/RDF/) a pro potřeby Dublin Core (DC) je specifikován jako jednoduchý (http://dublincore.org/documents/dcmes-xml/) nebo kvalifikovaný (http://dublincore.org/documents/dcq-rdf-xml/) zápis Dublin Core v RDF/XML. Zápis kvalifikovaného Dublin Core je v přípravě, a proto vycházíme především ze zápisu jednoduchého Dublin Core v RDF/XML.

Dokument musí začínat na prvním řádku deklarací XML

<?xml version="1.0"?>
Pokud není uvedeno kódování, je použito kódování UTF-8. Mezi doporučená kódování patří UTF-8, ISO-8859-2 a CP-1250.

Po deklaraci následuje reference na XML DTD nebo XML Scheme.

Další část XML dokumentu je tvořena deklarací RDF a jmenných prostorů, např.

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/">

Uvnitř elementu rdf:RDF je vnořen minimálně jeden element popisující jednu práci, např.

<rdf:Description rdf:about="http://example.org/">
...
</rdf:Description>

Uvnitř elementu rdf:Description jsou uvedeny jednotlivé prvky popisující e-VŠKP, které mohou obsahovat atributy xml:lang pro popis jazyka nebo rdf:about pro upřesnění metadatového prvku.

Příklad zápisu v RDF/XML

<?xml version="1.0" encoding="utf-8" ?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:thesis="http://eVSKP/scheme/thesis/">
<rdf:Description>
   <dc:type>Diplomová práce</dc:type>
   <dc:title xml:lang="cs" >Úvod do problematiky veřejného výpůjčního práva</dc:title>
   <dc:language>cs</dc:language>
   <dc:creator>Kábrtová, Jana</dc:creator>
   <dc:contributor.advisor>Přibylová, Daniela</dc:contributor.advisor>
   <dc:contributor.referee>Kera, Denisa</dc:contributor.referee>
   <dc:date.created>2001-10-04</dc:date.created>
   <thesis:degree.name>Mgr.</thesis:degree.name>
   <thesis:degree.level>magisterský</thesis:degree.level>
   <thesis:degree.grantor>Univerzita Karlova v Praze. Filozofická fakulta. Ústav informačních studií a knihovnictví</thesis:degree.grantor>
   <dc:publisher>KSV Jinonice</dc:publisher>
   <dc:identifier>
       <dcterms:URI>http://doi.vskp.cz/120.12/31</dcterms:URI>
   </dc:identifier>
   <dc:description>Práce se zabývá problematikou veřejného výpůjčního práva (dále VVP) jak v historickém kontextu, tak jeho současnou praxí v existujících světových systémech. Práce je rozdělena do sedmi kapitol. -- První kapitola je věnována světové terminologii užívané v oblasti VVP... </dc:description>
</rdf:Description>
</rdf:RDF>

2.2.2 XML

Standard XML je pro potřeby standardu Dublin Core podrobněji specifikován ve zvláštním doporučení (viz http://dublincore.org/documents/dc-xml-guidelines/). Toto doporučení kromě syntaxe pro prvky Dublin Core obsahuje návod pro implementaci prvků nad rámec Dublin Core. Na rozdíl od implementace jednoduchého Dublin Core bude XML obsahovat další prvky definované níže v tomto dokumentu (viz kapitola 5 Kvalifikovaný Dublin Core ve výše zmíněném doporučení).

Základní pravidla kódování metadat:

Pro potřeby eVŠKP bude definováno XML schéma pro validaci dokumentu, použití XML DTD není doporučováno

Pro potřeby eVŠKP budou definovány jmenné prostory pro použití v XML

Jednotlivé kvalifikátory jsou implementovány jako XML elementy a jejich hodnota jako obsah elementů. Použitý jazyk je uveden jako atribut xml:lang, použité kódovací schéma jako atribut xsi:type

Všechna jména elementů jsou psány malým písmenem

Pro zapsání více metadatových prvků stejného jména je použito opakování XML elementu, příp. s odlišením jazyka a schématu v atributech, např.

<dc:title xml:lang="cz">Titulek</dc:title>
<dc:title xml:lang="en">Title</dc:title>
Ke zvážení je zápis „rozšířených“ Dublin Core prvků, v úvahu přichází varianty:
  1. <dc:contributor.advisor>
       Přibylová, Daniela
    </dc:contributor.advisor>
  2. <dc:contributor>
       <advisor>Přibylová, Daniela</advisor>
    </dc:contributor>

Příklad zápisu v XML:

<?xml version="1.0" encoding="utf-8" ?>
<metadata xmlns="http://eVSKP.cz/scheme/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:thesis="http://eVSKP/scheme/thesis" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://eVSKP.cz/scheme/ http://eVSKP.cz/scheme/schema.xsd">
   <dc:type>Diplomová práce</dc:type>
   <dc:title lang="cs">Úvod do problematiky veřejného výpůjčního práva</dc:title>
   <dc:language xsi:type="dcterms:RFC3066">cs</dc:language>
   <dc:creator>Kábrtová, Jana</dc:creator>
   <dc:contributor.advisor>Přibylová, Daniela</dc:contributor.advisor>
   <dc:contributor.referee>Kera, Denisa</dc:contributor.referee>
   <dc:date.created xsi:type="dcterms.w3cdtf">2001-10-04</dc:date.created>
   <thesis:degree.name>Mgr.</thesis:degree.name>
   <thesis:degree.level>magisterský</thesis:degree.level>
   <thesis:degree.grantor>Univerzita Karlova v Praze. Filozofická fakulta. Ústav informačních studií a knihovnictví</thesis:degree.grantor>
   <dc:publisher>KSV Jinonice</dc:publisher>
   <dc:identifier xsi:type="dcterms:URI">http://doi.vskp.cz/120.12/31</dc:identifier>
   <dc:description lang="cs">Práce se zabývá problematikou veřejného výpůjčního práva (dále VVP) jak v historickém kontextu, tak jeho současnou praxí v existujících světových systémech. Práce je rozdělena do sedmi kapitol. -- První kapitola je věnována světové terminologii užívané v oblasti VVP...</dc:description>
</metadata>

2.2.3 HTML/XHTML

Kódování v HTML/XHTML je vhodné pro účely kódování metadat do HTML/XHTML stránky s obsahem e-VŠKP.

Jednotlivé kvalifikátory jsou kódovány jako XHTML značka META,

Kvalifikátory DC aj. jsou psány velkými znaky, následuje tečka, pokračování kvalifikátoru může být zapsáno velkými či malými písmeny, první písmeno však musí být vždy malé (jedná se o doporučení, není závazné). Příklad:

<meta name="DC.title" xml:lang="cs" content="Ústavní právo">
<meta name="DC.language" scheme="DCTERMS:RFC3066" content="cs">

Příklad zápisu v HTML/XHTML:


<head profile="http://dublincore.org/documents/dcq-html/">
<title>Ukázka zápisu v HTML/XHTML</title>
<link rel="schema.DC" URL="http://purl.org/dc/elements/1.1/">
<link rel="schema.DCTERMS" URL="http://purl.org/dc/terms/">
<meta name="DC.type" content="Diplomová práce">
<meta name="DC.title" xml:lang="cs" content="Úvod do problematiky veřejného výpůjčního práva">
<meta name="DC.language" scheme="DCTERMS:RFC3066" content="cs">
<meta name="DC.creator" content="Kábrtová, Jana">
<meta name="DC.contributor.advisor" content="Přibylová, Daniela">
<meta name="DC.contributor.referee" content="Kera, Denisa">
<meta name="DC.date.created" scheme="DCTERMS:W3CDTF" content="2001-10-04">
<meta name="THESIS.degree.name" content="Mgr.">
<meta name="THESIS.degree.level" content="magisterský">
<meta name="THESIS.degree.grantor" content="Univerzita Karlova v Praze. Filozofická fakulta. Ústav informačních studií a knihovnictví">
<meta name="DC.publisher" content="KSV Jinonice">
<meta name="DC.identifier" scheme="DCTERMS:URI" content="http://doi.vskp.cz/120.12/31">
<meta name="DC.description" xml:lang="cs" content="Práce se zabývá problematikou veřejného výpůjčního práva (dále VVP) jak v historickém kontextu, tak jeho současnou praxí v existujících světových systémech. Práce je rozdělena do sedmi kapitol. -- První kapitola je věnována světové terminologii užívané v oblasti VVP...">
</head>

2.3 Schémata kódování dat

Pro tvorbu a komunikaci metadat v národním i mezinárodním rámci jsou specifikovány potřebné standardy zápisu některých definovaných prvků (datum, jazyk, jméno apod.), které jsou závazné. Primárně se používají schémata DC (http://purl.org/dc/elements/1.1/) a DCTERMS (http://purl.org/dc/terms/).

2.3.1 Datum

Formát data se řídí dle standardu ISO 8601, jehož obsah je zahrnut i v dokumentu Konsorcia W3C (http://www.w3.org/TR/NOTE-datetime). Přípustné jsou různé varianty od zápisu jen roku přes zápis konkrétního dne (preferováno) až po přesnou definici času. Položky dne jsou odděleny pomlčkou, v případě času je povinný znak T a uvedení časové zóny (pro ČR „+01:00“)

Příklady:

<meta name="DC.date" content="2005" />
<meta name="DC.date" content="2005-01" />
<meta name="DC.date" content="2004-12-31" />
<meta name="DC.date" content="2004-12-31T19:20+01:00" />

2.3.2 Jazyk

Podle internetového standardu RFC 3066 (http://www.ietf.org/rfc/rfc3066.txt) je při kódování jazyka možné vycházet z normy ISO 639-1 (stanovuje dvoumístné kódování jazyka, za pomlčku lze uvést volitelně dvoumístný kód země) nebo normy ISO 639-2 (třímístné kódování jazyka, konkrétně ISO 639-2/B). V případě, že existuje dvoumístný kód, doporučuje se použít spíš kód dvoumístný než třímístný. Autorizovaný seznam kódů z ISO 639-2 (Codes for the representation of names of languages) je veden a udržován v rámci Registračního úřadu (autority) při LC (http://www.loc.gov/standards/iso639-2/englangn.html).

Neautorizovaný seznam kódů z normy ISO 639-2 je v překladu do češtiny z roku 2001 k dispozici také na URL: <http://www.mpo.cz/xqw/webdav/-UTF8-/dms_mpo/getFileinternet/11534/8488/jazyky_en.pdf>

Použitelná schémata:

Příklad:

<meta name="DC.language" scheme="ISO 639-2" content="cze" />
<meta name="DC.language" scheme="ISO 639-1" content="cs" />
<meta name="DC.language" content="cs" />
<meta name="DC.title" xml:lang="en" content="Second title" />

2.3.3 Formát zdroje

Označení formátu elektronického souboru je prováděno většinou automaticky, ale jeho označení je významné při přenosu elektronického dokumentu, konverzi a při stahování dokumentu k uživateli. Standardem je běžně používaný Internet Media Types - MIME (Multipurpose Internet Mail Extensions) popsaný v RFC 2046 (http://www.ietf.org/rfc/rfc2046.txt). Přehled typů MIME je k dipozici také na URL (je odkazován ze základních specifikací DCMI): (http://www.iana.org/assignments/media-types/index.html).

Příklad:

<meta name="DC.format" scheme="DCTERMS.IMT" content="application/pdf">

Další vybrané formáty dle MIME:

2.3.4 Jména fyzických osob

Jména fyzických osob se zapisují ve formě: Příjmení, Křestní Jména

Příklad:

<meta name="DC.creator" content="Mácha, Karel Hynek">

2.4 Seznamy a číselníky

Seznamy/číselníky slouží jako jednotný zdroj používaných hodnot pro jednotlivé vybrané metadatové prvky. Doporučuje se používat mezinárodní a národní jmenné soubory autoritních záznamů a číselníky a dále zavést vlastní schéma EVSKP obsahující jednotlivé číselníky s trvalými odkazy na aktuální XML seznamy (lze využít při počítačovém zpracování – seznam nahrát a dát uživateli ve formuláři na výběr ve formě menu).

Všechny číselníky by měly být dostupné na unikátní perzistentní URL adrese. Budou mít doporučující charakter (tj. je možné použít i hodnotu neuvedenou v seznamu). Jednotlivé seznamy je možné dle požadavků jednotlivých uživatelů rozšiřovat o další hodnoty.

Pro e-VŠKP budou zapotřebí následující seznamy:

2.5 Příklad metadatového záznamu

Záznam reálné disertační práce s omezeným veřejně dostupným množstvím metadat (v kódu XHTML)

...
<link rel="schema.DC" href="http://purl.org/dc/elements/1.1" />
<link rel="schema.DCTERMS" href="http://purl.org/dc/terms/" />
<meta name="DC.title" xml:lang="cze" content="Nestandardní modely pro rozhodování a vyjednávání ekonomických subjektů týkající se ekonomických informací" />
<meta name="DC.creator" content="Hlaváček, Michal" />
<meta name="DC.description" xml:lang="cze" content="Tato disertační práce je věnována relativně nové oblasti ekonomie informací. Tento obor ekonomie je zajímavý mimo jiné tím, že se nachází na průniku zájmu jinak relativně striktně oddělených oblastí ekonomie jakými jsou například mikroekonomie, makroekonomie, teorie finančních trhů a finančního zprostředkování a pod. Disertační práce se skládá z pěti na sobě relativně nezávislými kapitolami, které mají charakter separátních článků, a které pokrývají výše uvedené oblasti. V první kapitole je prezentován model, který vysvětluje existenci finančního zprostředkování existencí informační asymetrie vycházející z obdobného modelu v článku Holmström, Tirole (1997). V kapitole druhé je prezentován mikroekonomický model pokoušející se modelovat předávání informací mezi dvěma subjekty, mezi kterými existuje pozitivní externalitní vazba, kde je modelována relativní ochota donátora předávat informaci v závislosti na jeho velikost. Ve třetí kapitole je uveden model producenta informačních komodit (či komodit, které v sobě skrývají vysoké fixní výzkumné náklady), který má sice nulové mezní náklady a využívá možností monopolu, oproti tomu však čelí omezení souvisejícím s hrozbou vstupu konkurenta. Z jeho pohledu je tento vstup náhodnou událostí závisející na výši zisku (čím vyšší zisk, tím vyšší pravděpodobnost vstupu konkurenta), kterou producent váží s opačným rizikem odchodu vlastníků z titulu nízkého zisku. Ve čtvrté kapitole je uvedena aplikace teorie transferu informací do makroekonomie, když je zde prezentován model difuse technologie se zpožděním mezi rozvinutou zemí vyvíjející nové technologie, a zemí zaostalou, která tyto technologie pouze se zpožděním kopíruje. Je ukázáno, že takovýto model může i při realistických předpokladech vysvětlit v realitě sledované rozdíly v ekonomické úrovni zemí (na rozdíl od standardních modelů s výzkumem a vývojem), přičemž zde klíčovou roli hraje právě faktor zpoždění. V kapitole jsou dále diskutovány faktory ovlivňující velikost faktoru zpoždění, především pak role lidského kapitálu. V závěrečné páté kapitole je prezentován probitový/logitový model odhadu přežívání podniků v letech 1998-2001. Na jeho základě je pak konstatováno, že v uvedené době hrála zřejmě difuse technologií v přežívání podniků významnou roli." />
<meta name="DC.publisher" content="Univerzita Karlova. Fakulta sociálních věd. Institut ekonomických studií" />
<meta name="DC.contributor.advisor" content="Cahlík, Tomáš" />
<meta name="DC.date.created" scheme="DCTERMS.W3CDTF" content="2004-08-01" />
<meta name="DC.type" content="text.dissertation" />
<meta name="DC.format" scheme="DCTERMS.IMT" content="text/pdf" />
<meta name="DC.identifier" scheme="URL" content="http://ies.fsv.cuni.cz/storage/work/406_hlavacek.pdf" />
<meta name="DC.language" scheme="ISO639-2" content="cze" />
<meta name="thesis.degree.name" content="Ph.D." />
<meta name="thesis.degree.level" content="doktorský" />
<meta name="thesis.degree.discipline" content="Ekonomie/Ekonomické teorie" />
<meta name="thesis.degree.grantor" content="Univerzita Karlova. Fakulta sociálních věd" />
...

3 Přispěvatelé

Text návrhu standardu EVSKP-MS byl jako interní dokument připravován postupně Pracovní skupinou (viz zpracovatelé) Odborné komise pro otázky elektronického zpřístupňování vysokoškolských kvalifikačních prací AKVŠ, a to zhruba v období od června 2004 do listopadu 2005. Návrh standardu v jeho první veřejné verzi (EVSKP-MS, verze 0.1) byl vícenásobně diskutován na pravidelných zasedáních Odborné komise. Předkládaná verze byla v základních částech schválena dne 3. 10. 2005. K formulacím textu v rámci diskusí přispěli zejména: