Guia de l’usuari
NOTA: Aquesta és la traducció catalana d'octubre de 2012 de la versió anglesa de la pàgina wiki http://wiki.dublincore.org/index.php/User_Guide. La Guia de l'usuari ha estat completament revisada amb data de 2011. |
|
---|
- Contribuïdor: Stefanie Rühle
- Contribuïdor: Tom Baker
- Contribuïdor: Pete Johnston
Creació de metadades | Publicació de metadades
1 Objectiu i abast d’aquesta guia
5 URI i espais de nom [namespaces] del Dublin Core
6 Què són les dades enllaçades [linked data]
7 Dublin Core i dades enllaçades [linked data]
7.1 Nivells d’interoperabilitat
Objectiu i abast d’aquesta guia
"El Dublin Core" (també conegut com el Conjunt d’elements de metadades del Dublin Core (Dublin Core Metadata Element Set), creat el 1995, és un conjunt de quinze elements genèrics per descriure recursos. Aquests elements són: Creador, Contribuïdor, Editor, Títol, Data, Llengua, Format, Matèria, Descripció, Identificador, Relació, Font, Tipus, Cobertura, i Drets. Avui el Dublin Core és un estàndard [1] [2] [3], usat en nombroses implementacions, i un dels principals vocabularis en la Web.
Però les "metadades Dublin Core" són més que els quinze elements. Queden més ben descrites com un estil de metadades evolucionat a partir dels esforços per contextualitzar els quinze elements en una aproximació coherent a les metadades del World Wide Web en general. Des de les darreries de 1990, l’estil Dublin Core ha evolucionat en el Dublin Core Metadata Initiative (DCMI) –ara incorporat com a organització no lucrativa allotjada en la Biblioteca nacional de Singapur– conjuntament amb una aproximació genèrica a les metadades desenvolupades en el World Wide Web Consortium sota l’epígraf “la web semàntica” [Semantic Web]. Aquest enfocament de la web semàntica va arribar a un trencament el 2006 amb el moviment de les dades enllaçades [linked data], que utilitza el DCMI Metadata Terms com un dels seus vocabularis clau. El "DCMI Metadata Terms" és un conjunt més ampli que inclou els quinze elements i un bon nombre de propietats i classes relacionades. El "Dublin Core application profile" és l’expressió clau de l’estil Dublin Core. Un perfil d’aplicació utilitza termes de metadades del DCMI juntament amb termes d’altres vocabularis més especialitzats per descriure un tipus específic d’informació – i ho fa en el marc de la web semàntica.
Aquestes pautes proporcionen un punt d’entrada als usuaris del Dublin Core –això és, per als usuaris del DCMI Metadata Terms en l’"estil Dublin Core". Als catalogadors, se’ls ensenya com crear “descripcions” de metadades per a recursos d’informació com ara documents, imatges, dades, etc. Els implementadors, donaran suport amb la publicació de metadades Dublin Core com a dades enllaçades. Les pautes no ensenyen ni com s’han de crear els perfils d’aplicació Dublin Core –vegeu Guidelines for Dublin Core Application Profils– ni com s’ha d’expressar el Dublin Core Terms en diferents sintaxis (per exemple, xml) –vegeu la secció "Syntax Guidelines" of DCMI Specifications. Aquesta Guia de l’usuari conté les seccions següents:
- Guia de l’usuari: una breu introducció sobre el Dublin Core i els termes del Dublin Core [Dublin Core Terms]
- Creació de Metadades: una descripció de com crear continguts de metadades del DCMI il·lustrats amb exemples
- Publicació de Metadades: una descripció de com utilitzar les metadades del Dublin Core com a dades enllaçades il·lustrades amb exemples
Què són les metadades?
Les metadades han estat amb nosaltres des que la gent va començar a fer llistes en tauletes d’argila o en rotlles. El terme "meta" ve del grec “amb”. Amb el temps, "meta" es va utilitzar per denotar quelcom de transcendental o que va més enllà de la seva naturalesa. Les “Meta-dades”, són, doncs, "dades sobre dades", com ara el contingut dels catàlegs, inventaris, etc. Des dels anys noranta, les “metadades” s’associen a descripcions llegibles per màquina de coses, habitualment en el context de la web. Les descripcions estructurades de metadades ajuden a trobar recursos rellevants dins les masses indiferenciades de dades disponibles en línia. Quelcom amb interès pot ser descrit amb metadades, des de col·leccions de llibres fins a lligues de futbol o productes que es vulguin vendre. Descriure diferents tipus de recursos requereix diferents tipus de metadades i estàndards per a metadades.
Què és el Dublin Core?
A meitat dels anys noranta el Dublin Core començà amb la idea de les “metadades bàsiques” per a la descripció simple i genèrica de recursos electrònics. Un grup internacional i interdisciplinari de professionals procedents de les biblioteques, la informàtica, la codificació de textos i la comunitat dels museus, i altres camps acadèmics relacionats, desenvoluparen aquest estàndard bàsic – els quinze elements del Dublin Core. Però això només foren els primers passos –a partir d’aquell moment elWorld Wide Web canvià en molts aspectes i va iniciar el camí cap a la Web semàntica. El Dublin Core va seguir aquest camí desenvolupant altres estàndars per a metadades basats en el treball del World Wide Web Consortium sobre un model genèric de dades per a metadades, el Resource Description Framework (RDF). Al mateix temps, l’objectiu del Dublin Core es va ampliar des dels “recursos electrònics” per “encabir”, en principi, qualsevol objecte que pugui ser identificat, ja sigui electrònic, físic o conceptual, i en particular els recursos inclosos dins dels tipus citats en el DCMI Type Vocabulary.
Els estàndards de metadades del Dublin Core són, doncs, avui en dia:
- El DCMI Abstract Model (DCAM) –una sintaxi basada en RDF de model independent que suporta mapatges i traduccions de sintaxis diferents.
- El Sinagpore Framework for Dublin Core Application Profiles –un marc que defineix els components que calen per documentar un perfil d’aplicació compatible amb Dublin Core.
-
Els Vocabularis de Metadates Dublin Core
1. DCMI Metadata Terms en els /termes/ espais de nom
2. DCMI Type Vocabulary
3. Termes de metadades relacionats amb el DCMI Abstract Model
4. Dublin Core Metadata Element Set, Version 1.1
Termes Dublin Core
Els vocabularis Dublin Core de Metadades distingeixen quatre tipus de termes: propietats, classes, tipus de dades i vocabularis d’esquemes de codificació.
- Propietats o Elements del Dublin Core, respectivament, són els atributs "bàsics" dels recursos, usats per a la descripció uniforme i estructurada de recursos. Propietats com ara dc:title, dc:creator, etc. es defineixen en el Dublin Core Metadata Element Set (DCMES), que és el conjunt dels quinze elements genèrics creats als anys noranta. I propietats com ara dcterms:title, dcterms:alternative, etc. es defineixen com [1] termes de metadades del DCMI —també coneguts com a subpropietats o afinaments del DCMES. En els sistemes de registres basats en metadades, les propietats són anomenades generalment camps de metadades.
-
Les Classes són grups de recursos que tenen certes propietats en comú i que per tant queden juntes com a membres d’un sol concepte. Les Classes del Dublin Core són termes dels DCMI Type Vocabularies – per exemple, dcmitype:Collection, dcmitype:dataset, etc. El Dublin Core també defineix classes com a termes de metatadades del DCMI [ http://dublincore.org/documents/dcmi-terms/#H6] – per exemple, dcterms:Agent, dcterms:BibliographicResource, etc. Les relacions entre classes i propietats del Dublin Core són les següents:
♦ Cada propietat pot estar relacionada amb una classe o més per mitjà d’una relació de has domain relationship [té relació de domini], en la qual domini indica la classe de recursos que la propietat hauria d'utilitzar per descriure
♦ Cada propietat pot estar relacionada amb una classe o més per mitjà d’una relació de has range relationship [té relació de d’abast], en la qual abast indica la classe de recursos que s'haurien d'usar com a valors per a aquella propietat.
Per a més informació sobre dominis i abasts usats amb les propietats del DCMI vegeu Domains and Ranges for DCMI Properties
-
Tipus de dades o Syntax Encoding Schemes (SES) [esquemes de codificació de sintaxi (SES)], respectivament, són les regles que especifiquen com s’ha d’estructurar un valor. El Dublin Core defineix Syntax Encoding Schemes com a termes de metadades del DCMI –per exemple, dcterms:W3CDTF per a l’especificació de la data. La relació entre tipus de dades i propietats del Dublin Core és la següent:
♦ Certes propietats –per exemple, l’identificador, etc. poden estar tipificades per un esquema de codificació de sintaxi (SES), esquema de codificació de sintaxi (SES) estableix la sintaxi dels valors usats amb aquella propietat. -
Un Vocabulary Encoding Scheme (VES) [esquema de codificació de vocabularis (VES)] o Concept Scheme [esquema conceptual], respectivament, identifica els vocabularis controlats –com ara tesaurus, classificacions, encapçalaments de matèries, taxonomies, etc.–els termes dels quals poden ser usats com a valors. La relació entre un esquema de codificació de vocabularis i les propietats és la següent:
♦ Certes propietats –per exemple, matèria, cobertura, etc.– poden quedar restringides a un esquema de codificació de vocabularis (VES), en el qual el esquema de codificació de vocabularis (VES) estableix quins valors poden ser usats amb aquella propietat.
Aquesta Guia de l’usuari descriu l’ús de les Propietats del Dublin Core i la seva relació amb les classes, els esquemes de codificació de sintaxi (SES) i els esquema de codificació de vocabularis (VES). S'enumeren, doncs, totes les propietats definides en els dos espais de nom següents del DCMI Metadata Terms :
- http://purl.org/dc/elements/1.1/ (fent-hi referència amb el prefix curt "dc:")
- http://purl.org/dc/terms/ ("dcterms:")
i s’il·lustra el seu ús amb exemples. Els exemples s’ofereixen des de dos punts de vista: per al “catalogador” que crea les descripcions de metadades, generalment amb ajuda des d'una d’interfície del programari, i per al “tècnic” responsable de publicar les dades creades com a dades enllaçades.
- Creació de metadades: descriu com crear contingut per a les metadades del DCMI llistant les propietats pel seu nom, URI abreujat, i la seva definició, i agrupa les propietats relacionades –això és, les propietats que poden ser descrites amb pautes similars són il·lustrades amb exemples similars.
-
Publicació de metadades: descriu com s’han d’usar les metadades del DCMI com a dades enllaçades llistant les propietats pel seu espai de nom [namespace].
♦ Els espais de nom dels termes [terms namespace]
♦♦ usats amb valors literals
♦♦ usats amb valors no literals
♦ L'espai de nom [namespace] antic o d'element
La guia no fa referència a l’ús de les propietats del Dublin Core amb diferents sintaxis. Per a aquest tema, vegeu:
- Expressing Dublin Core metadata using the Resource Description Framework (RDF)
- Guidelines for implementing Dublin Core in XML
- Expressing Dublin Core Description Sets using XML (DC-DS-XML)
- Expressing Dublin Core metadata using HTML/XHTML meta and link elements
- Expressing Dublin Core metadata using the DC-Text format
URIs i espais de noms [namespaces] del Dublin Core
Cada terme del Dublin Core ha de tenir assignat un nom que és únic en el context d’un conjunt particular de termes DCMI –per exemple, resum— i un URI d’un espai de nom [namespace] DCMI que és l’únic identificador universal per a aquell terme –per exemple, http://purl.org/dc/terms/abstract
La DCMI Namespace Policy (política d’espai de nom del DCMI) defineix l’URI de terme del DCMI com “l’URI per a un terme declarat i gestionat pel DCMI” i un espai de nom del DCMI com “una col·lecció d'URI de termes del DCMI en què a cada terme li és assignat un URI que comença amb el mateix URI de base. L’URI de base es coneix com a l’URI DCMI Namespace. (Cal assenyalar que nom d'espai DCMI no és el mateix que 'nom d'espai XML'). Aquesta política de noms d'espai defineix els quatre URI de base següents:
- http://purl.org/dc/elements/1.1/ per a les quinze propietats del Conjunt de Metadades del Dublin Core Metadata Element Set –anomenat espai de nom antic [legacy namespace]
- http://purl.org/dc/dcmitype per a classes en el DCMI Type Vocabulary – anomenat espai de nom de tipus [type namespace]
- http://purl.org/dc/dcam per a termes usats en el DCMI Abstract Model (dels quals n’hi ha dos actualment)
- http://purl.org/dc/terms/ per a totes les altres propietats, classes, esquemes de codificació de vocabularis i tipus de dades del DCMI –anomenat espai de nom de termes [terms namespace]
Per a assegurar la interoperabilitat i persistència tots els URI del DCMI accedeixen les declaracions de termes DCMI processables per màquina, representant un o més termes DCMI.
Què són les dades enllaçades?
Les dades enllaçades són un mètode per exposar, compartir, i connectar dades en la web semàntica usant URIs i RDF (vegeu http://linkeddata.org/ ). Les metadades són l’espina dorsal d’aquest mètode, fent enunciats [statements] sobre les dades i sobre com es relacionen les unes amb les altres.
En les dades enllaçades aquests enunciats han de ser expressats amb Triples RDF, que divideixen els enunciats en tres parts.
el subjecte –la part que identifica la cosa que descriu l’ enunciat
el predicat –la part que identifica una propietat de la cosa descrita
l’objecte –la part que identifica el valor que té aquesta propietat quan es descriu aquesta cosa.
(vegeu: http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#statements)
Un altre “must” quan es publiquen metadades de dades enllaçades és l’ús de URIs. En les dades enllaçades es necessiten URIs que facin referència a les coses per mitjà de la identificació, localització i entrellaçament de les metadades. Considerant això com un graf triple que descriu "A Christmas Carol" de Charles Dickens, podria aparèixer de la següent manera:
Aquí el valor "A Christmas Carol" és una simple seqüència o un valor literal. Un altre tipus de valors usats en un triple són els valors no literals que signifiquen que s’usa un URI que fa referència a una altra descripció – la descripció d0’una cosa que és l’objecte de l’enunciat. En el nostre exemple l’URI de la dbpedia de Charles Dickens fa la referència a aquesta descripció.
Basat en el que s’ha dit anteriorment, una descripció de metadades en dades enllaçades consisteix en:
- una referència a un recurs descrit, això és, a la cosa sobre les quals són les metadades, el subjecte de les metadades. Aquesta referència pren la forma d’un URI (Uniform Resource Identifier) o d’un marcador de posició (placeholder) sense nom que és inferit del context (per exemple, aquestes metadades inserides en un document són sobre el document mateix).
- referències a les propietats: relacions tipificades entre el recurs descrit i diversos trossos de la informació descriptiva, o entre el recurs descrit i un altre recurs. Els exemples de propietats, que també es coneixen com a predicats, inclouen els quinze elements del Dublin Core.
- valors: trossos d’informació descriptiva (seqüència de literals) o referències a altres ens (recursos), com ara persones o conceptes, que estan relacionats amb el recurs descrit per mitjà de les propietats.
- referències a les classes: això és als tipus, o categories, de les coses, com ara la categoria llibres o la categoria persones.
- referències als esquemes de codificació de sintaxi (SES) (tipus de dades RDF), això és especificacions de com les seqüències de valors fan referència a les coses en el món, com ara 2010-09-24, que usa el patró AAAA-MM-DD especificat a la ISO 8601 per representar la data 24 de setembre de 2010.
- referències als esquemes de codificació de vocabularis (VES), conjunts enumerats de recursos dels quals les coses referenciades com a valors en són membres, la forma de pertinença d’un encapaçalament de matèries al VES Library of Congress Subject Headings.
- etiquetes de llengua que indiquen la llengua de les paraules usades en les seqüències de valors literals.
En un graf RDF podria aparèixer de la manera següent:
En aquest exemple el recurs descrit és una pàgina web referenciada amb l’URI http://www.gutenberg.org/files/46/46-h/46-h.htm. Podem fer referència a una classe --en el nostre exemple, la classe”text” del Dublin Core Type Vocabulary-- usant el tipus de propietat.
Altres propietats del recurs són “títol”, “autor”, “creat” i “matèria”. S’utilitza el literal - "A Christmas Carol" i "2004-08-11" – i els valors no literals - <http://dbpedia.org/resource/Charles_Dickens > i <http://id.loc.gov/authorities/sh85025303#concept >. Els valors literals poden quedar restringits pels tipus de dades. En el nostre exemple, els valors que descriuen dates estan conformes a W3CDTF. Una etiqueta de llengua pot ser usada per descriure la llengua d’un valor literal (en el nostre exemple el valor del títol és l’anglès). Els valors no literals poden quedar restringits per esquemes de codificació de vocabularis (VES). En el nostre exemple, el valor usat per descriure el tema del recurs és un concepte del Library of Congress Subject Headings. Aquesta relació s’especifica per la propietat memberOf.
Dublin Core i dades enllaçades
Des l’aparició de la web semàntica i les dades enllaçades, els implementadors han d’encarar un ampli ventall d’alternatives d’aplicacions de disseny. Les propostes tradicionals basades en registres de metadades i etiquetes descriptives inserides en pàgines web romanen com a alternatives efectives dins els entorns tancats i controlats d’implementació, mentre que les propostes amb dades enllaçades es dissenyen per proporcionar metadades de forma genèrica que siguin reutilitzables fàcilment per altres aplicacions per tal de “barrejar” les dades pròpies amb dades relacionades publicades per altres. Les dades enllaçades han donat un nou significat a les velles idees, com ara les metadades inserides, que s’estan reinventant amb les noves tecnologies web i eines que resolen els problemes pràctics de descoberta dels recursos i de navegació. “El Dublin Core" (i el DCMI Metadata Terms) proporcionen una base sòlida per unir aquestes propostes tradicionals amb les noves, i veient els termes DC “com una llengua menor per poder fer una classe particular d’enunciats [statements] sobre els recursos”. En aquesta llengua, els termes s’hi ordenen en simples patrons d’enunciats i les metadades DCMI de les propietats són usades com a predicats en els triples subjecte-predicat-objecte.
Per descriure això en forma de text es pot utilitzar Turtle Syntax for RDF. En aquesta sintaxi el triple podria aparèixer de la següent manera:
ex:myPicture | dc:title "Milking the goats" ; |
dc:creator <http://d-nb.info/gnd/131724126> . |
<http://d-nb.info/gnd/131724126 > | foaf:name "Rühle, Stefanie" ; |
foaf:workplaceHomepage <http://www.sub.uni-goettingen.de/ > . |
En aquest exemple hi ha dos enunciats sobre una imatge:
- té un titol, que és „Milking the goats
- té un creador, representat per l’URI http://d-nb.info/gnd/131724126
i dos enunciats sobre la persona que ha creat aquesta imatge:
- és un enllaç a la pàgina principal del seu lloc de treball
- i el seu nom.
L’objecte o valor que utilitzem a la menció del títol és una seqüència simple anomenada valor literal. El valor usat en la menció del creador és un valor no literal, un URI que porta a una altra descripció de metadades, en què la persona que és el creador es descriu d’una manera més detallada –pel seu nom i per la pàgina principal de la seva feina. Tot i que els enunciats que usem sobre la persona no són propietats Dublin Core no són per això menys compatibles, ja que en l’espai de nom queda explícitament declarat que aquests termes són propietats –un dels quatre termes (d’espai de nom) coneguts del Dublin Core– i se’ls ha assignat un URI propi (vegeu els URIs i espais de nom Dublin Core) aquests termes queden declarats explícitament com a propietats . Això significa que podem usar altres propietats que els termes Dublin Core ja que aquests termes són compatibles amb Dublin Core. D’aquesta manera Dublin Core proporciona una gramàtica per a una “llengua franca de metadades per a turistes digitals”, una gramàtica que permet fusionar termes obtinguts de diferents vocabularis de diferents comunitats en una sola llengua i pot ser usada per visualitzar les dues versions, la simple o la complexa. Amb aquesta gramàtica, el Dublin Core proporciona un mecanisme per ampliar el conjunt de termes Dublin Core a les necessitats addicionals de descoberta de recursos, esperant que altres comunitats creïn i administrin conjunts de metadades addicionals, específicss per a les necessitats de les seves comunitats
Nivells d’interoperabilitat
Les metadades són de molta ajuda quan es navega dins la jungla d’informació de la web –per trobar, identificar, usar els recursos— o per compartir i intercanviar informació estructurada. Tot i així hi ha una certa tensió entre els requeriments de les aplicacions i les persones:
- la gent prefereix les descripcions personalitzades que reflecteixin la seva percepció del món
- les aplicacions necessiten interoperabilitat entre les descripcions per poder processar-les eficientment.
Els vocabularis de metadades ajuden a superar aquest buit. Els vocabularis defineixen les propietats i classes que es poden utilitzar per descriure recursos de manera coherent dins o entre diverses comunitats. Un vocabulari proporciona una base comuna per a l’intercanvi de descripcions dins els grups de persones. Suporten la interoperabilitat de diferents aplicacions de metadades, i suporten la capacitat de les aplicacions per canviar les dades dins els sistemes amb nul·la o mínima pèrdua d’informació. El Dublin Core distingeix quatre nivells d’interoperabilitat. Aquesta Guia de l’usuari tracta del dos primers nivells:
- Nivell 1: Definicions de termes compartits: En aquest nivell, una comunitat utilitza les mateixes classes i propietats, per exemple, DCMI Metadata Terms. La creació de metadades suporta el primer nivell d’interoperabilitat. Però el nivell 1 d’interoperabilitat és tant obert que porta ràpidament a la proliferació de solucions particulars incompatibles amb la resta, com ara aquestes metadades expressades en formats que requereixen un programari específic per ser llegides i models de metadades que no poden mapar-se amb facilitat a representacions genèriques i interoperables com les que es poden expressar amb RDF. Per tant, aquesta guia recomana incloure el nivell 2 d’interoperabilitat.
- Nivell 2: Interoperabilitat semàntica formal: En aquest nivell, la descripció dels recursos es basa en, el model formal i compartit de metadades proporcionades pel W3C's Resource Description Framework (RDF), base de les dades enllaçades, o bé es pot mapar automàticament. És el punt dolç entre les implementacions ad-hoc i els models compartits de registres i restriccions, que romanen com l’objecte d’experimentació i recerca. Donada la situació el 2010, els implementadors poden dissenyar les seves metadades per a la seva compatibilitat. L’objectiu de les dades enllaçades juntament amb la confiança que asseguren la seva compatibilitat formal dins l’enorme creixement del Núbol de dades enllaçades. La publicació de metadades suporta aquest nivell d’interoperabilitat.
Els usuaris poden explorar la proposta de Dublin Core de compartir registres amb restriccions (Nivells 3 i 4) dels documents DCMI "Singapore Framework for Dublin Core Application Profiles", l’esborrany "Description Set Profiles: A constraint language for Dublin Core Application Profiles" , i les "Guidelines for Dublin Core Application Profiles" . Un exemple ben desenvolupat d’un perfil d’aplicació que segueix aquests principis que es pot trobar a "Scholarly Works Application Profile" .
Referències
1. ↑ http://www.iso.org/iso/search.htm?qt=15836&searchSubmit=Search&sort=rel&type=simple&published=on
2. ↑ http://www.niso.org/standards/z39-85-2007/
3. ↑ http://www.ietf.org/rfc/rfc5013.txt