Utilitzar el Dublin Core
Títol | Utilitzar el Dublin Core |
Contribuïdor (traducció): | Biblioteca de Catalunya |
Creador: | |
Data d'edició: | 2002-04-25 |
Identificador: | http://www.bnc.cat/sprof/normalitzacio/dc/dc_guide0.php |
última versió anglesa: | |
Traduccions: | |
Estatus del document: | Traducció catalana d'una Recomanació de la DCMI |
Descripció del document: | Aquest document està pensat com a punt d'entrada dels usuaris del Dublin Core. Ajudarà els no especialistes a crear registres descriptius simples de recursos d'informació (per exemple, documents electrònics). Els especialistes poden trobar en el document un punt de referència útil per a la documentació del Dublin Core, a mesura que aquesta canvia i creix. |
Sumari
1.1 Què són les metadades?
1.2 Què és el Dublin Core?
1.3 Objectiu i abast d'aquesta guia
2. Sintaxi i qüestions relacionades
2.1 HTML
2.2 RDF/XML
2.3 Metadades incloses en un recurs
2.4 Metadades independents
3. Principis bàsics dels elements descriptius
3.1 Contingut dels elements i vocabularis controlats
5.1 Classes de qualificadors
5.2 El principi "Dumb-Down"
6.1 Exemples genèrics[Enllaç al document original en anglès]
6.2 Exemples en HTML simples [Enllaç al document original en anglès]
6.3 Exemples en HTML qualificats [Enllaç al document original en anglès]
6.4 Exemples en RDF simples (de pròxima aparició)
6.5 Exemples en RDF qualificats (de pròxima aparició)
6.6 Exemples d'altres fonts:
7. Glossari[Enllaç al document original en anglès]
8. Lectures i referències[Enllaç al document original en anglès]
1. Introducció
1.1 Què són les metadades?
Es pot dir que hi ha metadades d'ençà que el primer bibliotecari va fer una llista dels documents d'un prestatge amb rotlles manuscrits. El terme "meta" ve d'una paraula grega que vol dir "juntament, amb, després, a continuació". Però, de fet, el llatí o el català empren el prefix "meta" per designar alguna cosa transcendent o que va més enllà de la naturalesa. Les metadades, doncs, es poden considerar dades sobre altres dades. és el terme de l'era Internet per a la informació que els bibliotecaris han donat tradicionalment en els catàlegs i que fa referència més comunament a la informació descriptiva sobre recursos web.
Un registre de metadades consta d'un conjunt d'atributs o elements necessaris per a descriure el recurs en qüestió. Per exemple, un sistema de metadades comú en biblioteques -el catàleg de biblioteques- consta d'un conjunt de registres de metadades amb elements que descriuen un llibre o qualsevol altre document d'una biblioteca: autor, títol, data de creació o edició, matèries i signatura topogràfica que especifica la localització del document al prestatge.
L'enllaç entre un registre de metadades i el recurs que descriu pot prendre una d'aquestes dues formes:
1. els elements es poden incloure en un registre separat del document, com en el cas d'un registre del catàleg d'una biblioteca; o
2. les metadades poden estar inserides en el recurs mateix.
Com a exemples de metadades inserides que es troben incorporades en el recurs mateix, hi ha les dades CIP (Cataloging In Publication) impreses al verso de la portada del llibre, o la capçalera TEI en un text electrònic. Moltes de les normatives de metadades que s'utilitzen avui en dia, incloent-hi la normativa del Dublin Core, no prescriuen cap tipus d'enllaç i permeten decidir en cada implementació particular.
Tot i que el concepte de metadades és anterior a Internet i al Web, l'interès per les normatives i les pràctiques de metadades ha esclatat amb l'augment de l'edició electrònica i les biblioteques digitals i amb la "sobrecàrrega d'informació" resultant de les grans quantitats de dades digitals indiferenciades disponibles en línia. Tothom qui hagi provat de trobar informació en línia utilitzant un dels populars serveis de cerca al Web haurà experimentat la frustració de recuperar centenars, i fins i tot milers d'"encerts", amb una limitada capacitat per a afinar o per a fer més precisa la cerca. L'adopció a gran escala de normatives i pràctiques descriptives de metadades per als recursos electrònics millorarà la recuperació de recursos pertinents a Internet. Com fan notar Weibel i Lagoze, dos dels capdavanters en el camp del desenvolupament de metadades:
"L'associació de metadades descriptives normalitzades amb els objectes de la xarxa té com a potencial la millora substancial de les capacitats de descoberta de recursos per mitjà de cerques basades en camps (per exemple, autor, títol), que permeten la indexació d'objectes no textuals i el seu accés al contingut substitutiu, que és diferent d'aquell accés al contingut del recurs mateix" (Weibel i Lagoze, 1997).
és, precisament, a aquesta necessitat de "metadades descriptives normalitzades" on s'adreça el Dublin Core.
1.2 Què és el Dublin Core?
La normativa de metadades del Dublin Core és un conjunt d'elements simple però efectiu per a descriure una àmplia gamma de recursos en la xarxa. La normativa del Dublin Core comprèn quinze elements, la semàntica dels quals ha estat establerta per consens per un grup internacional de professionals de disciplines diverses, com ara la biblioteconomia, la informàtica, la codificació de textos, la comunitat museística i altres camps relacionats del coneixement.
El Dublin Core també es pot considerar com un "llenguatge reduït per a fer una classe particular d'enunciats sobre recursos" (Baker, 2000). En aquest llenguatge hi ha dues classes de termes –els elements (substantius) i els qualificadors (adjectius)– que es poden ordenar en un model simple d'enunciats. Els recursos mateixos són els subjectes implícits d'aquest llenguatge. En el món divers d'Internet, el Dublin Core pot ser considerat com una "llengua franca de metadades per a turistes digitals": aferrada fàcilment, però no necessàriament, fins a la comesa d'expressar relacions o conceptes complexos.
El conjunt d'elements del Dublin Core es perfila a la Secció 4. Tots els elements són opcionals i es poden repetir. Tots els elements tenen també un conjunt limitat de qualificadors, és a dir, d'atributs que poden ser utilitzats per afinar més (no per ampliar) el significat de l'element. La Dublin Core Metadata Initiative (DCMI) ha definit vies normalitzades per a "qualificar" els elements amb diferents tipus de qualificadors. Hi ha disponible un conjunt de qualificadors recomanats d'acord amb la "bona pràctica" de la DCMI, juntament amb una llista formal en elaboració.
Tot i que el Dublin Core afavoreix els objectes en forma de document (ja que els recursos textuals tradicionals són bastant ben entesos), també es pot aplicar a altres recursos. La seva idoneïtat d'utilització amb recursos no documents individuals dependrà fins a cert punt de la similitud de les seves metadades amb les metadades d'un document típic i també de quin objectiu s'hagi pensat que han d'acomplir les metadades. (S'invita als implementadors interessats a utilitzar el Dublin Core per a diferents recursos que fullegin les pàgines del Dublin Core Projects per tal de veure-hi idees sobre com utilitzar les metadades del Dublin Core per als seus recursos).
El Dublin Core té com a objectius assolir les següents característiques:
- Simplicitat de creació i manteniment
El conjunt d'elements del Dublin Core s'ha mantingut tan reduït i simple com ha estat possible per tal de permetre als no especialistes crear de manera fàcil i econòmica registres descriptius simples per als recursos d'informació, alhora que es proporcionen els mitjans adequats per a una recerca efectiva en l'entorn de la xarxa.
- Semàntica entesa comunament
La descoberta d'informació a través del vast camp d'Internet es veu dificultada per les diferències en la terminologia i en les pràctiques descriptives que hi ha d'un camp del coneixement a un altre. El Dublin Core pot ajudar el "turista digital" –un cercador no especialista– a trobar el seu camí, ja que ofereix un conjunt d'elements comuns, la semàntica dels quals és compresa i suportada universalment. Per exemple, els científics interessats en localitzar articles d'un autor determinat i els estudiants interessats en les obres d'un artista determinat poden estar d'acord en la importància de l'element "creador". Una tal convergència en un conjunt d'elements comuns, encara que lleugerament més genèrics, incrementa la visibilitat i l'accessibilitat de tots els recursos dins d'una disciplina concreta i més enllà.
- Abast internacional
El conjunt d'elements del Dublin Core es va desenvolupar originàriament en anglès, però s'han fet versions en moltes altres llengües, incloent el finès, el noruec, el tailandès, el japonès, el francès, el portuguès, l'alemany, el grec, l'indonesi i l'espanyol. L'Special Interest Group on Dublin Core on Multiple Languages coordina les tasques d'enllaçar aquestes versions en una llista distribuïda que utilitza la tecnologia del Resource Description Framework desenvolupada pel World Wide Web Consortium (W3C).
Tot i que els reptes tecnològics de la internacionalització de la World Wide Web no han estat dirigits per la comunitat de desenvolupament del Dublin Core, la implicació de representants de quasi tots els continents ha assegurat que el desenvolupament de la normativa tingui en consideració la naturalesa multilingüe i multicultural del món de la informació electrònica.
- Extensibilitat
En equilibrar les necessitats de simplicitat en la descripció de recursos digitals amb la necessitat d'una recuperació precisa, els desenvolupadors del Dublin Core han reconegut la importància de proporcionar un mecanisme per a ampliar el conjunt d'elements DC a les necessitats afegides de la descoberta de recursos. S'espera que altres comunitats d'experts en metadades crearan i administraran conjunts de metadades addicionals. Les metadades d'aquests conjunts es podran enllaçar amb les metadades del Dublin Core per a cobrir les necessitats d'extensibilitat. Aquest model permet que diferents comunitats utilitzin els elements del DC per a la descripció d'informació bàsica, la qual serà utilitzable a Internet en permetre l'addició de dominis específics que prenen sentit dins d'un camp més limitat. Actualment s'estan desenvolupant instruccions específiques per a implementar un model d'aquest tipus.
1.3 Objectiu i abast d'aquesta guia
Aquest document està pensat com a punt d'entrada per als usuaris del Dublin Core. Ajudarà els no especialistes a crear registres descriptius simples de recursos d'informació (per exemple, documents electrònics, imatges JPEG, videoclips). Els especialistes poden trobar en el document un punt de referència útil per a la documentació del Dublin Core, a mesura que aquesta canvia i creix.
La guia mostra d'una manera no tècnica com qualsevol pot utilitzar les metadades del Dublin Core per fer més accessible el seu material. Aquesta guia tracta de la presentació i el contingut dels elements de les metadades del Dublin Core, de com utilitzar-les per compondre un registre complet de metadades Dublin Core i de com qualificar els elements per tal de donar suport a una àmplia varietat de comunitats.
Un altre dels objectius importants d'aquest document és promoure les "bones pràctiques" de descripció de recursos en utilitzar el conjunt d'elements del Dublin Core. La comunitat del Dublin Core reconeix que la coherència en la creació de metadades és una clau important per a aconseguir una recuperació completa i una visualització intel·ligible enmig de fonts dispars de registres descriptius. Les metadades incoherents amaguen efectivament els registres volguts i produeixen uns resultats en la cerca que són incomplets, imprevisibles o desiguals.
2. Sintaxi i qüestions relacionades
En aquesta guia, hem optat per representar els exemples de Dublin Core en diferents sintaxis, incloent-t'hi: HTML (el format Hypertext Markup Language del Web), RDF/XML (el Resource Description Framework que utilitza Extensible Markup Language) i d'una forma genèrica (Element="valor"). L'HTML proporciona un format de fàcil comprensió per a manifestar els conceptes subjacents del Dublin Core, però per a aplicacions més complexes que utilitzen la qualificació té més sentit l'ús de l'RDF/XML. Quan es considera apropiada una sintaxi, és important tenir en compte que els conceptes del Dublin Core són aplicables a pràcticament qualsevol format de fitxer, sempre que les metadades es presentin de forma adequada per tal de ser interpretades tant per un motor de cerca com per un ésser humà.
2.1 HTML
"Encoding Dublin Core Metadata in HTML" (Kunze, 1999) proporciona una guia per a utilitzar HTML amb Dublin Core no qualificat, tant si les metadades estan inserides en el recurs com si van en un fitxer a part.
També es pot utilitzar HTML per a expressar el Dublin Core qualificat, però fer-ho comporta unes limitacions intrínseques. La idea actual de com aconseguir-ho de la millor manera es troba en el document de treball: Recording qualified Dublin Core metadata in HTML meta elements.
2.2 RDF/XML
L'RDF (Resource Description Framework) permet que diversos esquemes de metadades puguin ser llegits tant pels éssers humans com analitzats per les màquines. L'RDF utilitza l'XML (Extensible Markup Language) per a expressar l'estructura que permet a les comunitats de metadades definir la semàntica actual. Aquest mètode descentralitzat reconeix que un sol esquema no és apropiat per a totes les situacions i que aquests esquemes necessiten un mecanisme d'enllaç independent d'una autoritat central per a facilitar la descripció, la identificació, la comprensió, la utilització i/o l'intercanvi.
L'RDF permet la descripció de diferents objectes sense especificar el detall requerit. L'aglutinant subjacent, l'XML, simplement requereix que es defineixin tots els espais de nom [namespaces] i que un cop definits puguin ser utilitzats en la mesura necessària del proveïdor de metadades.
Per exemple:
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" |
||
xmlns:dc="http://purl.org/dc/elements/1.1/"> |
||
<rdf:Description rdf:about="http://media.example.com/audio/guide.ra"> |
||
<dc:creator>Rose Bush</dc:creator> |
||
<dc:title>A Guide to Growing Roses</dc:title> |
||
<dc:description>Describes process for planting and nurturing different kinds of rose bushes.</dc:description> |
||
<dc:date>2001-01-20</dc:date> |
||
</rdf:Description> |
||
</rdf:RDF> |
Aquest exemple simple utilitza Dublin Core per si mateix per a descriure un enregistrament sonor d'una guia per a cultivar rosers. Amb XML i RDF, Dublin Core es pot combinar amb altres vocabularis de metadades. Per exemple, la descripció anterior en Dublin Core simple es pot utilitzar juntament amb altres vocabularis com ara vCard, el qual pot descriure l'afiliació de l'autor i la informació de contacte o amb un vocabulari més especialitzat de "descripció de roses" que descrigui els rosers amb més detall.
2.3 Metadades incloses en un recurs
Algunes aplicacions que utilitzen el Dublin Core han triat d'inserir les seves metadades dins del recurs mateix. Aquest mètode es presenta més sovint en documents codificats en HTML, però de vegades també és possible en altres classes de documents. S'han desenvolupats eines simples per tal de proporcionar fàcilment metadades Dublin Core en pàgines codificades en HTML. Una eina d'aquest tipus, la DC.dot, extreu informació de metadades d'un document en HTML i la formata de manera que es pugui editar i després tallar i tornar a enganxar dins de la capçalera d'HTML del document original.
2.4 Metadades independents
Hi pot haver metadades independents en qualsevol tipus de bases de dades i generalment proporcionen un enllaç amb el recurs descrit. Aquest mètode és probable que sigui el més pràctic per a molts recursos no textuals i també s'està incrementant el seu ús en text, principalment per a suportar de manera més fàcil el manteniment i el compartiment de metadades.
3. Principis bàsics dels elements descriptius
Tots els elements són opcionals i repetibles. Els elements de metadades poden aparèixer en qualsevol ordre. L'ordenació de les diverses ocurrències d'un mateix element (per exemple, Creator) pot tenir una significació volguda pel proveïdor, però no es garanteix que l'ordenació sigui conservada en l'entorn de cada usuari. Per exemple, RDF/XML suporta l'ordenació, però en canvi HTML no ho fa.
3.1 Contingut dels elements i vocabularis controlats
Les dades del contingut d'alguns elements es poden seleccionar en un "vocabulari controlat", és a dir, en un conjunt limitat de termes utilitzats coherentment i definits acuradament. Això pot millorar espectacularment els resultats de la cerca perquè els ordinadors són prou bons per a casar paraules però febles pel que fa a la comprensió de la forma amb la qual la gent es refereix a un sol concepte utilitzant paraules diferents, això és els sinònims. Sense un control bàsic de la terminologia, les metadades incoherents o incorrectes poden degradar profundament la qualitat dels resultats de cerca. Per exemple, sense un vocabulari controlat, "caramels" i "llaminadures" poden ser utilitzats per referir-se al mateix concepte. Els vocabularis controlats, en canvi, poden reduir la probabilitat d'errors de picat quan s'anoten metadades.
Un dels costos d'un vocabulari controlat és la necessitat d'un cos administratiu que revisi, actualitzi i difongui el vocabulari. Per exemple, el Library of Congress Subject Headings (LCSH) i el National Library of Medicine Medical Subject Headings (MeSH) són vocabularis formals, indispensables per a cercar els reculls catalogats amb rigor. Tots dos, però, requereixen organitzacions de suport significatives. Un altre dels costos es troba en la necessitat de formació de cercadors i creadors de metadades de manera que sàpiguen quan han d'utilitzar el MeSH per entrar, per exemple, "infart de miocardi" en lloc del terme més col·loquial "atac de cor".
La utilització de vocabularis controlats es pot fer més efectiva per mitjà dels qualificadors.
4. Elements bàsics
Aquesta secció llista tots els elements bàsics amb el seu nom complet i etiqueta. Per a cada element hi ha una descripció de referència (DCMES 1.1 i traducció catalana) i hi ha unes pautes que ajuden en la creació del contingut de metadades, tant si es fa "des de zero" com si es fa a partir de la conversió de registres existents en un altre format. També es proporcionen els enllaços amb els exemples i els Qualificadors del Dublin Core recomanats per a cada element.
Els elements estan llistats en l'ordre en què van ser desenvolupats, però hi ha altres maneres útils d'agrupar-los. En la taula següent, es pot veure que alguns elements fan referència al contingut del document, d'altres a la propietat intel·lectual del document i altres a la instanciació, o versió, particular del document.
5. Qualificadors
5.1 Classes de qualificadors
El juliol de 2000 el Dublin Core Metadata Initiative va publicar la seva llista de Qualificadors del Dublin Core recomanats. En el moment de la ratificació d'aquests qualificadors, la DCMI reconegué dues grans classes de qualificadors:
- Afinament dels elements. Aquests qualificadors fan que el significat d'un element sigui més reduït o més específic. Un element afinat participa del significat d'un element no qualificat, però amb un abast més restringit. Un client que no entén un element específic, hauria de poder ignorar el qualificador i tractar el valor de la metadada com si fos un element no qualificat (més ampli). Les definicions dels termes d'afinament dels elements per als qualificadors haurien de ser disponibles públicament.
- Esquema de codificació. Aquests qualificadors identifiquen esquemes que ajuden a la interpretació del valor d'un element. Aquests esquemes inclouen vocabularis controlats i notacions formals o normes d'anàlisi. Un valor expressat utilitzant un esquema de codificació serà, per tant, una mostra seleccionada en un vocabulari controlat (això és, un terme d'un sistema de classificació o d'un conjunt d'encapçalaments de matèries) o d'una seqüència formada d'acord amb una notació formal (per exemple, "2000-01-01" com a expressió estàndard d'una data). Si un esquema de codificació no és entès per un client o un representant, el valor pot ser encara útil a un ésser humà. La descripció definitiva d'un sistema de codificació per als qualificadors ha de ser clarament identificada i estar disponible per a l'ús públic.
5.2 El principi "Dumb-Down"
La utilització de qualificadors com a nivell addicional de detall introdueix una situació en la qual el client pot trobar reculls de recursos descrits utilitzant Dublin Core amb qualificadors que són desconeguts per l'aplicació d'aquest client. Això pot succeir o bé perquè el client no suporta els qualificadors i el recull sí, o bé perquè el recull suporta qualificadors especialitzats desenvolupats pels implementadors per a les necessitats locals específiques o necessitats dels dominis.
La interpretació útil d'aquestes descripcions dependrà de la capacitat de l'aplicació d'ignorar els qualificadors desconeguts i tornar enrere fins al significat més ampli de l'element en la seva forma no qualificada. El principi que guia la qualificació del significat dels elements del Dublin Core, col·loquialment conegut com a "Dumb-Down Principle", és que el client ha d'ignorar qualsevol qualificador i utilitzar la descripció com si no fos qualificada. Tot i que això pot donar com a resultat una pèrdua d'especificitat, el valor de l'element restant (menys el qualificador) ha de continuar essent, generalment, correcte.