La LEMAC al llarg del temps: perspectives de futur
La Llista d'encapçalaments de matèria en català (LEMAC) és un vocabulari controlat format per encapçalaments de matèria —expressió lingüística (paraula o conjunt de paraules)— que representen el contingut temàtic d'un document —un concepte, un esdeveniment, un nom, un títol— emprats per fer una recerca en un catàleg, bibliografia o índex, tal com vam fer constar en l’article corresponent de la Viquipèdia en català.
Els vocabularis controlats identifiquen una forma preferent d’expressar un concepte, possibiliten múltiples punts d’accés (ex.: referències primeres o referències de vegeu) que remeten al terme preferent i proporcionen el joc de relacions d’un terme: altres termes més genèrics, altres termes més específics o, simplement, altres termes relacionats.
Una fase important i, potser la més intel·lectual de la catalogació, és la realització de l’anàlisi temàtica. L’anàlisi temàtica és l’acte de determinar i de resumir el contingut conceptual d’un document i és un procés consistent en dues etapes: la identificació del tema i la traducció del tema a un llenguatge controlat. El llenguatge controlat emprat per la Biblioteca de Catalunya, i per la major part del sistema bibliotecari català, és la Llista d'encapçalaments de matèria en català (LEMAC).
La LEMAC va ser iniciada el 1983 per l’Institut Català de Bibliografia (ICB) per a l’elaboració de l’índex alfabètic de matèries de la Bibliografia nacional de Catalunya i es va gestionar a través del mòdul del Sistema d’Informació per a Catàlegs Automatitzats de Biblioteques (SICAB). L’ICB va decidir adaptar els Library of Congress Subject Headings (LCSH), previ estudi de l’aleshores professor de l’Escola de Bibliologia, Jordi Rubió i Lois, a qui es va encomanar l’elaboració d’un projecte previ, el qual conservem en el nostre arxiu.
D’altra banda, els LCSH són el resultat de l’acumulació dels encapçalaments de matèria establerts per la Library of Congress des del 1868 i que han estat emprats des d’aleshores en la seva catalogació. Des del 1988, altres biblioteques han contribuït als LCSH amb els seus encapçalaments. Els LCSH també es poden cercar en línea en la Library of Congress Classification Web, a la qual s’accedeix per un servei de subscripció, o de forma gratuïta en l’enllaç Library of Congress Authorities. La Library of Congress publica actualitzacions setmanals. Aquestes dades són distribuïdes pel Cataloging Distribution Service, mitjançant el pagament d’una quota. L’any 2013 els LCSH es deixen de publicar en paper.
LCSH
El 1988, el Servei de Biblioteques de la Generalitat de Catalunya decideix fer una edició preliminar en paper de la Llista d’encapçalaments de matèria en català, després d’encomanar la traducció al català de la Lista de encabezamientos de materia para bibliotecas de Carmen Rovira i Jorge Aguayo, la qual se sumava a la tasca d’adaptació que l’Institut Català de Bibliografia feia dels LCSH. El 1991 es publica una altra edició en paper de l’edició preliminar actualitzada.
LEMAC
Arran de la publicació de la Llei 4/1993 del Sistema Bibliotecari de Catalunya i de la dissolució de l’ICB, amb el traspàs del seu personal a la Biblioteca de Catalunya (BC), va ésser el Servei de Normalització Bibliogràfica de la BC el que va assumir el manteniment de la LEMAC, que el 1999 es codifica en format llegible per màquina. A l’abril del 2002, la Llista d’encapçalaments de matèria en català es fa accessible per Internet a través de la pàgina web de la Biblioteca de Catalunya. Els registres d’autoritat de la LEMAC es poden visualitzar tant en forma de tesaurus com codificats en format MARC 21.
Altres llistes d'encapçalaments de matèria que també serveixen de base per a la creació dels registres de la LEMAC són en l’àmbit francòfon: el Répertoire de vedettes-matière de la Universitat de Laval (Laval RVM), reconeguda com la norma canadenca per la Biblioteca Nacional de Canadà i emprada per la xarxa de catalogació compartida; i el repertori Répertoire d’autorité matière encyclopédique et alphabétique unifié (RAMEAU), llista d’autoritat d’encapçalaments de matèria oficial a França, inspirat en la versió canadenca.
Després de fer una ràpida incursió en la història de la LEMAC, ens podem preguntar en quin moment es troba ara i quines són les seves perspectives de futur.
En primer lloc, a l’igual que va fer el Jordi Rubió al principi de la nostra trajectòria, cal que ens situem en el context bibliotecari català. Una gran part de les biblioteques del nostre país està caminant cap un nou canvi de sistema informàtic, que es convertirà en un sistema compartit per les biblioteques participants i que conduirà a la constitució d’un catàleg unificat. Això implica un augment ingent de la feina a fer i la necessitat de comptar amb un equip qualificat que pugui treballar en la construcció d’una LEMAC, que cada vegada serà més extensa i exhaustiva.
Però hi ha un altre fet crucial que està modificant el panorama de la normativa bibliotecària. Estem a punt d’implementar les RDA: Recursos, descripció i accés que és la nova norma de catalogació que substitueix les Regles angloamericanes de catalogació, 2a edició. RDA va més enllà dels codis de catalogació anteriors, perquè proporciona directrius per a la catalogació de recursos digitals, i està pensada per a la descripció i l'accés de qualsevol recurs. Els registres resultants de la seva aplicació podran ser utilitzats en diversos entorns digitals (Internet, OPAC web, etc.). RDA és una de les peces clau per al futur dels catàlegs en el web semàntic. En aquests moments la Library of Congress ja està modificant els encapçalaments dels LCSH afectats per aquesta nova normativa.
Paral·lelament al canvi de mentalitat que s’ha produït en la catalogació descriptiva per tal d’adaptar-se a l’entorn del web semàntic, el mateix canvi ha tingut lloc en el món de la catalogació de matèries. Passem a comentar, tot seguit, l’estat de la qüestió.
En els darrers anys s’ha plantejat una enorme polèmica sobre el sentit de la pervivència del llenguatge propi dels LCSH dins del nou entorn web. L’any 2006, la mateixa Library of Congress va estar dubtant sobre la conveniència de seguir mantenint els LCSH, però finalment, l’any 2008, l’informe redactat pel Library of Congress Working Group on the Future arribà a la conclusió que l’anàlisi temàtica –inclosa l’anàlisi del contingut i la creació i aplicació d’encapçalaments de matèria i de classificació numèrica– era una funció fonamental de la catalogació i, encara que fos cara, malgrat tot, resultava crucial. En canvi, l’ús d’altres vocabularis controlats, com ara l’ Art & Architecture Thesaurus (AAT), mai no van ser objecte de polèmica dins del mateix entorn web.
En la primera dècada del present segle XXI, la Library of Congress crea el Linked Data Service, el qual permet, tant a les persones com a les màquines, d’accedir a les dades d’autoritat de la LC. Aquest servei implementa el moviment Linked Open Data que es va fundar el 2007 per W3C Semantic Web Education and Outreach (SWEO) Interest Group, l’objectiu principal del qual és que les dades estiguin en obert i a l’abast de tothom. Qualsevol pot participar en aquest projecte, simplement ha de publicar les dades d’acord amb les normes del Linked Data i interrelacionar-les amb grups de dades existents.
Les dades han de complir quatre normes bàsiques perquè es puguin enllaçar: 1) necessiten una direcció única URI, que identifica el tipus d’objecte o concepte; 2) cal posar-les en línia (HTTP) per poder-les consultar i vincular; 3) cal proporcionar dades útils fent ús d’estàndards com RDF (Resource Description Framework) o SPARQL (SPARQL Protocol and RDF Query Language) i 4) les dades han d’enllaçar altres dades en el web mitjançant la corresponent URI.
El Library of Congress Linked Data Service va ser creat per sumar-se a aquest moviment de les dades enllaçades (Linked Data movement) i implementar la seva forma d’exposar i interconnectar les seves en el web semàntic a través d’URIs diferenciables (id.loc.gov.). El primer lliurament del Linked Data Service va ser el conjunt de dades intregrat pels LCSH, que es varen publicar a l’abril del 2009. Aquest servei també proporciona accés a altres vocabularis controlats, creats i mantinguts per la Library of Congress que es van incorporar al llarg del 2010 i del 2011.
El Library of Congress Linked Data Service presenta les seves dades en MADS/RDF (Metadata Authority Description Schema/Resource Description Framework) i SKOS (Simple Knowledge Organization System), però, quan ho considera adient, també utilitza la seva pròpia ontologia per aplicar-la al seu sistema de classificació.
Aquests són els formats web o d’intercanvi de dades que fan accessible tots els registres de forma individual: XHTML/RDFa (Extensible Hypertext Markup Language/Resource Description Framework in Atributes) (és a dir, llenguatge d’etiquetatge d’hipertext extensible/marc de descripció de recursos en atributs); RDF/XML (Resource Description Framework/Extensible Markup Language) (és a dir, llenguatge d’etiquetatge extensible); N-Triples, format per a l’emmagatzematge i transmissió de dades; JSON (JavaScript OBJECT Notation), estàndard obert basat en text dissenyat per a l’intercanvi de dades llegibles per humans.
Abans de realitzar una cerca concreta en la pàgina web del Library of Congress Linked Data Service per familiaritzar-nos amb la nova presentació, farem referència al programa MACS (Multilingual Access to Subjects = Accès multilingue par sujet), endegat per la Bibliothèque Nationale de France (BNF), ja que això ens permetrà d’interpretar millor la nova visualització del registre d’autoritat dels LCSH que hem escollit com a exemple.
El Répertoire d’autorité-matière encyclopédique et alphabétique unifié (RAMEAU) de la BNF participa en el projecte multilingüe europeu MACS (Multilingual Access to Subjects = Accès multilingue par sujet). Aquest programa MACS té com a objectiu el desenvolupament de l’accés multilingüe per tema, a fi de permetre que l’usuari final o el professional pugui consultar directament, en la seva pròpia llengua materna, el contingut de catàlegs estrangers, tant si es troben indexats en alemany, en anglès o en qualsevol altra llengua.
Actualment, dins del prototip proposat, la consulta o la interrogació per tema es pot fer en anglès, alemany o francès que són les llengües pertanyents als quatre catàlegs de les biblioteques nacionals que participen en el projecte: la Bibliothèque National Suisse, la BNF, la British Library i la Deutsche Bibliothek. La interrogació multilingüe ha estat possible gràcies al treball efectuat pels gestors dels llenguatges d’indexació emprats en aquestes biblioteques: RAMEAU (per al francés), LCSH (per a l’anglès), SWD (Schlagwortnormdatei) (per a l’alemany). Aquest treball consisteix a establir les equivalències entre les matèries de les llistes d’autoritat existents (equivalències exactes o parcials, simples o complexes). Així doncs, no es tracta d’una traducció, ni de la creació d’un nou tesaurus, sinó d’una cooperació que, a partir d’una gestió compartida, conserva l’autonomia de cadascun dels llenguatges d’indexació.
Des d’un punt de vista tècnic, el projecte MACS ha conduït a la configuració d’un prototip creat per la societat Index Data de Dinamarca i per la Tilburg University Library dels Països Baixos. Aquest prototip conté les nocions enllaçades entre elles, a més dels registres bibliogràfics corresponents a aquestes nocions en els diferents catàlegs. El prototip simula el futur funcionament d’un sistema multilingüe gràcies a dues interfícies que, d’una banda, permeten generar les equivalències entre els llenguatges d’indexació; i, de l’altra, d’interrogar els diferents catàlegs mitjançant aquestes equivalències. Malgrat tot, encara manca arribar a desenvolupar la manera d’actualitzar automàticament les equivalències entre els diferents llenguatges d’indexació, a partir de les seves evolucions respectives. El programa MACS s’integra en el projecte TEL (The European Library), futur portal que permetrà l’accés únic als recursos de les biblioteques europees.
L’any 2008 el llenguatge d’indexació RAMEAU es va traduir a SKOS (Simple Knowledge Organisation System), per tal d’expressar el llenguatge RAMEAU amb els formalismes propis del web semàntic i de facilitar així la seva utilització dins d’aquest context. El vocabulari RAMEAU expressat en SKOS/RDF es pot consultar en el lloc web data.bnf.fr, on, a partir d’ara, es pot accedir al conjunt del vocabulari RAMEAU en SKOS amb la possibilitat d’intercanviar-lo en aquest format. D’altra banda, la Library of Congress també ha facilitat el llenguatge d’indexació dels LCSH en SKOS i, gràcies al projecte MACS, s’ha pogut realitzar una alineació d’aquest vocabulari amb els conceptes RAMEAU, la qual cosa no fa més que demostrar l’enorme impuls d’aquesta nova eina.
I ara, tot tornant a enllaçar amb el que havíem dit més amunt, podem veure que, en la pàgina web del Library of Congress Linked Data Service, s’ofereix la possibilitat de fer cerques de tots els seus recursos en tots els formats compatibles amb el web semàntic. Així doncs, passarem a fer una cerca concreta per la matèria “Elephants” i ens fixarem en els resultats. Podeu accedir al resultat de la cerca fent clic a sobre de la imatge.
Cerca Elephants: http://id.loc.gov/authorities/subjects/sh85042531
Tots els enllaços subratllats ens permeten accedir a una informació més detallada al voltant de l’enllaç clicat, als registres d’autoritat corresponents al joc de referències (termes específics, termes generals), a les equivalències exactes o parcials dels conceptes pertanyents a altres esquemes o llistes d’autoritat i a la visualització del registre de matèries en altres formats, fins i tot, en l’últim enllaç es fa la conversió de MARC a XML.
Com es pot deduir de tot el que s’ha exposat fins ara, el llenguatge propi dels encapçalaments de matèria ha experimentat una profunda transformació quant al format per tal d’adaptar-se a les noves exigències plantejades pel web semàntic i, lluny de desaparèixer, està cobrant una nova força que neix de la col·laboració de totes aquelles institucions que, al llarg dels anys, han treballat en la creació dels diferents vocabularis controlats, amb la intenció d’enriquir el web amb una eina de cerca que sempre serà més fiable que la simple cerca per paraula clau.
De totes maneres, a tall de cloenda, cal dir que per tal que les biblioteques catalanes puguin participar en el projecte de les dades enllaçades, es requereixen importants inversions econòmiques i de sistema i també cal comptar amb els recursos humans necessaris (informàtics i bibliotecaris) per poder projectar la LEMAC cap a aquesta nova era.
Imma Baldocchi i Joan Saez
Servei de Normalització Bibliogràfica
Comentaris