Dipòsit legal de publicacions nascudes digitals: nou mòdul web per al dipòsit en línia
El dipòsit legal és el mecanisme que tenen les biblioteques nacionals de bona part del món per recollir la producció bibliogràfica del seu país.
La llei de dipòsit legal vigent és la llei 23/2011, de 29 de juliol[1], en la qual apareix per primera vegada l’obligatorietat, per a l’editor, de dipositar publicacions nascudes digitals sense suport tangible (és a dir, a la xarxa), i que es desenvolupa en detall al Reial decret 635/2015, de 10 de juliol[2], que regula el dipòsit legal de les publicacions en línia.
Els trets característics de la nova legislació de dipòsit legal de les publicacions en línia són:
- Continua l’obligació de dipositar, si bé no s’assigna número de DL a les publicacions, donada la dificultat de delimitar correctament les unitats documentals a les webs, bases de dades, repositoris, etc.
- Els centres de preservació de DL, com la Biblioteca de Catalunya, tenen la possibilitat de capturar els recursos en línia, tant els que són d’accés obert, com restringit.
- Existeix l’obligació de dipositar per part del responsable de la publicació en línia, si el centre de conservació així ho demana.
- S’obre la possibilitat a realitzar una preservació distribuïda mitjançant convenis de col·laboració amb entitats posseïdores de repositoris que compleixin una sèrie de requisits de preservació fixats per la Biblioteca de Catalunya.
La nova regulació ha portat a la Biblioteca de Catalunya a dues accions principals:
- Dissenyar un sistema de dipòsit de publicacions nascudes digitals en línia, via web, amb destinació al seu repositori de preservació COFRE[3] (COnservem per al Futur Recursos Electrònics), que inclou la gestió des de la recepció fins a la catalogació i consulta; sistema que exposarem amb més detall en aquesta article.
- Definir un protocol de requeriments mínims per a subscriure convenis de col·laboració amb repositoris d’entitats que vulguin contribuir a la preservació digital[4].
Mòdul web per al dipòsit de publicacions nascudes digitals
Aquest mòdul és la resposta a la necessitat d’unificar i normalitzar el mètode de transferència de la producció digital des dels editors a la Biblioteca de Catalunya.
Fins al moment de la seva posada en marxa, els documents nascuts digitals s’enviaven o rebien fent servir mètodes o suports heterogenis:
- Els primers anys de la publicació electrònica (llibre electrònic però també publicacions en altres formats textuals, imatges o objectes complexos com CD’s interactius) en suports físics com CD, DVD, o memòries USB, amb els coneguts riscos de degradació del contenidor i el perill per tant de perdre l’accés a les dades.
- Més endavant per correu electrònic o via enllaços a magatzems al núvol.
En qualsevol cas, aquests suports arribaven a uns circuits “clàssics” de materials en paper no preparats per a gestionar, emmagatzemar i conservar aquests suports o es desaven en volums de dades de la xarxa interna de l’organització. I per tant no eren reconduïts a cap procediment de validació, d’emmagatzematge apropiat ni tampoc eren catalogats o posats a l’abast del públic (respectant els drets vigents).
A partir del moment que el repositori de preservació digital de la Biblioteca de Catalunya, COFRE, ja era un sistema en funcionament, la BC va decidir implementar un mòdul que facilités als editors el dipòsit en línia dels documents i proporcionés a més una metodologia per a la seva validació pel personal de la biblioteca: el mòdul DL-UP.
Aquest desenvolupament està format per:
- Un frontal web que guia als editors en el procés de càrrega dels documents digitals i els permet visualitzar l’estat de les seves càrregues.
- Una base de dades on es desen les metadades relatives a les càrregues (data, estat, dades bibliogràfiques, enllaç amb COFRE).
El frontal interactua per una banda amb el programari de gestió electrònica del Dipòsit Legal[5] per a validar les credencials de l’editor i per una altra amb el COFRE per a crear el document i transferir els fitxers que el composen. La imatge 1 mostra el diagrama de flux del procediment des de la petició de càrrega en el mòdul DL-UP per part de l’editor, fins que els documents són validats a COFRE i catalogats al catàleg de la BC. O pel contrari, rebutjats per errors en els fitxers carregats.
Imatge 1
La petició de càrrega d’un document digital al mòdul DL-UP és un procés de 4 passos que permet a l’editor incorporar la informació requerida i carregar els fitxers que composen el document (imatge 2).
Imatge 2
El mòdul DL-UP empaqueta la informació i els fitxers, i ho transfereix a una localització temporal, mentre realitza un seguit de crides seqüencials al repositori COFRE amb l’objectiu de cercar o crear el contenidor lògic, crear l’estructura del nou objecte (document, versió, esdeveniment de creació) i transferir els fitxers a la seva localització física definitiva.
Una vegada la transferència s’ha realitzat correctament, s’envia un missatge al grup de catalogadors expert en el tipus de material especificat, els quals són responsables de comprovar i validar els fitxers carregats i la informació proporcionada per l’editor.
Si es valida el document, es procedeix a la seva catalogació al catàleg de la BC i posteriorment s’afegeix el número de registre bibliogràfic assignat pel catàleg al document carregat al repositori COFRE.
COFRE mentrestant realitzarà els processos de comprovació habituals a qualsevol càrrega en el repositori: detecció de virus, càlcul de la signatura digital dels fitxers carregats, identificació de format. Una vegada la validació manual es completa, l’objecte serà tractat seguint els mateixos procediments que la resta d’objectes que es guarden al repositori de preservació: comprovació cíclica de virus i de signatura digital, còpia remota, creació de fitxer sidecar de metadades, logs d’accés i modificació.
Si la validació presenta problemes: impossibilitat d’obrir els fitxers, qualitat insuficient, falta de metadades per a identificar els fitxers, etc., el catalogador rebutja el document. Immediatament es genera un avís que arriba a l’Àrea de Tecnologia de la Informació de la BC, des d’on es realitza una segona comprovació amb l’objectiu de solucionar el problema: instal·lant visors apropiats, demanant contrasenyes, etc. Si el problema es resol, s’avisa manualment al catalogador, el qual pot continuar amb el procés normal de validació.
Si el problema no es pot resoldre, es rebutja la càrrega definitivament. Aquesta acció genera un avís per correu electrònic a l’editor per a què procedeixi a resoldre l’error i faci de nou la càrrega.
A la imatge 3 podem veure el llistat de les peticions de càrrega realitzades per un editor al mòdul DL-UP. Aquest llistat li permet gestionar les seves peticions de càrrega, realitzar-ne de noves a partir de les dades d’una càrrega anterior o resoldre els errors de càrregues rebutjades.
Imatge 3
Actualment s’han rebut documents de 46 editors diferents, amb un total de 1.652 documents. Es reben tant monografies (llibres, partitures, audiovisuals,...) com publicacions periòdiques, en diversos formats. La imatge 4 representa la distribució de les càrregues per tipus de fitxers on es pot observar que la major part de documents arriben, actualment, en format PDF. Però també es reben audiovisuals en diversos formats, llibre electrònic en format epubs, etc.
Imatge 4
Karibel Pérez
Àrea de Tecnologia de la Informació
Eugènia Serra
Directora
[1] Llei 23/2011, de 29 de juliol, de dipòsit legal. BOE núm. 182 publicat el 30/07/2011. <https://www.boe.es/diario_boe/txt.php?id=BOE-A-2011-13114>
[2]Reial decret 635/2015, de 10 de juliol, pel qual es regula el dipòsit legal de les publicacions en línia. DOGC núm. 6231 publicat el 11/10/2012. <http://dogc.gencat.cat/ca/pdogc_canals_interns/pdogc_resultats_fitxa/?action=fitxa&documentId=618165>
[3] La BC va posar en marxa el repositori COFRE (COnservem per al Futur Recursos Electrònics) el 2011 amb diversos objectius: conservar els màsters resultat del seu programa de digitalització, guardar una còpia periòdica de PADICAT, i preservar el DL de publicacions nascudes digitals. A l’informe Repositori de preservació digital de la Biblioteca de Catalunya. <http://www.recercat.cat/handle/2072/97251> es descriu el plantejament i disseny inicial, fins i tot quan encara no era anomenat COFRE.
[4] Per a més informació podeu consultar: El nou escenari del dipòsit legal en línia més enllà de l’arxiu web. Pérez, Karibel; Serra, Eugènia. Biblioteca de Catalunya, 2018. <http://www.cobdc.net/15JCID/wp-content/uploads/2018/05/Comu15.pdf>
[5] Més informació a <http://www.bnc.cat/Professionals/Diposit-legal>
Facebook de la biblioteca Twitter de la biblioteca Flickr de la biblioteca Tagpacker de la biblioteca Canal Youtube de la biblioteca Pinterest de la biblioteca Instagram de la biblioteca