Top menu






Capítol 2: Principis digitals bàsics

2.1 Estàndards. És fonamental per a la preservació del so que els formats, resolucions, suports i sistemes tecnològics escollits segueixin estàndards consensuats internacionalment i apropiats als propòsits de l'arxiu. Els formats, resolucions o versions no estandarditzats pot ser que no es trobin entre els procediments de preservació futurs que hi garanteixin l'accés a llarg termini i migracions de format subsegüents.

2.2 Freqüència de mostreig. La freqüència de mostreig determina el límit màxim en la resposta freqüencial del sistema. La IASA recomana una freqüència de mostreig mínima de 48 KHz per a la producció de còpies digitals a partir de qualsevol material analògic. No obstant això, l'adopció de freqüències més elevades disponibles avui dia (freqüències de sobremostreig) pot resultar avantatjosa per a molts tipus de contingut. Malgrat el fet que les freqüències de sobremostreig codifiquen el so més enllà del domini de l'oïda humana, l'efecte conjunt del sobremostreig i la tecnologia de conversió aporta una millora qualitativa també al marge de l'oïda humana. D'altra banda, els inesperats artefactes que puguin aparèixer en l’enregistrament formen part al seu torn del document sonor, siguin producte inherent al procés de fabricació de l’enregistrament o conseqüència del desgast, de l'ús incorrecte o de l'emmagatzematge defectuós. Ambdues fonts d'informació, so i artefactes, s'han de preservar amb la màxima precisió. Per a certs senyals i certs tipus de soroll, l’ús de freqüències de mostreig superiors als 48 KHz pot ser beneficiós. La IASA recomana els 96 KHz, no com a valor màxim sinó únicament com a pauta. Per a la majoria dels materials sonors aquestes freqüències de mostreig hauran de ser suficients. En el cas d'objectes originàriament digitals, la freqüència de mostreig del sistema d'emmagatzematge hauria d’igualar la de l'objecte digital.

2.3 Nombre de bits per mostra. El nombre de bits per mostra1 determina el marge dinàmic o fons d'escala de l'àudio codificat d'un esdeveniment o d’un objecte sonor. L'ús de 24 bits teòricament codifica un marge dinàmic aproximat al dels límits físics de l'oïda humana, encara que certes limitacions tècniques redueixin lleugerament el valor final. Mitjançant 16 bits, l'estàndard del CD, el marge que es pot obtenir pot ser inadequat per a captar la dinàmica de molts tipus de material, especialment durant la codificació de transitoris d'alt nivell que sovint s’esdevé en la transferència de discs malmesos. La IASA recomana un nombre de com a mínim 24 bits de codificació per mostra d'àudio per a capturar material analògic. En el cas d'objectes d'àudio ja digitals d'origen, el nombre de bits per mostra del sistema d'emmagatzematge ha de ser si més no igual al del document original. És convenient assegurar-ne el màxim aprofitament del marge dinàmic del sistema d’enregistrament durant els processos de transferència del senyal d'àudio. 

2.4 Conversors d'analògic a digital (A/D)

2.4.1 El procés de conversió de l'àudio analògic a flux de dades digitals (A/D) no hauria d’acolorir ni afegir cap tipus de soroll extern al so. Els conversors són el component més determinant en la cadena digital de la preservació. A la pràctica, el convertidor A/D incorporat a la targeta de so d'un ordinador estàndard no pot acomplir les especificacions requerides, tenint en compte els circuits de baix cost i el soroll elèctric inherent a tot ordinador. La IASA recomana l'ús de convertidors A/D discrets (independents, no integrats) connectats a altres dispositius, sigui mitjançant interfícies dedicades AES/EBU o S/PDIF, sigui mitjançant interfícies de bus en sèrie com IEEE 1394 (FireWire) o USB, en qualsevol cas capaces de convertir l'àudio analògic en digital segons les especificacions que s'indiquen a continuació. Totes aquestes especificacions s'han de mesurar a la sortida digital del convertidor (A/D) d'acord amb els estàndards AES 1917-1998 (r2004) 2, IEC 61606-3 i altres associats allà on es detalla.

2.4.1.1 Distorsió harmònica total més soroll (THD+N)
Amb senyal de referència de 997 Hz a -1 dBFS, la distorsió harmònica total més soroll (THD+N) ha de ser inferior a -105 dB sense ponderar, -107 dBA (ponderació A), limitada en banda de 20 Hz a 20 KHz.
Amb senyal de referència de 997Hz a -20dBFS, la distorsió harmònica total més soroll (THD+N) ha de ser inferior a -95 dB sense ponderar, -97 dBA (ponderació A), limitada en banda de 20 Hz a 20 KHz.

2.4.1.2 Marge dinàmic (relació senyal-soroll)
Cal que el convertidor A/D disposi d'un marge dinàmic no inferior a 115 dB sense ponderar, 117 dBA (mesurat com a THD+N relativa a 0dBFS, limitat en banda a 20 Hz a 20 KHz, senyal de referència 99 Hz a -60 dBFS).

2.4.1.3 Resposta freqüencial
Per a una freqüència de mostreig de 48 KHz, la resposta freqüencial mesurada ha de ser millor que ± 0,1 dB per a la banda de 20 Hz a 20 KHz.
Per a una freqüència de mostreig de 96 KHz, la resposta freqüencial mesurada ha de ser millor que ± 0,1 dB per a la banda de 20 Hz a 20 KHz i que ± 0,3 dB per a la banda de 20 Hz a 40 KHz.
Per a una freqüència de mostreig de 192 KHz, la resposta freqüencial mesurada ha de ser millor que ± 0,1 dB per la banda de 20 Hz a 20 KHz i que ± 0,3 dB per a la banda de 20 Hz a 50 KHz.
Senyal de referència 997 Hz, amplitud -20dBFS.

2.4.1.4 Distorsió d'intermodulació (IMD segons SMPTE/DIN/AES17)
La distorsió d’intermodulació del convertidor A/D no ha d'excedir els -90 dB (utilitzant les seqüències de tons aparellats proposades per AES17/SMPTE/DIN, tons combinats equivalents a una sola ona sinusoïdal a màxima amplitud de fons d'escala).

2.4.1.5 Linealitat d'amplitud
El convertidor A/D haurà de mostrar una linealitat en el guany d'amplitud de ± 0,5 dB en el marge de -120 dBFS a 0 dBFS (referència sinusoïdal de 997 Hz).

2.4.1.6 Senyals enharmònics espuris
Millor que -130 dBFS amb senyal de referència de 997 Hz a -1 dBFS.

2.4.1.7 Precisió del rellotge intern de mostreig
Per a un convertidor sincronitzat al seu rellotge de mostreig intern, la previsió freqüencial mesurada a la sortida del flux de dades digital ha de ser millor que ± 25 ppm.

2.4.1.8 Fluctuació del senyal
La fluctuació en l'exactitud temporal del procés de mostreig mesurada a la sortida de la interfície del convertidor A/D ha de ser de <5 ns.

2.4.1.9 Sincronització externa
En cas de sincronitzar el rellotge intern de mostreig del convertidor A/D a una referència externa, el convertidor ha de reaccionar transparentment a les variacions entrants de la freqüència de mostreig en un ± 0,2% de la freqüència nominal.
El circuit de resincronització externa ha de rebutjar la desviació del senyal entrant de manera que el rellotge de mostreig sincronitzat a la font externa quedi lliure d'artefactes i alteracions.

2.4.2 Interfícies d'àudio IEEE 1394 (Firewire) i USB. Molts convertidors A/D permeten la connexió directa amb un ordinador central a través de les interfícies en sèrie d'alta velocitat IEEE1394 (Firewire) i USB 2.03Ambdues s'utilitzen amb èxit com a interfícies de transmissió d'àudio a través de la majoria de plataformes d'ordinadors personals i poden reduir la necessitat d'instal·lar interfícies de so d'alta qualitat en el xassís dels ordinadors. La qualitat de l'àudio digital és generalment independent de la tecnologia d'interfície que s'utilitzi.

2.4.3 Selecció de convertidors A/D. El convertidor A/D és el component tecnològic més determinant en el procés digital de la preservació. Per a l'elecció del convertidor, abans de qualsevol avaluació, la IASA recomana testejar les especificacions en funció dels estàndards recentment descrits. Tot aparell que no compleixi amb les especificacions tècniques bàsiques recomanades per la IASA produirà conversions de precisió insuficient. Conjuntament amb l'avaluació tècnica caldrà realitzar tests estadísticament vàlids d'escolta a cegues sobre una llista limitada de convertidors, per a determinar la idoneïtat i rendiment globals. Totes les especificacions i tests descrits són complexos i rigorosos i el seu compliment és de gran importància en l'elecció i en l’avaluació dels convertidors A/D. Les especificacions que els mateixos fabricants faciliten de vegades són incòmodes de comparar, sovint són incompletes i ocasionalment resulten difícils de conciliar amb el rendiment efectiu del dispositiu que pretenen representar. Pot ser de l'interès de certes comunitats o grups dur a terme tests coordinats de grup per a maximitzar recursos. Algunes institucions, com arxius públics, biblioteques o departaments acadèmics de l'àmbit científic poden facilitar assistència en els procediments d'avaluació.

2.5 Targetes de so. Cal que la targeta de so utilitzada per un ordinador en tasques de preservació d'àudio disposi d'una entrada digital dotada d'un mecanisme de sincronització del flux de bits d'àudio digital d'alta qualitat, capaç de permetre la transmissió d'aquest flux sense canvis o alteracions. Com que el convertidor A/D ha de ser extern i independent, la principal tasca de la targeta de so en el procés de preservació serà la de transmetre transparentment el senyal digital al bus de dades de l'ordinador, encara que pugui també retornar el senyal entrant com a àudio analògic amb fins de monitoratge. Caldrà comprovar la compatibilitat de la targeta triada amb les freqüències de mostreig i nombre de bits adequats al nostre propòsit, així com assegurar la immunitat a sorolls o artefactes estranys al procés. La IASA recomana l'ús de targetes de so d'alta qualitat que responguin a les següents especificacions:

2.5.1 Marge de freqüències de mostreig: de 32 KHz a 192 KHz, ± 5 %.

2.5.2 Quantificació d'àudio digital: de 16 a 24 bits per mostra.

2.5.3 Variabilitat de la freqüència de mostreig (varispeed): automàtica segons el flux de bits d'àudio digital entrant (autosincronització) o segons la referència externa de rellotge de mostreig (wordclock).

2.5.4 Sincronització: rellotge intern, rellotge extern (wordclock), autosincronització a l'entrada d'àudio digital.

2.5.5 Interfície d'àudio: AES/EBU d'alta velocitat acord amb les especificacions AES3.

2.5.6 Tolerància a la fluctuació de la base de temps del senyal (jitter): regeneració de senyal sense error per a  entrades amb fluctuació de fins a 100 ns.

2.5.7 Transparència a subcodis d'àudio digital.

2.5.8 Entrades de codi de temps opcionals.

2.6 Sistemes basats en ordinador i programari de processament. Les generacions d'ordinadors més recents tenen capacitat suficient per a manipular grans fitxers de so. Ja en el domini digital, cal mantenir la integritat dels fitxers d'àudio. Com s'ha anat argumentant, els punts clau en el procés de preservació són la conversió d'àudio analògic a digital (responsabilitat del convertidor A/D) i la introducció de dades en el sistema, sigui a través d'una targeta de so o d’un altre port de dades. Tanmateix, alguns sistemes trunquen el nombre de bits per mostra digital (el també anomenat wordlength) per raons de processament intern, fet que resulta en una reducció del nombre efectiu de bits per mostra; altres sistemes només processen formats comprimits de fitxer, com l'MP3. En qualsevol dels casos, el resultat no és acceptable. La IASA recomana l'adopció de sistemes professionals d'àudio basats en ordinador que treballin amb un nombre de bits de processat per mostra superior al del propi del fitxer d'àudio (és a dir, superior als 24 bits) sense cap alteració del format original del fitxer.

2.7 Reducció de dades. Ha esdevingut una pràctica generalment acceptada en el món de l’arxiu d’àudio, que quan es seleccioni un format de destinació (o màster), no s’utilitzin formats basats en la reducció de dades sovint anomenats, erròniament, formats comprimits mitjançant tècniques de codificació perceptual (codificadors amb pèrdues, de l'anglès lossy codecs). Les transferències basades en aquestes tècniques impliquen la irremeiable pèrdua d'informació original. El resultat d'aquests processos sonarà potser idèntic a l'original, si més no en la primera generació, però la reutilització o retransferència del material reduït quedarà severament limitada i la seva integritat arxivística compromesa.

2.8 Formats de fitxer

2.8.1 Hi ha un bon nombre de formats d'àudio lineal que es poden utilitzar per a la codificació de so. Malgrat això, com més gran sigui l'acceptació i l’ús de cert format en l'àmbit de l'àudio professional, més alta serà la probabilitat d'acceptació a llarg termini i major també la quantitat d'eines desenvolupades per a la migració d'aquest format a futurs estàndards quan sigui necessari. Tenint en compte la simplicitat i la ubiqüitat de la modulació lineal per impulsos codificats, LPCM (Linear Pulse Code Modulation), multiplexada per a la informació en estèreo, la IASA recomana l'ús del format WAVE (amb extensió de fitxer *. wav) desenvolupat per Microsoft i IBM com una extensió del format RIFF (de l'anglès Resource Interchange File Format, format de fitxer per a l'intercanvi de recursos). Els fitxers WAVE són àmpliament utilitzats en la indústria del so professional.

2.8.2 Fitxers BWF [EBU Tech 3285]. Els fitxers BWF (Broadcast Wave File) són una extensió dels fitxers .wav (WAVE) proposats per la tecnologia més recent d'àudio. Els beneficis de BWF tant per a la preservació com per a la producció de so radiquen en la incorporació de metadades a les capçaleres que formen part del fitxer. Aquesta característica representa un avantatge en la majoria dels casos bàsics d’intercanvi i arxiu de dades. No obstant això, la naturalesa fixa de la informació incrustada en el mateix fitxer pot esdevenir un desavantatge en sistemes de gestió de dades d'alta complexitat i grandària. (vegeu la discussió sobre aquest tema en els capítols 3 i 7). Aquesta i altres limitacions pròpies de BWF es poden afrontar mitjançant la introducció i l’ús d'un conjunt mínim de metadades en les capçaleres dels fitxers BWF, alhora que es mantenen altres metadades vinculades a sistemes externs de gestió. L'estàndard AES31-2-2006 (Transferència d'àudio a través de fitxers i xarxes -Transferència i intercanvi de fitxers d'àudio -Formats de fitxer per a la transferència de dades d'àudio digital entre sistemes de diferent tipus i fabricació) és àmpliament compatible amb el conjunt de metadades proposat per BWF, de manera que s'espera que els futurs desenvolupaments en aquest camp continuïn apostant per la viabilitat d'aquest format. BWF ja és àmpliament acceptat per la comunitat arxivística. Així doncs, malgrat les seves limitacions, la IASA recomana l'ús dels fitxers BWF [EBU Tech 3285] amb finalitats d’arxiu.

2.8.3 Per a les sessions d'àudio multipista, les bandes sonores de cinema, vídeo o, en general, fitxers d'àudio de grans dimensions, es pot usar el format MBWF/RF64 [EBU Tech 3306], compatible amb BWF, AES31 i també com a fitxer . wav en un contenidor MXF (Media Exchange Format). Com que aquest format es troba encara en procés de desenvolupament, una opció pragmàtica és la creació de múltiples fitxers BWF monofònics síncrons, agrupats en un fitxer contenidor amb format tar (tape archive).

2.9 Cadena d'àudio. La combinació d'equips de reproducció, cablejat de senyal, mescladors i altres dispositius de processament del so han de respondre a especificacions que igualin o superin les de l'àudio digital de destinació, a la freqüència de mostreig i nombre de bits per mostra especificats. L'equip de reproducció, cadena d'àudio, format de destinació (màster) i estàndards adoptats han d'excedir les especificacions pròpies del suport d'àudio original.


1          També anomenat "profunditat de bits" en traducció literal de l'anglès. (n. dels t.)

2          Actualment en la seva revisió r2009. (n. dels t.)

3          Totes dues interfícies han estat recentment actualitzades, com és el cas d'USB 3.0. (n. dels t.)

______________________________

<--anterior    SUMARI     següent-->