55
Cap´ ıtulo 1 Definiciones generales y amplificaci´on. 1.1. Valor medio, de pico y rms. En general las se˜ nales que se utilizan en un sistema de audio contienen componentes alternas, por lo cual su valor instant´aneo resulta poco interesante a la hora de dimensionar los sistemas que se van a utilizar. Las caracter´ ısticas de las se˜ nales que nos interesar´an son: su valor de pico, y su valor medio. Dada una se˜ nal x(t) expresada en t´ erminos de tensi´on se define su valor medio en un intervalo T como: x (t)= 1 T T 0 x (t) dt (1.1) El valor de pico se define como el m´aximo valor que alcanza la se˜ nal en el intervalo de ob- servaci´on. El valor depico esimportante en cuanto nosdice lam´axima potencia instant´anea que va consumir la se˜ nal. La potencia instant´anea la definiremos como: P i (t)= x 2 (t) R (1.2) Donde x(t) es una onda de tensi´on y R es la carga donde medimos la potencia. Sin em- bargo los dispositivos de audio (mesas de mezclas, amplificadores) son capaces de soportar una potencia instant´anea relativamente alta mientras que sus limitaciones vienen dadas por la potencia consumida en un periodo largo de observaci´on, es decir por la potencia media. Se define la potencia media en un intervalo T como el valor medio de x 2 (t) en un ese intervalo: 1

Cursod e Amplificacion

Embed Size (px)

Citation preview

Capıtulo 1

Definiciones generales y amplificacion.

1.1. Valor medio, de pico y rms.

En general las senales que se utilizan en un sistema de audio contienen componentesalternas, por lo cual su valor instantaneo resulta poco interesante a la hora de dimensionarlos sistemas que se van a utilizar. Las caracterısticas de las senales que nos interesaran son:su valor de pico, y su valor medio.

Dada una senal x(t) expresada en terminos de tension se define su valor medio en unintervalo T como:

〈x (t)〉 =1

T

∫ T

0x (t) dt (1.1)

El valor de pico se define como el maximo valor que alcanza la senal en el intervalo de ob-servacion. El valor de pico es importante en cuanto nos dice la maxima potencia instantaneaque va consumir la senal. La potencia instantanea la definiremos como:

Pi (t) =x2 (t)

R(1.2)

Donde x(t) es una onda de tension y R es la carga donde medimos la potencia. Sin em-bargo los dispositivos de audio (mesas de mezclas, amplificadores) son capaces de soportaruna potencia instantanea relativamente alta mientras que sus limitaciones vienen dadas porla potencia consumida en un periodo largo de observacion, es decir por la potencia media.Se define la potencia media en un intervalo T como el valor medio de x2(t) en un ese intervalo:

1

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

Pm =⟨

x2 (t)⟩

=1

T

∫ T

0x2 (t) dt (1.3)

La ecuacion anterior se puede interpretar como la media en un intervalo de la potenciainstantanea considerando una carga de 1 Ω. A partir de esta potencia media definimos elvalor rms 1 como:

Vrms =√

Pm (1.4)

El valor rms es por lo tanto un valor de tension y representa la tension eficaz en terminosde generacion de potencia, es decir la tension equivalente que contribuye a la generacion dela potencia media liberada en la carga.

1.2. Unidades logarıtmicas.

Las unidades logarıtmicas son las mas utilizadas para expresar relaciones de potencias ytensiones en aplicaciones de audio y vıdeo. Hay dos razones principales: los calculos con estetipo de unidades resultan sencillos e intuitivos debido a que las ganancias y atenuacionesde un sistema se suman en vez de multiplicarse; la segunda razon es que el oıdo presentauna respuesta logarıtmica a las variaciones de nivel sonoro: un aumento del 50% de presionsonora no se percibe como un aumento del 50% del volumen. Sin embargo si variamos lapresion sonora de forma logarıtmica la sensacion sera un aumento lineal del volumen sonoro.

Existen gran cantidad de unidades logarıtmicas, pero las mas utilizadas en el campo delaudio son los dB, dBW, dBm, dBV y dBu.

dB, dBW y dBm Los decibelios o dB son unidades que expresan la relacion entre dospotencias. Se define un dB como:

dB = 10log(P1

P2

) (1.5)

Donde P1 y P2 son dos potencias en vatios. Los dB son unidades adimensionales. Parapoder expresar una potencia en unidades logarıtmicas se utiliza el dBW y el dBm, que sedefinen como:

dBW = 10log(P (W )

1(W )) (1.6)

1Root Mean Square

2

CAPITULO 1. Definiciones generales y amplificacion. Sistemas de Audio e Vıdeo. Curso 2003-2004

dBm = 10log(P (mW )

1(mW )) (1.7)

Es decir, una referencia de 0 dBW indica una potencia de un vatio y una referencia de 0dBm una potencia de un milivatio.

dBV En determinados casos es necesario expresar una relacion entre tensiones tambienen unidades logarıtmicas. Si disponemos de una tension V aplicada a una resistencia Rgenerara una potencia:

P =V 2

R(1.8)

Tomando como referencia un voltio aplicado a la misma resistencia:

dBV = 10log(V 2

12) = 20log(V ) (1.9)

En general la tension V no sera continua sino alterna y por lo tanto se utilizaran valoresrms. Un nivel de 0 dBV indicara una tension de 1 V rms independientemente de la cargasobre la que esa tension este actuando. Observese que los dBV indican una relacion entrepotencias por lo que sigue siendo posible operar con dB y dBV conjuntamente.

dBu Muchos de los equipos de audio habituales utilizan como medida dBu (algunas vecesdenominados dBv) en vez de dBm o dBV. Un valor de 0 dBu corresponde al nivel de tensionque aplicado sobre una carga de 600 Ω genera una potencia de 1 mw. Los dBu toman por lotanto una referencia de 0.774 V rms.

dBu = 20log(V

0,774) (1.10)

La impedancia de 600 Ω es la estandar para diversos dispositivos y medios de transmision(por ejemplo la linea telefonica), por lo cual se toma como carga por defecto. El sufijo u sig-nifica unloaded, es decir sin carga, expresando que una medida en dBu se toma sin anadir unacarga adicional; esto evidentemente sera cierto si estamos midiendo en una lınea telefonicao en cualquier otro medio que presente esa impedancia. En ese caso, si medimos sobre unacarga de 600 Ω, los valores obtenidos en dBu coinciden numericamente con los obtenidos endBm (puesto que los dBm toman como referencia un milivatio).

3

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

Sımbolo Referencia para 0 dB

dBV 1 V rmsdBu 0.775 V rmsdBW 1 WdBm 1 mw

Cuadro 1.1: Unidades logarıtmicas

A pesar de lo dicho los dBu se utilizan independientemente de la carga sobre la queeste actuando la senal. Una referencia de 0 dBu indica siempre un nivel de tension de 0.774V . Si por ejemplo las especificaciones de un dispositivo indican un nivel maximo de salidade 20 dBu sobre una resistencia de 10 K deducimos que es capaz de ofrecer un maximo de7.74 V.

20dBu = 20log

(

X(V )

0,774

)

(1.11)

X = 0,774 · 1020

20 = 7,74V (1.12)

En la mayorıa de los equipos de audio modernos, las salidas y entradas son sensiblesa niveles de tension y no de potencia (excepto en las conexiones entre amplificadores depotencia y altavoces) por lo que de las unidades de la tabla 1.2 las mas utilizadas son el dBVy dBu. La conversion entre dBV y dBu es sencilla de deducir:

XdBu = 20log

(

X(V )

0,775

)

= 20log(X(V )) − 20log(0,775) (1.13)

XdBu = XdBV + 2,2dB (1.14)

1.3. Niveles operativos.

Aunque los niveles operativos utilizados por los dispositivos de audio varıan en un rangomuy amplio, se suelen distinguir tres tipos diferentes:

Nivel de Microfono Mic Level.Se consideran de este tipo niveles hasta -20 dBu (77.5 mV). Se obtienen a la salida demicrofonos, giradiscos, cintas magneticas y pastillas de guitarras y otros instrumentos.

4

CAPITULO 1. Definiciones generales y amplificacion. Sistemas de Audio e Vıdeo. Curso 2003-2004

Nivel de linea Line LevelSe consideran de linea niveles un rango de -20 a 30 dBu. Generan senales de este ordende magnitud teclados electronicos, previos, mesas de mezclas, procesadores de senal yen general la mayorıa de los dispositivos implicados en un estudio de grabacion, exceptolos amplificadores de potencia.

Nivel de altavoz Speaker level.

Se consideran de este tipo niveles mayores de 30 dBm. Se obtienen a la salida de losamplificadores de potencia y de los altavoces.

1.4. Medidores.

Las mesas de mezclas disponen de medidores que permiten al tecnico comprobar los nivelesde senal que circulan por los canales. Se utilizan dos tipos de medidores: el de unidades devolumen (VU meter y el PPM o Peak Program Meter, siendo el primero de ellos el mas comun.Las mesas mas modernas sustituyen sin embargo el tradicional VU meter por medidoresdigitales basados en LEDs. Veremos una breve descripcion de cada uno de estos dispositivos.

1.4.1. VU meter

El VU meter es un sistema de medicion bastante antiguo pero que sigue utilizandoseampliamente hoy en dıa. Su popularidad reside en que la medida que proporciona coincidebastante fielmente con la sensacion de volumen sonoro que percibe el oıdo.

Hay varias razones para esto. Por una parte el VU meter responde al valor rms de lasenal de entrada de la misma manera que hace el propio oıdo, por lo que su medida da unaidea mucho mas aproximada del volumen de la senal que si respondiese a valores maximosde senal. Ademas, el tiempo que la aguja tarda en alcanzar su maxima deflexion es de apro-ximadamente 0.33 s, lo cual produce que los picos instantaneos de senal no se reflejen en elmedidor ası como no afectan a la sensacion de volumen que percibimos.

Fısicamente el VU meter consiste en una aguja que recorre una escala graduada de -10 a3 VU (unidades de volumen). El valor cero corresponde a un nivel de referencia de 4 dBu.La medida obtenida respecto a la referencia coincide con decibelios si se utiliza una senalsinusoidal. Si la senal es mas compleja, la lectura del VU meter es superior al nivel en dB.

5

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

1.4.2. PPM

El PPM es un medidor activo (frente al VU meter que es pasivo). La principal diferenciacon el anterior es que tiene un tiempo de respuesta de 10 ms, mucho menor que el VU metery por lo tanto es capaz de responder a picos de senal.Existen varios tipos de medidores PPM que se diferencian en la escala utilizada, aunque entodos estan graduados en dB.

1.4.3. Medidores digitales.

Disponibles en los dispositivos modernos, estos medidores presentan ciertas ventajas res-pecto a los anteriores. Consisten en hileras de LEDs o visores de cristal lıquido que deiluminan indicando el nivel de la senal de entrada. Ademas de ser mas exactos permitenla visualizacion simultanea del valor de pico y del nivel rms, generalmente el nivel de picoalcanzado se mantiene iluminado durante unos instantes permitiendo al usuario su lectura.

1.5. Niveles de referencia.

Al realizar una grabacion es imprescindible ajustar los margenes de variacion de las senalesque se pretende almacenar a los permitidos por los distintos elementos que intervienen enel proceso de mezcla. Esta variacion se vera limitada superiormente por el maximo nivelsoportado por el dispositivo e inferiormente por el nivel de ruido o noise floor. Si se supera elmaximo nivel permisible, la senal resultara distorsionada y en el peor de los casos el apara-to danado. Si el nivel de senal desciende por debajo del nivel de ruido, la senal sera inaudible.

Si tomamos como ejemplo una grabacion en directo, el margen de ruido vendra dado porel ruido ambiental que se introduce por el microfono, y el nivel maximo por el propio voca-lista. En caso de una grabacion de estudio donde no existe ruido ambiental, el nivel mınimovendra fijado por el ruido electrico que introducen los dispositivos y el maximo, igual queantes, por los pasajes mas fuertes de la grabacion.

Margen dinamico La diferencia entre ambos niveles, maximo y mınimo es lo que denomi-namos margen dinamico. En una grabacion de musica moderna, el margen dinamico puedealcanzar un valor de hasta 120 dB, superior al permitido por cualquier sistema de almace-namiento, lo que obliga a su reduccion mediante dispositivos especiales denominados com-presores y limitadores que estudiaremos mas adelante.

6

CAPITULO 1. Definiciones generales y amplificacion. Sistemas de Audio e Vıdeo. Curso 2003-2004

El margen dinamico obtenido a la salida del instrumento se mantendra durante toda lacadena de mezcla (a menos que utilicemos dispositivos especıficos para reducirla) indepen-dientemente de que variemos los niveles electricos. Por ejemplo, si obtenemos a la entradade un microfono un rango de 40 a 130 dB SPL, es decir un margen dinamico de 90 dB,podremos ajustar su preamplificador para recibir a la entrada de la mesa de mezclas el nivelde senal electrica que deseemos. Este proceso no modificara el margen dinamico.

Nivel nominal Aunque una grabacion presente un margen dinamico muy alto, la mayorparte del tiempo el nivel de la senal mantendra unos valores mas o menos constantes. Esconveniente que este nivel medio coincida con el de funcionamiento optimo de los dispositivosutilizados para la mezcla. Las mesas de mezclas estan disenadas para funcionar a un nivelde senal que se denomina nivel nominal u operativo que corresponde a un valor de 4 dBu(1,23 V), este valor ofrece una lectura cero en el medidor de unidades de volumen o VU meter.

Habitualmente se ajustara el nivel medio de senal mediante el preamplificador del instru-mento o de la mesa de mezclas para que coincida con el nivel nominal, que representara elnivel normal de funcionamiento de la mesa.

Headroom y S/N Una vez ajustado el nivel nominal de funcionamiento, obtendremos unosmargenes de variacion de la senal de entrada limitados superiormente por el nivel de satu-racion del dispositivo e inferiormente por su nivel de ruido o el de la propia senal.

A la diferencia entre el nivel nominal y el nivel de ruido se le denomina relacion senalruido (S/N) y nos dice el margen inferior de variacion de la senal que podemos permitir sinque el ruido del dispositivo afecte a la grabacion.

La diferencia entre el nivel nominal y el maximo permitido por el dispositivo se denominaheadroom. El headroom indica el margen superior de variacion de la senal permisible antesde que esta se vea recortada o distorsionada. En la mayorıa de las mesas de mezclas, elheadroom es de unos 20 dB, es decir se permite un nivel maximo de 24 dBu.

Por ejemplo, en el caso de una entrada de microfono con un margen dinamico de 40 dBSPL (ruido ambiente) a 130 dB SPL (maxima senal), ajustaremos el preamplificador de for-ma que el maximo nivel recibido por el microfono (130 dB SPL) coincida con el maximo dela mesa de mezclas (24 dBu) con lo cual el nivel nominal correspondera a una presion sonorade 110 dB SPL. En este caso, el headroom sera de 24 dBu - 4dBu=20 dB, el nivel de ruido

7

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

S/N

Headroom

24 dBu

-20

-30

-40

-50

-60

-10

0

10

2014 dBu

-55 dBu

Nivel

(dBu)

Nivel de Ruido -66 dBu

Nivel Nominal 4 dBu

Dinámico

Margen

Figura 1.1: Ejemplo de margen dinamico..

(40 dB SPL) correspondera a -66 dBu y la relacion senal ruido sera de 70 dB.

En la figura 1.1 puede verse la representacion del margen dinamico, nivel de ruido y hea-droom de una grabacion. Tambien puede observarse la variacion en los niveles producida porun compresor (que sera estudiado mas adelante).

Dependiendo del tipo de musica que pretendamos grabar es posible que un headroom de20 dB sea insuficiente. Por ejemplo, una orquesta sinfonica produce un nivel medio menorque un grupo de rock y sin embargo un margen dinamico igual o mayor. En este caso de-beremos proveer un headroom mayor (hasta 30 dB frente a los 20 de la musica moderna)para permitir picos mayores sobre el nivel medio y evitar que el sonido resulte distorsionadoen los pasajes fuertes. El metodo es ajustar el nivel nominal a un nivel de grabacion 10 dBpor debajo del utilizado normalmente, con esto aumentaremos el headroom hasta un valoradecuado a costa de reducir la relacion S/N.

8

CAPITULO 1. Definiciones generales y amplificacion. Sistemas de Audio e Vıdeo. Curso 2003-2004

+

-Ei

EoR1

R2

Figura 1.2: Amplificador operacional con realimentacion negativa.

1.6. Amplificadores.

Los amplificadores se utilizan extensamente en el mundo del audio profesional no solo ensu faceta mas conocida: amplificadores de potencia que alimentan sistemas de altavoces, sinoen otras tareas como adaptacion de niveles de senal e incluso impedancias.

Internamente, el proceso de amplificacion de una senal se realiza mediante valvulas devacıo o transistores. Como es bien sabido si la senal de entrada supera los margenes de fun-cionamiento del transistor o valvula, se produce el fenomeno denominado saturacion, y lasenal de salida se ve recortada, generandose una serie de armonicos que producen un efectode distorsion bien conocido.

El circuito basico amplificador en los sistemas de audio es el amplificador operacional 1.2,llamado ası porque posibilita la realizacion de operaciones matematicas con senales analogi-cas. El amplificador operacional permite la obtencion de ganancias altas con gran estabilidady ancho de banda. Idealmente el amplificador operacional se modela como un componentecon ganancia infinita (100 a 110 dB), impedancia de entrada tambien infinita (en realidaddel orden de los 10 M) e impedancia de salida cero (unos pocos Ω).

1.7. Preamplificadores.

Los preamplificadores o previos se utilizan para adaptar senales muy debiles (-70 a -50dBu), a los niveles requeridos por las entradas de las mesas de mezcla (-20 a 4 dBu).

El diseno de los preamplificadores es de gran importancia ya que por ser el primer ele-mento activo de la cadena la calidad que proporcionen va a influir de manera importante enel resto de la mezcla.

9

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

Las caracterısticas exigibles a los preamplificadores son un nivel de ruido muy bajo yuna distorsion pequena. El nivel de ruido es especialmente importante puesto que fijara elmargen dinamico para el resto de la mezcla.

Los previos se utilizan para amplificar microfonos y en ciertos casos guitarras electricas.Las mesas de mezclas disponen de un preamplificador a la entrada de cada canal que permitela conexion directa de microfonos.

1.8. Amplificadores de potencia.

Los amplificadores de potencia se utilizan para elevar la senal de entrada a los nivelesnecesarios para alimentar sistemas de altavoces.

Las caracterısticas que buscaremos en un amplificador de potencia seran una respuestaplana para el rango de frecuencias audible (20 Hz a 20 KHz), una tasa de distorsion baja yuna determinada potencia nominal de salida dependiendo de nuestras necesidades.

1.8.1. Distorsion armonica y ruido.

Una medida habitual de la calidad de los amplificadores es su distorsion armonica. Seproduce a causa de no linealidades en su respuesta, siendo mas acusado el efecto cuando nosacercamos a la zona de saturacion.

La distorsion armonica consiste en la aparicion de armonicos no presentes en la senal deentrada que colorean el sonido. En algunos casos este efecto de coloracion es deseable, comoen los amplificadores de guitarra, pero en el caso de amplificadores de potencia el resulta-do sera un sonido poco natural y por tanto interesara que esta distorsion sea lo menor posible.

En la figura 1.3 puede verse un ejemplo de este tipo de distorsion. La senal introducida alamplificador es un tono puro con una frecuencia F . A la salida de este aparecen componen-tes de frecuencia 2F (segundo armonico) y 3F (tercer armonico), no presentes en la senaloriginal.La distorsion armonica se mide como el nivel relativo de uno o varios de los armonicos frenteal nivel de la senal de entrada. Por ejemplo una distorsion del 1% del 2o armonico indicaque el nivel del segundo armonico es el 1% del tono de prueba. Otra especificacion habituales la distorsion armonica total o THD que indica el nivel de la suma de todos los armonicosrespecto al nivel de la senal original.

10

CAPITULO 1. Definiciones generales y amplificacion. Sistemas de Audio e Vıdeo. Curso 2003-2004

2do

Armónco Armónco

3er

Tono de prueba

Distorsión

Figura 1.3: Distorsion armonica

La medida de la distorsion armonica de un dispositivo se realiza inyectando un tono puroy midiendo el nivel de los armonicos a la salida. Si el nivel de los armonicos es suficientementebajo, es posible que estos se encuentren enmascarados por el nivel de ruido del amplificadory por lo tanto el nivel medido puede corresponder a ruido y no a distorsion armonica, poresta razon en algunos casos se especifican valores de distorsion + ruido, indicando que esimposible diferenciar un efecto del otro.

La distorsion armonica depende del nivel y frecuencia de la senal que utilicemos como test.Si el nivel de senal es cercano al nivel de saturacion del amplificador, se producira un efectode saturacion o recorte. Este efecto se traduce directamente en la aparicion de armonicos deltono fundamental, por lo cual la distorsion armonica crecera dramaticamente para valoresde senal cercanos a la maxima potencia de salida del amplificador (figura 1.4). En cuanto ala frecuencia, la distorsion armonica no es constante para todo el ancho de banda del am-plificador siendo habituales valores mayores para frecuencias altas y bajas, y menores paramedias. En ocasiones el fabricante suministra graficas de variacion de la distorsion armonicaen funcion de la frecuencia.

Un ejemplo de especificacion de la distorsion armonica:

THD (-3dB at rated output, 8 Ω): 0.003%

Donde se indica una THD del 0.003% para una potencia de salida 3 dB por debajo de lanominal y actuando sobre una carga de 8 Ω.

11

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

1 10

.01

.1

.0010

THD (%)

100

Potencia de Salida (W)

1 KHz

10 KHz

100 Hz

Figura 1.4: Distorsion armonica en funcion de la potencia de salida.

1.8.2. Potencia nominal.

Generalmente se expresa como la maxima potencia media de una onda sinusoidal continuaque se puede liberar en una carga de 4 Ω. Este valor se da para una distorsion maxima y unrango de frecuencias determinado. Las especificaciones pueden incluir tambien la potenciamaxima de salida para otras cargas ( 8 y a veces 2 Ω) y para funcionamiento estereo y mono,por ejemplo:

Potencia de una onda sinusoidal continua para una distorsion THD menor del 0.05

Estereo 8 Ω.Ambos canales activos: 240 W por canal.

Estereo 4 Ω.Ambos canales activos: 400 W por canal.

Como se puede comprobar, debido a limitaciones de corriente, el amplificador ofrece algomenos del doble de potencia a la mitad de carga, es por esto que son utiles las especificacionespara diferentes valores de carga.

12

CAPITULO 1. Definiciones generales y amplificacion. Sistemas de Audio e Vıdeo. Curso 2003-2004

1.8.3. Respuesta en frecuencia y ancho de banda de potencia.

Respuesta en frecuencia y ancho de banda de potencia son dos especificaciones complemen-tarias que nos indican la capacidad del amplificador de ofrecer una respuesta sin distorsionpara diferentes frecuencias, en el primer caso se fija una potencia baja y se mide

Respuesta en frecuencia. Indica el rango de frecuencias para el cual el amplificador man-tiene inalterada la senal de entrada, es decir presenta una respuesta plana. Generalmente lamedida de la respuesta en frecuencia se da para una senal de test de 1 W. Se suelen indicarlos margenes de tolerancia de la medida, por ejemplo:

Frecuency Response (at 1 W): 1Hz - 250 KHz +0dB, -3dB

Nos indica que la respuesta en frecuencia del aparato es plana en un rango de 1 Hz a 250KHz con -3dB de tolerancia.

Ancho de banda de Potencia La especificacion de la respuesta en frecuencia no es del todoutil puesto que se calcula para una senal de 1 W. Para potencias mas altas es de esperarque la distorsion sea mayor y por lo tanto la respuesta en frecuencia diferente. Ademas, laganancia del amplificador suele ser variable con la frecuencia, decayendo para los extremosdel ancho de banda del amplificador. Para cuantificar esta variabilidad se utiliza el Ancho debanda de potencia que se define como el margen de frecuencias en el cual el amplificador escapaz de ofrecer al menos la mitad de su potencia nominal sin recortar la senal. Este valorse puede especificar numericamente o mediante una grafica en la que se muestra la potenciade salida en funcion de la frecuencia. Una especificacion tıpica:

Power Bandwidth (8 Ω, THD 0.03%): 5 Hz - 50 KHz

Estos datos estan tomados del mismo amplificador que en el ejemplo anterior, pudiendosecomprobar que el ancho de banda de potencia es mucho menor que la respuesta en frecuencia.El ancho de banda de potencia es una especificacion mas restrictiva y mas realista que larespuesta en frecuencia, ya que nos indica la distorsion que se obtendra para diferentesfrecuencias utilizando la maxima potencia del amplificador. En este caso se deduce que parauna distorsion THD del 0.03% y actuando sobre una carga de 8 Ω la potencia de salida delamplificador decae a la mitad de su valor nominal para una frecuencia inferior de 5 Hz y unasuperior de 50 KHz (suponemos que la referencia es el valor nominal de potencia puesto queno se indica ningun otro valor).

13

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

ZoutZin SalidaEntradaZs

Zl

Zs Impedancia de FuenteZin Impedancia de EntradaZout Impedancia de SalidaZl Impedancia de Carga

FUENTEAMPLIFICADOR

DESTINO

Figura 1.5: Impedancias de entrada y salida.

1.8.4. Impedancias de entrada y salida.

Aunque este no es un tema especıfico de los amplificadores de los amplificadores de po-tencia, introduciremos aquı los conceptos de impedancia de entrada y salida.

Como impedancia de entrada y salida entendemos respectivamente la resistencia que seve a la entrada y la salida de un dispositivo. Existen dos formas basicas de realizar unaconexion: en algunos casos la salida esta pensada para ser conectada a una entrada con unaimpedancia mas o menos del mismo valor (normalmente del orden de 600 Ω), conexion de-nominada adaptada (matched); en otros casos el dispositivo dispone de una impedancia desalida baja pensada para su conexion a una entrada con impedancia muy alta, permitiendoası que la mayor potencia posible se libere en la carga , a esta conexion se le denomina enpuente bridged.

En general la especificacion de un dispositivo indicara su impedancia de entrada y o bienla impedancia maxima de la fuente o bien un rango de impedancias posible. Por ejemplo:

Source Impedance: 200 Ω to 600 Ω nominal.Input Impedance: 2.8k Ω.

Se indica que el dispositivo presenta una impedancia de entrada de 2.8K y esta pensadopara la conexion de fuentes con una impedancia de salida entre 200 y 600 Ω, es decir parauna conexion en puente.

Para las impedancias de salida, se especificara la impedancia mınima de la carga conec-table. Puesto que la carga mınima aceptable dara unos resultados pobres, se indica tambienla carga recomendada o nominal:

14

CAPITULO 1. Definiciones generales y amplificacion. Sistemas de Audio e Vıdeo. Curso 2003-2004

Output impedance: 100 Ω.load impedance: 2k Ω.Nominal load impedance: 10k Ω.

La impedancia de salida es de 100 Ω estando pensada para su utilizacion con entradas de10k. Si se conecta una carga menor de 2K el funcionamiento no sera correcto y habra peligrode danar el aparato.

Damping Factor El Damping factor se utiliza en ocasiones para especificar la impedanciade salida de un amplificador. Indica el cociente entre la impedancia de la carga (8 Ω para unaltavoz) y la de salida del amplificador. Una especificacion tıpica podrıa ser:

Damping Factor: (8 Ω load)400 minimun below 250 Hz.50 minimun below 10 KHz.

Segun estos datos podemos deducir que la impedancia de salida es como maximo 0.16 Ωa 10 KHz y 0.02 Ω por debajo de 250 Hz. Observese por lo tanto que la impedancia no esconstante respecto a la frecuencia.

1.8.5. Otras caracterısticas

Tiempo de respuesta.Slew Rate

Mide la habilidad del amplificador para responder a cambios rapidos de la tension dela senal. Un tiempo de respuesta bajo puede causar una distorsion importante en la senalamplificada. El efecto se hace mas pronunciado para potencias grandes.

Sensibilidad.

Indica el nivel rms de tension que debe tener una onda sinusoidal para conducir el ampli-ficador a su nivel nominal de salida utilizando una impedancia determinada (habitualmente8 Ω).

15

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

16

Capıtulo 2

Control del margen dinamico

El maximo rango dinamico que se suele considerar en una pieza musical es del orden deunos 120 dB, mientras que muchos medios de transmision y/o almacenamiento presentan unrango menor; por ejemplo, una cinta magnetica puede tener unos 60 dB y un disco compactode 80 a 90 dB. Esta disparidad en el margen dinamico de unos medios a otros hace que seanecesario incluir un control para evitar problemas de saturacion de la etapa siguiente o undeterioro considerable de la senal debido a la presencia de distintos ruidos existentes, comoya comentaremos.

2.1. Margen dinamico

Una vez ya introducido previamente el concepto de margen dinamico, o rango dinamico,y su importancia, pasemos ahora a comentar un par de cuestiones de interes.

2.1.1. Deteccion del nivel

A la hora de detectar el nivel de una senal sonora podemos usar varias aproximaciones:

1. Valor de pico instantaneo: se usara siempre que deseemos controlar que la senal nosupere un cierto valor, ni la mas mınima fraccion de tiempo (dependiendo de la rapidezde respuesta del circuito detector, claro)

2. Valor medio de la senal o tambien calcular su Valor cuadratico medio (rms): paraetiquetar un cambio de nivel, la senal debera mantenerse en el nuevo nivel duranteun cierto tiempo, ya que estamos efectuando un promediado a lo largo de un ciertoperıodo. La deteccion del nivel usando el valor rms suele proporcionar resultados massatisfactorios desde un punto de vista perceptual.

17

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

La descripcion del cambio en los distintos niveles de la senal y en su rango dinamico alusar compresores y expansores de este, suelen quedar reflejados en una curva caracterısticasimilar a la presentada en Figura 2.1, donde se plasma la correspondencia entre los nivelesde entrada y de salida.

Figura 2.1: Curva caracterıstica de un compresor

Apliquemos el proceso que apliquemos, es de destacar la importancia de mantener la ima-gen estereo, es decir, el balance de potencias entre el canal izquierdo y derecho para evitarposibles desplazamientos de la posicion percibida si aplicamos amplificaciones o atenuacionesdistintas en ambos canales.

2.1.2. Tıpicos rangos dinamicos

Como se puede observar en la siguiente relacion, el margen dinamico que nos podemosencontrar en distintos medios es sumamente variado. Por ejemplo, son valores tıpicos:

Maximo rango musical Unos 120 dB aprox.

Mesa de mezclas analogica mayor que 90 dB

Cinta digital / Disco compacto 90 dB aprox.

18

CAPITULO 2. Control del margen dinamico Sistemas de Audio e Vıdeo. Curso 2003-2004

Cinta analogica 70 dB aprox.

Radio (FM) unos 60 dB

Disco de vinilo unos 50 dB

Cinta de vıdeo unos 50 dB

Radio (AM) de 20 a 30 dB

Ruido ambiente del hogar de 35 a 45 dB SPL como Nivel de Presion Sonora habitual.

Estos valores plasman la necesidad de disponer de unos elementos que adecuen los distintosrangos dinamicos de unos equipos a otros. Si los amplificadores son usados para hacer corres-ponder niveles de entrada y salida ajustados a los elementos interconectados, los compresoresy expansores nos facilitaran el aprovechamiento de todo el margen dinamico disponible en unsistema, independientemente de los rangos de trabajo de los sistemas anteriores y posteriores.

2.2. Compresores

Como su propio nombre indica, comprimen el margen dinamico a base de aplicar uncontrol automatico de ganancia. La relacion entre el nivel logarıtmico de entrada y el delnivel logarıtmico modificado de salida es el llamado factor de compresion, activandosehabitualmente el compresor a partir de un cierto umbral (threshold of compression, knee,rotation point). Tiene un detector de nivel que gobierna al otro elemento, el propio Con-trol Automatico de Ganancia (que es habitualmente un amplificador controlado por voltaje(VCA)). Dicho detector de nivel viene caracterizado por un umbral, un tiempo de ataque(attack time) y un tiempo de caıda (decay, recovery, release time)1, ajustables en muchos ca-sos, y proporciona una senal de control para el VCA (ver Figura 2.2), ademas de informacionpara monitorizar los niveles de entrada/salida y la ganancia aplicada en cada instante.

El factor de compresion y la curva caracterıstica quedan reflejados en la Figura 2.1,correspondiente a una compresion aplicada en todo el margen de niveles de entrada (sinconsiderar un umbral).

2.2.1. Efecto sobre la senal

Veamos un ejemplo: supongamos que aplicamos un compresor 2:1 en todo el margendinamico de entrada, es decir, modificando cualquier valor de entrada a un nuevo valor. Si

1 El tiempo de ataque y el de caıda marcan la evolucion de la ganancia a lo largo del tiempo; si estos tiempos son nulos,

el cambio de la ganancia ante una variacion brusca del nivel sera instantaneo, mientras que normalmente existe un tiempo de

transicion en el que la ganancia va cambiando hacia el nuevo valor.

19

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

Figura 2.2: Esquema de un circuito compresor

la senal de entrada, p.e. proveniente de un disco compacto, tuviera un margen de 90 dB,con +20 dBm de maximo y - 70 dBm de mınimo, y la etapa posterior fuera una emision deradio FM (+10 dBm/-40 dBm), ocurrirıa lo reflejado en la Figura 2.3:

Figura 2.3: Rango dinamico antes y despues de la compresion

Es decir, el nuevo margen dinamico de 45 dB puede ser emitido a traves de la etapa deradio sin ningun problema aparente. Pero ya comentamos que el detector tiene lo que sellaman unos tiempos de ataque y caıda no ideales, es decir, distintos de cero segundos. Estohace que, dependiendo de la senal de entrada, pueda haber partes de la senal a las que no seles aplica la compresion deseada. Pongamos por caso que se pretende comprimir una senaltemporal como la mostrada en la Figura 2.4 y supongamos que los tiempos de respuesta delcompresor viene dados por la Figura 2.5, donde se muestran conjuntamente la ganancia ideal

20

CAPITULO 2. Control del margen dinamico Sistemas de Audio e Vıdeo. Curso 2003-2004

que se deberıa aplicar y la real , debida a la no idealidad del compresor. La senal de salidava a ser la mostrada en 2.6 que, como se puede observar, queda claramente distorsionadadebida a la aplicacion de ganancias incorrectas en los cambios de la senal. La razon es laaplicacion de un incremento en el nivel de salida para trozos de senal correspondientes a unelevado nivel de entrada y, viceversa, la atenuacion de partes que deberıan ser amplificadasdebido a su bajo nivel de entrada.

Figura 2.4: Senal de entrada

Figura 2.5: Ganancia aplicada (a trazos la ideal)

Esto puede ser nefasto en ambos casos, pero especialmente en el primero: el aplicar unnivel sumamente elevado a la siguiente etapa provocara, probablemente y como mal menor,un recorte en la senal debido a la saturacion del sistema o, en el caso peor, danos debido al

21

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

Figura 2.6: Despues de pasar por el compresor

exceso de potencia de entrada en la siguiente etapa. El segundo caso puede hacer que ciertaspartes mas debiles de la senal desaparezcan durante un cierto perıodo de tiempo, hasta queel compresor recupere su ganancia adecuada.

2.2.2. No idealidades: problemas y soluciones

Una forma de evitar estos casos extremos pasa por limitar la capacidad de compresiondel sistema, por ejemplo usando la curva caracterıstica de la Figura 2.7, donde la nuevacompresion tiene unos valores maximos de amplificacion y atenuacion debido al cambio dependiente. El forzar que a partir de unos ciertos niveles bajos y altos de entrada la pendien-te pase a ser la unidad garantiza que este acotada la maxima amplificacion y atenuacionalcanzada.

Los valores tıpicos de compresion no suelen ser demasiado altos (excepto los limitadores,que veremos a continuacion), con valores desde un factor 1.5:1 hasta 4:1, habitualmente.

Los tiempos de ataque y caıda (o recuperacion) mınimos varıan mucho en funcion delhardware usado, pero valores del margen 100 µs-1ms para el tiempo de ataque y de unos0.5s-2s para el de recuperacion suelen ser habituales. Muchos compresores tienen mandosexternos que facilitan el control de estos tiempos, para hacerlos mayores que el mınimodependiendo de la aplicacion. Y ¿por que puede interesar hacer mas largos estos tiempos? Eltener un tiempo de ataque cuasi- instantaneo parece algo deseable, pero corremos el riesgode que al final se perciba como tal, esto es, como un cambio brusco en el nivel del sonido.

22

CAPITULO 2. Control del margen dinamico Sistemas de Audio e Vıdeo. Curso 2003-2004

Figura 2.7: Valores extremos de ganancia acotados

La aparicion de cambios de nivel muy seguidos en el tiempo puede provocar una oscilacionclaramente audible en el nivel medio de la senal, especialmente en componentes de muybaja frecuencia, por lo que se pueden arbitrar soluciones que introduzcan una cierta inerciatemporal, de forma que el cambio no sea tan brusco y, por tanto, no tan perceptible. Ası,algunos incorporan una inercia en la deteccion del nivel, de forma que un breve cambioen la potencia de la senal (muy habitual en audio) no dispare un cambio en la ganancia aaplicar. Incluso la deformacion en la senal que acabamos de estudiar puede ser interesantepara ciertos instrumentos (p.e.: para aumentar la pegada de un bajo electrico). Recordemos:siempre en funcion de la aplicacion: si el objetivo es evitar que un pico supere un cierto nivela toda costa, este tiempo debera ser lo mas corto posible.

En cuanto al tiempo de caıda, suele ser mas largo para aliviar precisamente estos cam-bios de nivel repentinos, de forma que la transicion se haga de forma mas suave. Incluso,dependiendo del tipo de musica, puede interesar tener ese tiempo especialmente largo, perohay que tener en cuenta el efecto que esto puede provocar en las partes mas debiles de la senal.

Algunos compresores anaden un detector de cruces por cero, que activa un cambio en laganancia solo si la senal es de muy bajo nivel, minimizando el efecto subjetivo del cambio.

Como el proceso exige un retardo, debido a la no idealidad de los elementos, una configu-

23

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

racion muy habitual es el desplazar el compresor a una rama lateral (side chain) e introducirun retardo en la rama principal o aprovechar el retardo provocado por algun otro proceso,de forma que la accion se haga sıncrona a los cambios de la senal o, incluso, preceda a dichoscambios; el efecto conseguido puede variar mucho dependiendo de como apliquemos estaconfiguracion.

2.2.3. Limitadores

Los limitadores son un caso particular de los compresores, donde se procede exclusivamen-te a una compresion de los niveles mas altos, permaneciendo los niveles mas bajos inalterados,como se ve en la Figura 2.8. Su factor de compresion suele ser muy elevado (8:1, 10:1, 20:1e incluso mas2 son valores tıpicos) y sus tiempos de ataque y caıda deben ser muy cortos yaque su aplicacion fundamental es garantizar que nunca superamos unos ciertos valores enel nivel de la senal de salida del limitador.

Figura 2.8: Curva de un limitador

2.2.4. Uso de los compresores

Entre los muchos usos que pueden tener estos elementos podemos destacar, ademas delya mencionado de ajuste a un cierto rango dinamico deseado, por ejemplo:

2 Si no queremos que el nivel exceda nunca de un determinado valor aplicaremos un factor de compresion ∞ : 1

24

CAPITULO 2. Control del margen dinamico Sistemas de Audio e Vıdeo. Curso 2003-2004

1. Uniformidad en el nivel sonoro: si la distancia entre la fuente sonora y el captador varıa(p.e. un vocalista y su microfono), la fuente tiene mas margen dinamico que el deseadodebido a la propia ejecucion del instrumento (p.e. un bajo electrico) o se desea que hayauna uniformidad en el conjunto (p.e. un programa de radio). La eleccion del umbral ylos tiempos de ataque y caıda es especialemente crıtica en estas aplicaciones.

2. Atenuacion dependiente de una segunda senal : se puede hacer que el umbral o el factorde compresion dependan de otra senal, como por ejemplo la reduccion del nivel delfondo musical cuando entra hablando un locutor de radio.

3. Control de picos: evitar lo ya comentado, que existan picos excesivos que puedan pro-vocar recortes en la senal sonora, efectos no deseados (p.e. intermodulaciones en untransmisor de radio) o danos en el sistema siguiente (p.e. caıda de un microfono y peli-gro de dano en las pantallas a’custicas que estan presentando esa entrada amplificada).Suelen ser limitadores los encargados de esta funcion.

4. Reduccion de ciertas bandas de frecuencia: ante determinados siseos provocados porciertos sonidos sibilantes (p.e. /s/), se puede aplicar una compresion (de-esser) restrin-gida a la zona de altas frecuencias (6-8 KHz). Esta compresion no afecta al resto de labanda.

5. Elevacion del nivel medio de grabacion: en fuentes con muchos transitorios, como puedeser la voz humana, el aplicar un limitador solo a las partes de mayor nivel hace que,en media, podamos elevar el nivel de senal que captamos o registramos, lo que facilitauna mejor relacion Senal a Ruido, sin saturacion (overloading) en el medio usado parala grabacion (p.e. cinta magnetica). Si se aplica a una fuente concreta en una mezcla,podemos enfatizar su presencia ya que la sensacion sonora va a aumentar aunque lospicos se reduzcan, ya que en media se eleva su nivel. Si se aplica a toda una cancion, porejemplo, su nivel de presencia sera mayor en un programa de radio que otras cancionesque no sean comprimidas.

2.3. Expansores

Producen el efecto inverso al ya comentado en la seccion anterior, en este caso se expande elmargen dinamico a base de aplicar un control automatico de ganancia. La relacion logarıtmica(en dB) entre el nivel de entrada y el del nivel modificado de salida es el llamado factorde expansion, activandose habitualmente el expansor tambien a partir de un cierto umbral(threshold). El detector de nivel y el control de ganancia son basicamente similares a los yacomentados en los compresores.

El factor de expansion y la curva de transferencia quedan reflejados en la Figura 2.9,afectando a todos los niveles de entrada (sin aplicar un umbral). La combinacion de un

25

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

Figura 2.9: Expansor

compresor seguido mas adelante de un expansor forma lo que se llama un compansor, quesi los procesos fueran exactamente inversos equivaldrıa a un sistema que no modificarıa lasenal. La presencia de distintas curvas o tiempos de ataque y caıda no complementarios enel compresor y en el expansor hacen que esto no sea ası habitualmente.

2.3.1. Efecto sobre la senal

Como ya comentamos, el aplicar una amplificacion o atenuacion incorrecta puede distor-sionar la senal a su paso por el compresor, como tambien ocurre a su paso por el expansor.

Ademas el expandir la senal hace que los niveles mas bajos se vean atenuados, lo quepuede ser usado para eliminar el ruido de fondo. Si esta eliminacion es brusca (factor 1 : ∞)a partir de un umbral, el cambio en el ruido de fondo puede llegar a ser perceptible y, portanto, molesto, por lo que suele ser recomendable usar tiempos de reaccion largos o aplicarfactores de expansion bajos.

2.3.2. No idealidades: problemas y soluciones

La deformacion en la senal, provocada por tiempos de respuesta no nulos y cambiosbruscos en la senal, se puede controlar usando retardos en la rama principal por dondeevoluciona la senal original o con la aplicacion de la misma tecnica que ya mencionamos

26

CAPITULO 2. Control del margen dinamico Sistemas de Audio e Vıdeo. Curso 2003-2004

en el compresor, limitando la ganancia (tanto amplificacion como atenuacion) aplicada a lasenal. La clave esta en volver a una pendiente unidad en la curva de transferencia a partirde ciertos valores umbrales, como ya se comento anteriormente.

2.3.3. Puertas de ruido

Como caso particular de los expansores podemos comentar las llamadas Puertas de Ruido,que afectan solamente a los niveles mas bajos en la senal de entrada, aplicandoles una fuerteatenuacion.

2.3.4. Uso de los expansores

Mencionemos ahora la principal aplicacion de estos sistemas, ademas de la ya mencionadade ajustar el margen dinamico antes de una determinada etapa:

1. Eliminacion del ruido de fondo: si sabemos el margen de trabajo que nos interesa en uncierto captador (p.e. un microfono), podemos usar una Puerta de Ruido para eliminartodo aquello que no supere un cierto nivel umbral, asociado casi siempre a ruidos defondo existentes (p.e. otras fuentes sonoras, paso de paginas, ruido de ropas,etc.). La to-ma puede quedar especialmente limpia siempre que los valores de ajuste sean adecuadospara la aplicacion.

2. Modificacion del sonido: si queremos eliminar ciertos niveles de un instrumento; porejemplo, aplicarlo en los golpes de la caja de una baterıa puede ayudar a conseguiruna buena referencia de sincronıa (claqueta), sin los efectos de resonancia de la caja.El disparo (trigger) para que actue o no una puerta de ruido, opcion habitual en lasmismas, puede venir de una senal externa, lo que facilita su uso.

3. Reduccion de interferencias: si observamos problemas con interferencias entre canales(crosstalk), pistas de grabacion, etc., podemos aplicar un expansor para eliminar esassenales residuales ajenas a la pista actual.

2.4. Reductores de ruido

Hemos discutido como podemos aumentar o disminuir el margen dinamico de excursionde la senal de audio, dependiendo de la aplicacion concreta que queramos desarrollar. Unade esas aplicaciones es la utilizacion conjunta de un proceso de compresion seguido de unproceso de expansion, lo que se entiende por compansion, para conseguir minimizar losefectos de ciertos ruidos presentes en la cadena de audio.

27

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

2.4.1. Compansores en tiempo

La compresion, en general, como hemos visto suele atenuar los niveles altos, pero amplificalos mas bajos ; esta ultima car cterıstica puede ser usada para elevar el nivel de la senal en suspartes mas debiles, de forma que supere a ciertos niveles de ruido presentes en otros modu-los sucesivos. Pongamos un ejemplo: un sistema de grabacion (una cinta de cassette, porejemplo) que tiene un determinado nivel de ruido intrınseco al proceso de almacenamiento.Deseamos grabar una senal que tiene el margen dinamico presentado en la Figura refcom-pansor que, previamente, vamos a comprimir. Durante el proceso de grabacion se anade unruido de un nivel inferior al nuevo nivel comprimido de las partes mas debiles en la senal.Esto hace que dicho ruido no se mezcle en el mismo rango dinamico de la senal comprimida,sino por debajo. Si ahora expandimos la senal a sus valores iniciales, el ruido de grabacionse vera reducido en nivel por debajo, probablemente, del mınimo nivel presente en el nuevomargen dinamico. Se ha conseguido, aparentemente, eliminar el ruido presente en el disposi-tivo de almacenamiento. Evidentemente el sistema de almacenamiento tiene mas fuentes dedistorsion, pero este sencillo metodo consigue reducir considerablemente el ruido presente alfinal del proceso. Es decir, para conseguir el efecto necesario necesitamos expandir la senalrecogida en la cinta con el mismo factor que la hemos comprimido. El reproducir la cintasin expandir el margen nos llevarıa a escuchar el audio con un margen que no es el original,totalmente descompensado con respecto a los niveles originales. En principio, cuanto mayorsea el factor de compresion/expansion, mayor es la reduccion del ruido presente.

Por ejemplo, el sistema comercial dbx efectua este proceso en el dominio del tiempo,tomando como referencia la banda completa de frecuencias, usando un factor de compresionde 2:1 entre los niveles - 90 dBm y +25 dBm, con el punto de ganancia unidad en +4 dBm(0VU), sin depender del nivel.

El usar una compansion en toda la banda puede dar problemas dependiendo del nivel dela senal a lo largo de la frecuencia, es decir, de su distribucion de energıa en el espectro. Si lasenal tiene un gran contenido en bajas frecuencias (como suele ser lo habitual en senales deaudio), entonces la compansion puede que no afecte a ruidos existentes en altas frecuencias,habituales en las cintas como puede ser el siseo, ya que el proceso queda gobernado por laenergıa predominante, la de bajas frecuencias. Veamos como solucionar este problema en laproxima seccion.

2.4.2. Compansores por bandas de frecuencia

Aunque el sistema dbx dispone tambien de unos filtros de preenfasis y deenfasis de lasfrecuencias mas altas para intentar resolver este ultimo problema, centremonos en la formade trabajo de otro sistema comercial con una larga tradicion, los sistemas de reduccion de

28

CAPITULO 2. Control del margen dinamico Sistemas de Audio e Vıdeo. Curso 2003-2004

ruido Dolby: Dolby spectral recording (SR), Dolby A y los sistemas para equipos domesticosDolby B y Dolby C, ademas del ultimo Dolby HX.

Dolby A usa cuatro compansores distintos, uno para cada una de las cuatro bandas defrecuencia en las que divide el espectro: 0-80 Hz, 80 Hz- 3 KHz, 3-20 KHz y 9-20 KHz. Lasbandas tienen un cierto solape entre ellas, lo que hace su efecto mas equilibrado. Dolby B yC usan esquemas similares en su filosofıa, aunque con bandas no fijas.

Cualquiera de estos esquemas funciona con una filosofıa marcada por los siguientes puntos:

Trabajan con compresores distintos para cada banda de frecuencias, ya sean estas fijaso moviles.

La compansion se aplica basicamente a los niveles mas bajos de senal.

Operan con un sistema en paralelo, que se activa o no dependiendo del nivel de la senal.

Para su correcto funcionamiento requieren una senal de calibracion.

La reduccion de ruido que podemos conseguir va a variar, por tanto, de la zona de frecuen-cia en la que trabajemos. Pongamos un ejemplo para discutir esta nueva tecnica: supongamosuna division uniforme del espectro en cuatro bandas y los cuatro compresores obedeciendouna misma relacion entrada-salida, actuando sobre una senal que en un momento dado tienela distribucion espectral de energıa reflejada en la Figura 2.10, en la que tambien se presentael nivel de ruido que el sistema de grabacion va a introducir (supongamos ruido blanco, porsimplicidad).

Figura 2.10: Espectro con la senal original y el ruido

29

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

El espectro de la senal muestra una distribucion de energıas tıpica en muchos fragmentosmusicales: mucha mas energıa en bajas frecuencias que en altas. Si el ruido se sumara a lasenal original, probablemente quedarıa enmascarado en las dos primeras bandas, debido a lapresencia de mucha energıa en bajas frecuencias, pero en las dos bandas siguientes interferirıaclaramente con la senal e incluso enmascararıa la ultima banda, eliminando la informacionpresente en esta, ya que la relacion Senal-a-Ruido serıa extremadamente baja. Si la senal escomprimida por bandas, su espectro se aproximara al reflejado en la Figura 2.11, donde lasdos ultimas bandas han sido amplificadas quedando ahora por encima del ruido que se intro-duce a continuacion. Una vez almacenada, la senal se debe expandir para ser reproducida,de forma que se obtiene la senal mostrada en la Figura 2.12, donde se observa claramentecomo el ruido ha sido perfilado, disminuyendo claramente en las bandas superiores y man-teniendose enmascarado en las bandas inferiores.

Figura 2.11: Accion del compresor en las bandas altas

2.4.3. Curiosidades

Si escuchamos material grabado usando un metodo en frecuencia como los que acaba-mos de comentar, pero sin expandir, realmente lo que oımos es el espectro mostrado enla Figura refespeccompreyruido, que es muy distinto al original, evidentemente. De todasformas ocurre a veces que resulta subjetivamente mas agradable no conectar el expansor queconectarlo, ya que en caso de hacerlo, el audio suena demasiado apagado. Una explicacionpara este fenomeno la podemos encontrar al tener en cuenta que el sistema de grabacion va

30

CAPITULO 2. Control del margen dinamico Sistemas de Audio e Vıdeo. Curso 2003-2004

Figura 2.12: Despues de expandir

a introducir mas distorsiones que un simple ruido de grabacion, y entre las distorsiones mashabituales figura la del filtrado paso-bajo, tanto mas exagerado cuanto peor sea la calidad dela cinta magnetica, la suciedad de los cabezales o las car acterısticas del equipo reproductoren sı. Esto hace que no aplicar el expansor, que equivale a una amplificacion de las bandasmas altas (las mas afectadas por dicho filtrado), proporcione una audicion mas agradable yaque se recupera la informacion en las bandas superiores, aun a costa de escuchar el siseo de lacinta (ruido bastante estacionario en sus caracterısticas y, por consiguiente, perceptualmentesoportable por adaptacion). Obviamente, si es posible, es mejor expandir la senal y aplicaruna ecualizacion controlada para realzar esas frecuencias superiores y evitar el ruido de lacinta.

Como el objetivo de estos sistemas es la reduccion de ruido, la respuesta conjunta delcompresor y del expansor debe aproximarse lo mas posible a la unidad, lo que invalida eluso de otro tipo de expansor que no sea el correspondiente al proceso inverso del compresorusado.

31

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

32

Capıtulo 3

Procesos sobre la senal de audio

3.1. Ecualizacion y bancos de filtros

3.1.1. Conceptos generales. Tipos de filtros

Un filtro simple se puede definir a traves de varios parametros:

1. Ganancia asociada: factor de multiplicacion que afecta a la senal de entrada en unadeterminada zona de frecuencias, si el filtro es lineal. Dependiendo del perfil del filtro,dicha ganancia va cambiando en funcion de la frecuencia.

2. Frecuencia central: va asociada usualmente a la descripcion de filtros paso-banda.Posicion en frecuencia de su centro, si el filtro es simetrico; el valor en dicha posiciondefine la ganancia del filtro.

3. Frecuencia(s) de corte: se suelen definir como la frecuencia para la cual la gananciadel filtro ha caıdo 3 dB con respecto a su valor maximo (ganancia del filtro en sufrecuencia central).

4. Factor de calidad (Q): Es la relacion fc

∆f, siendo ∆f su ancho de banda asociado y

fc su frecuencia central. Si Q es elevado, el perfil del filtro es muy abrupto.

5. Ancho de banda: se puede definir de muchas formas, aunque una de las mas usadases el llamado ancho de banda a 3 dB, es decir, la distancia entre las frecuencias donde laganancia en la frecuencia central del filtro ha disminuıdo en dicha cantidad (la distanciaentre las frecuencias de corte).

Los filtros, en relacion a la zona de frecuencias que seleccionan, se suelen denominar dela siguiente forma:

Filtros paso-bajo: su frecuencia de corte inferior se supone inexistente, ya que laganancia es estable idealmente desde 0 Hz. y cae 3 dB en su frecuencia de corte superior.

33

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

Filtros paso-alto: su frecuencia de corte superior se supone inexistente, con una ga-nancia estable idealmente desde el tope total de la banda del sistema, cayendo 3 dB ensu frecuencia de corte inferior.

Filtros paso-banda: definidos por su frecuencia central y por las frecuencias de corteinferior y superior.

Filtros paso-todo: no modifican el modulo de la senal en el dominio de la frecuencia,pero sı modifican su fase.

Filtros banda eliminada: son filtros paso-banda cuya ganancia es una atenuacionmas o menos rigurosa del nivel de la senal de entrada. Si su factor de calidad es muyelevado, se denominan filtros (notch).

La relacion entre las frecuencias de corte y la frecuencia central nos informa sobre ladescomposicion que podemos efectuar al usar un determinado banco de filtros que cumpladicha relacion para todos sus elementos. Ası, tendremos descomposiciones en frecuencia:

Uniformes: en ellas el ancho de banda se mantiene constante a lo largo de todo el ejede frecuencias, es decir, fs − fi = K, siendo fs la frecuencia de corte superior, fi lafrecuencia de corte inferior y K una constante.

No uniformes: obedecen a la relacion fs

fi= K, por lo que proporcionan una division

con filtros mas estrechos cuanto mas bajas sean las frecuencias centrales y mas anchoscuanto mas altas estas sean. Los mas usados son filtros en octava (K = 2), en un terciode octava (K = 21/3) y de un decimo de octava (K = 21/10).

3.1.2. Ecualizadores

Por ecualizadores vamos a entender un conjunto de filtros que, combinados adecuada-mente, nos van a facilitar la variacion de la distribucion espectral de la energıa en la senal deentrada. La precision en el perfilado que podremos aplicar dependera del numero de filtrosy del ancho de banda y posiciones de cada uno de ellos.

Ecualizador grafico

Se suele denominar ası un banco de filtros cuyo interfaz consiste en unos potenciome-tros que regulan la ganancia asociada a cada uno de los filtros paso-banda. La forma y lafrecuencia central son fijas, permitiendose solamente la variacion de la ganancia de cadabanda.

Suelen, dependiendo del numero de bandas, evolucionar de octava en octava en su formay frecuencia central.

34

CAPITULO 3. Procesos sobre la senal de audio Sistemas de Audio e Vıdeo. Curso 2003-2004

Ecualizador parametrico

Un ecualizador parametrico generico permite la variacion de los tres parametros funda-mentales en el filtro que definen:

Frecuencia central: por cuestiones de diseno de los filtros, suelen limitarse a un margende frecuencias: por ejemplo, tendremos la posibilidad de variar la frecuencia central enel margen 30-1000 Hz. para una banda, en el margen 200-5000 Hz. en otra y una ultimaen el margen 3-16 KHz. en el caso simple muy habitual de disponer de tres filtros.

Factor de calidad (Q): Este parametro en muchos casos no esta presente, usando unfactor de calidad constante para todos los filtros. Actualmente cada vez mas ecualiza-dores proporcionan la posibilidad de variarlo, de forma que podemos obligar a que elfiltro afecte a un ancho de banda mayor o menor a voluntad.

Ganancia: El parametro que siempre suele estar. Nos facilita la modificacion de laenergıa presente en cada banda, como ya se ha comentado.

3.2. Aplicaciones de un filtrado

El uso de filtros es una herramienta basica al trabajar con senales de audio, aunque nohay que perder de vista que siempre es recomendable intentar mejorar las caracterısticas deun sistema, o grupo de sistemas, antes de intentar arreglar algun problema existente con unaecualizacion apropiada.

Estos son algunos ejemplos de aplicacion:

Medida de distorsiones: una forma de medir la distorsion armonica y el ruido de unsistema es aplicar un tono o tonos de referencia a la entrada del mismo, y usando unfiltro de banda eliminada suprimir de la salida las frecuencias de la senal de prueba.

Eliminacion de ruidos: tanto para evitar siseos de alta frecuencia como para eliminarinterferencias debidas a la red de alimentacion electrica, por ejemplo.

Compensar el efecto de un sistema: si ecualizamos antes o despues de un sistema quemodifique la distribucion espectral de una senal, podemos minimizar este efecto.

Compensar el efecto de una sala: si el sistema es un recinto acustico, podemos ecualizarla senal que vamos a presentar a traves del sistema de sonorizacion, para compensarperdidas o resonancias de la sala.

Evitar realimentaciones: en un sistema realimentado (p.e. un sistema de sonorizacioncon microfonos y altavoces) el efecto de un sistema dentro del bucle puede llevar a lainestabilidad al conjunto. Atenuando ciertas componentes donde resuene el sistema sepuede evitar el acople.

35

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

Perfilar sonidos de instrumentos: para variar el timbre del instrumento a gusto delusuario o para facilitar la mezcla con otros sonidos de forma que un instrumento nooculte a otro.

3.3. Otros procesos en la senal

Desde el punto de vista del Procesado Digital de la Senal existen multitud de formas dellevar a cabo modificaciones de interes en la senal de audio. La combinacion de dos senales,por ejemplo, se puede implementar con un simple sumador, y con dos multiplicadores yatenemos lo que se suele llamar un mezclador, es decir, combinar las senales con gananciasdiferentes de la unidad. El retardar la senal nos proporciona una version retrasada de lamisma, que si la combinamos apropiadamente con otra senal, o ella misma, puede ayudarnosa crear algunos efectos interesantes. Veamos algunos de ellos:

3.3.1. Creacion de ecos y reverberacion

Un eco acustico es, usualmente, una version retrasada de la senal original una vez seha desplazado por un determinado medio y ha sido reflejada en una superficie o interfaz.Realmente lo unico que se debe hacer para generar un eco es retardar la senal y sumarsela aella misma; para completar el esquema anadiremos una determinada ganacia en el lazo querefleje las posibles perdidas en el modulo debidas a la propagacion de la onda. Un esquemasimple serıa el mostrado en la Figura 3.1, donde figuran los dos parametros variables: laganancia de retorno y la distancia temporal del eco con respecto a la senal origen.

Retardo

τ

GananciaG

s(n)

Figura 3.1: Celula basica de retardo

Si quisieramos modelar una combinacion de ecos determinada, deberıamos acumular ecoscon retardos y ganancias distintas. En concreto, si la intencion es modelar la respuesta de

36

CAPITULO 3. Procesos sobre la senal de audio Sistemas de Audio e Vıdeo. Curso 2003-2004

una sala, es decir, su reverberacion, deberemos tener en cuenta las caracterısticas que estatiene. El llamado ecograma, como captacion de la energıa que llega a un microfono cuandointroducimos un impulso, nos proporciona una salida similar a la mostrada en la Figura 3.2.Como podemos ver, despues del sonido directo, el llamado rayo directo, aparecen las primerasreflexiones seguidas de lo que propiamente se suele denominar cola reverberante. Esta colaviene perfilada en su energıa por una caıda de tipo exponencial, por lo que si quisieramoscomponer un sistema que tuviera esa respuesta deberıamos empezar a combinar celulasbasicas de retardo para conseguir dicha respuesta. Los valores colocados en cada celula,ganancia y retardo, son claves para conseguir que el audio procesado suene como si realmentefuera originado en un recinto acustico determinado.

Rayodirecto

Primerasreflexiones

Reverberación t

Figura 3.2: Ecograma

3.3.2. Desfasado (phasing): flanger

Si el conexionado del camino retardado se hace de forma ligeramente distinta, como elmostrado en la Figura 3.3, el efecto puede ser radicalmente distinto. La respuesta del sistemaes un filtrado todo-ceros, lo que provoca que la senal sufra un perfilado en frecuencia tipopeine, ya que las senales se van cancelando conforme llegan al captador en determinadospuntos en frecuencia relacionados con el espaciamiento temporal de llegada.

3.3.3. Generacion de coros (chorus)

Otro efecto muy usado es el llamado chorus, en el que se pretende simular la respuestade distintas fuentes sonando al unısono; que este unısono sea imperfecto, como lo es en larealidad, crea un cambio en el sonido especialmente interesante para senales provenientes defuentes armonicas individuales. Un coro real cantando al unısono se puede modelar con tresparametros fundamentales que varıan de una a otra fuente de forma ligera:

37

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

Retardo

τ

GananciaG

s(n)

Figura 3.3: Celula basica de desfase

Retardo: las fuentes pretenden conseguir un unısono, pero siempre existe un pequenodesfase temporal en la evolucion de la senal proveniente de cada fuente.

Tono (pitch) : aunque se pretende conseguir entonar la misma nota en cada momento,las fuentes tienen siempre una ligera desviacion unas con respecto a las otras.

Ganancia: no todas las fuentes reales consiguen, aunque lo pretendan, emitir la mismaenergıa acustica en cada instante.

Retardo

τGanancia

GModulación

en frecuencia

s(n)

Figura 3.4: Celula basica de un chorus

Un esquema similar al de la Figura 3.4 es suficiente para generar un efecto chorus bastantereal, siempre y cuando no se exageren los valores de variacion de los parametros de una fuentevirtual a otra.

38

CAPITULO 3. Procesos sobre la senal de audio Sistemas de Audio e Vıdeo. Curso 2003-2004

3.3.4. Modificacion del pitch y del tempo

Si por pitch entendemos las variaciones en el tono o la nota asociados a una determinadapieza musical y por tempo la cadencia de aparicion de los sucesos (el ritmo), existen situacio-nes en las que es muy interesante el poder modificar estos parametros y/o su duracion total.Tomemos como ejemplo un pasaje musical en el que presentamos un tono de una frecuenciaf1 durante un tiempo L1, cambiamos a otro de frecuencia superior f2 (armonico del anteriorpor simplicidad) y lo mantenemos otro perıodo L2 (identico a L1 por simplicidad), volve-mos a retomar el tono de frecuencia f1 y ası sucesivamente. Aquı el pitch viene claramentemarcado por f1 y f2, mientras que el tempo, o cadencia de aparicion de cambios, viene dadopor el inverso de L1 (L2). La duracion total del pasaje vendra determinado por la cantidadde perıodos de uno y otro tono que tengamos, y por la velocidad de reproduccion queutilicemos. Hay que tener en cuenta que aumentar esta velocidad equivaldrıa a suponer quela frecuencia de muestreo es mayor que la real y disminuirla supondrıa la consideracion deuna frecuencia de muestreo menor, lo cual influye evidentemente en el ancho de banda queestamos considerando como parte de la senal.

Si nosotros, manteniendo la velocidad, eliminamos una duracion T1 = 1/f1 de cada unode los fragmentos de uno y otro tono, conseguiremos reducir la duracion total sin habercambiado el valor del pitch de la cancion. El tempo, por contra, habra aumentado ya que lacadencia de aparicion de cambios de un tono al otro se ha visto incrementada en un factorL1/(L1−T1). El inverso de este factor es el valor por el que se ha reducido la duracion totalde la pieza.

Si ahora redujeramos la velocidad de reproduccion por un factor (L1 − T1)/L1, la du-racion volverıa a su valor inicial, el tempo tambien, pero el pitch, debido a esa reducciondisminuirıa en dicho factor.

Si en vez de eliminar un perıodo T1, lo anadieramos en cada fragmento de uno y otrotono (cada L1 = L2), manteniendo la velocidad de reproduccion, conseguirıamos aumentarla duracion.

39

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

40

Capıtulo 4

Interconexion y mezcla de sonidos

Dedicaremos ese capıtulo a una breve introduccion a los protocoles de interconexion y a loque se suele denominar el proceso de mezcla. Ademas de comentar brevemente como pode-mos interconectar sistemas e intercambiar informacion entre ellos, describiremos la estructuray propondremos un metodo de trabajo asociado al sistema de conmutacion y encaminamientode senales que se conoce por el nombre de mesa de mezclas .

4.1. Protocolos de interconexion

La produccion de audio y vıdeo implica hoy en dıa una gran diversidad de fuentes desenal. Una grabacion tıpica puede exigir la mezcla de varias fuentes de sonido pregrabadascon efectos o musica generados en vivo y con una grabacion en vıdeo. Todos los dispositi-vos implicados deben estar correctamente sincronizados, bien mediante senales especiales desincronismo o cualquier otro mecanismo que permita una base de tiempos comun para todos.

El problema se ve agravado por la variedad de soportes utilizados para el almacenamiento,por ejemplo, los sistemas de almacenamiento en cinta magnetica presentan variaciones develocidad de arrastre debidos a la tension de la cinta y el estado del motor del dispositivo.

Las soluciones desarrolladas a lo largo del tiempo son muy variadas: desde la sincroni-zacion de sonido e imagen en cinematografıa mediante la impresion optica del sonido en lapelıcula utilizando como referencia las perforaciones de esta, hasta la utilizacion de sistemasdigitales con referencias temporales absolutas.

Los sistemas de sincronizacion mas utilizados hoy en dıa son los siguientes:

41

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

Figura 4.1: Pulso FSK de sincronismo.

Relojes propietarios.Algunos sintetizadores y cajas de ritmo electronicas poseen sistemas propios de sincro-nizacion basados en la generacion de pulsos a una determinada frecuencia. Las tasasmas utilizadas consisten 24, 48 y 96 pulsos por negra. Estos pulsos de sincronismo nogeneran por lo tanto una referencia temporal fija, sino que consisten en el equivalentedigital a un metronomo, dependiente del tiempo y el compas utilizado.

FSKEste sistema fue ampliamente utilizado antes de la aparicion del MIDI. Inicialmente segeneraba una senal TTL de 5v como senal de sincronismo que era almacenada en unapista de audio, esta senal consistıa en un tren de pulsos cuadrados a una frecuencia de24 o 48 pulsos por negra. La mayor desventaja del sistema resultaba ser la distorsionque se producıa en la onda cuadrada debido a la mala respuesta de la cinta magneticaa bajas frecuencias. La solucion fue la utilizacion de una senal FSK compuesta de dostrenes de pulsos cuadrados a frecuencias 1,25 y 2.5 KHz (figura 4.1).

SMPTE/EBULos sistemas de sincronismo basados en pulsos como los dos descritos anteriormente,presentan el problema de que no ofrecen informacion temporal absoluta, sino referentea la velocidad de reproduccion de los dispositivos. Los codigos de tiempo SMPTE secrearon en los anos 60 con el nacimiento de los sistemas de vıdeo para permitir su sin-cronizacion. Se basan en la generacion de una trama que marca temporalmente puntosde la cinta, generando una referencia temporal absoluta.

MIDILa norma MIDI, aunque creada para la comunicacion entre instrumentos digitales seutiliza extensivamente para sincronizacion en conjunto con los sistemas SMPTE. Laversion basica de la norma incluye como veremos mas adelante generadores de sincro-nismo basados en pulsos, que frecuentemente son convertidos a FSK. Posteriormentese ha desarrollado una extension de la norma denominada MTC 1 con el objetivo de

1MIDI time code.

42

CAPITULO 4. Interconexion y mezcla de sonidos Sistemas de Audio e Vıdeo. Curso 2003-2004

obtener un sistema compatible con SMPTE y con sus mismas prestaciones.

A continuacion estudiaremos brevemente las normas SMPTE, MIDI y MTC que son lasmas utilizadas hoy en dıa para el sincronismo de dispositivos.

4.2. SMPTE time code.

El objetivo de los codigos de tiempo SMPTE 2 es permitir la sincronizacion entre di-ferentes sistemas de cinta analogica superando el problema que supone las diferencias develocidad de arrastre de cinta de los distintos reproductores. Los codigos SMPTE consistenen tramas con informacion temporal que se insertan con determinada frecuencia en la cintade audio o de vıdeo, marcando temporalmente un segmento de la cinta y que pueden serrecuperadas por los lectores, permitiendo su posicionamiento temporal. Cada segmento tem-poral marcado se denomina cuadro (termino proveniente de la produccion de vıdeo) y suelenalmacenarse cada 1

24o 1

30de segundo.

El codigo de tiempo SMPTE se representa como un numero de 8 dıgitos con el significadoque puede verse en la figura 4.2. En general los lectores tienen capacidad para leer los codigosde tiempo y los representan bien superpuestos a la propia imagen o bien en visores especiales.

horas

01:23:50:18min. seg. cuadros.

Figura 4.2: Informacion SMPTE

El usuario puede conocer la posicion temporal de cada segmento de la cinta respecto a suorigen y por lo tanto utilizar los mandos de movimiento rapido y rebobinado para posicio-narse en el cuadro deseado.

4.2.1. Estructura de la trama SMPTE

La trama SMPTE consta de 80 bits repartidos en 10 bytes. Las horas, minutos, segundosy numero de cuadro se almacenan separando unidades y decenas en codigo BCD.

2Society of Motion Picture and Television Engineers

43

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

El segundo nibble 3 de cada byte, a excepcion de los dos ultimos, se utiliza para informa-cion de usuario. Existen por lo tanto 8 grupos de usuario donde se puede almacenar fechade grabacion, codigos ASCII o cualquier otra informacion util. Los dos ultimos bytes contie-nen una palabra de sincronizacion que permite al lector reconocer el fin de cada palabra ydetectar si la cinta se esta moviendo en uno u otro sentido.

Respecto al bit 10, se denomina drop frame bit y veremos a continuacion su utilidad.

4.2.2. Drop frame

El estandar SMPTE fue pensado para una tasa de vıdeo de 30 cuadros por segundo, quees la que se utiliza para vıdeo en blanco y negro. Sin embargo con la aparicion del vıdeo encolor se introdujo una nueva tasa de 29.97 cuadros/s. Esto significa una desviacion de 0.03cuadros/s respecto a la medida dada por la trama SMPTE, es decir 108 cuadros en una hora,lo cual implica que en una hora el reloj SMPTE se habra retrasado 3,6 s respecto al real. Enocasiones esta desviacion puede despreciarse, pero para aplicaciones tipo television o radio,puede ser necesaria una sincronizacion perfecta entre la lectura SMPTE y el reloj. Esto sepuede conseguir simplemente despreciando (no almacenando) 108 cuadros cada hora. En lapractica se desprecian dos tramas cada minuto excepto en los minutos 00, 10, 20, 30, 40 y 50.Existen sistemas de vıdeo en color que utilizan este metodo y sistemas que permiten la dis-crepancia descrita, esto se indica en la trama SMPTE mediante el bit 10 llamado drop frame.

4.2.3. Almacenamiento de la trama.

La trama SMPTE se almacena bien en una canal separado o bien insertado en la propiainformacion de vıdeo. La modulacion utilizada es de tipo manchester bifase. Existen variastasas de almacenamiento dependiendo del tipo de aplicacion y el estandar utilizado.

30 cuadros por segundoUtilizada para vıdeo NTSC en blanco y negro y audio. Es la tasa original para la quefueron disenados los codigos SMPTE.

30 cuadros por segundo, con drop frameCreada para vıdeo en color (ver apartado anterior).

25 cuadros por segundoUtilizada en Europa para vıdeo en color y blanco y negro (no existe version drop frame.

3Se denomina nibble a un grupo de 4 bits, es decir medio byte

44

CAPITULO 4. Interconexion y mezcla de sonidos Sistemas de Audio e Vıdeo. Curso 2003-2004

24 cuadros por segundoUtilizada en la industria cinematografica para mantener compatibilidad con el estandarde cine.

La tasa principal es 30 cuadros por segundo utilizada para vıdeo NTSC en blanco y negro.

Maestro.

Esclavo

Sincronizador

Sincronismo

Control

Figura 4.3: Sincronizacion por bucle cerrado.

4.2.4. Sincronizacion mediante SMPTE.

La sincronizacion mediante SMPTE requiere la utilizacion de un dispositivo especial lla-mado sincronizador, cuyo objetivo es controlar la velocidad de uno o varios reproductoresde audio o vıdeo, llamados esclavos, tomando como referencia los codigos recibidos desde undispositivo maestro.

La sincronizacion del dispositivo esclavo se efectua mediante un sistema de realimentacionen bucle cerrado (figura 4.3). Cada reproductor envıa la informacion SMPTE obtenida dela cinta al sincronizador, el cual esta conectado a los motores de los dispositivos pudiendocontrolar su velocidad y su direccion de arrastre.

El sincronizador compara las referencias de tiempo obtenidas y segun el tipo de sincro-nizacion que se solicite puede situar todos los dispositivos en la misma referencia temporalque el maestro, deteniendolos o poniendolos en marcha cuando este lo haga o bien utilizarlos codigos SMPTE como pulsos de sincronismo para mantener a todos los dispositivos a lamisma velocidad de reproduccion que el maestro.

4.3. Interfaz AES/EBU.

El interfaz AES/EBU es un protocolo serie de transmision de audio digital creado por laAudio Engineering Society (AES) y la European Broadcasting Union (EBU). Para audio no

45

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

Preambulo Auxiliar Muestra de audio V U C P

14 4 20 1 1 1

Figura 4.4: Estructura de la trama AES/EBU

profesional se utiliza una version simplificada de esta norma denominada SPDIF (Sony/PhilipsDigital Interface). Los DATs y la mayorıa de los grabadores digitales utilizan este interfacepara transmitir la informacion de audio digital generada.

El protocolo AES/EBU es un protocolo serie, que permite la transmision de dos canalesde audio por un solo cable y de manera independiente a la frecuencia de muestreo utilizadaque segun el estandar puede ser de 32 KHz, 44.1 KHz y 48 KHz. Las muestras de audiose codifican con 24 bits en complemento a dos utilizando codigo Manchester bifase (igualque en SMPTE) y formando tramas que son enviadas con una tasa igual a la frecuencia demuestreo utilizada.Cada trama esta formada por dos subtramas de 32 bits correspondientes a los canales dere-cho e izquierdo con el formato representado en la figura 4.4. El campo preambulo identificasi la subtrama corresponde al canal A, al canal B o si corresponde al canal A y ademas alcomienzo de una trama de estado del canal cuyo uso se explica mas adelante. Los cuatrosiguientes bit pueden emplearse para enviar informacion auxiliar si no se utiliza la resolucionmaxima de 24 bits. Los cuatro ultimos bits tienen el siguiente significado:

V (Audio Sample Validity). Indica si la muestra de audio esta libre de errores.

U (User Bit Data): Indica si la trama incluye informacion de usuario.

C (Audio Channel Status): Se utiliza para crear la trama de estado de canal.

P (Subframe Parity): Paridad de la subtrama.

Los bits de estatus de canal de 192 tramas consecutivas se utilizan para formar una palabrade 24 bytes que contiene la informacion del estado del canal, donde se indica la frecuenciade muestreo utilizada, un codigo de redundancia cıclica, informacion de sincronizacion, etc.

4.4. MIDI

4.4.1. Introduccion

La norma MIDI (Musical Interface for Digital Instruments) fue creada para permitir la in-terconexion de instrumentos de manera que los musicos pudiesen utilizar los sonidos de variossintetizadores desde un solo teclado. La popularidad de este interfaz se extendio rapidamente,

46

CAPITULO 4. Interconexion y mezcla de sonidos Sistemas de Audio e Vıdeo. Curso 2003-2004

apareciendo otros instrumentos (guitarras, controladores de viento) con capacidades MIDI einterfaces con ordenadores que permiten el control de los dispositivos MIDI desde programasespeciales que ademas estan dotados de capacidades de grabacion, edicion etc.

Por ultimo, la extension de la norma MIDI y su flexibilidad ha permitido que se introduzcaen los estudios profesionales de grabacion, tanto como metodo de sincronizacion entre dis-tintos dispositivos como para el control de mesas de mezcla, grabadoras multipista e inclusosistemas de luces.

4.4.2. Generalidades.

La transmision de datos vıa el interfaz MIDI se realiza en serie a una velocidad de 31,25Kb/s. Generalmente los dispositivos MIDI disponen de dos conectores tipo DIN de 5 pines(figura 4.5), que se denominan MIDI IN y MIDI OUT, y opcionalmente de un tercero deno-minado MIDI THRU.

13

25 4

13

25 4

13

25 4

MIDI IN

MIDI TRHU

MIDI OUT

Optoacoplador

Buffer

Buffer

Figura 4.5: Conectores de un sistema MIDI.

Los conectores MIDI IN y MIDI OUT se utilizan respectivamente para recibir y enviartramas MIDI, mientras el MIDI THRU presenta a su salida una copia exacta de lo recibidoen el MIDI IN, de forma que es posible la conexion de dispositivos en cascada.

En la figura 4.6 puede verse la interconexion de tres dispositivos MIDI. El dispositivomaestro tiene conectada su salida MIDI OUT a la entrada MIDI IN del dispositivo 1. Estea su vez conecta su salida MIDI THRU a la entrada MIDI IN del siguiente dispositivo yası sucesivamente.

Cuando el instrumento maestro envıa informacion MIDI a traves de su salida, indicando

47

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

por ejemplo la pulsacion de una nota, el dispositivo siguiente la recibe a traves de su entradaponiendo una copia exacta del mensaje en su salida MIDI THRU. De esta manera todos losdispositivos conectados reciben la informacion y por lo tanto desde el dispositivo maestro esposible controlar cualquiera de la cadena.

Para direccionar los dispositivos, cada mensaje lleva asignado un numero de canal, exis-tiendo 16 canales en cada conexion MIDI. Cada instrumento debe estar sintonizado a uno oa varios canales, ignorando el resto de los mensajes. Por ejemplo, suponiendo que los dispo-sitivos de la figura 4.6 son sintetizadores, podemos configurar el dispositivo 2 para recibir atraves del canal 1 y asignar a ese canal un sonido de piano, al dispositivo 3 le asignamos a suvez el canal 2 y un sonido de guitarra. Si desde el dispositivo maestro seleccionamos el canal1 como salida, al pulsar una tecla obtendermos un sonido de piano en el dispositivo 1, si porel contrario seleccionamos como canal de salida el 2, obtendremos un sonido de guitarra enel dispositivo 3.

Dispositivo 1Dispositivo Maestro

THRU THRUINOUT

Dispositivo 2

IN

Figura 4.6: Interconexion en cascada de tres dispositivos MIDI

Los mensajes MIDI llevan solamente informacion sobre el canal y la accion que debe rea-lizarse en este, la asignacion de un sonido depende de la configuracion del dispositivo querecibe el mensaje.

4.4.3. Estructura de la trama MIDI.

Los datos MIDI se estructuran en palabras de 8 bits (bytes) denominadas mensajes MIDIque se envıan precedidas de un bit de comienzo (cero) y un bit final (uno). Cada mensa-je esta compuesto de un byte de estado que indica el tipo de comando a realizar y uno odos bytes de datos, indicando informacion dependiente del comando. Los bytes de estadocomienzan siempre con un 1 mientras los de datos comienzan con un 0.

Existen dos tipos de mensajes MIDI: mensajes de canal y mensajes del sistema. Losprimeros envıan informacion destinada a un canal determinado, mientras los segundos seenvıan a todos los dispositivos en la cadena.

48

CAPITULO 4. Interconexion y mezcla de sonidos Sistemas de Audio e Vıdeo. Curso 2003-2004

Mensajes de canal.

Utilizan cuatro bits del byte de estado para identificar el canal direccionado y los cuatrorestantes para codificar el tipo de mensaje. Ademas pueden necesitar uno o dos bytes dedatos adicionales. Se distinguen a su vez dos tipos de mensajes de canal:

Voice Messages. Controlan los sonidos de un instrumento determinado. Este tipo demensajes constituyen el grueso de los que se envıan habitualmente en una conexionMIDI. Pueden ser de diversos tipos: comienzo final de una nota, variaciones en la presionde una tecla, cambios de programa, controles de parametros, etc.

Mode Messages. Definen la respuesta del instrumento a los Voice Messages. Se envıancon el mismo byte de estado que el mensaje Control Change, diferenciandose por elprimer byte de datos que para los Mode Messages toma valores de 120 a 127. Los ochoMode Messages existentes controlan el comportamiento de los controles, polifonıas, etc.

Por ejemplo, un voice message puede indicar la aparicion de una nueva nota en un canal,mientras un mode message podrıa indicar al instrumento que interrumpa todas las notas queestan activadas.

En general un instrumento puede recibir mensajes MIDI en mas de un canal, en ese caso,el canal por el que se reciben las instrucciones principales (las que indican el modo de fun-cionamiento del instrumento en general) se denomina canal basico. Los Mode Messages sesuelen enviar por el canal basico y afectan a la respuesta de todo el instrumento, mientraslos Voice Messages se pueden enviar por cualquier canal (incluyendo el canal basico).

Tipo de Mensaje s

Mensajes Mensajesde Sistemade Canal

MessagesModeVoice

MessagesSystem

ExclusiveMessages

System CommonMessages Messages

Real TimeSystem

Figura 4.7: Tipos de mensajes MIDI.

49

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

SecuenciadorOut

in

Dispositivo Maestro

Dispositivo Esclavo

Out

In

In

Thu

Almacenamiento

Figura 4.8: Ejemplo de un sistema MIDI con secuenciador

Mensajes del Sistema.

Son mensajes no asignados a un canal que se destinan a todos los dispositivos en la ca-dena. Se usan para controlar secuenciadores, sincronizar dispositivos MIDI, enviar mensajesexclusivos de un fabricante, etc.

4.4.4. Secuenciadores MIDI

En la figura 4.8 puede verse el esquema de un sistema tıpico de grabacion y reproduccionMIDI. Un secuenciador con capacidad de almacenamiento se comunica directamente con eldispositivo master, que a su vez se conecta al resto de la cadena mediante su salida MIDITHRU.

Los secuenciadores son dispositivos digitales que permiten la grabacion edicion y posteriorreproduccion de la informacion MIDI generada por el teclado master. Se utilizan tres tiposde secuenciadores: aquellos integrados en los propios sintetizadores, que suelen ser bastantesimples y con pocas posibilidades; dispositivos especıficos, mas flexibles pero caros, y orde-nadores. Los ordenadores son los dispositivos mas utilizados como secuenciadores MIDI yaque al disponer de software variado resultan muy flexibles, teniendo ademas un interfaz deusuario mucho mas eficiente que los secuenciadores especializados. Existen interfaces MIDIpara la conexion de dispositivos MIDI a cualquier tipo de ordenador, e incluso ordenadorescon el interfaz integrado en la propia placa base.

Por comodidad, los secuenciadores MIDI suelen tener la apariencia de grabadoras mul-tipista en el sentido de que la informacion se organiza en pistas sobre las cuales se puedenrealizar las mismas operaciones que permite un grabador (editar pistas, grabar varias enuna, etc). Sin embargo el concepto es diferente en un secuenciador y un grabador analogico.En un secuenciador, cada pista puede contener informacion MIDI correspondiente a uno ovarios canales, siendo por lo tanto un contenedor para informacion MIDI, mientras que uncanal es una conexion logica entre el secuenciador y un instrumento en la cadena.

50

CAPITULO 4. Interconexion y mezcla de sonidos Sistemas de Audio e Vıdeo. Curso 2003-2004

La restriccion de 16 canales impuesta por la norma es facilmente superable disponiendode un interfaz con varias salidas MIDI. Los secuenciadores son capaces de asignar pistas acanales de cualquiera de las salidas MIDI disponibles, de manera que es posible el manejogran cantidad de pistas.

4.4.5. Sincronizacion mediante MIDI

La sincronizacion mediante un sistema MIDI se realiza mediante los mensajes SystemReal Time y System Common Song Position Pointer. La informacion generada por estosmensajes circula a traves del propio cable MIDI por lo que a diferencia del sistema SMPTEno es necesaria la utilizacion de sincronizadores externos.

4.4.6. MIDI Time Code

Los sistemas de sincronizacion soportados por la norma MIDI que hemos visto en elapartado anterior tienen la desventaja de que no ofrecen una referencia temporal fija, sinodependiente del tempo y compas de la secuencia, estan por lo tanto sometidos a cambios develocidad.

Para obtener una referencia absoluta de tiempo, se creo una extension a la norma MIDIoriginal denominada MIDI Time Code o MTC utilizando aquellos mensajes MIDI no defini-dos en la norma. Los mensajes MTC permiten ademas una traduccion directa de los codigosSMPTE a mensajes MIDI facilitando la interconexion de dispositivos analogicos y digitales.

51

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

4.5. Introduccion al sistema de mezclas

Las aplicaciones que suelen llevar asociadas un proceso de mezclas de sonidos pueden sermuy variadas, pero hay tres fundamentales: la monitorizacion, que nos permite presentaral tecnico o musico el resultado de la mezcla, la amplificacion de potencia, que desarrollala presentacion acustica del resultado final de la mezcla y la grabacion en algun medio dealmacenamiento del producto final, una vez mezclado.

Aunque algunos de los elementos puedan variar, o faltar alguno de ellos, veamos cuales sonlas partes fundamentales de un estudio de grabacion, entorno en el cual la mesa de mezclashace de sistema central de control

Mesa de mezclas: la ”mesa”. El sistema central que gobierna y direcciona las senaleselectricas provenientes de multiples elementos.

Transductores acustico-electricos: conjunto de microfonos y sensores de distintostipos que nos facilitan la captacion de la senal acustica y su conversion.

Fuentes sonoras ”electricas”: todos los instrumentos electronicos que generan sonidoa partir de informacion guardada en su interior. No es necesaria la transduccion yalimentan directamente a la mesa con senales electricas.

Grabador multipista: dispositivo de almacenamiento que, usualmente, permite gra-bar y reproducir al mismo tiempo varias senales independientes.

Procesadores externos de efectos: sistemas externos a la mesa que reciben senalesde esta y se las devuelven procesadas.

Monitorizacion: conjunto de transductores electrico- acusticos (pantallas, auricula-res, . . . ) que presentan la senal resultado de la mezcla para que se pueda hacer unseguimiento de la misma.

Senales de control externo: senales de sincronismo o automatizacion que facilitan elcontrol de elementos externos o la modificacion del modo de funcionamiento de la mesaen funcion de senales de control externas. Por ejemplo, senales de sincronismo temporal,comandos MIDI, etc.

Recinto: el entorno acustico en sı. Ya sea la sala de grabacion o la llamada sala decontrol.

Si usaramos un sımil grafico, un sistema de mezcla nos permite dibujar sonidos: los mi-crofonos e instrumentos son los pinceles, el dispositivo de grabacion el lienzo y la mesa demezclas hace de paleta en la que podemos mezclar los colores que luego plasmaremos en laimagen acustica final.

52

CAPITULO 4. Interconexion y mezcla de sonidos Sistemas de Audio e Vıdeo. Curso 2003-2004

4.5.1. Nomenclatura

Estos son los conceptos basicos que definen la arquitectura de una mesa de mezclas:

Ganancia variable: potenciometros deslizantes o rotatorios.

Bus: camino de propagacion de la senal. Su interconexion posibilita la mezcla.

Conmutador: desvıo de la informacion hacia otro bus distinto. A veces la senal se pro-paga a varios buses con ganancias distintas en cada uno.

Conectores: clavijas de conexion electrica.

Sistemas: distintos procesos que se pueden intercalar en determinados puntos del caminode la senal.

4.6. Mesa de mezclas

4.6.1. Buses de informacion

Podemos hablar de los siguientes caminos de informacion dentro de la mesa:

Bus de canal (de pista o de entrada): es el camino de la senal electrica que se recogecomo entradas a la mesa, previas a ninguna mezcla con otros buses de canal.

Bus de efectos: de envıo y retorno. En el se mezclan uno o mas canales para enviarlosen el bus de envıo de efectos y procesar la senal conjunta. La vuelta viene a travesdel bus de retorno de efectos.

Bus de grupos auxiliares: permiten agrupar senales provenientes de varios buses en unosolo.

Bus estereo (par estereo): en grabaciones estereo es el par de buses L (izquierdo) y R(derecho) que contienen la mezcla final. El producto definitivo en grabaciones multicanalvendra contenido en tantos buses como canales finales haya.

4.6.2. Modulo de canal (modulo de entrada/salida I/O)

Es el conjunto de conexiones y procesos que suelen ir asociados a cada bus de canal deentrada, y los elementos basicos son:

Conexion: suele ser de tipo XLR, para microfonos, y de JACK, para lınea

53

Antonio Pena, [email protected]. E.T.S.E.Telecomunicacion. Univ. de Vigo

Preamplificacion de la senal: es conveniente ajustar los niveles de entrada para que nosaturen la entrada ni queden demasiado debiles para mantener una SNR razonable.Suelen disponer de un atenuador adicional de ganancia fija (20dB, p.e.) para usar conlas entradas de nivel muy alto.

Control de volumen: el bus lleva asociado un potenciometro (suele ser deslizante -fader -), que permite modificar la energıa de la senal que discurre a traves de el.

Con estos elementos primarios ya podemos hacer una mezcla basica. Vayamos anadiendoahora varios elementos habituales que anaden flexibilidad al sistema:

Control de panoramica (PAN): un potenciometro rotatorio nos facilita el enviar unamisma senal a dos canales con ganancias separadas. Pero tambien es interesante dispo-ner de un conmutador que nos permita optar entre dos o mas buses, por lo que juntandoestos dos elementos obtenemos un mando habitual en la mesa de mezclas. Consta de uninterruptor que nos permite seleccionar pares de pistas, los que se deseen simultanea-mente, de forma que la senal se transmite a los pares de buses activados. La gananciarelativa asociada a cada par viene dada por la posicion del mando rotatorio PAN .

Ecualizador: en serie dentro de cada bus de entrada suele existir un ecualizador (pa-rametrico, usualmente), que nos permite perfilar espectralmente la senal antes de lamezcla con otros canales.

Sin ecualizacion: es habitual disponer de una opcion de bypass para activar o desactivarel ecualizador.

4.6.3. Bucles de efectos: envıo y retorno en paralelo y en serie

Bucle serie de efectos: para acceder a un procesador ajeno al propio modulo de entrada,puede haber un conector que facilite la extraccion y retorno, en el llamado punto deacceso o insercion. Se suele usar para aplicar ecualizaciones, compresiones y puertas deruido.

Bucle paralelo de efectos: mientras que el bucle serie vuelve a colocar la senal modificadaen el propio canal, el bucle paralelo, llamado de envıo y retorno, suele enviar la senalmodificada a un bus de efectos, donde se pueden agrupar con otras senales. La mezclade la senal sin procesar (dry) y la procesada se realiza mas adelante.

Toma de senal PRE y POST: esta toma en paralelo de la senal se puede hacer antes(PRE) de la influencia de la ecualizacion y fader del modulo de entrada, o despues(POST).

54

CAPITULO 4. Interconexion y mezcla de sonidos Sistemas de Audio e Vıdeo. Curso 2003-2004

4.6.4. Otros elementos adicionales

MUTE: boton que nos permite silenciar el canal en la mezcla final (sin tener que mo-dificar sus parametros de mezcla).

SOLO: boton que permite escuchar solamente el canal en la mezcla final, sin modificarlos parametros de los demas canales.

Desfasador: boton al comienzo del modulo de entrada que permite un desfase de 180§.Util para conexiones desfasadas.

Mezcla de monitorizacion: aunque se pueden obtener de otras formas, a veces hayuna seccion especıfica para proporcionar una segunda mezcla que presentemos en laspantallas (monitores) o auriculares.

CUE: similar a la anterior. Se suele usar para proporcionar una mezcla extra para losmusicos que estan grabando, de forma que tengan la referencia del resto de instrumentosya grabados previamente.

Medidores: VU-metros, LEDs, etc. Si el indicador es de aguja, hay que tener en cuenta eltiempo de respuesta de la misma, lo que hace que los picos de senal no se vean reflejadosclaramente y puede estar saturando sin llegar a reflejarse en el medidor. Para eso sueleexistir un LED relacionado con un medidor mas rapido que indica si hemos llegado alpico.

55