......IV.3.4.Enmascaramiento no simultáneo

 

IV.4.Bandas críticas y tasa de bandas críticas

 

Como se vio en el Cap. III, el comportamiento de la cóclea como analizador en frecuencia puede resumirse en dos características:

La forma del patrón de excitación provocado por un tono puro (ver Fig. IV.7) ilustra bien estas dos características, e indica que la selectividad en frecuencia del sistema auditivo no es infinita6.

 

IV.4.1.Ancho de banda crítico

El ancho de banda crítico es un concepto desarrollado por Fletcher [13], que puede interpretarse como una medida de la selectividad frecuencial del oído.

El ancho de banda crítico permite explicar por qué, dado un tono de una cierta frecuencia, una banda de ruido estrecha centrada en dicha frecuencia produce la misma cantidad de enmascaramiento sobre el tono que una banda ancha de ruido, aun cuando el nivel de densidad espectral de ambos ruidos sea igual y, por ende, la energía del ruido de banda estrecha sea menor [6].

Bajo la suposición de que un tono "sumergido" en una banda de ruido es apenas audible cuando la intensidad del tono es igual a la intensidad total del ruido enmascarante, Fletcher [13] determinó que, cuando el ancho de la banda de ruido cae por debajo de cierto valor crítico, la densidad espectral del ruido debe ser inversamente proporcional al ancho de dicha banda para que el tono permanezca enmascarado; cuando el ancho de la banda de ruido supera dicho valor crítico, la densidad espectral del ruido enmascarante debe permanecer constante para que el tono sea apenas audible.

En otras palabras, si el ancho de la banda de ruido varía, para enmascarar al tono es necesario que la energía del ruido contenida en un intervalo de frecuencias alrededor del tono sea constante.

La energía efectiva de la señal enmascarante es aquella confinada en tal intervalo, mientras que el resto no contribuye al enmascaramiento del tono [2]. El ancho de este intervalo crítico ha sido denominado ancho de banda crítico.

De esta manera, el ancho de banda crítico (tal y como lo definió Fletcher) se obtiene cuando el ancho de la banda de ruido es tal que la intensidad de un tono de prueba apenas audible es igual a la intensidad de la banda de ruido [13]. Ahora bien, esta medida de la selectividad del sistema auditivo es incorrecta, puesto que Fletcher basó su definición en dos suposiciones erróneas [9] [2]:

 

IV.4.2 Bandas críticas: definición y determinación experimental

A pesar de los errores implícitos en la definición de Fletcher, el concepto de un ancho crítico sigue siendo válido, puesto que numerosos experimentos psicoacústicos indican que las respuestas de los sujetos ante distintos fenómenos perceptuales cambian abruptamente cuando los estímulos sobrepasan un cierto ancho de banda [9].

Así pues, se define una banda crítica (BC) como un intervalo de frecuencia que representa la máxima resolución frecuencial del sistema auditivo en diversos experimentos psicoacústicos [6] [9]. Adicionalmente, puede decirse que una BC constituye el intervalo de frecuencia en el cual el oído interno efectúa una integración espacial (es decir, espectral) de la intensidad de la señal sonora : la BC es el intervalo en el cual se "suma" la energía de las distintas componentes espectrales de la señal.

El significado de las bandas críticas se comprende mejor una vez que se estudian algunos experimentos psicoacústicos, en los cuales la BC aparece como un resultado natural.

Medición de la sonoridad

El concepto moderno de banda crítica fue desarrollado por Zwicker y colaboradores [2] en el contexto de la suma de sonoridades o intensidades subjetivas.

La siguiente figura indica la variación de la sonoridad de una banda de ruido centrada en 2 kHz, en función del ancho de dicha banda. La intensidad total del ruido se mantiene constante en 47 dB SPL, de modo que la densidad espectral del ruido varía en forma inversamente proporcional al ancho de banda.

Como se observa, mientras el ancho de banda de la señal sea inferior al valor crítico (Å 300 Hz), la sonoridad permanece constante; cuando el ancho de banda es mayor que una BC, la sonoridad aumenta.

*

Fig. IV.16. Sonoridad de una banda de ruido en función del ancho de la banda.

Medición del umbral de audibilidad

Es posible medir el valor de una BC mediante un experimento que permita determinar el umbral de audibilidad usando un complejo de tonos puros. La siguiente figura ilustra el resultado de la determinación del UA en la vecindad de 1 kHz, donde la curva del UA puede considerarse plana.

Fig. IV.17. Umbral de audibilidad en torno a 1 kHz en función del número de tonos de prueba.

Inicialmente, se determina el UA con un solo tono de 920 Hz, y el valor obtenido (3 dB SPL) corresponde al nivel de presión sonora del tono de prueba apenas audible.

Posteriormente se añade un nuevo tono de 940 Hz; para que el complejo de tonos esté en el umbral de detección, el nivel de cada tono debe reducirse a la mitad, de modo que la intensidad total del complejo de tonos sigue siendo de 3 dB SPL.

Si se va aumentando el número de tonos del complejo (separados entre sí por un intervalo de 20 Hz), es preciso ir reduciendo proporcionalmente el nivel de cada tono individual para que la señal total siga siendo apenas perceptible, hasta que el ancho de banda ocupado por el complejo alcanza un valor crítico de aprox. 160 Hz (es decir, abarca una banda crítica). A partir de ese valor, aun cuando aumente el número de tonos, para que el complejo sea apenas audible es necesario mantener el nivel individual de cada tono [2].

De este experimento es posible concluir que la banda crítica corresponde, efectivamente, al intervalo de frecuencias en el cual se suma la intensidad de las componentes confinadas a dicho intervalo, para producir un umbral de audibilidad dado.

Si se utiliza ruido uniformemente enmascarante, se puede medir este efecto a lo largo de todo el rango de frecuencias audibles, puesto que, a diferencia del UA, el patrón de enmascaramiento obtenido es plano (independiente de la frecuencia). Los resultados obtenidos en un experimento de esta naturaleza son virtualmente idénticos a los mostrados en la Fig. IV.17 [2].

 

Medición del efecto de enmascaramiento

La siguiente figura muestra el nivel de una banda estrecha de ruido apenas perceptible, centrada entre dos tonos de mayor intensidad.

 

Fig. IV.18. Umbral de enmascaramiento de una banda de ruido, en función de la separación entre dos tonos enmascarantes.

Como se observa en la figura, mientras la separación de los tonos no supere el valor de una banda crítica, el UE permanece más o menos constante (es independiente de la separación entre los tonos); una vez que la distancia entre los tonos es mayor que una BC (Å 300 Hz, a 2 kHz), el UE decae rápidamente.

Es importante hacer notar que el punto de transición en la curva, correspondiente a una BC, es aproximadamente constante para niveles moderados de señal (< 70 dB SPL) y, por ello, generalmente se asume que los valores de las BCs son independientes del nivel de señal, aun cuando esto no sea cierto [9].

 

IV.4.3 Tasa de bandas críticas

Los anchos de las bandas críticas dependen de la frecuencia, como se ilustra en la Fig. IV.19. Esta curva, tomada de [2], se obtuvo promediando los resultados de la medición de las BCs en más de 50 sujetos y con cinco métodos distintos. Por debajo de los 500 Hz, el ancho de banda crítico es aproximadamente constante (aprox. 100 Hz), mientras que por encima de los 500 Hz crece en proporción a la frecuencia: el ancho de una banda crítica centrada en una frecuencia superior a 500 Hz es de alrededor del 20% de la frecuencia central.

*

Fig. IV.19. Ancho de las bandas críticas en función de la frecuencia.

Esta curva puede ser modelada mediante la siguiente ecuación [2], la cual permite calcular el ancho de banda crítico (en Hz), ÆfBC, correspondiente a la frecuencia en Hz, f, con un error inferior al 10%:

 

(4.2)

En base a los valores obtenidos mediante la Fig. IV.19 o la Ec. 4.2, es posible subdividir el rango de frecuencias audibles en intervalos adyacentes de una BC de ancho, que no se solapan entre sí [2], y que representan una primera aproximación al problema de modelar la selectividad en frecuencia del oído interno.

Esta subdivisión se representa en la siguiente figura; en el rango audible de 20 Hz a 20 kHz se encuentran 25 bandas críticas adyacentes7, numeradas en forma consecutiva en la figura.

En la Tabla IV.1 se muestran los valores que definen las primeras 24 BCs, según Zwicker [2], los cuales se han convertido en un estándar "de facto" para describir la distribución de las BCs en función de la frecuencia.

Fig. IV.20. Bandas críticas adyacentes en el rango de frecuencias audibles.

Ahora supóngase que se subdivide de manera continua el rango de frecuencias audibles en intervalos solapados entre sí de una BC de ancho, y que se desea obtener, para cada frecuencia f0, un valor que represente el número (no necesariamente entero) de bandas críticas adyacentes y no solapadas contenidas en el intervalo de 0 a f0 Hz. Los valores así obtenidos constituyen la denominada tasa de bandas críticas [92] [2], también llamada escala de bandas críticas.

Nº de banda crítica

Frec. central (Hz)

Frec. superior (Hz)

Ancho de la BC(Hz)

1

50

100

100

2

150

200

100

3

250

300

100

4

350

400

100

5

450

510

110

6

570

630

120

7

700

770

140

8

840

920

150

9

1000

1080

160

10

1170

1270

190

11

1370

1480

210

12

1600

1720

240

13

1850

2000

280

14

2150

2320

320

15

2500

2700

380

16

2900

3150

450

17

3400

3700

550

18

4000

4400

700

19

4800

5300

900

20

5800

6400

1100

21

7000

7700

1300

22

8500

9500

1800

23

10500

12000

2500

24

13500

15500

3500

Tabla IV.1. Distribución de las bandas críticas en función de la frecuencia.

En términos de la Fig. IV.20, puede imaginarse una "ventana" de ancho igual a una BC que se "desliza" entre los puntos correspondientes a las BCs adyacentes, desde 0 hasta f0 Hz, de modo que a cada valor de frecuencia f0 se le asigna un número real en el eje vertical, correspondiente a la cantidad de intervalos adyacentes y no superpuestos de una BC de ancho, "acumulados" desde 0 hasta f0 Hz.

Estrictamente hablando, la tasa de BCs (Fig. IV.21) y el ancho de las bandas críticas (Fig. IV.20) están relacionados8 a través de la siguiente ecuación [54]:

(4.3)

En la Fig. IV.21 se muestra la relación entre la tasa de bandas críticas, la frecuencia y el número asignado a las BCs adyacentes de la Fig. IV.20.

Fig. IV.21. Tasa de bandas críticas en función de la frecuencia.

Para los valores de tasa de BCs, se ha definido como unidad el "bark": un intervalo de frecuencia de 1 bark es, por definición, un intervalo de una BC de ancho en cualquier punto del rango de frecuencias audibles [2]. En la Fig. IV.21 se observa que la primera BC abarca el intervalo de 0 a 1 bark, la segunda BC el intervalo de 1 a 2 barks, y así sucesivamente.

La relación entre la tasa de BCs y la frecuencia puede ser expresada mediante la siguiente ecuación [2], la cual permite calcular la tasa de bandas críticas (en barks), z, correspondiente a la frecuencia en Hz, f, con un error inferior a ±0,2 barks:

(4.4)

IV.4.4 Relación con otras variables físicas y fisiológicas

Las bandas críticas y su escala asociada, la tasa de BCs, están relacionadas estrechamente con diversos fenómenos fisiológicos y psicoacústicos. Por una parte, los intervalos de una BC de ancho corresponden a distancias iguales a lo largo de la membrana basilar, medidas en sentido longitudinal (desde la ventana oval hacia el helicotrema): cada BC representa una distancia de 1,3 mm [2].

Puesto que los receptores auditivos están distribuidos de manera equidistante a lo largo de la membrana, cada BC corresponde por lo tanto a un número constante de receptores; en consecuencia, un número Z0 de bandas críticas, que representa un intervalo de Z0 barks, equivale a una distancia de 1,3 Z0 mm.

Por ende, la función de tasa de bandas críticas en términos de la frecuencia puede interpretarse como una función que indica la relación entre la frecuencia de la señal sonora y su posición asociada en la membrana basilar [2].

La Fig. IV.22 ilustra la relación entre la tasa de BCs y diversos parámetros físicos, fisiológicos y perceptuales. En la parte superior de la figura se representa en forma esquemática la cóclea "desenrollada"; la membrana basilar corresponde a la zona rayada del dibujo.

Fig. IV.22. Relación entre la tasa de bandas críticas y otras escalas de medición.

En esta figura resulta obvio que no existe una relación simple entre la frecuencia y las demás escalas. Sin embargo, la relación entre la tasa de BCs y parámetros tales como la posición en la membrana basilar (escala fisiológica), el número de incrementos de frecuencia apenas perceptibles y el cociente de frecuencias subjetivas o "alturas del sonido" (escalas Psicoacústicas) resulta prácticamente lineal.

Por todo lo expuesto, la tasa de BCs no sólo está asociada con una medida de la selectividad en frecuencia, como lo son las bandas críticas, sino que además constituye una escala más natural y conveniente que la escala de frecuencias para representar gráficamente e interpretar fenómenos perceptuales [2].

IV.4.5 Excitación, enmascaramiento y bandas críticas

Para ilustrar lo expuesto en la sección anterior, en la Fig. IV.23 pueden observarse los patrones de excitación producidos por bandas de ruido estrechas, centradas en distintas frecuencias y con la misma intensidad total (60 dB SPL), expresados en función de la tasa de BCs.

Nótese que, a diferencia de lo observado en la Fig. IV.10, la forma de las curvas (en especial, la pendiente hacia las bajas frecuencias) es virtualmente idéntica, independientemente de la frecuencia central de la señal sonora.

Fig. IV.23. Patrones de excitación de bandas estrechas de ruido centradas en distintas frecuencias, en función de z.

En la Fig. IV.24 se muestran los patrones de excitación producidos por bandas de ruido de 1 bark de ancho e intensidad variable, centradas en 1 kHz (Å 8,5 barks).

Obsérvese que la pendiente de las curvas hacia las bajas frecuencias permanece casi constante (Å 27 dB/bark), independientemente de la intensidad total de la señal sonora; asimismo, el decaimiento de la excitación fuera de la BC ocupada por la banda de ruido puede aproximarse razonablemente bien mediante rectas. La pendiente hacia las altas frecuencias varía con la intensidad de la señal, tal como se vio en la sección IV.3.3.

Asimismo, los patrones de enmascaramiento producidos por bandas de ruido de 1 bark de ancho resultan invariantes frente a la frecuencia central de la señal enmascarante, cuando se expresan en función de la tasa de BCs [2] . Las curvas correspondientes pueden obtenerse a partir de los patrones de excitación de las Figs. IV.23 y IV.24, simplemente mediante un desplazamiento en sentido vertical, como se verá en la sección IV.5.

Fig. IV.24. Patrones de excitación de bandas estrechas de ruido centradas en 1 kHz, en función de z.

Intensidad por banda crítica

Debido al efecto de "suma" de intensidades en intervalos de una BC, en ocasiones puede ser conveniente expresar el espectro de una señal, o sus patrones de excitación y enmascaramiento, en términos de la intensidad por banda crítica, definida como:

(4.5)

donde: dI/df = densidad espectral de intensidad (intensidad por Hz).

Puesto que la tasa de BCs resulta más apropiada para representar la excitación y el enmascaramiento, resulta conveniente escribir la Ec. 4.5 en términos de z:

(4.6)

Esta cantidad puede expresarse en dB, tal como el nivel de intensidad sonora, usando la intensidad de referencia I0 :

(4.7)

 

Indice de enmascaramiento y tonalidad de la señal.........