......Excitación y nivel de excitación

 

IV.3 Enmascaramiento sonoro

IV.3.1 Definición

El enmascaramiento sonoro puede definirse como el proceso en el cual el umbral de audibilidad correspondiente a un sonido se eleva, debido a la presencia de otro sonido [5]. Para ilustrar mejor este fenómeno, imagínese el siguiente experimento:

Un sujeto audiológicamente normal se introduce en un ambiente anecoico y con bajo nivel de ruido acústico de fondo, y se le hace escuchar una señal sonora A (p. ej., un tono puro) que sea perfectamente audible, es decir, cuyo nivel de presión sonora esté muy por encima del umbral de audibilidad del sujeto a la frecuencia del tono. Se le pide al sujeto que juzgue (subjetivamente) la intensidad del tono de prueba A. Luego, se añade una señal sonora B (p. ej., una banda de ruido centrada en la frecuencia del tono) de bajo nivel SPL, y se va aumentando progresivamente el nivel de B, manteniendo constante el nivel de A. El sujeto notará que, a medida que aumenta el nivel de la señal B, la intensidad aparente o subjetiva de A disminuye hasta que, eventualmente, A se hace inaudible. En este caso se dice que la señal A está totalmente enmascarada4 por la señal B.

Se cree que el enmascaramiento sonoro tiene su origen en los receptores auditivos situados en la membrana basilar [7]. Los receptores que se encuentran estimulados por una señal A deben recibir un nuevo nivel de estimulación o excitación debida a otra señal B, tal que la diferencia entre la excitación debida a A y B juntas supere a la debida a A en una determinada magnitud: si esto ocurre, el sonido B será percibido; en caso contrario, B será inaudible.

De esta forma, cada componente en frecuencia de cada señal sonora ocasiona un nivel de actividad neural (excitación) en diversas zonas de la membrana basilar, lo que altera la detectabilidad de otras componentes [5]; de ahí la relación entre excitación y enmascaramiento.

Como se verá posteriormente, el enmascaramiento depende del nivel de presión sonora de las señales "enmascarante" y "enmascarada", así como de la separación en frecuencia y en tiempo entre las mismas.

En las siguientes secciones se discutirán diversas características del fenómeno de enmascaramiento sonoro. Por simplicidad, los ejemplos presentados se refieren únicamente al caso más sencillo de enmascaramiento, en el cual se tiene una sola señal enmascarante (la cual será siempre una banda de ruido) y una sola señal de prueba o enmascarada (la cual será siempre un tono puro).

Más adelante se estudiará el caso más complejo, en el cual se tiene un número indeterminado de bandas de ruido y tonos que pueden enmascararse entre sí, lo cual equivale a tener dos señales de espectro arbitrario (p. ej., una señal musical y el ruido de codificación asociado a ella) como señales enmascarante y enmascarada.

Asimismo, a menos que se indique lo contrario, se ignorará el efecto que tienen el oído externo y el oído medio sobre el espectro de la señal (puede suponerse que el espectro de las señales utilizadas se corrige con la inversa de la función de transferencia del oído externo y medio).

 

IV.3.2 Umbral de enmascaramiento y nivel de sensación

Para medir cuantitativamente la magnitud del enmascaramiento, así como para distinguir entre el umbral de audibilidad en condiciones de "silencio" (es decir, en ausencia de otra señal distinta a la señal de prueba) y el UA en condiciones de enmascaramiento, se define el umbral de enmascaramiento (UE) como "el nivel de presión sonora de un sonido de prueba necesario para que éste sea apenas audible en presencia de una señal enmascarante" [2].

De la definición anterior resulta obvio que los umbrales de audibilidad y de enmascaramiento deben ser idénticos en ausencia de señales enmascarantes.

Si se representa en forma gráfica el valor del UE en función de la frecuencia (u otra variable análoga), se obtiene una curva denominada patrón de enmascaramiento. Como se verá, debido a la estrecha relación entre la excitación y el enmascaramiento, los patrones respectivos asociados a una misma señal son muy similares en su forma (no así en sus valores).

Adicionalmente, se define el nivel de sensación (NS) de una señal de prueba como la diferencia, en dB SL, entre el umbral de enmascaramiento y el umbral de audibilidad correspondientes a dicha señal y expresados en dB SPL:

(4.1)

 

La unidad "dB SL", aplicada a cualquier parámetro relacionado con estímulos sonoros, se utiliza para recalcar el hecho de que es una medida relativa al umbral de audibilidad.

 

IV.3.3 Enmascaramiento simultáneo

Dependiendo de la ubicación temporal de la señal de prueba (P) con respecto a la señal enmascarante (E), se pueden distinguir tres situaciones posibles (Fig. IV.8):

1) Enmascaramiento simultáneo: E y P se presentan solapados en el tiempo (E está presente durante toda la duración de P).

2) Enmascaramiento previo a la presentación de la señal enmascarante, o pre-enmascaramiento: E se presenta después de P.

Fig. IV.8. Ubicación temporal de las señales enmascarante y enmascarada.

3) Enmascaramiento posterior a la presentación de la señal enmascarante, o post-enmascaramiento: E se presenta antes que P.

 

A continuación se examinan algunos ejemplos que muestran la dependencia del enmascaramiento simultáneo con el contenido espectral de la señal enmascarante y con su nivel de presión sonora.

 

Efectos espectrales

La siguiente figura muestra el patrón de enmascaramiento generado por ruido blanco (de espectro plano entre 20 Hz y 20 kHz) con distintas densidades espectrales. La curva punteada inferior corresponde al UA; los extremos izquierdo y derecho de las curvas de los UEs se superponen con el UA.

Fig. IV.9. Patrón de enmascaramiento producido por ruido blanco.

 

En la curva superior de la Fig. IV.9 (correspondiente al ruido de mayor intensidad), en la cual el efecto del UA es mínimo, se observa que:

1) El umbral de enmascaramiento asociado al ruido blanco es prácticamente constante (independiente de la frecuencia) en el rango de 20 a 500 Hz; por encima de los 500 Hz aumenta con la frecuencia, con una pendiente de aproximadamente 10 dB/década.

2) A pesar de que la intensidad de la señal enmascarante se encuentra distribuida uniformemente en frecuencia, resulta más fácil enmascarar (con ruido blanco) un tono de alta frecuencia que uno de baja frecuencia.

Como se verá posteriormente, el punto (1) es consecuencia de la no uniformidad de la resolución en frecuencia del sistema auditivo, aunada a un mecanismo de integración de la intensidad sonora en el dominio frecuencial; el resultado descrito en el punto (2) puede generalizarse a cualquier señal enmascarante, y se debe a las propiedades de la membrana basilar.

En la siguiente figura se puede observar el patrón de enmascaramiento provocado por bandas de ruido de una banda crítica de ancho y nivel de 60 dB SPL. Las bandas de ruido, centradas en 70, 250, 1000, 4000 y 8000 Hz, tienen anchos de 100, 100, 160, 700 y 1700 Hz, respectivamente.

Las pendientes superior e inferior de cada banda de ruido son superiores a 200 dB/octava, por lo que sus espectros pueden ser considerados rectangulares (ruido pasabanda ideal). La curva inferior corresponde al UA.

 

(a) Escala lineal de frecuencia. (b) Escala logarítmica de frecuencia.

Fig. IV.10. Patrón de enmascaramiento producido por bandas de ruido angostas.

 

Nótese que:

1) El efecto de enmascaramiento se extiende fuera del intervalo de frecuencias en el cual está confinada la señal enmascarante. En la Fig. IV.10 se observa que el efecto de enmascaramiento se extiende en un rango más amplio hacia las altas frecuencias que hacia las bajas.

2) El máximo valor del UE en cada curva decrece al aumentar la frecuencia central de la banda de ruido, a pesar de que el nivel SPL de cada banda es idéntico; en la banda centrada en 250 Hz, el máximo del UE es aproximadamente igual a 58 dB SPL, mientras que en la banda centrada en 4 kHz es de unos 55 dB SPL.

3) Existe una fuerte dependencia del UE con la frecuencia; en la Fig. IV.10(b) se ve que, en una escala logarítmica de frecuencias, la forma y las pendientes de la curva correspondiente a la banda de ruido centrada en 1000 Hz son muy similares a las de la curva centrada en 4000 Hz. Por otro lado, en una escala lineal de frecuencias (Fig. IV.10(a)) las curvas de las bandas de ruido centradas por debajo de los 500 Hz son similares entre sí.

 

A partir del punto (3) anterior y del punto (1) en el caso del ruido blanco como señal enmascarante, podría pensarse que el efecto de enmascaramiento depende de la frecuencia en forma lineal, por debajo de los 500 Hz, y en forma logarítmica por encima de 500 Hz.

 

Dependencia del nivel de señal

 

En la siguiente figura se muestra el patrón de enmascaramiento correspondiente a bandas de ruido centradas en 1 kHz. Todas las bandas de ruido tienen el mismo ancho de banda (160 Hz), pero difieren en el nivel de presión sonora.

 

Fig. IV.11. Patrón de enmascaramiento producido por bandas de ruido de distinta intensidad sonora.

 

En esta figura se nota que el valor máximo del patrón de enmascaramiento depende del nivel de la señal enmascarante, en forma tal que un incremento de X dB en la presión sonora de la señal provoca un incremento de X dB en el UE máximo (situado aproximadamente en la frecuencia central de la banda de ruido).

Por otro lado, la dependencia de las pendientes con respecto al nivel de señal resulta un tanto inesperada: hacia las frecuencias inferiores a la frecuencia central de la banda de ruido, la pendiente permanece prácticamente constante (es casi independiente del nivel), mientras que hacia las altas frecuencias la pendiente aumenta (en magnitud) a medida que disminuye el nivel de señal.

Este fenómeno está relacionado, aparentemente, con el mecanismo de realimentación a cargo de las células ciliares externas [2] (ver sección III.6): un tono o banda estrecha de ruido de gran intensidad provoca la saturación de las células (es decir, desaparece la realimentación), por lo que la selectividad en frecuencia de la membrana basilar es más pobre y, por ende, la excitación neural se distribuye en una zona más amplia de dicha membrana; por el contrario, cuando la señal es de baja intensidad, la acción de las células ciliares externas aumenta drásticamente la selectividad, de modo que la envolvente de la onda viajera es más estrecha y, en consecuencia, la excitación se concentra en un intervalo de la membrana más pequeño.

Las pendientes hacia las bajas frecuencias permanecen casi constantes debido a la acción pasabajos de la membrana basilar: la señal se atenúa rápidamente una vez que sobrepasa la zona de la membrana en la cual produce la máxima vibración y se acerca al helicotrema (ver sección III.5.1), por lo que el nivel de actividad neural provocado por dicha señal es bajo y, en consecuencia, el umbral de enmascaramiento es menor (es decir, es más difícil que la señal pueda enmascarar a un tono de menor frecuencia).

 

Umbral de audibilidad y de enmascaramiento

En las Figs. IV.9, IV.10 y IV.11 se observa que los patrones de enmascaramiento se superponen con el umbral de audibilidad en las bajas y altas frecuencias. Este solapamiento es de esperarse, puesto que, a medida que la distancia en frecuencia entre las señales enmascarante y enmascarada aumenta, el efecto de la primera debe disminuir y, eventualmente, desaparecer.

La relación entre el umbral de audibilidad y los patrones de enmascaramiento es aún más estrecha, puesto que el UA puede considerarse, en cierta medida, como un umbral de enmascaramiento. El umbral de audibilidad, tal como fue definido en la sección IV.1.1, puede descomponerse en varias partes:

 

 

Efectos temporales

Los ejemplos estudiados hasta ahora corresponden a señales de prueba de gran duración (> 200 ms). Ahora bien, tanto el umbral de audibilidad como el de enmascaramiento dependen de la duración de la señal de prueba. La siguiente figura muestra la variación del UA para tonos de 200, 1000 y 4000 Hz, así como la variación del UE producido por ruido uniformemente enmascarante5 (RUE), en función de la duración de la señal de prueba.

El valor de umbral indicado en el gráfico es igual al nivel de un tono de duración infinita (potencia del tono) a partir del cual se extrae un segmento de señal con la duración indicada. Las curvas correspondientes al RUE son válidas en el rango de frecuencias audibles.

 

Fig. IV.12. Umbral de audibilidad y de enmascaramiento en función de la duración de la señal enmascarada.

 

Para duraciones de la señal de prueba de más de 200 ms, el umbral permanece constante, mientras que para duraciones inferiores a 200 ms el umbral aumenta en 10 dB por década de tiempo: es decir, si el UE de un tono de T segundos de duración es igual a X dB SPL, el UE de un tono de 0,1T segundos será de (X + 10) dB SPL.

Esta dependencia sugiere que, para duraciones inferiores a 200 ms, el sistema auditivo opera como un detector de energía [2]: de este modo, si se reduce la duración de una señal de T a 0,1T segundos, para que la señal siga siendo apenas audible es preciso incrementar la potencia de la señal de P a 10P, con el fin de que la energía de la señal, e=PT, permanezca constante.

Por otro lado, para duraciones de más de 200 ms el umbral (es decir, la detectabilidad del tono de prueba) es independiente de la duración. En consecuencia, se puede inferir que el sistema auditivo opera como un detector de energía dentro de una ventana de tiempo de 200 ms de duración [2].

 

 

Enmascaramiento no simultáneo.......