miércoles, 16 de septiembre de 2009

Hay ruidos... y ruidos (III)

En las dos primeras partes de esta serie he intentado explicar la diferencia entre un ruido aleatorio y un ruido "pseudo aleatorio" o al menos previsible en parte.

Además, en la segunda parte he hablado de redundancia para garantizar la llegada de un mensaje. ¿Cuánta información tiene la voz humana?. Mediante sistemas de compresión de voz para transmisión dgital es posible comprimir la voz a tasas de velocidad muy bajas. Por ejemplo, nuestros teléfonos GSM emplean tasas típicas de 9600 bits por segundo (bps), pero teléfonos de satélite pueden llegar a valores tan bajos como 2400 o 1200 bps con merma de la calidad pero manteniendo la comprensión del mensaje. Algunos sistemas militares van aún algo más lejos.

Consideremos una señal de voz recibida con una relación S/N de 12 dB (6dB es un salto en unidades S de un receptor). Es decir, que si por ejemplo se está recibiendo ruido de fondo en nivel S3, cuando hay señal sobre el ruido de S/N=12dB se recibe S5. Quien haya sufrido estas circunstancias sabe que la recepción, aunque no imposible exige concentración para su comprensión.

Empleando el teorema de Shannon podemos calcular la información que es posible transferir en estas circunstancias para un canal de 2500 Hz -típico de SSB- y que es de: 10190 bps. Esta capacidad es comparable a la de una comunicación típica GSM, pero se escucha peor.

La forma de pensar cómo mejorar esta situación, potencialmente mejorable a raíz de los cálculos, no es cómo bajar el nivel de ruido ¡que no se puede!, sino como mejorar el nivel de la voz aprovechando sus características redundantes y nuestra percepción. Aprovechando el concomiento de ciertas características de la voz y nuestra percepción de la misma es posible reforzar la comprensión de la voz por el oyente. Es lo que se llama "speech enhancement" -mejora de voz-, uno de los aspectos del "speech processing" -proceso de voz-.

Veámoslo de otro modo. Tenemos -la media de los hipaspanohablantes castellanos- más posibilidades de comprender lo que dice un buen locutor de radio -Y me viene a la cabeza Matías Prats- de lo que dice un andaluz de la sierra de Córdoba hablando como lo hacen en su pueblo. No se invierte más energía o se transmite más información en un caso que en otro. Simplemente, en el primer caso decimos que está "más claro". Potenciamos -bueno, lo hace nuestro cerebro sin dejarnos intervenir mucho- la redundancia que hay en la información recibida para comprenderla mejor.

Un buen proceso de mejora de voz trata de potenciar las partes que mejoran nuestra comprensión. Lleva de moda un tiempo llevar esto al otro extremo, es decir al punto en el que se genera la señal. El proceso de voz previo a la transmisión es una forma en muchos casos de mejorar la recepción de nuestro mensaje sin aumentar la cantidad de energía empleada.

Al menos de todo esto puede deducir que para su próxima emisión SSB hablar claro, potenciar la prosodia Pero ya lo sabe, si habla claro, mantiene un nivel constante y cuida la prosodia su mensaje llegará mejor aunque el receptor no disponga de un "mejorador de voz" ¿O debiera decir "mejorador de prosodia"?.

No hay comentarios:

Publicar un comentario