martes, 29 de septiembre de 2009

¿WAV o MP3?

En una entrada anterior -clasificación de señales- indicaba uno de los varios lugares en la WEB de los que se pueden descargar sonidos correspondientes a diferentes formas de modulación. Si nos acercamos a esta página veremos que los sonidos están en formato ".wav".

Este formato, no comprime la información y por lo tanto ocupa más cantidad de memoria que un formato como MP3. Más cantidad de memoria significa más tiempo para la descarga y mayor uso del ancho de banda disponible del servidor. ¿Puede significa esto que KB9UKD, Gary es un despistado y se le ha pasado por alto o puede haber otra explicación?.

Demos una vuelta por la WEB en búsqueda de más, encontramos la página de EA2BAJ, Eduardo, uno de los pioneros del PSK-31, la de WB8NUT, Duffy la de N4SPP, Frank ... todas ellas están en formato WAV ¿Son todos tan despistados?. Sin duda tiene que haber otra explicación.

Pues la hay y además es bastante simple. MP3 es un sistema de compresión destructivo (Al contrario que WinZIP, por ejemplo, que es no desctructivo). La información que sale de un compresor MP3 es diferente que la que entra y no es posible volver atrás porque se ha perdido parte de la información. Si apenas se nota la diferencia es porque la información que se ha perdido es la que resulta difícil o imposible de apreciar mediante el oído.

Pero los modos digitales no están hechos para el oído, sino para un demodulador que precisa la señal íntegra. Por ejemplo, para nuestro oído, dos señales armónicas (Por ejemplo un tono con la nota Do a 784 Hz (quinta octava) y otro con la misma nota dos octavas por encima, es decir 2*2*784=3136 Hz sonará igual independientemente de la fase que haya entre ellas. Si uno de los procesos MP3 altera esta fase el oyente no lo percibirá. Sin embargo si se trata de dos portadoras simultáneas en un sistema multiportadora como el MT63 el resultado será una mayor dificultad en la demodulación de la señal.

Quiero pensar que quienes han recopilado estas señales han tenido en cuenta la posibilidad de que se pasen por un demodulador, y por ello se ha mantenido la señal íntegra.

Si ha hecho pruebas con señales comprimidas y apenas ha visto diferencia es muy posible que su relación señal/ruido sea muy alta. La comparación hay que hacerla con relaciones señal/ruido muy bajas para ver las diferencias. En muchos equipos el punto en el que se toma la señal, y las posibles alteraciones que haya sufrido en el camino influyen en el resultado final. La forma de onda ".WAV" guarda TODAS las muestras obtenidas a la velocidad y resolución establecidas.

miércoles, 23 de septiembre de 2009

SDR y manejo remoto

Hace un par de días, escuchando por la noche en la frecuencia de un repetidor VHF próximo, segí una conversación acerca de las estaciones con control remoto. Cada vez son más los aficionados que debido a diversas circunstancias -ruido urbano, dificultad para colocar las antenas o simple investigación entre otras- se plantean la posibilidad de tener la estación en un punto más o menos alejado de su lugar de residencia habitual y manejarla desde otro punto.

El acceso masivo a la red internet ha hecho que esta idea sea no sólo posible posible sino también asequible para un aficionado medio. En la conversación erscuché una referencia: "Para eso lo que puede ir bien es una FLEX-1500". Inmediatamente me vino a la memoria la estación de EA3OG (Luis del Molino) que tuve ocasión de visitar hace unos meses. También una FLEX-5000 en Villassar de Mar manejada remotamente desde su QTH en el centro de Barcelona.

¿Se trata de una casualidad o es que para esto hay que emplear de forma irremediable una SDR?. Para gestionar remotamente la estación no es necesario que la radio remota sea una SDR. Lo que sí es necesario es que tenga algún medio de control remoto. En una radio SDR, por concepto, prácticamente todas sus funciones están implementadas en software, por lo que resulta fácil intuir que el control a través de software y comunicaciones es una tarea simple. En otras radios no siempre es tan simple aunque pocas cosas son imposibles.

Voy a poner dos ejemplos de equipos NO-SDR y su control remoto: Para el primer ejemplo he elegido una ICOM IC7800, para el segundo un DRAKE TR4.

El primer equipo (ICOM-IC7800) dispone de conexión a ordenador y un conjun to de comandos. El comando remoto ya es posible si se dispone de un medio de comunicación. Una conexión mediante módem o mejor una ADSL es adecuada. Para el audio se deberá habilitar un canal separado. Una línea telefónica o de nuevo una conexión ADSL son adecuados. Ya es posible el control remoto.

El segundo equipo no dispone de conexión a ordenador, ni de procesador adecuado para el control remoto. Además, ¡si es de válvulas! y el ¡VFO es de condensador variable!. Aunque difícil, la solución sigue siendo posible.

La fotografía de hoy presenta un equipo de cirujía remota. Con este equipo un corujano puede operar a paciente situado a decenas o cientos de kilómetros operando sus instrumentos y observando el resultado gracias a la informaciópn que viaja sobre un canal de comunicaciones.

Aunque siempre he considerado a los médicos como personas con poco miedo al riesgo, creo que operar un TR7 es menos arriesgado que hacer una operación. Eso sí, habría que sustituir sus instrumentos de corte por elementos menos agresivos.

La estación no es solamente la radio. Quedan amplificadores, acopladores, selectores de antena, medidores diverso tipo... pero todo lo indicado sigue sirviendo.

Por supuesto, no todo es tan bonito. Existen siempre algunos "efectos secundarios" en este proceso, pero por hoy nos quedaremos con la parte positiva.

El control remoto de una estación no es algo nuevo, pero sí se ha simplifado gracias a la expansión de las comunicaciones y a la integración de las tecnologías digital y SDR en la radio.

martes, 22 de septiembre de 2009

Clasificación de señales

Unas cuantas vueltas al dial de nuestro receptor nos hacen descubrir un mundo de sonidos extraños que contienen información en diferentes formatos. Los oídos entrenados son capaces de distinguir estas modulaciones: "Esto es SSTV, esto RTTY y esto otro CLOVER...". De este modo se puede seleccionar el demodulador adecuado para extraer la información.

Cuando se escucha en determinadas bandas y frecuencias es fácil saber el tipo de emisión asignado a esa banda, y no resulta difícil su identificación. Por ejemplo, el sonido que se escucha en la frecuencia de 13882.5 KHz. corresponde muy probablemente a una emisión FAX de una estación meteorológica (DDK) en Hamburgo.

Cuando no se dispone ni de la habilidad mencionada en el primer párrafo ni de listados actualizados de emisiones, el análisis de señal -que puede hacerse en cualquier ordenador empleando programas más o menos habituales- puede acudir en nuestra ayuda. Una visión del espectro de la señal y de su aspecto en el tiempo también nos permiten deducir el tipo de modulación. Esi sí, con algo más de conocimiento respecto a sus características.

Esta última aproximación es más "formal" que las anteriores, y mucho más precisa al implicar valores reales medidos y no percepciones o suposiciones. Por otra parte, resulta que es la más adecuada (ya que está en forma digital) para ser procesada de forma automática mediante un programa.

Las técnicas de análisis de señal para identificar los detalles de una forma de modulación concreta y facilitar la selección y configuración de demodulador adecuado se basan en el proceso digital de señales. Se denominan técnicas de clasificación de señales.

Estas técncias se pueden emplear en algo más que identificar modulaciones. Por ejemplo, se emplean en la identificación de tipos de sonido -voz hablando, voz cantando, música, tipo de instrumentos en una grabación...-, en trabajos forenses para la identificación de sonidos o en el análisis de un electroencefalograma.

Pero no nos salgamos de nuestro contexto SDR. Un oyente humano puede distinguir una emisión RTTY, pero resultará más difícil distinguir si la diferencia entre las frecuencias empleadas es de 150 o 180 Hz y si la velocidad es de 45 o de 50 Hz. Para un clasificador de señal esta es una tarea simple. En un tiempo muy corto puede extraer estos parámetros con gran precisión.

Podemos imaginar una próxima generación de radios en las que no será necesario seleccionar el modo -salvo para llamadas en transmisión, claro está-. La radio cambiará de modo automáticamente al detectar la señal. Mientras esto sucede, nos vendrá bien un poco de práctica auditiva. Para ello podemos escuchar como suenan diferentes modulaciones en la página de KB9UKD, Gary .

viernes, 18 de septiembre de 2009

La tarjeta Beagle. OMAP-3530.

El tiempo de desarrollo de un sistema con un nivel de complejidad como el de la radio SDR que tengo en mi cabeza requiere una extraordinaria inversión de tiempo y esfuerzos. Por eso me veo en la necesidad de buscar formas que aceleren dicho avance. Una es el estudio y el uso de técnicas que mejoren el rendimiento. Otra es la implicación de más personas en la idea.

Buceando hace poco en internet tras una tarjeta basada en OMAP-L137 de bajo precio que sirviese como base para un desarrollo práctico -tarjeta que por cierto no encontré- me topé con otra tarjeta muy interesante basada en OMAP-3530, y denominada "beagleboard" (lo de beagle es por la raza de perros, no por la península). Aunque tras el análisis decidí no salirme de mi idea inicial de emplear un OMAP-L137, me pareció en producto muy interesante, especialmente por todo lo que ofrece a un precio de ¡$149!.

El OMAP-3530, se parace al OMAP-L137 en que dispone también de dos procesadores de propósito general, un ARM Cortex-A8 a 720 MHz y un DSP de coma fija a 520 MHz, además de otros procesadores especializados, especialmente en gestión de señales vídeo (compresión y descompresión) lo que le hace ideal para dispositivos portátiles de altas prestaciones como el novísimo N900 de Nokia, que también lo integra.

Gracias a esta tarjeta un aficionado puede acceder a estos dispositivos que de otro modo difícilmente podría emplear. Salvo que sea tan hábil como para hacer en casa una soldadura POP de dos encapsulados BGA.

Lo mejor -y a veces lo peor- de encontrar algo nuevo en la red, es que te abre un nuevo mundo -y también te ayuda a distraerte del camino original-. Y claro ¡alguien ya había tenido la misma idea!. Usar esta tarjeta como base para parte de una SDR. El resto de los componentes lo forman un convertidor -upconverter y downconverter- denominado USRP y el software gnuradio de los que no creo haber hablado hasta el momento.

Aunque finalmente veo que, si nadie lo remedia, tendré que preparar una solución similar con el OMAP-L137. Invertí unas cuentas horas, aprendí cosas nuevas... Aunque no haya resuelto el problema que me llevó a esta búsqueda, el viaje ha merecido la pena.

miércoles, 16 de septiembre de 2009

Hay ruidos... y ruidos (III)

En las dos primeras partes de esta serie he intentado explicar la diferencia entre un ruido aleatorio y un ruido "pseudo aleatorio" o al menos previsible en parte.

Además, en la segunda parte he hablado de redundancia para garantizar la llegada de un mensaje. ¿Cuánta información tiene la voz humana?. Mediante sistemas de compresión de voz para transmisión dgital es posible comprimir la voz a tasas de velocidad muy bajas. Por ejemplo, nuestros teléfonos GSM emplean tasas típicas de 9600 bits por segundo (bps), pero teléfonos de satélite pueden llegar a valores tan bajos como 2400 o 1200 bps con merma de la calidad pero manteniendo la comprensión del mensaje. Algunos sistemas militares van aún algo más lejos.

Consideremos una señal de voz recibida con una relación S/N de 12 dB (6dB es un salto en unidades S de un receptor). Es decir, que si por ejemplo se está recibiendo ruido de fondo en nivel S3, cuando hay señal sobre el ruido de S/N=12dB se recibe S5. Quien haya sufrido estas circunstancias sabe que la recepción, aunque no imposible exige concentración para su comprensión.

Empleando el teorema de Shannon podemos calcular la información que es posible transferir en estas circunstancias para un canal de 2500 Hz -típico de SSB- y que es de: 10190 bps. Esta capacidad es comparable a la de una comunicación típica GSM, pero se escucha peor.

La forma de pensar cómo mejorar esta situación, potencialmente mejorable a raíz de los cálculos, no es cómo bajar el nivel de ruido ¡que no se puede!, sino como mejorar el nivel de la voz aprovechando sus características redundantes y nuestra percepción. Aprovechando el concomiento de ciertas características de la voz y nuestra percepción de la misma es posible reforzar la comprensión de la voz por el oyente. Es lo que se llama "speech enhancement" -mejora de voz-, uno de los aspectos del "speech processing" -proceso de voz-.

Veámoslo de otro modo. Tenemos -la media de los hipaspanohablantes castellanos- más posibilidades de comprender lo que dice un buen locutor de radio -Y me viene a la cabeza Matías Prats- de lo que dice un andaluz de la sierra de Córdoba hablando como lo hacen en su pueblo. No se invierte más energía o se transmite más información en un caso que en otro. Simplemente, en el primer caso decimos que está "más claro". Potenciamos -bueno, lo hace nuestro cerebro sin dejarnos intervenir mucho- la redundancia que hay en la información recibida para comprenderla mejor.

Un buen proceso de mejora de voz trata de potenciar las partes que mejoran nuestra comprensión. Lleva de moda un tiempo llevar esto al otro extremo, es decir al punto en el que se genera la señal. El proceso de voz previo a la transmisión es una forma en muchos casos de mejorar la recepción de nuestro mensaje sin aumentar la cantidad de energía empleada.

Al menos de todo esto puede deducir que para su próxima emisión SSB hablar claro, potenciar la prosodia Pero ya lo sabe, si habla claro, mantiene un nivel constante y cuida la prosodia su mensaje llegará mejor aunque el receptor no disponga de un "mejorador de voz" ¿O debiera decir "mejorador de prosodia"?.

miércoles, 9 de septiembre de 2009

Hay ruidos... y ruidos(II)

Todavía no voy a desvelar el misterio panteado en mi entrada anterior "Hay ruidos y ruidos (I)". Antes de resolver el aparente misterio quiero incidir un poco más en el tema del ruido.

Shannon demostró de forma elegante la capacidad de un canal con ruido gaussiano. La ecuación establece una capacidad de información en bits/segundo (unidades de información por segundo). Desgraciadamente Shannon no concluye la forma de conseguir esa capacidad. En cualquier sistema real, esta capacidad está algo o mucho por debajo de este límite.

Lo primero que hay que saber es que la información en bits por segundo no tiene que ver con la velocidad de comunicación en bauds (aunque en algunos modos pueda coincidir o aproximarse mucho, en otros son valores totalmente diferentes). Por ejemplo, es posible comunicar a 400 bauds (bauds es la velocidad en símbolos por segundo) para obtener finalmente valores tan dispersos de información como 20 bits/segundo o 40000 bits/segundo. Intuitivamente, y sin acudir a la ecuación de Shannon, podemos pensar que para el primer caso se podrá hacer con relaciones señal/ruido más bajas que para el segundo.

Para el primer caso, bastará con que la información correspondiente a un bit se distribuya en varios símbolos, mientras que para el segundo un símbolo deberá proporcionar más de un bit. Los sistemas de comprobación (CRC...) y corrección de errores (Hamming, Reed Solomon, Viterbi...) añaden símbolos que NO contienen información pero hacen el mensaje más largo en número de símbolos. Esto permite reducir la probabilidad de error respecto a un mensaje sin codificación en iguales condiciones de relación señal/ruido.

Sistemas como el GPS llevan esto al límite. Para transmitir 50 bits/segundo emplean una velocidad algo superior a 1 Mbaud. Esto permite recibir la señal cuando su nivel de energía es menor que el ruido de fondo presente. Es lo que se denomina espectro expandido.

Todas estas técnicas no están en contra de la teoría establecida por Shannon. Técnicas similares se emplean en comunicaciones del espacio profundo o a nivel de aficionado en comunicaciones EME (rebote lunar). Es como hacerse entender gritando más (mejor relación señal ruido) o hablando más bajo pero mucho más despacio, marcando la pronunciación de cada letra o repitiendo lo mismo varias veces (sistema redundante). En los dos casos se invierte la misma cantidad de energía, en el primero con más potencia en menos tiempo, y en el segundo con menos potencia durante más tiempo. Por lo tanto, el resultado debe ser similar.

Si se pregunta qué tiene que ver esto con la paradoja de la eliminación de ruido en la recepción de voz... ¡lo siento! pero tendrá que seguir esperando. Mientras tanto vaya pensando en el concepto de redundancia. Cuando se repite algo que ya sabemos, no se aporta información.

lunes, 7 de septiembre de 2009

Homenaje al libro

Era una simple cuestión de tiempo. Tras unas decenas de años dedicados al desarrollo de lo que ahora se llaman sistemas "empotrados" y que yo llamaba simplemente sistemas basados en microcontrolador (¡sí! yo trabajé con dispositivos MCS48) ha llegado el momento de dar un gran salto.

A medida que se fue disponiendo de nuevos procesadores con características más avanzadas, la petición de mayores funcionalidades para los diseños era un hecho inevitable. Sin embargo, quizá por los dispositivos que me tocó en suerte desarrollar, nunca tuve necesidad de afrontar diseños que no se puedieran abordar desde el punto de vista de "un solo hombre y desde cero".

Ciertamente, tuve que adoptar algunas estrategias para mejorar mi rendimiento, como el uso de compiladores de lenguaje "C", la modularización del trabajo, el aprovechamiento de lo escrito previamente... pero simpre fue posible mantener la filosofía.

Estos últimos años, mi trabajo me ha separado de la labor pura de desarrollo ¿Será el principio de Peter? pero en mis escasos ratos libres no puedo dejar de pensar en que algún día terminaré esa máquina revolucionaria que me dará la satisfacción del ingeniero (Ver página 173). En algunas entradas previas ya he hecho mención a mis devaneos más recientes en este sentido.

Para ello, he tenido que adaptar mi mentalidad. Parece que no se pueden diseñar máquinas que no tengan pantalla a color táctil con gráficos en movimiento y sonido. El indicador luminos, el zumbador y los interruptores han pasado a la historia.

Así que, tras muchas dudas, decidí que debía dar un gran salto, e informarme a fondo de esa cosa que llaman "embedded linux", que pone de forma inmediata a disposición del desarrollador de "equipos electrónicos basados en microprocesador" el trabajo de decenas de miles de horas de excelentes programadores.

Una cosa es decirlo así, y otra cosa es aplicarlo en la práctica. El comienzo de búsqueda de información, como en muchas ocasiones, comenzó en la red. La red está llena de información, pero extraer la que es realmente de interés y distinguir entre la válida, la regular, la mala e incluso la malintencionada (por cierto muy abundantes éstas dos últimas) es otra cosa.

Como en otras ocasiones he procedido del modo habitual: Leer mucho, extraer información para ir rechazando la inútil o inválida, seguir leyendo más y seguir extrayendo. Hasta que llegué a un punto en el que las numerosísimas dudas se iban resolviendo con lentutud, tras horas de búsqueda y filtraje de información. En ese momento me vino la inspiración. Me acordé de algo que hacía antes de que existiese internet. Buscar libros sobre el tema en una librería. Con lo que ya había aprendido, seguro que sería capaz de apreciar qué libros contienen información útil.
Así lo hice. Una visita a una librería técnica, unas horas de ojeo, y salí de allí con unos cuantos libros.

Ahora invierto más tiempo leyendo y consultando los libros que buscando información en internet y cuando hago esto último la búsqueda es más fácil, dirigiéndose de forma directa a fuentes de mayor fiabilidad.

Poco a poco voy logrando mi propósito de conocer el medio en el que me voy a mover en el próximo futuro. Y he dado el gran salto gracias a los buenos libros. Alguien que leí hace tiempo pero que no recuerdo dijo que escribía libros proque creía que el mejor modo de aprender sobre un tema era escribir un libro sobre él. Debemos agradecer a quienes aún siguen escribiendo con la intención de aprender y transmitirnos lo aprendido.

jueves, 3 de septiembre de 2009

Hay ruidos... y ruidos (I)

Ya estamos de vuelta de vacaciones. Han actuado como un filtro atenuador que ha atenuado el exceso de ruido que tenía en mi cabeza. Pero creo que al mismo tiempo ha reducido de forma similar el nivel de información. Esperemos recuperar la información sin aumentar el ruido.

Y hablando de ruido ¿Hasta qué punto el proceso digital de señales es capaz de eliminar el ruido?. Para ello, en primer lugar debemos aclarar qué es el ruido.

Desde un punto de vista puramente teórico es toda forma de energía que no contine información útil. Desde un punto de vista práctico esta definición también parece aceptable. Si, por ejemplo, estamos escuchando una transmisión en nuestro equipo de onda corta y alguien se pone a transmitir en la misma frecuencia, evidentemente aunque se transmite información, para nuestra recepción es puro y simple ruido. Si estamos en un bar lleno de gente conversando el resto de las conversaciones contienen información pero es ruido en nuestra conversación.
Pero la generada por humanos no es la única fuente de ruido. Tenemos también el propio ruido de los equipos, debido a sus componentes (En los equipos SDR ese ruido se manifiesta debido a la precisión de la conversión A/D y del cálculo posterior), el ruido térmico, el ruido atmosférico en formas muy varidas...
El ruido que NO SE PUEDE ELIMINAR es el ruido aleatorio. Por su propia definición, el ruido aleatorio es imprevisible, y por lo tanto es imposible contrarrestarlo. A esta categoría pertenecen el ruido térmico y parte del ruido atmosférico. Otros ruidos, sin embargo, son más previsibles. Supongamos que es nuestra escucha de una emisión aparece, debido a la "carga" de un transmisor, un tono, o debido a un mal filtraje un zumbido. Estos ruidos son "previsibles" y es posible eliminarlos.
Desde luego, si el ruido está dentro del ancho de banda de nuestra señal, al eliminar el ruido eliminaremos también parte de la señal, pero aún así el resultado es una mejora de la relación S/N (la cantidad de energía con información respecto a la cantidad de energía con ruido) lo que redunda en una mejora de la recepción.
¡Pero yo he visto y escuchado sistemas que mejoran la calidad de la voz eliminando el sonido de "lluvia" de fondo!. ¿No es caso ruido aleatorio?. Pues sí, es ruido aleatorio. Pero no pienso desdecirme de mi afirmación anterior respecto a la imposibilidad de eliminarlo. Seguiremos hablando de ruido y aclararemos esta paradoja.