
En Julio de 1998 presenté en la Escuela Técnica Superior de Ingenieros de Telecomunicación de la Universidad de Vigo, mi Proyecto Fin de Carrera por la Especialidad de Telemática.
Partiendo de un diseño teórico ya realizado de la parte digital de un codificador Nicam, y de un prototipo desarrollado a partir de dicho diseño que se ajustaba al estándar para sonido estéreo, pero que nunca llegó a funcionar, mi primer cometido fue realizar un análisis exhaustivo de todos los elementos del diseño (tanto a nivel teórico como de prototipo).
Después de dicho análisis obtuve como conclusión que la parte digital del diseño teórico y la implementación posterior en el prototipo habían sido realizadas adecuadamente, pero que el problema de dicho prototipo se basaba en que la última etapa analógica del diseño (la colocación de la portadora Nicam en 5,85 MHz) no se estaba realizando de manera correcta, dando problemas de estabilidad y de niveles de salida en dicha portadora, que era necesario subsanar.
A continuación, mi Proyecto consistió en realizar de nuevo esa última etapa analógica y comprobar que la señal generada pudiese ser perfectamente decodificada por un televisor compatible Nicam proponiendo una implemetación del canal de datos a 11 kbit/s hasta ahora no utilizado en Nicam, y sugiriendo una interfaz adecuada para dicho propósito.
Asimismo, realicé un desarrollo teórico de un decodificador Nicam haciendo uso de circuitos integrados comerciales, e implementé a nivel software y hardware una placa que realizaba la decodificación del canal de datos a 11 kbit/s.
El sistema Nicam 728 (Near Instantaneous Companded Audio Multiplex) fue desarrollado a principios de los '80 por el BBC Research Centre en consulta con la IBA y representantes del British Radio and Equipment Manufacturers Association (BREMA) para la norma I de televisión utilizada en el Reino Unido. Posteriormente fue modificado para poder adaptarse a los sistemas B/G usados en la mayor parte de la Europa continental. Además, se ha demostrado su funcionamiento con los sistemas D/K usados en Europa del Este y con el sistema L usado en Francia; y teóricamente podría adaptarse a los sistemas de 525 líneas M y N usados en América, Canadá y Japón.
El estándar Nicam utiliza la misma estructura que una de las opciones de codificación de sonido de la familia MAC/paquetes para la difusión directa por satélite (DBS), con lo que en un principio se intentaba que se pudiesen utilizar los circuitos desarrollados para esta clase de sistemas, simplificando y abaratando el diseño de los receptores.
El Nicam 728 es un sistema PCM que permite la transmisión de dos sonidos con gran calidad, junto con la señal de vídeo y el sonido monofónico convencional en FM. Los dos sonidos aportados por Nicam 728 pueden configurarse como:
Los procesos que realiza el sistema para configurar las señales de sonido para la tranmisión son los siguientes:
En el codificador se parte de dos señales de audio que se someten a una operación de preacentuamiento de las frecuencias altas (siguiendo la recomendación J.17 del CCITT), que será compensado en el receptor mediante el proceso inverso o deénfasis. Este proceso se realiza porque las señales de audio típicas tienen un contenido energético más alto en bajas que en altas frecuencias. La curva de preacentuamiento tiene la forma:

Para conseguir una buena reproducción del sonido original es necesario muestrearlo
a una frecuencia superior al doble de la componente de frecuencia más elevada del
sonido. Dado que el ancho de banda de los canales de sonido se limita mediante filtros
paso bajo a 15 kHz antes de la conversión A/D, una frecuencia de muestreo supeior
a 30 kHz sería satisfactoria. La frecuencia elegida ha sido de 32 kHz para hacerla
coincidir con la de los sistemas MAC y otros de transmisión punto a punto.
Para conseguir el nivel de calidad previsto se necesitan al menos 14 bits por
muestra. La elección de un número inferior significaría hacer audible el error de
cuantificación, que se manifestaría en forma de ruido de fondo. Estos 14 bits son
también los utilizados por los compact-disc no profesionales.
Es decir, el ADC entrega cada milisegundo una muestra de 14 bits en complemento
a dos, centrada en todo ceros para 0V:
01111111111111 -> mayor valor positivo de la escala .............. 00000000000001 00000000000000 -> representa 0V 11111111111111 .............. 10000000000000 -> mayor valor negativo de la escala
La frecuencia de muestreo utilizada (32 kHz) y los 14 bits por muestra, se
traducirían en un flujo binario para las dos vías de sonido próximo a 1 Mbit/s,
una vez añadidos los bits necesarios de sincronización, control y corrección de
errores. El ancho de banda resultante de esta señal sería tan elevado que dificultaría
su posicionamiento dentro del canal de TV, especialmente en el sistema B con anchos
de banda de 7 MHz.
El proceso de compresión-expansión permite reducir los 14 bits por muestra a
sólo 10, que posteriormente se transforman en 11 bits al añadir uno de paridad
para detección de errores.
Para efectuar este proceso de compresión-expansión casi instantánea
(que da nombre al estándar) se examinan grupos de 32 muestras consecutivas de 14
bits generados por cada conversor A/D, expresados en forma binaria, y se identifica la
muestra de mayor valor, con la que se define el factor de escala de las 32.
Según cuál haya sido la muestra mayor de esas 32, se transmitirá:
Muestra mayor -> Bits de escala Bits transmitidos ---------------- -------------- ----------------- B13...........B0 R2 R1 R0 B13...........B0 01XXXXXXXXXXXX 1 1 1 SSSSSSSSSSNNNN 001XXXXXXXXXXX 1 1 0 SNSSSSSSSSSNNN 0001XXXXXXXXXX 1 0 1 SNNSSSSSSSSSNN 00001XXXXXXXXX 1 0 0 SNNNSSSSSSSSSN 000001XXXXXXXX 0 1 1 SNNNNSSSSSSSSS 0000001XXXXXXX 0 1 0 SNNNNSSSSSSSSS 0000000XXXXXXX 0 0 X SNNNNSSSSSSSSS 1111111XXXXXXX 0 0 X SNNNNSSSSSSSSS 1111110XXXXXXX 0 1 0 SNNNNSSSSSSSSS 111110XXXXXXXX 0 1 1 SNNNNSSSSSSSSS 11110XXXXXXXXX 1 0 0 SNNNSSSSSSSSSN 1110XXXXXXXXXX 1 0 1 SNNSSSSSSSSSNN 110XXXXXXXXXXX 1 1 0 SNSSSSSSSSSNNN 10XXXXXXXXXXXX 1 1 1 SSSSSSSSSSNNNN
Para que el decodificador del receptor pueda reconstruir los catorce bits originales
debe recibir información de la posición que las muestras ocupan dentro de la tabla,
y ello se consigue transmitiendo el denominado factor de escala, mediante un
bit de paridad que se añade en cada conjunto de 10 bits. De este modo, para muestras
de pequeño valor la transmisión se efectúa con la precisión de 14 bits, dando lugar
a un bajo nivel de ruido. Para muestras de mayor nivel se va prescindiendo progresivamente
de los bits menos significativos, hasta eliminar de la transmisión los 4 últimos
para muestras con amplitudes superiores a la mitad del valor máximo.
Por ejemplo, para muestras con amplitudes entre 1/16 y 1/8 del máximo se prescinde
de 1 bit; entre 1/8 y 1/4 de 2 bits, etc.
El mayor nivel de ruido generado en el proceso cuando se transmiten menos de 14 bits se compensa por el también mayor nivel de la señal que le corresponde, dando lugar a una característica de relación señal a ruido casi constante para un amplio margen de niveles de señal.
Hay que tener en cuenta que los bits transmitidos de cada una de las 32 muestras cuando el factor de escala es 011 ó 000, son los mismos. Esto provoca una ambiguedad, que se permite para mantener la compatibilidad con la familia MAC/paquetes.
Con el proceso de compresión-expansión se consigue pasar de una relación S/N que en principio sería de 60 dB (si tenemos en cuenta sólo el número de bits), a unos más aceptables 84 dB.
A los 10 bits de cada muestra de sonido se añade un bit de paridad que se genera en el codificador, de modo que su suma en módulo 2 con los 6 bits más significativos de la muestra sea siempre cero. De este modo el decodificador examinará esos 6 bits más significativos y el de paridad añadido comprobando si su suma en módulo 2 es cero. Si alguno de los 7 bits resultantes se hubiese modificado en la transmisión, el decodificador detectará el error, pero no podrá identificar el bit erróneo ni, obviamente, corregirlo:
El hecho de haber protegido mediante el bit de paridad sólo los 6 bits más significativos de la muestra es consecuencia de los resultados obtenidos mediante pruebas perceptuales realizadas durante la definición de las normas MAC/Paquetes. La extensión de la protección a un número mayor de bits reduciría su efectividad al ser más probable la aparición de errores múltiples, en tanto que su aplicación a un menor número los mantendría protegidos, pero los errores generados en los menos significativos resultarían audibles.
La transmisión del primer factor de escala de las muestras de la trama (compuesto por tres bits) se realiza durante las primeras 27 muestras de la trama. Para ello las 27 muestras citadas se dividen en grupos de 9 y a cada uno se le asigna uno de los bits del factor de escala, modificando el bit de paridad de la forma:
El receptor debe, pues, extraer dos informaciones independientes del bit de paridad: el factor de escala y el de prueba de paridad. Para ello debe observar la paridad de cada grupo de 9 bits a los que corresponde un mismo factor y atribuir al conjunto paridad par o impar, según la exhiban la mayoría de las muestras del grupo. De este modo se conoce el bit de factor de escala asociado, y después se puede detectar la presencia de bits erróneos en la muestra.
Este tipo de determinación del bit de escala es muy resistente a errores, ya que para que se produzca una incorrecta decodificación deben existir, al menos, cinco muestras con errores del conjunto de nueve; pero el incoveniente del sistema está en que reduce la eficacia de protección aportada por el bit de paridad.
Como de los 64 bits de paridad (uno por muestra comprimida) que hay en una trama sólo 54 toman parte en el mecanismo de codificación de los bits de los factores de escala, los 10 restantes se pueden utilizar para el transporte de 2 bits adicionales con un grado de protección moderado, pues cada uno de ellos sólo modifica la polaridad de 5 bits de paridad. A estos bits no se le ha asignado ningún significado en el estándar, y constituyen de hecho un canal de datos moderadamente protegido a 2 kbit/s en los modos estéreo y dual, y a 1 kbit/s en el modo mixto de sonido más un canal de datos a 364 kbit/s. Tanto en estéreo como en dual estos bits adicionales se codifican así:
En el receptor se recalcularía la paridad de los seis bits más significativos más el bit de paridad modificado. Si todas o la mayoría de estas paridades en el grupo de cinco son pares, se toma como cero el bit de este canal de datos adicional; en caso contrario, se toma como uno. De esta forma, para que se produzca un error en la recuperación del bit de datos adicional tiene que haber 3 bits erróneos dentro del grupo de 5, lo cual es muy poco probable.
Para evitar que las interferencias o ruido puedan afectar a muchos bits de la misma palabra, éstas no se envían con sus bits consecutivos, sino que se realiza una trasposición de los mismos. De esta manera, dos bits que están juntos en una misma muestra se encuentran separados 16 posiciones en la trama.
Es decir, es como si tuviésemos una matriz con 44 filas, en la que en cada fila hay 4 palabras de 11 bits (correspondientes a los 10 bits de la muestra tras la compresión y al bit de paridad modificado por el factor de escala), y 16 columnas; en dicha matriz se escribiría de izquierda a derecha y de arriba a abajo, y se leería de arriba a abajo y de izquierda a derecha.
Este entrelazado, que consigue que los errores se distribuyan entre las palabras haciendo más eficiente el bit de paridad, sólo afecta a los 704 bits de sonido o datos, no a la cabecera de la trama.
Las muestras digitalizadas de las señales de audio después del proceso anterior se configuran según una estructura de trama de 728 bits, en que el orden de transmisión de bits es de la forma:
| C1 | C2 | C3 | MODO |
|---|---|---|---|
| 0 | 0 | 0 | Sonido estéreo |
| 0 | 1 | 0 | Dos señales mono |
| 1 | 0 | 0 | Una señal mono y datos a 352 kbit/s |
| 1 | 1 | 0 | Datos a 704 kbit/s |
Para mejorar la compatibilidad de la señal Nicam con el video y sonido analógicos, tanto del propio canal como del posible adyacente superior, se precisa que su espectro sea semejante al ruido y que sea invariable con la transmisión de sonido o datos. Para ello, se aleatoriza la señal de trama sumándole en módulo 2 una señal pseudoaleatoria definida por el generador polinomial y palabra de aleatorización siguientes:
111111111
De este proceso sólo se excluye la palabra de alineación de trama, que se utiliza para sincronizar el generador pseudoaleatorio del receptor.
La secuencia generada tiene 511 bits y se arranca con el primer bit a aleatorizar (C0). Su limitada longitud no reduce la eficacia de la aleatorización y facilita la construcción del decodificador del receptor.
La trama de 728 kbit/s modula una portadora situada, en los sistemas B/G, 5.85 MHz por encima de la portadora de video del canal de televisión. Esta frecuencia se determinó como resultado de pruebas subjetivas de compatibilidad de los receptores monofónicos existentes, y de la obtención de mínimos niveles de interferencia desde el canal adyacente superior.
El tipo de modulación utilizada para reducir el ancho de banda y mantener una recepción fiable con receptores económicos fue la denominada Modulación Diferencial de Fase en Cuadratura (DQPSK), y con ella el flujo de símbolos transmitidos se reduce a la mitad (364 kbaud/s, o lo que es lo mismo: dos canales de 364 kbit/s que modulan dos portadoras de la misma frecuencia en cuadratura). Es decir, por cada dos bits transmitidos se genera un cambio de fase de la portadora de la forma:
| Datos | Cambio de fase |
|---|---|
| 0 0 | 0 o |
| 0 1 | -90 o |
| 1 0 | -270 o |
| 1 1 | -180 o |
La señal a la salida del modulador tendrá la forma:

donde:

donde:
Utilizando un filtro análogo en el receptor se obtiene una respuesta global en coseno alzado, que cumple el criterio de Nyquist sobre los pulsos que no producen interferencia entre símbolos. En los sistemas B/G se utiliza un factor de roll-off de 0.4, y en el sistema I el factor es de 1.
La portadora Nicam se encuentra a un nivel relativo de -20 dB respecto al nivel de pico de la portadora de video. La portadora convencional de audio en FM está a -10 dB en el sistema I y a -13 dB en los sistemas B/G.
Los sistemas B/G sitúan la portadora Nicam 5.85 MHz por encima de la video, mientras que el sistema I la sitúa a 6.552 MHz.