Renewable Energy Spain Universidade de Vigo Alumni Group on LinkedIn View Jose Enrique Puente's profile on LinkedIn XING Jose Enrique Puente

Plataforma satélite de servicios audiovisuales: Streaming, Broadcast, y Multicast
View more presentations from jepuente.

  1. Mi Proyecto Fin de Carrera
  2. Historia del sistema NICAM 728
  3. Especificaciones del estándar
  4. Procedimiento de codificación
    1. Conversión analógico-digital de las señales de sonido
    2. Compresión-expansión de las muestras
    3. Protección frente a errores
    4. Canal de datos moderadamente protegido a 2 kbit/s
    5. Entrelazado
    6. Estructura de la trama
    7. Aleatorización
    8. Modulación
  5. Bibliografía



  1. Mi Proyecto Fin de Carrera

    En Julio de 1998 presenté en la Escuela Técnica Superior de Ingenieros de Telecomunicación de la Universidad de Vigo, mi Proyecto Fin de Carrera por la Especialidad de Telemática.

    Partiendo de un diseño teórico ya realizado de la parte digital de un codificador Nicam, y de un prototipo desarrollado a partir de dicho diseño que se ajustaba al estándar para sonido estéreo, pero que nunca llegó a funcionar, mi primer cometido fue realizar un análisis exhaustivo de todos los elementos del diseño (tanto a nivel teórico como de prototipo).

    Después de dicho análisis obtuve como conclusión que la parte digital del diseño teórico y la implementación posterior en el prototipo habían sido realizadas adecuadamente, pero que el problema de dicho prototipo se basaba en que la última etapa analógica del diseño (la colocación de la portadora Nicam en 5,85 MHz) no se estaba realizando de manera correcta, dando problemas de estabilidad y de niveles de salida en dicha portadora, que era necesario subsanar.

    A continuación, mi Proyecto consistió en realizar de nuevo esa última etapa analógica y comprobar que la señal generada pudiese ser perfectamente decodificada por un televisor compatible Nicam proponiendo una implemetación del canal de datos a 11 kbit/s hasta ahora no utilizado en Nicam, y sugiriendo una interfaz adecuada para dicho propósito.

    Asimismo, realicé un desarrollo teórico de un decodificador Nicam haciendo uso de circuitos integrados comerciales, e implementé a nivel software y hardware una placa que realizaba la decodificación del canal de datos a 11 kbit/s.


  2. Historia del sistema NICAM 728

    El sistema Nicam 728 (Near Instantaneous Companded Audio Multiplex) fue desarrollado a principios de los '80 por el BBC Research Centre en consulta con la IBA y representantes del British Radio and Equipment Manufacturers Association (BREMA) para la norma I de televisión utilizada en el Reino Unido. Posteriormente fue modificado para poder adaptarse a los sistemas B/G usados en la mayor parte de la Europa continental. Además, se ha demostrado su funcionamiento con los sistemas D/K usados en Europa del Este y con el sistema L usado en Francia; y teóricamente podría adaptarse a los sistemas de 525 líneas M y N usados en América, Canadá y Japón.

    El estándar Nicam utiliza la misma estructura que una de las opciones de codificación de sonido de la familia MAC/paquetes para la difusión directa por satélite (DBS), con lo que en un principio se intentaba que se pudiesen utilizar los circuitos desarrollados para esta clase de sistemas, simplificando y abaratando el diseño de los receptores.


  3. Especificaciones del estándar


  4. Procedimiento de codificación

    El Nicam 728 es un sistema PCM que permite la transmisión de dos sonidos con gran calidad, junto con la señal de vídeo y el sonido monofónico convencional en FM. Los dos sonidos aportados por Nicam 728 pueden configurarse como:

    Los procesos que realiza el sistema para configurar las señales de sonido para la tranmisión son los siguientes:

    1. Conversión analógico-digital de las señales de sonido:

      En el codificador se parte de dos señales de audio que se someten a una operación de preacentuamiento de las frecuencias altas (siguiendo la recomendación J.17 del CCITT), que será compensado en el receptor mediante el proceso inverso o deénfasis. Este proceso se realiza porque las señales de audio típicas tienen un contenido energético más alto en bajas que en altas frecuencias. La curva de preacentuamiento tiene la forma:

      Para conseguir una buena reproducción del sonido original es necesario muestrearlo a una frecuencia superior al doble de la componente de frecuencia más elevada del sonido. Dado que el ancho de banda de los canales de sonido se limita mediante filtros paso bajo a 15 kHz antes de la conversión A/D, una frecuencia de muestreo supeior a 30 kHz sería satisfactoria. La frecuencia elegida ha sido de 32 kHz para hacerla coincidir con la de los sistemas MAC y otros de transmisión punto a punto.
      Para conseguir el nivel de calidad previsto se necesitan al menos 14 bits por muestra. La elección de un número inferior significaría hacer audible el error de cuantificación, que se manifestaría en forma de ruido de fondo. Estos 14 bits son también los utilizados por los compact-disc no profesionales.
      Es decir, el ADC entrega cada milisegundo una muestra de 14 bits en complemento a dos, centrada en todo ceros para 0V:

      01111111111111 -> mayor valor positivo de la escala
      ..............
      
      00000000000001
      00000000000000 -> representa 0V
      11111111111111
      ..............
      
      10000000000000 -> mayor valor negativo de la escala
      

    2. Compresión-expansión de las muestras:

      La frecuencia de muestreo utilizada (32 kHz) y los 14 bits por muestra, se traducirían en un flujo binario para las dos vías de sonido próximo a 1 Mbit/s, una vez añadidos los bits necesarios de sincronización, control y corrección de errores. El ancho de banda resultante de esta señal sería tan elevado que dificultaría su posicionamiento dentro del canal de TV, especialmente en el sistema B con anchos de banda de 7 MHz.
      El proceso de compresión-expansión permite reducir los 14 bits por muestra a sólo 10, que posteriormente se transforman en 11 bits al añadir uno de paridad para detección de errores.
      Para efectuar este proceso de compresión-expansión casi instantánea (que da nombre al estándar) se examinan grupos de 32 muestras consecutivas de 14 bits generados por cada conversor A/D, expresados en forma binaria, y se identifica la muestra de mayor valor, con la que se define el factor de escala de las 32.
      Según cuál haya sido la muestra mayor de esas 32, se transmitirá:

       Muestra mayor   -> Bits de escala  Bits transmitidos
      ----------------    --------------  -----------------
      B13...........B0       R2 R1 R0     B13...........B0
       01XXXXXXXXXXXX         1  1  1      SSSSSSSSSSNNNN
       001XXXXXXXXXXX         1  1  0      SNSSSSSSSSSNNN
       0001XXXXXXXXXX         1  0  1      SNNSSSSSSSSSNN
       00001XXXXXXXXX         1  0  0      SNNNSSSSSSSSSN
       000001XXXXXXXX         0  1  1      SNNNNSSSSSSSSS
       0000001XXXXXXX         0  1  0      SNNNNSSSSSSSSS
       0000000XXXXXXX         0  0  X      SNNNNSSSSSSSSS
       1111111XXXXXXX         0  0  X      SNNNNSSSSSSSSS
       1111110XXXXXXX         0  1  0      SNNNNSSSSSSSSS
       111110XXXXXXXX         0  1  1      SNNNNSSSSSSSSS
       11110XXXXXXXXX         1  0  0      SNNNSSSSSSSSSN
       1110XXXXXXXXXX         1  0  1      SNNSSSSSSSSSNN
       110XXXXXXXXXXX         1  1  0      SNSSSSSSSSSNNN
       10XXXXXXXXXXXX         1  1  1      SSSSSSSSSSNNNN
      

      Por ejemplo, para aquel grupo de muestras cuya muestra de mayor amplitud sea inferior a 1/16 de la amplitud máxima de salida del ADC (para las que son 0 los cinco bits más significativos), se prescinde de los cuatro bits (0000) adyacentes al más significativo, transmitiéndose solamente los diez restantes.

      Para que el decodificador del receptor pueda reconstruir los catorce bits originales debe recibir información de la posición que las muestras ocupan dentro de la tabla, y ello se consigue transmitiendo el denominado factor de escala, mediante un bit de paridad que se añade en cada conjunto de 10 bits. De este modo, para muestras de pequeño valor la transmisión se efectúa con la precisión de 14 bits, dando lugar a un bajo nivel de ruido. Para muestras de mayor nivel se va prescindiendo progresivamente de los bits menos significativos, hasta eliminar de la transmisión los 4 últimos para muestras con amplitudes superiores a la mitad del valor máximo.
      Por ejemplo, para muestras con amplitudes entre 1/16 y 1/8 del máximo se prescinde de 1 bit; entre 1/8 y 1/4 de 2 bits, etc.

      El mayor nivel de ruido generado en el proceso cuando se transmiten menos de 14 bits se compensa por el también mayor nivel de la señal que le corresponde, dando lugar a una característica de relación señal a ruido casi constante para un amplio margen de niveles de señal.

      Hay que tener en cuenta que los bits transmitidos de cada una de las 32 muestras cuando el factor de escala es 011 ó 000, son los mismos. Esto provoca una ambiguedad, que se permite para mantener la compatibilidad con la familia MAC/paquetes.

      Con el proceso de compresión-expansión se consigue pasar de una relación S/N que en principio sería de 60 dB (si tenemos en cuenta sólo el número de bits), a unos más aceptables 84 dB.

    3. Protección frente a errores

      A los 10 bits de cada muestra de sonido se añade un bit de paridad que se genera en el codificador, de modo que su suma en módulo 2 con los 6 bits más significativos de la muestra sea siempre cero. De este modo el decodificador examinará esos 6 bits más significativos y el de paridad añadido comprobando si su suma en módulo 2 es cero. Si alguno de los 7 bits resultantes se hubiese modificado en la transmisión, el decodificador detectará el error, pero no podrá identificar el bit erróneo ni, obviamente, corregirlo:

      • En el caso de que se hubieran producido dos errores, el decodificador no podrá detectarlo mediante esta simple comprobación de la paridad, pero estos errores son mucho menos probables que los simples, por el sistema de trasposición de bits utilizado, y de ahí su efectividad.

      • Si se detecta un error en la muestra, ésta puede ser sustituida por un valor resultante de la interpolación de las muestras anterior y posterior sin errores, lo que suele proporcionar un buen resultado.

      El hecho de haber protegido mediante el bit de paridad sólo los 6 bits más significativos de la muestra es consecuencia de los resultados obtenidos mediante pruebas perceptuales realizadas durante la definición de las normas MAC/Paquetes. La extensión de la protección a un número mayor de bits reduciría su efectividad al ser más probable la aparición de errores múltiples, en tanto que su aplicación a un menor número los mantendría protegidos, pero los errores generados en los menos significativos resultarían audibles.

      La transmisión del primer factor de escala de las muestras de la trama (compuesto por tres bits) se realiza durante las primeras 27 muestras de la trama. Para ello las 27 muestras citadas se dividen en grupos de 9 y a cada uno se le asigna uno de los bits del factor de escala, modificando el bit de paridad de la forma:

      • Transmisión estéreo, con factor de escala (FL2,FL1,FL0) para el canal izquierdo y (FR2,FR1,FR0) para el canal derecho:

        • FL2 modifica los bits de las palabras 0,6,12,...,48

        • FR2 modifica los bits de las palabras 1,7,13,...,49

        • FL1 modifica los bits de las palabras 2,8,14,...,50

        • FR1 modifica los bits de las palabras 3,9,15,...,51

        • FL0 modifica los bits de las palabras 4,10,16,...,52

        • FR0 modifica los bits de las palabras 5,11,17,...,53

      • Transmisión dual, con factor de escala (F12,F11,F10) para el canal primer canal mono y (F22,F21,F20) para el segundo:

        • F12 modifica los bits de las palabras 0,3,6,...,24

        • F22 modifica los bits de las palabras 1,4,7,...,25

        • F11 modifica los bits de las palabras 2,5,8,...,26

        • F21 modifica los bits de las palabras 27,30,33,...,51

        • F10 modifica los bits de las palabras 28,31,34,...,52

        • F20 modifica los bits de las palabras 29,32,35,...,53

      El receptor debe, pues, extraer dos informaciones independientes del bit de paridad: el factor de escala y el de prueba de paridad. Para ello debe observar la paridad de cada grupo de 9 bits a los que corresponde un mismo factor y atribuir al conjunto paridad par o impar, según la exhiban la mayoría de las muestras del grupo. De este modo se conoce el bit de factor de escala asociado, y después se puede detectar la presencia de bits erróneos en la muestra.

      Este tipo de determinación del bit de escala es muy resistente a errores, ya que para que se produzca una incorrecta decodificación deben existir, al menos, cinco muestras con errores del conjunto de nueve; pero el incoveniente del sistema está en que reduce la eficacia de protección aportada por el bit de paridad.

    4. Canal de datos moderadamente protegido a 2 kbit/s

      Como de los 64 bits de paridad (uno por muestra comprimida) que hay en una trama sólo 54 toman parte en el mecanismo de codificación de los bits de los factores de escala, los 10 restantes se pueden utilizar para el transporte de 2 bits adicionales con un grado de protección moderado, pues cada uno de ellos sólo modifica la polaridad de 5 bits de paridad. A estos bits no se le ha asignado ningún significado en el estándar, y constituyen de hecho un canal de datos moderadamente protegido a 2 kbit/s en los modos estéreo y dual, y a 1 kbit/s en el modo mixto de sonido más un canal de datos a 364 kbit/s. Tanto en estéreo como en dual estos bits adicionales se codifican así:

      • BIT0 modifica los bits de las palabras 54,55,56,57 y 58.

      • BIT1 modifica los bits de las palabras 59,60,61,62 y 63.

      En el receptor se recalcularía la paridad de los seis bits más significativos más el bit de paridad modificado. Si todas o la mayoría de estas paridades en el grupo de cinco son pares, se toma como cero el bit de este canal de datos adicional; en caso contrario, se toma como uno. De esta forma, para que se produzca un error en la recuperación del bit de datos adicional tiene que haber 3 bits erróneos dentro del grupo de 5, lo cual es muy poco probable.

    5. Entrelazado

      Para evitar que las interferencias o ruido puedan afectar a muchos bits de la misma palabra, éstas no se envían con sus bits consecutivos, sino que se realiza una trasposición de los mismos. De esta manera, dos bits que están juntos en una misma muestra se encuentran separados 16 posiciones en la trama.

      Es decir, es como si tuviésemos una matriz con 44 filas, en la que en cada fila hay 4 palabras de 11 bits (correspondientes a los 10 bits de la muestra tras la compresión y al bit de paridad modificado por el factor de escala), y 16 columnas; en dicha matriz se escribiría de izquierda a derecha y de arriba a abajo, y se leería de arriba a abajo y de izquierda a derecha.

      Este entrelazado, que consigue que los errores se distribuyan entre las palabras haciendo más eficiente el bit de paridad, sólo afecta a los 704 bits de sonido o datos, no a la cabecera de la trama.

    6. Estructura de la trama

      Las muestras digitalizadas de las señales de audio después del proceso anterior se configuran según una estructura de trama de 728 bits, en que el orden de transmisión de bits es de la forma:

      • 24 bits de cabecera de trama:

        • Palabra de alineación de trama (FAW): bits 1,2,...,8

          • Sirve para que el receptor pueda sincronizarse con el emisor.

          • Siempre los mismos bits: 01001110.

        • Palabra de control (C0,...,C4): bits 9,10,11,12,13

          • C0 cambia de estado cada ocho tramas, de modo que un ciclo completo de esta señal abarca 16 tramas. El tipo de información que transportan las tramas sólo puede cambiar con el flanco ascendente de este bit.

          • Los tres bits siguientes definen la naturaleza de la información que se está enviando:

            C1 C2 C3 MODO
            0 0 0 Sonido estéreo
            0 1 0 Dos señales mono
            1 0 0 Una señal mono y datos a 352 kbit/s
            1 1 0 Datos a 704 kbit/s

          • El último bit de la palabra de control (C4) es el bit de conmutación a sonido reserva, que vale 1 si la portadora Nicam lleva la misma información que el canal de sonido convencional analógico (con lo que el receptor podría conmutar automáticamente al canal de sonido en FM si falla la señal digital), y 0 en caso contrario.

        • Datos adicionales (AD0,...,AD10): bits 14,15,...,24

          • Actualmente no se utilizan , y están reservados para datos adicionales. Estos bits constituyen un tercer canal digital a 11 kbit/s complemetamente independiente.

        • 704 bits de información útil

          • En cada trama se transportan 64 palabras de sonido o datos, de 11 bits cada una (el primer bit de cada palabra representa el bit menos significativo, y el último el bit de paridad):

            • Modo estéreo: las muestras del canal izquierdo ocupan las posiciones impares, y las del derecho las pares.

            • Modo dual: cada trama lleva información de un canal únicamente, con lo cual se transmiten en cada una y seguidos, dos bloques comprimidos de 32 muestras cada uno. La información del canal A viaja en las tramas impares y las del canal B en las pares (considerando como trama número uno a la primera de un grupo de 16 que comienza con el flanco ascendente del bit de indicación de trama).

            • Modo sonido+datos: el canal de sonido va en las tramas impares y el de datos en las pares.

          • A estos 704 bits con la estructura descrita son a los que se aplica posteriormente el entrelazado.

    7. Aleatorización

      Para mejorar la compatibilidad de la señal Nicam con el video y sonido analógicos, tanto del propio canal como del posible adyacente superior, se precisa que su espectro sea semejante al ruido y que sea invariable con la transmisión de sonido o datos. Para ello, se aleatoriza la señal de trama sumándole en módulo 2 una señal pseudoaleatoria definida por el generador polinomial y palabra de aleatorización siguientes:

      x9 + x4 + 1

      111111111

      De este proceso sólo se excluye la palabra de alineación de trama, que se utiliza para sincronizar el generador pseudoaleatorio del receptor.

      La secuencia generada tiene 511 bits y se arranca con el primer bit a aleatorizar (C0). Su limitada longitud no reduce la eficacia de la aleatorización y facilita la construcción del decodificador del receptor.

    8. Modulación

      La trama de 728 kbit/s modula una portadora situada, en los sistemas B/G, 5.85 MHz por encima de la portadora de video del canal de televisión. Esta frecuencia se determinó como resultado de pruebas subjetivas de compatibilidad de los receptores monofónicos existentes, y de la obtención de mínimos niveles de interferencia desde el canal adyacente superior.

      El tipo de modulación utilizada para reducir el ancho de banda y mantener una recepción fiable con receptores económicos fue la denominada Modulación Diferencial de Fase en Cuadratura (DQPSK), y con ella el flujo de símbolos transmitidos se reduce a la mitad (364 kbaud/s, o lo que es lo mismo: dos canales de 364 kbit/s que modulan dos portadoras de la misma frecuencia en cuadratura). Es decir, por cada dos bits transmitidos se genera un cambio de fase de la portadora de la forma:

      Datos Cambio de fase
      0 0 0 o
      0 1 -90 o
      1 0 -270 o
      1 1 -180 o

      La señal a la salida del modulador tendrá la forma:

      donde:

      • Ai = 1,4142*exp(j*Fi): estado de la fase de la portadora (con Fi = 45o, 135o, 225o ó 315o).
      • Ti: período de símbolo (1/364 kHz).
      • w0: frecuencia de la portadora (5.85 MHz en los sistemas B/G).
      • h(t): respuesta impulsional del filtro de transmisión, que en frecuencia tiene la forma:

        donde:

        • T: período de símbolo.
        • k: factor de roll-off (exceso de ancho de banda respecto del mínimo posible de 1/2T).

        Utilizando un filtro análogo en el receptor se obtiene una respuesta global en coseno alzado, que cumple el criterio de Nyquist sobre los pulsos que no producen interferencia entre símbolos. En los sistemas B/G se utiliza un factor de roll-off de 0.4, y en el sistema I el factor es de 1.

      La portadora Nicam se encuentra a un nivel relativo de -20 dB respecto al nivel de pico de la portadora de video. La portadora convencional de audio en FM está a -10 dB en el sistema I y a -13 dB en los sistemas B/G.

      Los sistemas B/G sitúan la portadora Nicam 5.85 MHz por encima de la video, mientras que el sistema I la sitúa a 6.552 MHz.


  5. Bibliografía

Copyright © Jose Enrique Puente. All Rights Reserved.