ST-2110 :1. Introduction & Historique

Depuis son apparition, le standard ST 2110 est présenté comme une véritable révolution technologique. Après plusieurs années où il a largement été mis en avant sur les stands de l’IBC ou dans les brochures marketing, le ST 2110 commence à sortir des labos pour entrer en production chez les diffuseurs les mieux équipés, et son adoption s’accélère.

En tant qu’éditeurs de solutions Broadcast, nous avons bien sûr suivi l’évolution de ce standard dès sa sortie, pour l’intégrer à nos produits…​ Mais nous devons l’avouer, notre regard sur ce standard est bien plus nuancé que les articles superlatifs croisés sur internet. Dans cette série, nous plongerons dans les normes pour étayer notre point de vue, en espérant que vous nous partagiez le votre.

Nous avons découpé notre analyse en 6 volets :

1 - Historique

Les technologies qui ont précédé le standard ST-2110.

2 - Vue d’ensemble

Les atouts fondamentaux et limites du ST-2110.

3 - Codecs et infrastructure

Impact sur les réseaux et le choix des formats.

4 - Transport et signalisation

Protocoles de transmission, limitations et pistes d’amélioration.

5 - NMOS

La brique indispensable pour une production ST 2110.

6 - Conclusion

Faut-il investir dans les sociétés de recyclage de câbles coaxiaux ?

 

Notre expertise technique, notamment sur les protocoles de transmission audiovisuelle, nous donne une vision précise des défis d’implémentation. Cependant, cette focale technique combinée à une vilaine tendance au pragmatisme peut parfois nous faire passer à côté d’enjeux stratégiques et politiques plus larges : nous comptons sur vous pour venir enrichir notre réflexion et nous partager la vôtre sur notre page linkedIn.

Historique

Il peut sembler étrange et un peu inutile de devoir repartir aussi loin que l’analogique alors que le sujet qui nous intéresse est censé parler d’une technologie révolutionnaire. Cependant, nous ne pouvons que constater que les évolutions successives enchaînées par le transport de flux vidéo "en bande de base" se sont systèmatiquement construites sur l’ancêtre qu’ils sont censés remplacer. Si l’absence de rupture technologique franche est rassurante, l’héritage du passé pèse malgré tout assez lourdement sur l’efficacité des standards.

L’analogique : Un héritage encore présent aujourd’hui

La notion de signal en "bande de base" date de cette époque. Les intervalles de blanking sont utilisés pour insérer des données auxiliaires. En point à point, le signal est transporté sur des câbles coaxiaux 75 ohms.

Vidéo

Pour comprendre l’origine du SMPTE 2110, il faut revenir aux signaux analogiques. Le standard PAL en est un bon exemple, avec son format composite CVBS (Composite Video Blanking and Sync)

Un signal vidéo composite PAL occupe une bande passante utile d’environ 5 à 5,5 MHz en bande de base. Ce signal comprend la luminance, la chrominance (codée sur une sous-porteuse en quadrature) ainsi que les tops de synchronisation et de blanking.

Une fois démodulé, le signal vidéo pilote directement le tube cathodique de notre bon vieux téléviseur : le faisceau d’électrons balaie les luminophores de gauche à droite et de haut en bas. À la fin de chaque ligne et de chaque image, le rayon doit revenir à sa position de départ : pendant ces intervalles de retour, le signal vidéo est toujours transmis mais le faisceau est éteint — ce sont les intervalles de blanking. Ces intervalles de blanking sont tout de même exploités en y insérant des données auxiliaires, comme par exemple le télétexte ou les timecodes.

Audio

De son côté, l’audio est complètement décorrélé du signal vidéo. Il transite d’ailleurs par d’autres médias : câbles RCA, liaison dédiée sur la prise péritel.

Transmission

Dans le monde professionnel, les signaux vidéo sont transportés en point à point sur un câble coaxial de 75 ohms, équipés de connecteurs BNC.

En diffusion hertzienne, le signal composite PAL module la porteuse vidéo en AM à bande latérale résiduelle (VSB), tandis que l’audio est transmis sur une porteuse séparée, modulée en FM et décalée de quelques mégahertz au-dessus de la porteuse vidéo.

Un transpondeur VHF
Figure 1. Spectre d’une transmission PAL-I (Source Wikipedia)

SDI : Passerelle analogique / numérique

Une technologie robuste et fiable, qui apporte aux signaux audiovisuels la fiabilité d’une transmission numérique. On y retrouve entre autres le câble coaxial, ainsi que les intervalles de blanking hérités de l’analogique.

Normalisé par le SMPTE, le SDI est une numérisation quasi directe du signal vidéo analogique. Le signal est échantillonné puis transporté en point à point sur une liaison série portée par un câble coaxial de 75 ohms.

Comme toute liaison série, l’horloge n’est pas transmise séparément mais récupérée par le récepteur directement à partir du flux, garantissant ainsi la bonne synchronisation des deux équipements. Si un équipement doit traiter plusieurs flux en provenance de sources différentes, il faut alors asservir l’ensemble à une horloge commune via un port "genlock", afin d’assurer l’unicité des fréquences.

Concernant les données, le signal vidéo est transmis de manière quasiment identique à l’analogique, y compris les intervalles de blanking horizontaux et verticaux qui continuent de servir à transporter des données associées. On y insère toujours, par exemple, les sous-titres (encodés sous forme de télétexte, norme OP-47) ou encore les timecodes (LTC et VITC).

Contrairement à la diffusion PAL, la norme SDI prévoit également l’intégration des canaux audio. A cette fin, les pistes audio sont encapsulées …​ dans les intervalles de blanking.

L’avantage principal du SDI par rapport au PAL vient de sa transmission numérique, bien plus robuste aux erreurs : lorsque le signal passe correctement, sa restitution sans perte de qualité est garantie, quelle que soit la longueur du câble ou les perturbations électromagnétiques présentes sur le site.

La robustesse du câble coaxial et la simplicité de la liaison série ont permis à cette technologie de suivre les évolutions : résolutions HD, puis 4K, HDR, Dolby…

Même si technologiquement le SDI n’est qu’une simple liaison série transportant une version numérisée de notre signal analogique, ce standard couvre tout ce que l’on attend dans l’industrie Broadcast :

  • Fiable et robuste,

  • Facile à déployer et à maintenir,

  • Bien intégré au monde PC grâce à des fabricants comme DekTec, et donc intégrable facilement dans les applicatifs de montage ou broadcast,

  • Accessible économiquement : on trouve maintenant des grilles 80x80 12G-SDI à moins de 10 K€.

ST-2022-6 : Une première passerelle SDI vers IP

Une passerelle SDI / IP réalisée selon l’état de l’art, sans plus de valeur ajoutée.

Avec l’évolution des réseaux IP, et la démocratisation des liaisons 10 Gbps puis 25 Gbps, le transport de signaux SDI sur IP est devenu possible, sans avoir besoin de trop y réfléchir. ST-2022-6 est un protocole "passerelle" entre le monde SDI et l’univers IP : le signal est envoyé sans aucune modification via une liaison IP : seul le mode de transport varie.

Pour ce faire, ST 2022-6 se base sur RTP, dont il respecte parfaitement la philosophie. Il ajoute dans la charge utile un en-tête spécifique qui fournit les informations d’horloge nécessaires à la reconstruction du signal ainsi que la description du format vidéo transmis.

Cependant, il ne tire pas grand avantage des possibilités offertes par le changement de médium, notamment le fait de ne plus être limité par une liaison série, et son adoption a été assez marginale, dans la mesure où - tel quel - il ne fait que remplacer les grilles SDI et des câbles coaxiaux par des actifs réseau, et des fibres optiques.

Les standards hors SDI

ST 2110 est bien loin d’être le premier standard se penchant sur la transmission de flux audiovisuels en IP, et les avantages tout comme les inconvénients qu’il présente ont déjà été traités à de multiples reprises. Étonnamment, les solutions proposées couvraient déjà la majorité des avantages du ST 2110, souvent en utilisant les mêmes technologies.

Les standards IETF

L’IETF (Internet Engineering Task Force) s’est penchée à de multiples reprises sur les problématiques de transport de flux audiovisuels.

En 1996, elle publiait un standard ouvert : la RFC 1890 Profile for Audio and Video Conferences with Minimal Control, qui s’appuie sur RTP pour transporter des flux audiovisuels. Séparation des essences, définitions de profils comprenant entre autres des codecs « lossless » comme le PCM 16 bits pour l’audio, et des codecs simples pour la vidéo comme H.261 ou JPEG. Elle a été revue et corrigée en 2003 avec la publication de la RFC 3551. Elle est complétée par d’autres standards, notamment :

RFC 8860 Sending Multiple Types of Media in a Single RTP Session qui permet de multiplexer le transport de plusieurs essences sur le même flux multicast.

RFC 4571 : Framing Real-time Transport Protocol (RTP) and RTP Control Protocol (RTCP) Packets over Connection-Oriented Transport, qui propose une méthode pour encapsuler les flux RTP dans une liaison TCP/IP.

NDI - Network Device Interface

Toujours côté transmission vidéo, NewTek publiait en 2015 le standard NDI, protocole accompagné d’un SDK gratuit. Ce standard prévoit non seulement le transport des flux audiovisuels, mais il intègre aussi la découverte des équipements sur le réseau, ainsi que les mécanismes nécessaires au contrôle des équipements.

En l’état actuel des choses, il pourrait éventuellement lui être reproché d’être un standard propriétaire, contrôlé par une unique société et éventuellement de ne pas intégrer de codec réellement lossless.

OMT - Open Media Transport

OMT est le pendant ouvert du NDI. Rendu public début 2024, il partage la plupart des fonctionnalités offertes par le NDI - y compris l’adoption d’un codec visually lossless. Comme NDI, un SDK gratuit est fourni, et une implémentation est intégrée à ffmpeg, ce qui va permettre de faire des essais excessivement rapides et à faible coût.

Il est intéressant de noter que ce standard a fait le choix d’un transport sur TCP/IP, ceci peut sembler contre-intuitif au vu des débits considérés. Contrairement à UDP, TCP/IP assure la transmission des paquets : son usage permet donc effectivement d’éviter de programmer une surcouche pour récupérer les éventuels paquets perdus. Cependant, cela implique plusieurs inconvénients, et notamment l’obligation d’avoir un canal retour (en TCP/IP chaque paquet est acquitté), ainsi qu’un jitter dû aux retransmissions. Ce n’est pas forcément rédhibitoire, mais cela pose des contraintes fortes sur le réseau sous-jacent.

2 - Vue d’ensemble

Bibliographie

[1] SMPTE ST 2022-6:2012. Transport of High Bit Rate Media Signals over IP Networks. Society of Motion Picture and Television Engineers, 2012.

[3] H. Schulzrinne, S. Casner, R. Frederick, and V. Jacobson. RTP Profile for Audio and Video Conferences with Minimal Control. RFC 3551, IETF, juillet 2003.

[4] H. Schulzrinne, S. Casner, R. Frederick, and V. Jacobson. RTP Profile for Audio and Video Conferences with Minimal Control. RFC 1890, IETF, janvier 1996.

[5] M. Westerlund, C. Perkins, and J. Lennox. Sending Multiple Types of Media in a Single RTP Session. RFC 8860, IETF, janvier 2021.

[8] Open Media Transport Consortium. OMT Specification v1.0. 2024.

[9] SMPTE ST 2110-10:2017. SMPTE ST 2110-10:2017 Professional Media Over Managed IP Networks: System Timing and Definitions. Society of Motion Picture and Television Engineers, 2017.