L’INA propose une plateforme pour décrypter la télé et la radio grâce à l’IA

Le nouveau site de l'INA propose une vision statistique des programmes audiovisuels

L’institut national de l’audio-visuel (INA) lance data.ina.fr une nouvelle plateforme destinée à décrypter la TV et la radio grâce à l’intelligence artificielle et en faisant appel à ses propres données. Par exemple, une étudiante en économie qui souhaite connaitre la couverture médiatique du terme “shrinkflation” dans les matinales de la radio, pourra y trouver des éléments de réponses sur une sélection de chaînes qu’elle aura identifiées.

Des capsules directement en provenance de notre passé grâce à l’INA

Jusqu’à présent, l’INA a marqué les esprits notamment via ses publications sur Youtube d’extraits d’émissions TV qui permettent de se pencher sur notre passé tel qu’il a été capté par l’audio-visuel national. De quoi découvrir l’opinion des Français captée au fil des ans, et en nous faisant ressentir profondément la transformation de notre société durant ces 50 dernières années.

La nouvelle plateforme est présentée comme révolutionnant la manière de comprendre les médias audiovisuels français grâce à l’intelligence artificielle. Les données du dépôt légal de l’audiovisuel sont utilisables par tous. Le site « data.ina.fr » permet d’exploiter les données de  référence de la télévision et de la radio françaises grâce à des outils d’IA, dont un algorithme développé par les équipes de recherche de l’INA.


La chaîne de traitements de l’INA pour sa nouvelle plateforme (Cliquez pour agrandir)

Les informations communiquées par l’INA font apparaître l’usage de différents dispositifs techniques de transcription et d’analyse des contenus. On relève la présence de Whisper un outil de transcription « speech to text » d’OpenAI placé en Open Source et de Textrazor, une API (interface informatique) de NLP (Natural Language Processing) afin d’extraire les signifiants d’un texte (Qui, quoi, pourquoi et comment).

Data visualisation des tendances statistiques

La plateforme propose de la datavisualisation afin de mettre en lumière des tendances statistiques majeures des médias et de la société avec une approche qui vise à être transparente et pédagogique. Le site est alimenté par des flux de 20 chaînes de télévision et de radio. Il permet d’explorer de manière personnalisée les grandes tendances de présence médiatique.

Le site est destiné au grand public, aux journalistes, aux experts et aux chercheurs. data.ina.fr  propose d’accéder à des informations précieuses à travers des cartes et des graphiques interactifs. Le lancement s’effectue avec 5,5 ans d’historique du 1er  janvier 2019 au 30 juin 2024. Il y aura un événement éditorial deux fois par an. A chaque mise à jour, le site bénéficiera des données les plus récentes d’une plus grande profondeur historique.  

Trois grandes actions de contrôle (Cliquez pour agrandir)

Une centaine de spécialistes ont contribué au site

Pour cette plateforme, 27 millions d’heures de documents TV et radio au 31/12/23 sont stockées et archivées  dont une partie a déjà fait l’objet de traitements par des outils IA. L’INA a créé une direction « Data et tech » en 2021. Une dizaine de métiers sont sollicités pour cette initiative, des Data analystes, des Data scientists, des Data engineers, des  architectes d’infrastructures, etc. soit une centaine de personnes ayant contribué au site.

La direction Data et technologies à l’INA : un état dans l’état selon la Cour des Comptes ➔ lire l’article

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *