Enrichissement automatique des scripts de séries TV et films

par Benjamin Maurice

Projet de thèse en Informatique

Sous la direction de Hervé Bredin et de Camille Guinaudeau.

Thèses en préparation à Paris Saclay , dans le cadre de Sciences et Technologies de l'Information et de la Communication , en partenariat avec LIMSI - Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur (laboratoire) , TLP - Traitement du Langage Parlé (equipe de recherche) et de Université Paris-Sud (établissement de préparation de la thèse) depuis le 01-11-2017 .


  • Résumé

    L'objectif de ce projet est d'exploiter le flux audio en profondeur pour enrichir de façon automatique les scripts et sous-titres de séries télévisées et de films, en y ajoutant automatiquement les noms et positions des personnages. locuteur A — 'Nice to meet you, I am Leonard, and this is Sheldon. We live across the hall.' locuteur B — 'Oh. Hi. I'm Penny.' locuteur A — 'Sheldon, what the hell are you doing?' locuteur C — I am not quite sure yet. Do you know where Howard lives? En lisant ces deux conversations, un humain peut facilement déterminer que 'locuteur A' s'appele 'Leonard', 'locuteur B' est 'Penny' et 'locuteur C' est 'Sheldon'. L'objectif de ce projet est de combiner des approches de traitement automatique de la langue naturelle et de la parole pour arriver à ce résultat automatiquement.

  • Titre traduit

    Automatic enrichment of TV series and movies transcripts


  • Résumé

    The goal of this project is to fully exploit the audio stream to automatically enrich speech transcripts and subtitles of TV series and movies with the name and position of the characters. speaker A — 'Nice to meet you, I am Leonard, and this is Sheldon. We live across the hall.' speaker B — 'Oh. Hi. I'm Penny.' speaker A — 'Sheldon, what the hell are you doing?' speaker C — I am not quite sure yet. Do you know where Howard lives? Just looking at these two short conversations, a human can easily infer that 'speaker A' is actually 'Leonard', 'speaker B' is Penny and 'speaker C' is Sheldon. The objective of this project is to combine natural language processing and speech processing to do the same automatically.