Thèse en cours

Interprétation sémantique de transcriptions verbales de dialogues techniques en Français et en Anglais

FR  |  
EN
Auteur / Autrice : Moncef Boukhatem
Direction : Leo LibertiDavide Buscaldi
Type : Projet de thèse
Discipline(s) : Informatique, données, IA
Date : Inscription en doctorat le 01/02/2020
Etablissement(s) : Institut polytechnique de Paris
Ecole(s) doctorale(s) : École doctorale de l'Institut polytechnique de Paris
Partenaire(s) de recherche : Laboratoire : LIX - Laboratoire d'informatique

Résumé

FR  |  
EN

Le principal sujet de cette thèse CIFRE, en partenariat avec le cabinet de conseil en IT Retail OneTeam, est le Natural Language Processing (NLP). Sa spécificité est la conception et la mise en œuvre d'un ChatBot à usage interne. Plus précisément, ses cas d'utilisation seront d'aider à la relation entre les clients de OneTeam et son service client en ligne, d'aider à gérer les tickets techniques concernant les difficultés des clients avec le logiciel de vente au détail. Un ChatBot est une interface NLP entre un humain et une machine. Il est censé comprendre un sous-ensemble limité de langage naturel pertinent pour le contexte de l'application, fournir une d'interaction sous forme de dialogue et être capable de traduire les demandes humaines dans un langage soit semi-formel (à communiquer à un responsable technique) , ou un langage formel (par exemple une requête de recherche), ou un contexte pragmatique (par exemple implémenter un ensemble d'actions tel que lancer un logiciel ou exécuter une requête SQL), ou une combinaison de ceux-ci. Dans le cadre de cette thèse, le ChatBot doit comprendre une description informelle d'un problème technique côté client lié à l'une des applications des suites logicielles de OneTeam, et fournir une interface conditionnelle basée sur un choix booléen: soit la description correspond à un problème existant dans les tickets fermés stockés dans la base de données, ou non. Dans le premier cas, le ChatBot devrait construire la description pragmatique formelle nécessaire pour résoudre le problème client à portée de main. Dans le deuxième cas, le ChatBot doit traduire la description informelle en un ticket ouvert semi-formel à écrire dans la base de données des tickets. Bien que la conception et le déploiement de ChatBots ne soient pas en soi nouveau, le système global requis par OneTeam présente des fonctionnalités qui offre du challenge : 1. la description informelle en entrée peut être une transcription d'un message téléphonique, ce qui rend le texte beaucoup plus entaché d'erreurs, de signes de ponctuation et donc plus difficile à comprendre; 2. le langage limité à comprendre comprend plusieurs acronymes qui peuvent être mal orthographiés dans la description informelle, ainsi que des phrases non grammaticales; 3. dans le cas où le ChatBot doit engendrer directement la solution, il n'y a aucune marge d'erreur dans la compréhension et la bonne traduction formelle pragmatique. Aborder ces caractéristiques nécessitera des recherches scientifiques entre l'algorithmique et la linguistique computationnelle. Un autre défi est que le texte peut être en français ou en anglais, le français étant de loin plus probable. Bien que cette fonctionnalité en elle-même ne soit pas nécessairement originale, il existe une quantité considérablement plus limitée de ressources logicielles NLP disponibles en français par rapport à l'anglais. Cela nécessitera sans aucun doute une conception et une mise en œuvre supplémentaires des tâches de NLP de bas niveau.