Thèse soutenue

Construction semi-automatique de ressources pour la fouille d'opinion
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Joseph Lark
Direction : Emmanuel MorinSebastián Peña Saldarriaga
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 17/10/2017
Etablissement(s) : Nantes
Ecole(s) doctorale(s) : École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)
Partenaire(s) de recherche : COMUE : Université Bretagne Loire (2016-2019)
Laboratoire : Laboratoire des Sciences du Numérique de Nantes
Jury : Président / Présidente : Pascale Sébillot
Rapporteurs / Rapporteuses : Chloé Clavel, Xavier Tannier

Mots clés

FR

Mots clés contrôlés

Mots clés libres

Résumé

FR  |  
EN

Identifier les leviers de satisfaction des consommateurs est aujourd’hui capital dans un monde où la relation que tisse une entreprise avec ses clients est sa plus grande richesse. Le domaine de la fouille d’opinion, dans lequel s’inscrit cette thèse, propose des méthodes permettant de répondre à ce besoin. Celles-ci nécessitent cependant une mise à jour constante de ressources spécialisées qui sont la pierre angulaire des outils d’analyse d’opinion. Ce travail vise à développer des stratégies d’acquisition et de structuration de ces ressources, qui prennent la forme de lexiques, de patrons morpho-syntaxiques ou de textes annotés. Chacune de ces formes présente des difficultés d’acquisition propres, auxquelles s’ajoute la complexité de mettre à jour ces ressources en fonction de la langue à traiter ou du domaine des corpus analysés, notion primordiale en fouille d’opinion. Premièrement, nous menons une étude des éléments fondamentaux autour desquels l’opinion est construite dans le discours, conduisant à une nouvelle modélisation en étiquetage de séquence de l’opinion. Nous traitons ensuite la question de l’apport des différents types de ressources, dont il ressort que la meilleure stratégie est de les utiliser de concert. Enfin, nous proposons des méthodes d’acquisition pour chacune des ressources répondant non seulement aux besoins de la fouille d’opinion mais également aux contraintes du contexte industriel au sein duquel ces recherches sont menées.