Thèse soutenue

Peuplement d'une base de connaissance fondé sur l'exploitation d'un graphe d'entités

FR  |  
EN
Auteur / Autrice : Md Rashedur Rahman
Direction : Brigitte Grau
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 17/04/2018
Etablissement(s) : Université Paris-Saclay (ComUE)
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'informatique pour la mécanique et les sciences de l'ingénieur (Orsay, Essonne ; 1972-2020)
établissement opérateur d'inscription : Université Paris-Sud (1970-2019)
Entreprise : Institut de recherche technologique SystemX (Palaiseau, Essonne)
Jury : Président / Présidente : Chantal Reynaud
Examinateurs / Examinatrices : Brigitte Grau, Chantal Reynaud, Patrice Bellot, Marc Spaniol, Sophie Rosset, Florian Boudin
Rapporteurs / Rapporteuses : Patrice Bellot, Marc Spaniol

Résumé

FR  |  
EN

Le peuplement de base de connaissance (KBP) est une tâche importante qui présente de nombreux défis pour le traitement automatique des langues. L'objectif de cette tâche est d'extraire des connaissances de textes et de les structurer afin de compléter une base de connaissances. Nous nous sommes intéressés à la reconnaissance de relations entre entités. L'extraction de relations (RE) entre une paire de mentions d'entités est une tâche difficile en particulier pour les relations en domaine ouvert. Généralement, ces relations sont extraites en fonction des informations lexicales et syntaxiques au niveau de la phrase. Cependant, l'exploitation d'informations globales sur les entités n'a pas encore été explorée. Nous proposons d'extraire un graphe d'entités du corpus global et de calculer des caractéristiques sur ce graphe afin de capturer des indices des relations entre paires d'entités. Pour évaluer la pertinence des fonctionnalités proposées, nous les avons testées sur une tâche de validation de relation dont le but est de décider l'exactitude de relations extraites par différents systèmes. Les résultats expérimentaux montrent que les caractéristiques proposées conduisent à améliorer les résultats de l'état de l'art.