Thèse soutenue

FR
Auteur / Autrice : Mohammed Hasanuzzaman
Direction : Stéphane Ferrari
Type : Thèse de doctorat
Discipline(s) : Informatique et applications
Date : Soutenance en 2016
Etablissement(s) : Caen
Ecole(s) doctorale(s) : École doctorale structures, informations, matière et matériaux (Caen1992-2016)
Partenaire(s) de recherche : Laboratoire : Groupe de recherche en informatique, image, automatique et instrumentation de Caen (1995-....)
autre partenaire : Normandie Université (2015-....)
Jury : Président / Présidente : Brigitte Grau
Examinateurs / Examinatrices : Stéphane Ferrari, Brigitte Grau, Patrice Bellot, Adam Jatowt
Rapporteurs / Rapporteuses : Patrice Bellot, Adam Jatowt

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

La capacité à capturer l’information temporelle dans le langage naturel, qu’elle soit exprimée de manière explicite, implicite, ou par connotation, est essentielle pour de nombreuses applications telles l’extraction d’information, les systèmes de question-réponse, le résumé automatique. Associer une orientation temporelle au sens des mots pour capter l’information temporelle en langue est une tâche relativement directe pour les humains utilisant leurs connaissances sur le monde. Une base de connaissances lexicales associant automatiquement cette orientation au sens des mots serait de fait cruciale pour les tâches automatiques visant à interpréter la temporalité dans les textes. Dans cette recherche, nous présentons une ontologie temporelle, TempoWordNet, où les synsets de WordNet sont enrichis avec une information sur leur temporalité intrinsèque : atemporel, passé, présent et futur. Nous étudions et expérimentons différentes stratégies de construction, lexico-sémantique, probabiliste et hybride. TempoWordNet est évalué de manière intrinsèque et extrinsèque, une ressource fiable devant à la fois contenir un étiquetage temporel de haute qualité et améliorer les performances de certaines tâches externes. Les deux types d’évaluations montrent la qualité et l’intérêt de la ressource. Pour compléter nos travaux, nous étudions aussi comment une application de recherche telle un moteur de recherche peut tirer parti de cette ressource. Le retour des utilisateurs de TempoWordNet a encouragé à améliorer encore la ressource. Nous terminons donc en proposant une nouvelle stratégie de construction permettant d’améliorer de manière conséquente TempoWordNet.