Indexation et recherche conceptuelles de documents pédagogiques guidées par la structure de Wikipédia
Auteur / Autrice : | Carlo Abi Chahine |
Direction : | Jean-Pierre Pecuchet, Nathalie Chaignaud, Jean-Philippe Kotowicz |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 14/10/2011 |
Etablissement(s) : | Rouen, INSA |
Ecole(s) doctorale(s) : | École doctorale sciences physiques mathématiques et de l'information pour l'ingénieur (Saint-Etienne-du-Rouvray, Seine-Maritime ; ....-2016) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'informatique, de traitement de l'information et des systèmes (Saint-Etienne du Rouvray, Seine-Maritime ; 2006-...) |
Jury : | Président / Présidente : Monique Grandbastien |
Rapporteurs / Rapporteuses : Nathalie Aussenac-Gilles, Yolaine Bourda |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Cette thèse propose un système d'aide à l'indexation et à la recherche de documents pédagogiques fondé sur l'utilisation de Wikipédia.l'outil d'aide à l'indexation permet de seconder les documentalistes dans la validation, le filtrage et la sélection des thématiques, des concepts et des mots-clés issus de l'extraction automatique d'un document. En effectuant une analyse des données textuelles d'un document, nous proposons au documentaliste une liste de descripteurs permettant de représenter et discriminer le document. Le travail du documentaliste se limite alors à une lecture rapide du document et à la sélection et suppression des descripteurs suggérés par le système pour rendre l'indexation homogène, discriminante et exhaustive. Pour cela nous utilisons Wikipédia comme base de connaissances. Le modèle utilisé pour l'extraction des descripteurs permet également de faire de la recherche d'information sur un corpus de document déjà indexé.