Thèse soutenue

Indexation et recherche conceptuelles de documents pédagogiques guidées par la structure de Wikipédia

FR  |  
EN
Auteur / Autrice : Carlo Abi Chahine
Direction : Jean-Pierre PecuchetNathalie ChaignaudJean-Philippe Kotowicz
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 14/10/2011
Etablissement(s) : Rouen, INSA
Ecole(s) doctorale(s) : École doctorale sciences physiques mathématiques et de l'information pour l'ingénieur (Saint-Etienne-du-Rouvray, Seine-Maritime ; ....-2016)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'informatique, de traitement de l'information et des systèmes (Saint-Etienne du Rouvray, Seine-Maritime ; 2006-...)
Jury : Président / Présidente : Monique Grandbastien
Rapporteurs / Rapporteuses : Nathalie Aussenac-Gilles, Yolaine Bourda

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Cette thèse propose un système d'aide à l'indexation et à la recherche de documents pédagogiques fondé sur l'utilisation de Wikipédia.l'outil d'aide à l'indexation permet de seconder les documentalistes dans la validation, le filtrage et la sélection des thématiques, des concepts et des mots-clés issus de l'extraction automatique d'un document. En effectuant une analyse des données textuelles d'un document, nous proposons au documentaliste une liste de descripteurs permettant de représenter et discriminer le document. Le travail du documentaliste se limite alors à une lecture rapide du document et à la sélection et suppression des descripteurs suggérés par le système pour rendre l'indexation homogène, discriminante et exhaustive. Pour cela nous utilisons Wikipédia comme base de connaissances. Le modèle utilisé pour l'extraction des descripteurs permet également de faire de la recherche d'information sur un corpus de document déjà indexé.