Indexation et recherche conceptuelles de documents pédagogiques guidées par la structure de Wikipédia

par Carlo Abi Chahine

Thèse de doctorat en Informatique

Le président du jury était Monique Grandbastien.

Les rapporteurs étaient Nathalie Aussenac-Gilles, Yolaine Bourda.


  • Résumé

    Cette thèse propose un système d'aide à l'indexation et à la recherche de documents pédagogiques fondé sur l'utilisation de Wikipédia.l'outil d'aide à l'indexation permet de seconder les documentalistes dans la validation, le filtrage et la sélection des thématiques, des concepts et des mots-clés issus de l'extraction automatique d'un document. En effectuant une analyse des données textuelles d'un document, nous proposons au documentaliste une liste de descripteurs permettant de représenter et discriminer le document. Le travail du documentaliste se limite alors à une lecture rapide du document et à la sélection et suppression des descripteurs suggérés par le système pour rendre l'indexation homogène, discriminante et exhaustive. Pour cela nous utilisons Wikipédia comme base de connaissances. Le modèle utilisé pour l'extraction des descripteurs permet également de faire de la recherche d'information sur un corpus de document déjà indexé.

  • Titre traduit

    Learning document indexing and retrieval nased on wikipedia's structure


  • Résumé

    This thesis proposes an indexing suupport and information retrieval system for learning resources based on Wikipedia.The indexing support system assists the archivists in fetching the descriptors for a given document. The system analyses the textual content of the document and suggests to the archivists a set of relevant descriptors for this document. After a speed-reading of the document and superficail analysis, the archivists can validate, filter and select the descriptors they consider relevant. To perform this task, we decide to use Wikipedai as knowledge base. The suggest model also anables us to carry out information retrieval tasks on the previously analyzed documents of a corpus.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Institut national des sciences appliquées (Rouen Normandie).
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.