Indexation des documents dans un référentiel métier avec approche ontologique : Le système MAID au sein de l'Intranet de Suez-Environnement

par Wilfried Njomgue Sado

Thèse de doctorat en Technologies de l'information et des systèmes

Sous la direction de Thierry Denoeux.

Soutenue en 2005

à Compiègne .


  • Résumé

    Ces travaux présentent le système MAID, Multi Approche pour l'Indexation des Documents à travers l'approche sémantico linguistico statistique mise en place pour l'indexation semiautomatique des documents de Suez-Environnement. Elle combine en amont l'annotation sémantique du document à indexer via une ontologie de domaine, l'analyse linguistique du document et enfin l'analyse statistique par la décomposition en valeurs singulières des mots composant le document. Nous mettrons également en évidence l'apport de la sémantique par rapport à l'approche linguistico statistique. Enfin, nous présentons les résultats de l'expérimentation menée sur un corpus de Suez-Environnement et les perspectives dégagées dans ce domaine.

  • Titre traduit

    Document indexing with ontological approach in a profession referential : System MAID within Suez-Environment Intranet


  • Résumé

    This work presents an automatic method of indexing documents based on semantic, linguistic and finally statistics approaches. System MAID, Multi-Approach for the Indexing of Documents applies successively these approaches: a semantic analysis of water domain' s ontology that annotates the document, a linguistic analysis that extracts significant terms, a statistical analysis by the decomposition in singular values of words composing the document. Here, weighting terms are set to take advantages of both their position compared to other terms (co-occurrence) and their local and global context. We will also highlight the contribution of semantics compared to the linguistic-statistic approach. MAID was developed in order to suggest assignments topics of documents to a referential. Finally, we will present experiments results (with or without semantic treatment) and evaluation carried out on documents of Suez-Environnement.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (XIV-231 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. 244 réf.

Où se trouve cette thèse ?

  • Bibliothèque : Université de Technologie de Compiègne. Service Commun de la Documentation.
  • Disponible pour le PEB
  • Cote : 2005 NJO 1572
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.