Modélisation et réalisation d'un système prototype interactif de recherche d'information multimédia à forte composante textuelle

par Sid-Ahmed Lamrous

Thèse de doctorat en Contrôle des Systèmes

Sous la direction de Philippe Trigano.

Soutenue en 1999

à Compiègne .


  • Résumé

    Ce travail présente une recherche sur la conception d'une interface pour un système d'aide a la recherche d'informations. Les supports vises appartiennent au domaine du multimédia et ne sont pas uniquement constitués de textes. Le système prototype baptisé mdocspace adopte une indexation orientée documents en ce sens qu'elle utilise uniquement le corpus de documents pour extraire l'information jugée pertinente. Plus précisément, réutilisant la loi de zipf, l'indexation proposée se situe dans la lignée des indexations en texte intégral dites statistiques, se basant sur le fait que l'apparition d'un mot est fortement corrélée à la pertinence du terme qui lui est associé. Le but de ce travail est de proposer une nouvelle approche statistique et de l'expérimenter. Utilisant au mieux les informations sur la position géographique des termes dans les documents, la méthode d'indexation proposée est capable de post-coordination des termes. En ce sens, l'indexation ne se limite pas à extraire des mots indépendamment les uns des autres, mais peut lors de l'interrogation reconstituer des syntagmes complexes (ce qui s'appelle dans la littérature post-coordination, par opposition a la pré-coordination très classique dans les systèmes à sémantique forte). Le système mdocspace est conçu pour permettre de faciliter l'organisation de l'espace documentaire, et d'orienter le système dans le processus de sélection de documents par le biais de l'interface. L'objectif est de bâtir un protocole d'interaction coopérative utilisateur/système au cours de la recherche afin de converger précisément vers le besoin informationnel. Le raisonnement du système est image via une interface afin que l'utilisateur puisse se faire une représentation mentale sur la démarche de sélection des documents. Ainsi, l'utilisateur peut entrevoir si un document contient des éléments pertinents avant même de l'ouvrir. Cette interface fait partie d'une triade d'outils qui comprend des systèmes de gestion, d'indexation de documents, et de recherche documentaire, chaque module faisant l'objet de parties distinctes. Le système a été testé et évalué sur un corpus constitue de divers documents (rapports, thèses, articles, séminaires) du laboratoire Heudiasyc. Ces résultats ont conduit à d'autres utilisations en collaboration avec d'autres laboratoires.

  • Titre traduit

    Conception and realization of a prototype interactive system of multimedia retrieval information with textual component


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 165 p.
  • Annexes : 153 réf.

Où se trouve cette thèse ?

  • Bibliothèque : Université de Technologie de Compiègne. Service Commun de la Documentation.
  • Disponible pour le PEB
  • Bibliothèque : Université de technologie de Belfort-Montbéliard. Bibliothèque.
  • Disponible pour le PEB
  • Cote : THESE 99 LAM
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.