Filtrage automatique et appariement des segments textuels associés aux images à partir de documents électroniques : réalisation du système FILIMAGE

par Shahnaz Behnami

Thèse de doctorat en Linguistique

Sous la direction de Jean-Pierre Desclès.

Soutenue en 2003

à Paris 4 .


  • Résumé

    Cette étude présente l'extraction des segments textuels qui font référence aux images dans les documents électroniques. L'objectif de ce traitement est d'automatiser l'accès aux image et leurs commentaires. L'appariement de ces composantes est un moyen d'exploration adapté pour acquérir et visualiser des informations pertinentes. Les résultats obtenus sont tirés d'observations sur des corpus volumineux. L'approche adoptée pour le filtrage sémantique du texte associé à l'image est basée sur un formalisme appelé " Exploration contextuelle ", en terme des règles déclaratives. Le système Filimage comprend trois modules spécifiques de pré-traitement, d'extraction et d'appariement des composantes textuelles et visuelles. Il propose à l'utilisateur une consultation, une visualisation de l'ensemble des extraits qui sont stockés sur un support numérisé. Ils mettent en évidence de nouvelles réflexions rattachées aux systèmes opérationnels du filtrage d'informations en vue d'une meilleure compréhension du document dans son intégralité.

  • Titre traduit

    Automatic filtering and matching of the textual segments associated the images in the electronics documents : realization of the Filimage system


  • Résumé

    This study presents the extraction of the textual segments which refer to the images in the electronic documents. The objective of this automatic treatment aims at reaching the extracted components. The matching of these components is a means of exploration adapted to acquire and visualize relevant information. The results obtained are drawn from observations on large corpora. The approach adopted for the semantic filtering of the text associated with the image is based on a formalism called "contextual Exploration", in term of the declaratory rules. The Filimage system includes three specific modules of the preprocessing, extraction and matching of the textual and visual components. It proposes to the user a consultation, a visualization of the whole of the extracts which are stored on a digitized support. They make appear new reflexions attached to the operational systems of the filtering of information for a better comprehension of the document in its entirety.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (244 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : 229 références bibliographiques

Où se trouve cette thèse ?

  • Bibliothèque : Centre de recherche en informatique de Lens. Bibliothèque.
  • Disponible sous forme de reproduction pour le PEB
  • Cote : THE 03 BEH
  • Bibliothèque : Université de Paris-Sorbonne Paris 4. Service commun de la documentation. Bibliothèque Serpente.
  • Consultable sur place dans l'établissement demandeur
  • Cote : BUT 5700

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Bibliothèque interuniversitaire de la Sorbonne (Paris).
  • Non disponible pour le PEB
  • Cote : MC 6897
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.