Thèse soutenue

Un modèle d'exploration contextuelle du contenu des documents textuels : conception et réalisation d'un système informatique SEMANTEXT de filtrage et de structuration des textes

FR  |  
EN
Auteur / Autrice : Slim Ben Hazez
Direction : Jean-Pierre Desclès
Type : Thèse de doctorat
Discipline(s) : Informatique et communication
Date : Soutenance en 2002
Etablissement(s) : Paris 4

Résumé

FR  |  
EN

Le travail présenté dans cette thèse se focalise sur le développement de technique d'accès aux information textuelles selon différents points de vue. Dans cette optique, nous proposons un modèle un modèle en trois niveaux d'exploration contextuelle du contenu des textes. Ce modèle à pour bue de décrire d'une manière compacte et intuitive des données linguistiques et des opérations premier niveau est constitué d'un langage de description de motifs linguistiques. Le deuxième propose une algèbre d'expressions de repérage contextuel (ou ERC). Le dernier consiste en un langage de description de règles d'exploration contextuelle. Ces composants permettent de décrire divers phénomène linguistiques et textuels de surface et de spécifier des opérations de sélection qui portent sur différents niveaux d'organisation du texte. Ils forment le noyau de bases du système SEMAN'TEXT dont l'architecture s'articule autour d'un modèle dynamique du texte représenté sous forme d'un graphe décoré. L'architecture adoptée permet de réaliser et de mettre en interaction plusieurs tâches d'extraction. Ce travail s'appuie sur notre première expérience dans le développement du système CONTEXTO.