Principes de conception de systèmes hypertextes pour la fouille de données bibliographiques multibases

par Emmanuel Nauer

Thèse de doctorat en Sciences et techniques communes

Sous la direction de Amedeo Napoli.

Soutenue en 2001

à Nancy 1 .


  • Résumé

    Le besoin en information est primordial pour la recherche et la veille scientifiques et techniques. L'importante quantité de données disponibles actuellement sur un domaine d'activité nécessite de mettre en oeuvre des moyens adaptés pour exploiter ces données. Le but de ce travail de recherche est de fournir un environnement pour exploiter les données d'un domaine (références bibliographiques et Web) pour des besoins de recherches bibliographiques ou d'analyses de domaines. Dans ce cadre une approche générale pour construire un système hypertexte de fouille de données bibliographiques est proposé. L'hypertexte favorise l'accès exploratoire des données. Des fonctionnalités de fouille (dénombrements, classifications, extractions de règles) sont déclenchées à la demande pour analyser plus précisément les données. L'idée principale de cette thèse est que la fouille de données et la recherche d'information sont deux approches complémentaires pour appréhender des données : la fouille de données permet de guider la recherche d'information à partir des connaissances extraites des données. Inversement, la recherche d'information permet de guider la fouille de données par l'exploitation des connaissances issues de la fouille. La fouille de données favorise également l'accès à l'information sur le Web. Concrètement, les connaissances extraites des données bibliographiques fournissent une aide à la formulation de requêtes et permettent d'améliorer la précision des réponses obtenues lors de l'interrogation de moteurs de recherche. La mise en place d'un tel système nécessite d'exploiter les travaux de recherche en fouille de données, recherche d'information et bases de données. D'un point de vue technique, les outils de ces différents domaines sont combinés grâce à une approche modulaire exploitant XML pour la représentation et l'échange des données manipulées, et un traitement par flux de données.


  • Pas de résumé disponible.


  • Résumé

    Information is essential in scientific and technical research and watch. The significant quantity of currently available data in a domain requires to implement adapted tools to exploit them. The goal of this research is to provide an environment in which the data of a domain (bibliographical references and Web) can be exploited for bibliographical search or domain analysis needs. In this framework, a general approach to build an hypertextual datamining system on bibliographical data is proposed. The use of hypextext capabilities favorizes an explorative access to data. Functionalities of datamining (statistical information, classifications, rules extraction) may be available to analyze data more precisely. The principal idea of this thesis is that datamining and information retrieval are two complementary approaches to access and analyse data : datamining allows to guide the information retrieval by using the knowledge extracted from the data. Conversely, information retrieval allows to guide the datami- ning pro cess by taking into account the extracted knowledge. The datamining process also favours the information access on the Web. Concretely, the knowledge extracted from bibliographical data provides a help for query formulation and improve the answer's precision of web search engine Building such a system requires the exploitation of different technics, Le. Datamining, information retrieval and database management. From a technical point of view, the tools of these fields are combined thanks to a modular approach exploiting XML for the representation and the exchange of the data, and a data flow processing.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (201 p.)
  • Annexes : 304 ref.

Où se trouve cette thèse ?

  • Bibliothèque : Université de Lorraine (Villers-lès-Nancy, Meurthe-et-Moselle). Direction de la Documentation et de l'Edition - BU Sciences et Techniques.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.