Thèse de doctorat en Informatique
Sous la direction de Chantal Reynaud.
Soutenue en 2006
à Paris 11 , en partenariat avec Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne) (autre partenaire) .
L'explosion du nombre de sources d'information accessibles via le Web multiplie les besoins de techniques d'intégration des sources de données multiples et hétérogènes. Ces techniques reposent sur la construction d'une vue uniforme des données distribuées permettant de donner l'impression à l'utilisateur qu'il interroge un système homogène et centralisé. Les travaux menés dans cette thèse portent sur les ontologies en tant qu'outils d'aide à l'interrogation d'un serveur d'information. Les deux aspects des ontologies que nous avons traités sont les ontologies en tant qu'outil d'aide à l'affinement de requêtes, d'une part, et en tant qu'aide à l'interrogation unifiée, d'autre part. Concernant le premier aspect, nous proposons de construire progressivement, avec l'utilisateur, des requêtes plus spécifiques, plus contraintes que la requête initiale, jusqu'à l'obtention de réponses moins nombreuses et plus pertinentes. Notre approche est basée sur l'utilisation conjuguée d'une ontologie du domaine et de la technique des treillis de Galois. Concernant le second aspect, nous proposons une approche générique d'alignement d'ontologies mise en œuvre au travers d'un processus semi-automatique. L'approche que nous proposons s'applique en présence d'une dissymétrie dans la structure des taxonomies comparées. Nous proposons d'assembler, dans un ordre bien déterminé, des techniques terminologiques, structurelles et sémantiques. Ces deux aspects ont fait l'objet de travaux distincts effectués au sein de deux projets : le projet Picsel 2, mené en collaboration avec France Télécom R&D et le projet RNTL eDot, dont le domaine d'application porte sur l'analyse du risque alimentaire.
Ontologies and help for users for the interrogation of multiple and heterogeneous sources
The explosion in the number of information sources available on the Web multiplies the needs for multiple and heterogeneous data sources integration techniques. These techniques rest on the construction of a uniform view of the distributed data allowing to give to the user the feeling he queries a homogeneous and centralized system. The work undertaken in this thesis concerns ontologies as assistance tools to the interrogation of a server of information. The two aspects of ontologies which we treated are ontologies as a query refinement tool, on the one hand, and as an assistance for unified interrogation, on the other hand. Concerning the first aspect, we propose to gradually build, interactively with the user, more specific and more constrained requests until obtaining fewer and more relevant answers. Our approach is based on the combined use of related ontology and of Galois lattices. Concerning the second aspect, we propose a generic approach of alignment of ontologies implemented through a semi-automatic process. The approach that we propose applies in the presence of a dissymmetry in the structure of compared taxonomies. We propose to use together, in a precisely defined order, terminological, structural and semantic techniques. These two aspects were the subject of distinct works carried out within two projects. The first one was Picsel 2 project, carried out in collaboration with France Telecom R&D whose field of experimentation is tourism. The second was RNTL eDot project, whose applicability relates to the analysis of the bacteriological risk of food contamination.