Thèse de doctorat en Sciences informatiques
Sous la direction de Daniel Kayser.
Soutenue en 1985
à Paris 11 , en partenariat avec Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne) (autre partenaire) .
Le président du jury était Jean-Louis Laurière.
Le jury était composé de Daniel Kayser, Jean-Louis Laurière, Christian Fluhr, Mario Borillo, Lucie Fossier, Yves Kodratoff, Bernard Normier.
Les rapporteurs étaient Christian Fluhr.
Cette thèse fournit une description générale de RESEDA, système « intelligent » d’informatique documentaire qui utilise des techniques empruntées au Knowledge Engineering et l’Intelligence Artificielle (IA) pour le traitement de donnés biographiques complexes. Toutes les connaissances du système sont représentées sous forme purement déclarative, en utilisant un langage de représentation unique (« métalangage ») qui se sert de variables pour la représentation des informations appartenant à la base de règles ; le métalangage constitue un exemple de réalisation IA du concept de « grammaire de cas ». Pour des raisons d’efficacité informatique, les opérations d’inférence de « niveau zéro » de RESEDA sont exécutées en se servant uniquement des ressources de la « machine d’appariement » du système. Cette machine doit une grande partie de sa puissance à une utilisation judicieuse des données temporelles qui permet d’obtenir une indexation efficace de la base de faits. Seules les inférences d’ordre supérieur demandent d’utiliser de véritables « moteurs d’inférence ». Le moteur de RESEDA est caractérisé par les deux faits suivants : a) il est « commandé par l’évènement » (event driven) pendant la phase d’initialisation ; b) la résolution d’un problème est effectuée en le décomposant en sous-problèmes et en construisant progressivement un « arbre de choix ». Cet arbre est exploré en faisant usage d’une technique « en profondeur d’abord » avec « retour en arrière » (backtracking) systématique. Les opérations d’inférence de niveau supérieur du système sont constituées par les « hypothèses » et les « transformations ». La tâche des hypothèses est d’établir de nouvelles relations de cause entre des évènements présents dans la base de faits qui sont à priori complètement disjoints ; le système possède de cette façon une capacité, même si élémentaire, d’apprentissage.
Use of techniques dependant of artificial intelligence for the complex biographical data processing
The aim of this thesis is to provide a general description of RESEDA, an « intelligent » Information Retrieval system dealing with biographical data and using techniques borrowed from Knowledge Engineering and Artificial Intelligence (AI). All the system’s “knowledge” is represented in purely declarative form. This is the case both for the “fact database” and the “rule base”; the fact database contains the data, in the usual sens of the word that the system has to retrieve. Together, the fact and rule bases make up RESEDA’s “knowledge base”. Information in the knowledge base is depicted using a single knowledge representation language (“metalanguage”), which makes use of quantified variables when describing date in the rule base; the metalanguage is a particularly powerful realization of an AI type “case grammar”. For reasons of computational efficiency, the low-level (“level zero”) inferencing (retrieving) is carried out in RESEDA by using only the resources of the system’s match machine. This machine owes a large part of its power to the judicious use of temporal data in efficiently indexing the fact database. Only high-level inferences require the creation of real “inference engines”. RESEDA’s inference engine hat the general characteristics a) of being “event driven” in its initialization; b) of solving problems by constructing a “choice tree”. Traversal of the choice tree is performed depth-first with systematic backtracking. The high-level inference operations, relying on information in the rule base and making use of the inference engine, that are implemented in the system, are known as “transformations” and “hypotheses”. The “hypotheses” enable new causal relationships to be established between events in the fact database which are a priori totally disjointed; the system is thus equipped with an, albeit elementary, learning capability.