Induction automatique : aspects théoriques, le système ARBRE, applications en médecine

par Bruno Crémilleux

Thèse de doctorat en Informatique

Sous la direction de Claudine Schwartz.


  • Résumé

    L'objectif de ce travail est d'étudier l'induction en tant qu'outil exploratoire de bases d'exemples. L'induction automatique fournit une description tenant compte de l'ensemble des individus de la base d'exemples et en extrait la connaissance nécessaire à la résolution d'un problème. Il existe de nombreux algorithmes d'induction employant différents critères pragmatiques pour sélectionner une variable. Une formalisation mathématique du problème de la sélection d'une variable est proposée. Elle permet d'une part de définir une famille de "bons" critères reposant sur le choix d'une fonction strictement concave. D'autre part, les systèmes d'induction incertaine décrits dans la littérature emploient des techniques d'élagage dont le but est la construction d'arbres de classement. Une méthode d'élagage liée à un indice de qualité et adaptée à notre usage de l'induction incertaine est proposée. Elle montre en quoi la construction et l'élagage d'un arbre relèvent des mêmes concepts théoriques (l'indice de qualité fait intervenir les résultats des calculs entrepris lors de la construction de l'arbre). Un système d'induction (ARBRE) mettant enoeuvre ces résultats théoriques a été développé. Il met en évidence les spécifications qui, à notre avis, sont indispensables pour un système en domaine incertain. Il permet une exploration immédiate de base d'exemples sans connaissance préalable du domaine, et représente la connaissance acquise sous la forme d'arbres d'induction. Trois problèmes médicaux réels montrent l'intérêt de l'usage d'un tel système, adapté à tout domaine où la connaissance est incertaine.

  • Titre traduit

    Automatic induction : theoretical aspects, the system ARBRE, medical applications


  • Résumé

    The aim of this work is to investigatte as a tool for examples bases exploration. Indeed, automatic induction provides a decription of data-file and extracts some knowledge fitted to the problem at hand. It exists a lot of induction algorithms using different pragmatic criterions to choose a variable. A mathematical formalization of the problem of the selection of a variable is proposed. It allows to define a family of "good" criterions based on the choice of a stricly concave function. Elsewhere, uncertain induction systems described in the literature employ pruning methods in the last stage of classification trees building. A pruning method linked to the computation of a quality coefficient and adjusted to our use of uncertain induction is proposed. It makes clear that the construction and the pruning of a tree are dependent on the same theoretical concepts. An induction system (ARBRE) has been developped to make these theoretical consideration concrete and to allow practical proving of their efficiency. By the way, we review the specifications which, in our opinion, are required for a system in uncertain induction. The program ARBRE can perform an immediate exploration of examples bases, without prior knowledge of the domain, and represents the acquired knowledge in the form on induction trees. Thrre real medical problems show the interest of using such a system, adapted to any domain where the knowledge is uncertain.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (IV - 222 p.)
  • Annexes : Bibliogr. p.178 - 184

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire Joseph-Fourier.
  • Accessible pour le PEB
  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire Joseph-Fourier.
  • Disponible pour le PEB
  • Cote : TS 91/GRE1/0018
  • Bibliothèque : Moyens Informatiques et Multimédia. Information.
  • Disponible pour le PEB
  • Cote : IMAG-1991-CRE
  • Bibliothèque : Bibliothèque interuniversitaire de santé (Paris). Pôle médecine et odontologie.
  • Disponible pour le PEB
  • Cote : 263223
  • Bibliothèque : Université de Lorraine. Direction de la documentation et de l'édition. Médiathèque Campus Artem.
  • Non disponible pour le PEB
  • Cote : TH2/1991CRE
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.