Treillis de Galois pour les contextes multi-valués flous : Application à l'étude des traits de vie en hydrobiologie

par Aurélie Bertaux

Thèse de doctorat en Informatique.Fouille de données

Sous la direction de Florence Le Ber.

Soutenue en 2010

à Strasbourg .


  • Résumé

    Cette thèse en informatique se place dans le cadre de l’Analyse de Concepts Formels (ACF) et s'intéresse à des contextes complexes (multi-valués flous) dont la complexité repose sur deux axes. D’une part, les contextes multi-valués dont les attributs se divisent en plusieurs modalités. D’autre part, les contextes flous dont la relation entre objets et attributs n’est pas binaire. Nous présentons deux conversions des données multi-valuées floues. La première est une binarisation par une disjonction totale des attributs permettant l’exploitation d’implications et de comparer et combiner les treillis avec des méthodes statistiques telles que l’analyse factorielle. La seconde conversion est issue de l’échelonnage histogramme que nous définissons et qui permet de convertir les attributs en histogrammes. Afin de générer les concepts à partir des histogrammes, nous proposons une nouvelle fermeture de Galois basée sur une mesure de similarité entre ces histogrammes. Cette fermeture permet d’obtenir des concepts pour lesquels les objets possèdent des attributs non plus égaux mais similaires compris entre un minimum et un maximum communs. Nous proposons également des mesures de seuillage pour limiter le nombre de concepts générés et diminuer les temps de calculs. Enfin, deux algorithmes ont été testés pour implémenter cette fermeture : MinMaxNC et MinMaxC, dont nous comparons les performances. Cette thèse trouve son application notamment dans le domaine hydrobiologique dont une problématique est la sélection de traits écologiques de taxons permettant de caractériser l’état écologique des cours d’eau par le comportement des espèces au sein de leur environnement.

  • Titre traduit

    Galois lattices for fuzzy many-valued contexts : Application to life traits study in hydrobiology


  • Résumé

    This computer information science PhD takes place in the framework of Formal Concept Analysis (FCA) or Galois lattices, which are tools based on mathematical operators called Galois connections allowing to generate concepts. A concept is composed with a set of objects sharing a set of attributes. These concepts are generated from a context which is a table of binary relations between these objects and these attributes. We are interested in complex contexts for which the complexity is based on two elements. On one hand, on many-valued context for which the attributes are divided into several modalities. On the other hand, it is based on fuzzy contexts for which the relation between objects and attributes is not binary. We define fuzzy many-valued contexts which inherit of both complexities and introduce two conversions for fuzzy many-valued data. The first conversion is a binarisation by a complete disjonctive operation allowing to use tools such as implications and to compare and combine lattices with statistical methods such as factorial analysis. The second conversion is issued from histogram scaling which we define and which converts attributes into histograms. To generate concepts from histograms, we propose new Galois connections based on a similaritymeasure between these histograms. These connections allow to obtain concepts where objects share attributes which are not equal but similar between the same minimum and maximum. We also propose to use thresholds to limit the number of generated concepts and decrease calculating time. We have tested and compared the performance of two algorithms : MinMaxNC and MinMaxC implementing this connection. This PhD is applied to the hydrobiological domain for which it is needed to select ecological traits allowing to caracterize ecological quality of water surfaces due to the behaviour of species in their environment. The selection of these traits is based on the search of groups of taxons sharing morphological and physiological (called biological traits) characteristics. These groups correspond to concepts in FCA and biological data can be considered as fuzzy many-valued context for which we show the efficency of our approach.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (VIII-182 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 151-156.

Où se trouve cette thèse ?

  • Bibliothèque : Université de Strasbourg. Service commun de la documentation. Bibliothèque Blaise Pascal.
  • Disponible pour le PEB
  • Cote : Th.Strbg.Sc.2010;0731
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.