Construction d'arbres de décision avec valeurs incomplètes pour la sélection de graines de palmier à huile

par Mohd Najib Mohd Salleh

Thèse de doctorat en Informatique

Sous la direction de Patrice Boursier.

Soutenue en 2008

à La Rochelle .


  • Résumé

    Dans les cas de traitement d'information incomplète à l'aide d'arbres à décision, la qualité de l'affectation des valeurs dépend toujours du travail de classification. Dans certains cas, on ne pourra pas se contenter de méthodes générales qui tiennent peu compte de l'existant et il sera nécessaire d'affecter des valeurs vraisemblables. Afin de traiter ce problème d'affectation de valeurs manquantes à des attributs, nous proposons de généraliser les algorithmes de décision avec des modèles plus simples et plus compréhensibles, de manière à faciliter et optimiser le travail de l'expert humain. Notre proposition consiste à partitionner les données en nous basant sur l'information stockée et sur l'absence de certaines valeurs, mais également sur l'information globale afin d'améliorer aussi les performances de traitement. L'apport de ce travail consiste en de nouveaux algorihmes, ainsi que des analyses pour la classification de matériaux de plantation. Nous donnons des résultats d'expérimentation sur des données réelles, qui sont susceptibles d'améliorer de manière significative le travail de sélection des graines de palmier à huile.

  • Titre traduit

    Constructing decision tree with incomplete values for planting materials selection


  • Résumé

    A missing value in incomplete information always inherent the accuracy of classification tasks when a decision tree is used to classify unseen cases. There will be cases where plausible values are required to retain towards more principled and less intrusive. In order to handle the attribute with missing values, the researcher generalizes decision algorithms that provide simpler and more understandable models to optimally fulfill human expert requirement and constraint. Our objective is to partition data by taking full advantage of the information with the presence of missing values ; but with supporting global information to achieve better performance. The contributions of this study are newly developed algorithms and analyses for planting material classification. The researcher reports the empirical results that may provide high returnin planting material breeders in oil palm industry through effective policies design and decision making.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (149 p.)
  • Annexes : Bibliogr. p. 133-139

Où se trouve cette thèse ?

  • Bibliothèque : Université de La Rochelle. Bibliothèque universitaire.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.