Thèse soutenue

Traitement intelligent de données par réseaux de neurones artificiels : application à la valorisation des systèmes d'information géographiques

FR  |  
EN
Auteur / Autrice : Mohammed Attik
Direction : Frédéric Alexandre
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2006
Etablissement(s) : Nancy 1
Partenaire(s) de recherche : autre partenaire : Université Henri Poincaré Nancy 1. Faculté des sciences et techniques

Résumé

FR  |  
EN

Les travaux de recherche présentés dans cette thèse rentrent dans le cadre de la problématique de l'Extraction de Connaissances à partir des Données (ECD) que nous avons illustrée à travers le traitement des données du Système d'Information Géographique établi par le Bureau de Recherches Géologiques et Minières (BRGM). Les objectifs de cette thèse sont d'établir des cartes prédictives de substances, d'avoir une interprétation sur les critères permettant d'établir cette décision, et de fournir une hiérarchisation des attributs descriptifs. Pour atteindre ces objectifs, nous avons proposé étape par étape un ensemble d'améliorations que nous allons présenter comme suit : Dans un premier temps, nous avons proposé d'utiliser l'approche ensemble de classifieurs de réseaux de neurones offrant des réponses probabilistes afin de construire des cartes prédictives complémentaires pour une meilleure interprétation. Nous avons également proposé d'utiliser les techniques de détermination des " outliers " pour détecter les zones qui ne présentent pas les conditions de minéralisation. Dans un deuxième temps, nous avons proposé des améliorations de techniques pour la sélection de variables, en particulier pour les deux familles de sélection Optimal Brain Damage et Optimal Brain Surgeon, et pour des critères d'évaluation des méthodes de sélection de variables basées sur l'information mutuelle. Nous avons proposé d'utiliser l'approche ensembliste en sélection de variables pour déterminer les variables les plus pertinentes, hiérarchiser de manière globale l'ensemble des variables, permettre aux experts de choisir la ou les solutions qui apparaissent comme étant les plus compréhensibles, et enfin pour se focaliser uniquement sur une combinaison de règles décrivant le concept-cible issue d'un sous-ensemble pertinent de variables. Les deux premiers objectifs visés ci-dessus ont été abordés en utilisant les treillis de Galois et l'analyse statistique de distribution.