Représentation de l'incertitude et de l'imprécision entre les clusters avec des fonctions de croyance
Auteur / Autrice : | Zuowei Zhang |
Direction : | Arnaud Martin, Zhunga Liu |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 18/01/2022 |
Etablissement(s) : | Rennes 1 en cotutelle avec Northwestern Polytechnical University (Chine) |
Ecole(s) doctorale(s) : | MATHSTIC |
Partenaire(s) de recherche : | Laboratoire : Institut de recherche en informatique et systèmes aléatoires (Rennes) - DRUID |
Jury : | Président / Présidente : Christel Vrain |
Examinateurs / Examinatrices : Kuang Zhou, Deqiang Han | |
Rapporteurs / Rapporteuses : Thierry Denoeux, Zied Elouedi |
Mots clés
Mots clés contrôlés
Résumé
Le clustering crédibiliste fondé sur la théorie des fonctions de croyance est devenu un sujet important de la fouille de données en raison de sa capacité à caractériser l'incertitude et l'imprécision entre les clusters. Cependant, il existe encore des problèmes tels que l'ambiguïté des concepts de base, la complexité de calcul élevée et l'incapacité à détecter efficacement les clusters déséquilibrés et arbitraires. Cette thèse est consacrée à la résolution des problèmes ci-dessus et propose des solutions correspondantes, qui comprennent quatre parties. Tout d'abord, nous passons en revue de manière exhaustive les algorithmes de clustering crédibiliste existants et nous donnons les concepts et définitions associés, en détaillant en quoi le clustering crédibiliste peut caractériser l'incertitude et l'imprécision entre les clusters. Deuxièmement, nous proposons un algorithme de clustering dynamique qui peut réduire efficacement la complexité de calcul des algorithmes existants pour étendre les applications. Troisièmement, nous proposons un algorithme de regroupement par décalage de croyance pour caractériser l'incertitude et l'imprécision entre les grappes déséquilibrées. Quatrièmement, nous proposons un algorithme de convergence crédibiliste fondé sur les pics de densité qui généralise la détection de clusters de forme, de taille et de structure spatiale arbitraires. Des données artificielles et réelles ont permis de vérifier l'efficacité des algorithmes proposés. Enfin, nous discutons également de quelques recherches potentielles à l’issue de cette thèse.