Classification du cancer du sein par des approches basées sur les systèmes immunitaires artificiels

par Rima Dabladji

Thèse de doctorat en Informatique

Sous la direction de Khalifa Djemal.

Soutenue le 28-09-2016

à Paris Saclay , dans le cadre de École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne) , en partenariat avec Université d'Évry-Val-d'Essonne (établissement opérateur d'inscription) .

Le président du jury était William Puech.

Le jury était composé de Hichem Maaref.

Les rapporteurs étaient Frédéric Bouchara, Lionel Fillatre.


  • Résumé

    Le cancer du sein arrive dans le monde en première position en termes d’incidence et de mortalité parmi les différentes localisations cancéreuses chez les femmes. Malgré les avancées significatives faites ces dernières décennies en vue d’améliorer la gestion de ce type de cancer, des outils de diagnostic plus précis sont encore nécessaires pour aider les experts à lutter contre cette maladie mortelle. Dans ce cadre, des travaux de recherche considérables ont été réalisés dans l’espoir d’apporter de nouvelles perspectives pour l’amélioration du diagnostic du cancer du sein, en développant des systèmes de Décision Assistés par Ordinateur (DAO). Beaucoup de travaux se sont dirigés vers la détection de la présence de tissus cancéreux dans le sein et la classification de tumeurs en utilisant des outils issus de l’intelligence artificielle souvent inspirés par les systèmes naturels. En l’occurrence, les Systèmes Immunitaires Artificiels (SIA) constituent un domaine de recherche qui comble les domaines de l’immunologie, l’informatique et l’ingénierie. Les principaux développements au sein des systèmes immunitaires artificiels, ont mis l’accent sur trois principales théories immunologiques : la sélection clonale, les réseaux immunitaires et la sélection négative. Nous nous intéressons dans ce travail à l’utilisation de algorithmes de sélection clonale pour la classification des cellules mammaires en Bénignes/Malignes. En effet, ces approches sont généralement basées sur deux principaux processus : la reconnaissance de la forme de l’antigène et la sélection de la cellule mémoire spécifique à ce dernier. L’idée établie est que seules les cellules mémoires capables de reconnaître l’antigène sont sélectionnées pour le clonage et la mutation. Après avoir présenté le principe de ces algorithmes, nous étudierons, à travers plusieurs approches, leurs performances. Tout d’abord, on s’intéresse à l’amélioration de l’algorithme CLONALG, qui est un des algorithmes de base dans le domaine de la sélection clonale artificielle. Afin de renforcer l’apprentissage de ce dernier, avec une meilleure initialisation et une diversité maîtrisée, trois différentes méthodes sont proposées appelées Median Filter Clonal ALGorithm (MF-CLONALG), Average Cells Clonal ALGorithm (AC-CLONALG) et Validity Interval Clonal Selection (VI-CS). Cependant, bien qu’elles soient performantes, ces approches nécessitent un temps important de calcul. Dans ce contexte, la seconde approche qu’on propose vise à réduire les taux de calcul de ces algorithmes (et ceux des SIA en général) sans affecter leurs performances. L’algorithme Local Database Categorization Artificial Immune System (LDC-AIS) utilise le regroupement par K-means pour la catégorisation locale des données, et le réseau de neurones RBF pour l’apprentissage des catégories, afin d’accélérer le processus de sélection. La dernière partie de la thèse est dédiée à l’optimisation multimodale. En effet, après avoir présenté les algorithmes de sélection clonale comme outil compétitif de reconnaissance des formes et de classification, nous nous sommes intéressés à explorer ce concept, afin de démontrer les avantages des opérateurs de clonage et de mutations dans le cadre de l’optimisation de fonctions. En réponse à certains inconvénients du réseau de neurones MLP (Multi-Layer Perceptron), une procédure d’optimisation en plusieurs étapes est proposée, dans laquelle la rétropropagation est assistée par les processus de clonage et de mutation, pour une convergence plus rapide et précise du MLP. L’approche Multi-Layer Perceptron based Clonal Selection (MLP-CS) étant voisine des techniques évolutionnaires est comparée à un MLP optimisé par un algorithme génétique. Chacune des approches proposées dans ce travail est testée et comparée à différents travaux antérieurs en utilisant deux différentes bases de données mammaires à savoir la Wisconsin Diagnostic Breast Cancer (WDBC) et la Digital Database for Screening Mammography (DDSM).

  • Titre traduit

    Breast cancer classification using artificial immune system approaches


  • Résumé

    Breast cancer arrives in the world in first place in terms of incidence and mortality among the different cancer localizations in women. Despite the significant progress made in recent decades to improve the management of this type of cancer, more accurate diagnostic tools are still necessary to help experts fight against this fatal disease. In this context, considerable research studies have been carried out to bring new perspectives for the improvement of the diagnosis of breast cancer, by developing Computer-Aided Diagnosis systems (CAD). Many works were directed to detecting the presence of cancerous tissues in the breast and tumor classification using tools from artificial intelligence often inspired by natural systems. In this case, Artificial Immune Systems (AIS) are a research field that bridges the fields of immunology, computer science and engineering. The main developments in artificial immune systems, have focused on three main immunological theories: clonal selection, immune networks and negative selection. We focus in this work on the use of clonal selection algorithms for classification of breast cells in Benign / Malignant. Indeed, these approaches are generally based on two main processes: the shape recognition of the antigen and selection of the specific memory cell to it. The established idea is that only memory cells capable of recognizing the antigen are selected for cloning and mutation. After introducing the principle of these algorithms we will study, through various approaches, their performances. First, we focus on improving CLONALG algorithm, which is a basic algorithm in the field of artificial clonal selection. To enhance the learning of the latter, with a better initialization and controlled diversity, three different methods are proposed appointed Median Filter Clonal ALGorithm (MF-CLONALG), Average Cells Clonal ALGorithm (AC-CLONALG) and Validity Interval Clonal Selection (VI-CS). However, although successful, these approaches require significant computing time. In this context, the second proposed approach aims at reducing the computational rates of these algorithms (and those of the AIS in general) without affecting their performance. The Local Database Categorization Artificial Immune System algorithm (LDC-AIS) uses clustering by K-means for local data categorization, and RBF neural network for learning categories, to accelerate the selection process. The last part of the thesis is dedicated to multimodal optimization. Indeed, after having presented the clonal selection algorithms as competitive tools of pattern recognition and classification, we were interested in exploring this concept, to demonstrate the benefits of cloning and mutation operators in functions optimization’s framework. In response to some drawbacks of the MLP neural network (Multi-Layer Perceptron), an optimization procedure in several stages is proposed, in which the back-propagation is assisted by cloning and mutation processes, for fast and accurate convergence of MLP. Being close to evolutionary techniques, the Multi-Layer Perceptron based Clonal Selection approach (MLP-CS) is compared to an MLP optimized by a genetic algorithm. Each of the approaches proposed in this work is tested and compared to different previous works using two different breast databases which are the Wisconsin Diagnostic Breast Cancer (WDBC), and the Digital Database for Screening Mammography (DDSM).


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Informations

  • Détails : 1 vol. (xvi-129 p.)
  • Annexes : Bibliogr. p. 119-129.

Où se trouve cette thèse ?

  • Bibliothèque : Université d'Evry-Val d'Essonne. Service commun de la documentation. Bibliothèque centrale.
  • Non disponible pour le PEB
  • Cote : 616.994 DAB cla
  • Bibliothèque : Université d'Evry-Val d'Essonne. Service commun de la documentation. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.