Contributions à l'analyse d'images médicales pour la reconnaissance du cancer du sein

par Sègbédji Rethice Théophile Junior Goubalan

Thèse de doctorat en Traitement du signal et des images

Sous la direction de Hichem Maaref et de Khalifa Djemal.

Soutenue le 09-12-2016

à Paris Saclay , dans le cadre de École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne) , en partenariat avec Université d'Évry-Val-d'Essonne (établissement opérateur d'inscription) .

Le président du jury était Yves Goussard.

Le jury était composé de Hichem Maaref, Mouloud Adel.

Les rapporteurs étaient William Puech, Rachid Jennane.


  • Résumé

    Le diagnostic assisté par ordinateur du cancer du sein suscite de plus en plus un réel engouement en raison de la quantité sans cesse croissante d'images mammographiques issues des campagnes de dépistage. L'accent est mis sur les opacités mammaires en raison du risque élevé de cancer qui leur est associé. En effet, la variabilité des formes rencontrées et la difficulté à discerner les masses surtout quand ces dernières sont embarquées dans des densités importantes exigent une nouvelle stratégie plutôt adaptée aux cas les plus complexes à savoir les masses appartenant aux classes BI-RADS IV et V, c-à-d. respectivement les masses malignes spiculées et les distorsions architecturales. Dans ce travail, un système de diagnostic assisté par ordinateur entièrement automatique et conçu pour la segmentation et la classification des opacités dans les catégories bénigne/maligne ou graisseuse/dense, spécifiquement pour celles de type BI-RADS IV et V est abordé. Dans un premier temps, nous avons développé une approche de pré-traitement des images fondée sur l'apprentissage d'un dictionnaire parcimonieux sur les bases d'images, combiné à une réduction de dimension afin de supprimer de façon efficace et rapide le bruit de numérisation des images mammographiques présentes dans les bases utilisées pour concevoir notre système de diagnostic en comparaison des approches déjà existantes. Une fois les images pré-traitées, nous avons mis en place une procédure de segmentation non-supervisée des masses basée sur les champs de Markov et qui a l'avantage d'être à la fois plus rapide, plus efficace et plus robuste que les meilleures techniques de segmentation disponibles dans l'état-de-l'art. De plus, la méthode proposée s'affranchit de la variabilité des masses et ce quelque soit la densité de l'image. Dans l'idée de décrire convenablement les lésions malignes spiculées, nous avons conçu une méthode de segmentation des spicules qui présente la particularité de ne pas recourir à l'utilisation de descripteurs extraits manuellement dont les performances peuvent varier en fonction de leur qualité. L'approche proposée repose sur des hypothèses que nous avons formulées concernant l'aspect des spicules. Celles-ci nous ont conduits à développer un modèle Markovien combiné à une transformée de Radon locale pour extraire les structures curvilignes de l'image. Ensuite, nous servant d'un modèle a contrario, nous avons pu extraire les spicules de l'ensemble des structures détectées. Cette phase, vient clore la première partie de la conception de notre système, qui est en mesure d'extraire soit des masses spiculées, soit des distorsions architecturales. Afin de finaliser sa conception, nous avons procédé à la création d'un modèle d'aide à la décision qui, à l'inverse de ce qui s'est toujours fait dans l'état-de-l'art pour la discrimination des masses, procède à une extraction non-supervisée des descripteurs à l'aide d'une méthode issue du Deep learning, à savoir les réseaux de neurones à convolution. Les descripteurs extraits, sont ensuite utilisés dans un classifieur SVM pour apprendre un modèle. Ce modèle servira par la suite à la reconnaissance du cancer du sein. Les résultats obtenus pour chacune des étapes du système de diagnostic sont très intéressants et viennent combler un vide important dans la classification des masses en général et dans la distinction des masses malignes entre elles en particulier en se fondant sur trois niveaux de décision que sont la forme, la densité et les spicules.

  • Titre traduit

    Contributions to medical images analysis for breast cancer recognition


  • Résumé

    Computer-aided diagnosis of breast cancer is raising increasingly a genuine enthusiasm because of the ever-increasing quantity of mammographic images from breast cancer screening campaigns. The focus is on breast masses due to the high risk of cancer associated with them. Indeed, the variability of shape encountered and the difficulty to discern the masses especially when theyare embedded in a high density require a new approach especially suited for the most complex cases namely the masses which belong to classes BI-RADS IV and V, i.e. spiculated breast mass and architectural distortion. In this work, a fully automatic computer-aided diagnosis system is designed for the segmentation and classification of breast mass especially for malignant masses of classes BI-RADS IV and BI-RADS V. Initially, we developped a pre-processing method combined with the reduction of the dictionary size in order to remove effectively and quickly the digitization noise of the mammographic images that make up the database used to design our computer-aided diagnosis system in comparison with the existing approaches. After the image pre-processing, we haveproposed an unsupervised segmentation method based on a Markov random field which has the advantage of being faster, more efficient and more robust than the state-of-art segmentation methods. Furthermore, the proposed method overcomes the variability of the breast masses whatever the image density. In purpose to describe correctly the spiculated malignant lesions, we proposed anapproach which avoid the computation and extraction of local features, and to rely on general-purpose classification procedures whose performance and computational efficiency can greatly vary depending on design and image characteristics. The proposed method is based on several assumptions on the structure of spicules as they appear in mammograms which have been reported in the literature. In order to make use of the above assumptions, the proposed method proceeds the following steps: first the mammogram is separated into patches onto which the curvilinear structures are discretized into segments due to Radon transform. Then, Markov modeling and contextual information are used to refine the segment positions and associate segments into curvilinear structures. Finally, spicules are detected based on a contrario model. This stage conclude the first part of the design of our computer-aided diagnosis system, that is able to extract both spiculated masses and architectural distortion. In order to complete the design of the diagnosis system, we carried out the creation of a decision support model which, contrary to what has always been done in the state-of-art for discrimination of the masses, conducts an unsupervised extraction of features through Deep learning approach - namely convolutional artificial neural networks -, combined with an SVM-type classifier. The obtained model is then stored and used as a classifier for breast cancer recognition tasks during the generalization phase. The results obtained for each step of the design of our system are very interesting and come to fill an important gap in the distinction of different type of malignant masses.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Université d'Evry-Val d'Essonne. Service commun de la documentation. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.