Multiobjective Biclustering : from gene expression data to GWA data

par Khedidja Seridi

Thèse de doctorat en Informatique

Sous la direction de El-Ghazali Talbi et de Laetitia Jourdan.

Soutenue le 05-07-2013

à Lille 1 , dans le cadre de École doctorale Sciences pour l'Ingénieur (Lille) , en partenariat avec Laboratoire d'informatique fondamentale de Lille (LIFL) (laboratoire) .

  • Titre traduit

    Biclustering multiobjectif : des données d'expression génétiques aux données d'association génomique


  • Résumé

    Les puces à ADN sont des matrices qui indiquent les niveaux d’expression de milliers de gènes sous plusieurs conditions. L’analyse de ces données consiste à extraire des gènes qui ont un comportement similaire sous certaines conditions. En fait, les informations extraites sont des sous-matrices (biclusters) qui réspectent certaines contraints de cohérence. Le processus d'extraction est appelé biclustering. Dans cette thèse, nous traitons ce problème dans le contexte multiobjectif appliqué à l’analyse des données biologiques. Par conséquent, plusieurs questions liées à la modélisation des problèmes et la conception d’algorithmes ont été abordées. Tout d’abord, une description du problème est revue. En outre, une nouvelle mesure de la cohérence est proposée. En outre, deux modèles multiobjectif sont proposées afin d’extraire des biclusters de différents types. Par ailleurs, ce travail explore différentes métaheuristiques pour résoudre ces modèles . De plus, différentes hybridations entre les différentes métaheuristiques sont pris en compte. De plus, nous avons proposé une nouvelle application de biclustering, à savoir, l’analyse des données GWA. En fait, les données GWA consiste au génotype et le phénotype d’un ensemble d’individus. L’analyse de ces données consiste à trouver des associations entre des variants génétiques et les traits considérés. De ce fait, un modèle multiobjectifs pour le biclustering est proposé. En outre, un métaheuristique hybride est appliqué pour résoudre le modèle proposé. Les résultats expérimentaux, pour les deux applications, démontrent que les méthodes sont efficaces sur et permettent d'extraire des informations importantes.


  • Résumé

    Microarray data represents the expression levels of thousands of genes under several conditions. its analysis consists on discovering genes that have similar behavior across a subset of conditions. In fact, the extracted informations are submatrices (biclusters) that satisfy a coherence constraint. The process of extracting them is called biclustering. In this thesis, we deal with biclustering task applied to the analysis of biological data. Accordingly, several issues related to problem modeling and algorithms design have been addressed. First, a description of the problem and the different measures of biclusters coherence are reviewed. Furthermore, a new coherence measure allowing identification of all biclusters types with a low complexity is proposed. Additionally, two multiobjective models for biclustering problem are proposed in order to mine biclusters of different types. Besides problems modeling, this work investigates different metaheuristics to solve biclustering problem. Moreover, different hybridizations between different metaheuristics presenting different behaviors are considered. Additionally, we propose a new application of biclustering task, namely, analysis of GWA data. In fact, GWA data consists in genotype and phenotype informations of a set of individuals. Its analysis consists in finding associations between markers and the considered traits. Thus, a multiobjective model for biclustering method is proposed. Moreover, a hybrid metaheuristic is applied to solve the proposed model. Experimental results, for both applications, demonstrate that the proposed approaches are effective and are able to extract relevant informations from the considered data.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Université des sciences et technologies de Lille. Service commun de la documentation. Bibliothèque virtuelle.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.