Algorithmes pour la fouille de données et la bio-informatique

Kartick Chandra Mondal

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

FR |

EN

Auteur / Autrice :	Kartick Chandra Mondal
Direction :	Nicolas Pasquier
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 12/07/2013
Etablissement(s) :	Nice
Ecole(s) doctorale(s) :	École doctorale Sciences et technologies de l'information et de la communication (Sophia Antipolis, Alpes-Maritimes)
Partenaire(s) de recherche :	Laboratoire : Laboratoire Informatique, signaux et systèmes (Sophia Antipolis, Alpes-Maritimes)
Jury :	Examinateurs / Examinatrices : Nicolas Pasquier, Frédéric Precioso, Martine Collard-Poulard, Pascal Poncelet, Andrea Tettamanzi, Nicolas Lachiche

Mots clés

FR |

EN

Mots clés contrôlés

Arbres (théorie des graphes)

Treillis, Théorie des

Exploration de données

Mots clés libres

Extraction de connaissances à partir des données

Bases de règles d'association

Règles de classification

Règles d'association conceptuelles

Itemsets fermés fréquents

Treillis des itemsets fermés

Connexion de galois

Analyse de concepts formels

Structures de données

Arbres suffixés

Résumé

FR |

EN

L'extraction de règles d'association et de bi-clusters sont deux techniques de fouille de données complémentaires majeures, notamment pour l'intégration de connaissances. Ces techniques sont utilisées dans de nombreux domaines, mais aucune approche permettant de les unifier n'a été proposée. Hors, réaliser ces extractions indépendamment pose les problèmes des ressources nécessaires (mémoire, temps d'exécution et accès aux données) et de l'unification des résultats. Nous proposons une approche originale pour extraire différentes catégories de modèles de connaissances tout en utilisant un minimum de ressources. Cette approche est basée sur la théorie des ensembles fermés et utilise une nouvelle structure de données pour extraire des représentations conceptuelles minimales de règles d'association, bi-clusters et règles de classification. Ces modèles étendent les règles d'association et de classification et les bi-clusters classiques, les listes d'objets supportant chaque modèle et les relations hiérarchiques entre modèles étant également extraits. Cette approche a été appliquée pour l'analyse de données d'interaction protéomiques entre le virus VIH-1 et l'homme. L'analyse de ces interactions entre espèces est un défi majeur récent en bio-informatique. Plusieurs bases de données intégrant des informations hétérogènes sur les interactions et des connaissances biologiques sur les protéines ont été construites. Les résultats expérimentaux montrent que l'approche proposée peut traiter efficacement ces bases de données et que les modèles conceptuels extraits peuvent aider à la compréhension et à l'analyse de la nature des relations entre les protéines interagissant.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Algorithmes pour la fouille de données et la bio-informatique

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Algorithmes pour la fouille de données et la bio-informatique

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses