Thèse soutenue

Fragments structuraux : comparaison, prédictibilité à partir de la séquence et application à l'identification de protéines de virus

FR  |  
EN
Auteur / Autrice : Clovis Galiez
Direction : Jacques NicolasFrançois Coste
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 08/12/2015
Etablissement(s) : Rennes 1
Ecole(s) doctorale(s) : École doctorale Mathématiques, télécommunications, informatique, signal, systèmes, électronique (Rennes)
Partenaire(s) de recherche : PRES : Université européenne de Bretagne (2007-2016)
Laboratoire : Institut de recherche en informatique et systèmes aléatoires (Rennes) - Dyliss

Résumé

FR  |  
EN

Cette thèse propose de nouveaux outils pour la caractérisation locale de familles de protéines au niveau de la séquence et de la structure. Nous introduisons les fragments en contact (CF) comme des portions de structure conciliant localité spatiale et voisinage séquentiel. Nous montrons qu'ils bénéficient d'une meilleure prédictibilité de structure depuis la séquence que des fragments contigus ou encore que des paires de fragments qui ne seraient pas en contact en structure. Pour comparer structuralement ces CF, nous introduisons l'ASD, une nouvelle mesure de similarité ne nécessitant pas d'alignement préalable, respectant l'inégalité triangulaire tout en étant tolérante aux décalages de séquences et aux indels. Nous montrons notamment que l'ASD offre des meilleures performances que les scores classiques de comparaison de fragments sur des tâches concrètes de classification non-supervisée et de fouille structurale. Enfin, grâce à des techniques d'apprentissage automatique, nous mettrons en œuvre la détection de CF à partir de la séquence pour l'identification de protéines de virus avec l'outil VIRALpro développé au cours de cette thèse.