Thèse soutenue

Modélisation, analyse et classification de motifs structuraux d'ARN à partir de leur contexte, par des méthodes d'algorithmique de graphes

FR  |  
EN
Auteur / Autrice : Coline Gianfrotta
Direction : Dominique BarthAlain Denise
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 10/10/2022
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication
Partenaire(s) de recherche : Laboratoire : Données et algorithmes pour une ville intelligente et durable (Versailles ; 2015-...)
référent : Université de Versailles-Saint-Quentin-en-Yvelines (1991-....)
graduate school : Université Paris-Saclay. Graduate School Informatique et sciences du numérique (2020-....)
Jury : Président / Présidente : Sarah Cohen-Boulakia
Examinateurs / Examinatrices : Dominique Barth, Guillaume Fertin, Christine Gaspin, Alessandra Carbone
Rapporteurs / Rapporteuses : Guillaume Fertin, Christine Gaspin

Résumé

FR  |  
EN

Dans cette thèse, nous étudions le contexte structural de motifs structuraux d'ARN dans le but de progresser vers leur prédiction. En effet, certains motifs d'ARN, sous-structures apparaissant de façon récurrente dans les structures d'ARN, restent difficiles à prédire, en raison de la présence d'interactions non canoniques dans ces motifs, et en raison de la distance sur la séquence primaire séparant les différentes parties de ces motifs. Nous modélisons ainsi par des graphes le contexte structural topologique de ces motifs, et comparons les contextes des différentes occurrences en utilisant plusieurs algorithmes de graphes. Nous classifions ensuite les occurrences de motif selon leurs similarités de contexte topologique et selon leurs similarités de contexte 3D, à l'aide d'un algorithme de clustering recouvrant.Dans un premier temps, nous montrons sur un jeu de données de trois motifs structuraux que les similarités observées entre les contextes topologiques sont cohérentes avec les similarités entre les contextes 3D. Cela indique que le contexte topologique peut être suffisant pour déterminer le contexte 3D pour ces trois motifs.Dans un deuxième temps, nous étudions plusieurs classifications d'occurrences du motif A-minor, selon des similarités de contexte 3D. Nous y observons que des similarités de contexte 3D existent entre occurrences non homologues, ce qui pourrait être le signe d'un phénomène de convergence évolutive. De plus, nous observons que certaines parties du contexte 3D semblent mieux conservées que d'autres entre occurrences non homologues.Dans un troisième temps, nous étudions la capacité de prédiction du contexte topologique commun à des occurrences de motif A-minor, partageant des contextes 3D similaires, ainsi que la capacité de prédiction d'un signal de séquence sur ces mêmes occurrences. Pour cela, nous étudions la fréquence d'apparition de cette topologie et de ces séquences dans des structures d'ARN en l'absence de motifs A-minor. Nous en concluons que la topologie et la séquence associées représentent un bon signal pour la majorité des classes d'occurrences homologues étudiées.