Développement d'une stratégie innovante de modélisation de la structure des ARN - Etude des mécanismes moléculaires des IRES de type III

par Delphine Allouche

Thèse de doctorat en Biologie moleculaire

Sous la direction de Bruno Sargueil.

Thèses en préparation à Sorbonne Paris Cité , dans le cadre de École doctorale Médicament, toxicologie, chimie, imageries .


  • Résumé

    L'ARN est une macromolécule composée de bases azotées pouvant s'apparier entre elles et adopter diverses structures (secondaire, tertiaire). Cette structure secondaire est constituée de différents motifs comme des hélices, des boucles reliés entre-elles par des jonctions. La caractérisation de cette structure peut être réalisée au moyen de techniques biophysiques (cristallographie, RMN et Cryo-EM) mais également aux moyens de techniques biochimiques dites de « probing ». Des macromolécules biologiques (RNAses) ou de petites molécules chimiques permettent de sonder la structure de l'ARN en identifiant les nucléotides en simples brins. Parallèlement, il existe des logiciels qui, basés sur des calculs thermodynamiques, permettent de prédire les structures secondaires (RNAStructure, RNAFold...). La structure proposée correspond à la structure ayant l'énergie libre calculée la plus faible. Certains de ces logiciels peuvent utiliser les données expérimentales de probing comme contraintes afin d'améliorer la prédiction de la structure secondaire. Cependant ces prédictions restent inexactes pour des molécules de plus de 100 nucléotides, ceci notamment parce que le modèle thermodynamique est incomplet mais aussi parce qu'un ARN adopte plusieurs conformations. Partant de ce constat et en collaboration avec le Dr Ponty, la première partie de ma thèse a été consacrée au développement de nouvelles stratégies de modélisation de la structure secondaire des ARN. Cette méthode est basée sur des expériences de multi-probing sur un ARN de référence original : le ribozyme de Didymium iridis. D'après le modèle obtenu par diffraction aux rayons X, cet ARN possède de nombreux appariements non canoniques (appariements rarement prédit par les logiciels de prédiction), plusieurs pseudonoeuds et existe sous la forme de deux conformères. Une première stratégie qui permet d'élaborer un modèle à partir de données expérimentales multiples été développée et évaluée. Ensuite, une banque de mutants a été créée et sondée afin d'améliorer les algorithmes la prédiction des structures et surtout pour détecter les conformations alternatives. La seconde partie de ma thèse est dédiée à l'étude des mécanismes moléculaires des IRES de type III. Les IRES (Site d'Entrée Interne des Ribosomes) sont des structures présentes dans la région 5' non traduite (5'UTR) ou dans les régions intergéniques de certains ARN cellulaires ou viraux. Ces structures permettent le recrutement de la machinerie traductionnelle directement ou à proximité du codon initiateur. Les IRES sont classés en quatre catégories en fonction de leur structure et des facteurs cellulaires nécessaires au recrutement de la machinerie traductionnelle. Les IRES de type III dont le chef de file est l¿IRES du virus de l'hépatite C (HCV) possèdent des structures stables dans la région 5'UTR organisées en trois domaines et recrute un faible nombre de facteurs de l'initiation (eIFs). D'autres virus comme ceux de de la peste classique du porc (CSFV), Seneca Valley (SVV) ou le virus des frontières (BDV) possèdent des IRES semblables à l'exception d'un sous-domaine supplémentaire appelé IIId2. Le rôle de ce sous domaine n'est pas clair, en collaboration avec plusieurs équipes nous avons étudié son impact sur la traduction et la réplication de ces virus.

  • Titre traduit

    Development of an innovative strategy for modeling RNA structure - Study of the molecular mechanisms of type III IRES


  • Résumé

    RNA is a macromolecule composed of nitrogenous bases that can match each other and adopt various structures (secondary, tertiary). This secondary structure consists in the combination of different patterns such as helix, loops that are interconnected by junctions. The characterization of this structure can be carried out using biophysical techniques (crystallography, NMR and Cryo-EM) but also by biochemical techniques called "RNA structure probing". Biological macromolecules (RNAses) or small chemical molecules can probe the structure of RNA by identifying nucleotides in single strand conformation. At the same time, softwares based on thermodynamic calculations, make it possible to predict secondary structures (RNAStructure, RNAFold...). The proposed structure corresponds to the structure with the lowest calculated free energy. Some of these programs can use experimental probing data as constraints to improve the prediction of the secondary structure. However these predictions remain inaccurate for molecules longer than 100 nucleotides. In particular because the thermodynamic model is incomplete but also because an RNA adopts several conformations. Based on this observation and in collaboration with Dr. Ponty, the first part of my thesis was devoted to the development of new strategies for modeling the secondary structure of RNAs. This method is based on multi-probing experiments on an original benchmark RNA : the ribozyme of Didymium iridis. According to the model obtained by X-ray diffraction, this RNA possesses numerous non-canonical base pair (base pair rarely predicted by the prediction software), several pseudoknots and the capacity to form two conformers. A first strategy to develop a model from multiple experimental data was developed and evaluated. Then, a mutant bank was created and probed in order to improve the algorithms the prediction of the structures and especially to detect the alternative conformations. The second part of my thesis is dedicated to the study of the molecular mechanisms of IRES type III. IRES (Internal Ribosome Entry Site) are structures present in the 5' untranslated region (5'UTR) or in the intergenic regions of certain cellular or viral RNAs. These structures allow the recruitment of the translational machinery directly or near the initiator codon. IRES are classified into four categories based on their structure and the cellular factors required to recruit the translational machinery. Type III IRES, epitomized by the Hepatitis C Virus (HCV) IRES, has stable structures in the 5'UTR region organized into three domains and recruits a small number of initiation factors (eIFs). Other viruses such as Classical Swine Fever Virus (CSFV), Seneca Valley Virus (SVV) or border virus (BDV) have similar IRES with the exception of an additional subdomain called IIId2. The role of this sub-domain is not clear, in collaboration with several teams we studied its impact on the translation and replication of these viruses.