Thèse soutenue

Analyse exhaustive et modèles chémoinformatiques prédictifs des données physicochimiques et (éco)toxicologiques concernées par REACH

FR  |  
EN
Auteur / Autrice : Filippo Lunghini
Direction : Alexandre VarnekGilles Marcou
Type : Thèse de doctorat
Discipline(s) : Chemoinformatique
Date : Soutenance le 29/09/2020
Etablissement(s) : Strasbourg
Ecole(s) doctorale(s) : École doctorale Sciences chimiques (Strasbourg ; 1995-....)
Partenaire(s) de recherche : Laboratoire : Chimie de la matière complexe (Strasbourg)
Jury : Président / Présidente : Ronan Bureau
Examinateurs / Examinatrices : Alexandre Varnek, Gilles Marcou, Ronan Bureau, Patricia Rotureau, Philippe Azam, Ester Papa
Rapporteurs / Rapporteuses : Ronan Bureau, Patricia Rotureau

Résumé

FR  |  
EN

Cette thèse concerne la modélisation de propriétés environnementales et (éco)-toxicologiques pertinentes dans le cadre du règlement de l'Union Européenne sur l'enregistrement, l'évaluation, l'autorisation et la restriction des substances chimiques (REACH, CE n ° 1907/2006). Des modèles statistiques ont été générés à l'aide de méthodes d'apprentissage automatique, telles que les Séparateurs à Vaste Marge (SVM) ou les Forêts Aléatoires (Random Forest), et des descripteurs moléculaires. Les modèles sont conçus pour être utilisés comme une alternative crédible aux tests expérimentaux et pour compléter les données manquantes dans le cadre du règlement REACH. Les nouveaux modèles présentent plusieurs avantages par rapport aux modèles existants: (i) ils sont construits sur des ensembles de données sensiblement plus grands; (ii) ils sont validés sur des données externes de tailles significatives composés d’exemples issus d’un contexte industriel (l’entreprise Solvay); (iii) la précision des modèles est améliorée et leurs domaines d'applicabilité sont étendus.