Analyse exhaustive et modèles chémoinformatiques prédictifs des données physicochimiques et (éco)toxicologiques concernées par REACH
Auteur / Autrice : | Filippo Lunghini |
Direction : | Alexandre Varnek, Gilles Marcou |
Type : | Thèse de doctorat |
Discipline(s) : | Chemoinformatique |
Date : | Soutenance le 29/09/2020 |
Etablissement(s) : | Strasbourg |
Ecole(s) doctorale(s) : | École doctorale Sciences chimiques (Strasbourg ; 1995-....) |
Partenaire(s) de recherche : | Laboratoire : Chimie de la matière complexe (Strasbourg) |
Jury : | Président / Présidente : Ronan Bureau |
Examinateurs / Examinatrices : Alexandre Varnek, Gilles Marcou, Ronan Bureau, Patricia Rotureau, Philippe Azam, Ester Papa | |
Rapporteurs / Rapporteuses : Ronan Bureau, Patricia Rotureau |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Cette thèse concerne la modélisation de propriétés environnementales et (éco)-toxicologiques pertinentes dans le cadre du règlement de l'Union Européenne sur l'enregistrement, l'évaluation, l'autorisation et la restriction des substances chimiques (REACH, CE n ° 1907/2006). Des modèles statistiques ont été générés à l'aide de méthodes d'apprentissage automatique, telles que les Séparateurs à Vaste Marge (SVM) ou les Forêts Aléatoires (Random Forest), et des descripteurs moléculaires. Les modèles sont conçus pour être utilisés comme une alternative crédible aux tests expérimentaux et pour compléter les données manquantes dans le cadre du règlement REACH. Les nouveaux modèles présentent plusieurs avantages par rapport aux modèles existants: (i) ils sont construits sur des ensembles de données sensiblement plus grands; (ii) ils sont validés sur des données externes de tailles significatives composés d’exemples issus d’un contexte industriel (l’entreprise Solvay); (iii) la précision des modèles est améliorée et leurs domaines d'applicabilité sont étendus.