Conception de réseaux de neurones adaptés à la génétique des populations
Auteur / Autrice : | Antoine Szatkownik |
Direction : | Cyril Furtlehner |
Type : | Projet de thèse |
Discipline(s) : | Informatique |
Date : | Inscription en doctorat le 01/10/2022 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et de la communication |
Partenaire(s) de recherche : | Laboratoire : Laboratoire interdisciplinaire des sciences du numérique (Orsay, Essonne ; 2021-....) |
Equipe de recherche : A&O - Apprentissage et Optimisation | |
référent : Faculté des sciences d'Orsay |
Mots clés
Résumé
L'objectif du doctorat est de concevoir des réseaux neuronaux adaptés à la génétique des populations. En utilisant des réseaux neuronaux génératifs, on peut apprendre la distribution cachée d'un jeu de données génomiques et générer de nouvelles séquences qui imitent les séquences réelles mais qui ne sont identiques à aucune d'entre elles. Le doctorant contribuera à la conception, à l'entraînement et à l'évaluation de réseaux efficaces pour de données massives. Il développera et appliquera des métriques mesurant la qualité/utilité des données générées et le surajustement (overfitting) des modèles statistiques. Enfin, il testera des approches existantes et d'autres développées dans le cadre de la thèse pour l'interprétabilité en génétique des populations. Celles-ci seront testées dans le cadre de (i) modèles génératifs et (ii) réseaux supervisés pour l'inférence évolutive.