Thèse soutenue

Analyses hiérarchiques et temporelles de corpora scientifiques vues comme outils pour l’histoire des sciences
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Ian Jeantet
Direction : David Gross-Amblard
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 05/01/2021
Etablissement(s) : Rennes 1
Ecole(s) doctorale(s) : MATHSTIC
Partenaire(s) de recherche : Laboratoire : Institut de recherche en informatique et systèmes aléatoires (Rennes) - DRUID
Jury : Président / Présidente : Élisa Fromont
Examinateurs / Examinatrices : David Chavalarias, Zoltán Miklós
Rapporteurs / Rapporteuses : Pierre Gançarski, Christine Largeron

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Cette thèse vise à fournir une analyse automatique de publications scientifiques pour l'épistémologie quantitative. L'objectif final est de produire des cartes d'évolution des domaines scientifiques pour aider les épistémologues à déterminer les mécanismes en jeu et ce à partir du texte brut des publications. Nous proposons d'abord d'enrichir les connaissances sur la structure de la science à l'aide d'une nouvelle structure hiérarchique appelée quasi-dendrogramme qui peut être vue comme un graphe acyclique dirigé spécifique. Nous proposons un cadre d'étude comprenant un nouvel algorithme de regroupement hiérarchique chevauchant (OHC) afin de générer une telle hiérarchie à partir du texte d'articles scientifiques. L'un des problèmes majeurs est l'absence de vérité terrain. Nous proposons donc une nouvelle mesure de similarité qui compare des hiérarchies en estimant la correspondance existante entre niveaux de même taille. Enfin, nous proposons une méthode alternative pour générer des cartes évolutives de domaines scientifiques à partir de requêtes. Une carte évolutive est définie comme un ensemble de chronologies déterminées en suivant un alignement de hiérarchies de périodes consécutives. Nous avons également défini une probabilité d'évolution qui utilisée comme un seuil produit des cartes évolutives plus robustes.