Thèse en cours

Réconcilier des connaissances incertaines pour améliorer un graphe de connaissances
FR  |  
EN
Auteur / Autrice : Lucas Jarnac
Direction : Miguel Couceiro
Type : Projet de thèse
Discipline(s) : Informatique
Date : Inscription en doctorat le 15/02/2023
Etablissement(s) : Université de Lorraine
Ecole(s) doctorale(s) : IAEM - INFORMATIQUE - AUTOMATIQUE - ELECTRONIQUE - ELECTROTECHNIQUE - MATHEMATIQUES
Partenaire(s) de recherche : Laboratoire : LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Equipe de recherche : ORPAILLEUR

Résumé

FR  |  
EN

Les graphes de connaissances (GCs) sont devenus des atouts majeurs pour les entreprises. En effet, ils peuvent servir pour représenter et indexer les connaissances de l'entreprise ou en tant que référentiels sémantiques. Ils viennent en support de différentes applications : systèmes Question/Réponse, standardisation et interopérabilité des systèmes d'information, jumeaux numériques, ou gestion des connaissances. La construction manuelle des GCs par des experts est un processus long et fastidieux ne permettant qu'une couverture réduite par rapport à l'ensemble des connaissances disponibles. C'est pourquoi des approches d'extraction automatique de connaissances à partir de documents hétérogènes sont nécessaires (par ex., textes, CSV). Les connaissances extraites de ces sources doivent ensuite être réconciliées : il est ainsi nécessaire de détecter et gérer les équivalences (doublons), différences de granularité/vocabulaire, ou les contradictions. Cette réconciliation peut également prendre en compte des scores de confiance : dans la source, dans la connaissance représentée dans la source et exprimée par la source elle-même, dans l'algorithme d'extraction de la connaissance… L'objectif de la thèse consiste à proposer des approches pour la réconciliation des connaissances extraites de sources hétérogènes. En particulier, les travaux de thèse aborderont l'appariement des unités de connaissances (équivalences, contradictions…) en prenant en compte les spécificités de leurs sources initiales (textes, tableaux …). Nous accorderons une importance particulière à la prise en compte de leurs incertitudes / confiances différentes, à plusieurs niveaux (sources, connaissances, algorithmes d'extraction), et sur des échelles différentes (alphanumériques, probabilités...).