Auteur / Autrice : | Lucas Jarnac |
Direction : | Miguel Couceiro |
Type : | Projet de thèse |
Discipline(s) : | Informatique |
Date : | Inscription en doctorat le 15/02/2023 |
Etablissement(s) : | Université de Lorraine |
Ecole(s) doctorale(s) : | IAEM - INFORMATIQUE - AUTOMATIQUE - ELECTRONIQUE - ELECTROTECHNIQUE - MATHEMATIQUES |
Partenaire(s) de recherche : | Laboratoire : LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications |
Equipe de recherche : ORPAILLEUR |
Mots clés
Mots clés libres
Résumé
Les graphes de connaissances (GCs) sont devenus des atouts majeurs pour les entreprises. En effet, ils peuvent servir pour représenter et indexer les connaissances de l'entreprise ou en tant que référentiels sémantiques. Ils viennent en support de différentes applications : systèmes Question/Réponse, standardisation et interopérabilité des systèmes d'information, jumeaux numériques, ou gestion des connaissances. La construction manuelle des GCs par des experts est un processus long et fastidieux ne permettant qu'une couverture réduite par rapport à l'ensemble des connaissances disponibles. C'est pourquoi des approches d'extraction automatique de connaissances à partir de documents hétérogènes sont nécessaires (par ex., textes, CSV). Les connaissances extraites de ces sources doivent ensuite être réconciliées : il est ainsi nécessaire de détecter et gérer les équivalences (doublons), différences de granularité/vocabulaire, ou les contradictions. Cette réconciliation peut également prendre en compte des scores de confiance : dans la source, dans la connaissance représentée dans la source et exprimée par la source elle-même, dans l'algorithme d'extraction de la connaissance L'objectif de la thèse consiste à proposer des approches pour la réconciliation des connaissances extraites de sources hétérogènes. En particulier, les travaux de thèse aborderont l'appariement des unités de connaissances (équivalences, contradictions ) en prenant en compte les spécificités de leurs sources initiales (textes, tableaux ). Nous accorderons une importance particulière à la prise en compte de leurs incertitudes / confiances différentes, à plusieurs niveaux (sources, connaissances, algorithmes d'extraction), et sur des échelles différentes (alphanumériques, probabilités...).