Thèse de doctorat en Sciences et techniques communes
Sous la direction de JACQUES LEBBE.
Soutenue en 1997
à Paris 6 .
Le but de ce travail est de concevoir une plate-forme permettant d'acquerir des connaissances a partir de textes de description de concepts naturels pour constituer des bases de connaissances. Ce systeme d'acquisition, qui ne peut se passer de toute intervention humaine, est concu neanmoins pour reduire autant que possible le nombre d'interactions de l'utilisateur-expert lors du processus d'acquisition. Ces interactions sont indispensables pour acquerir l'expertise de l'intervenant mais aussi pour resoudre les problemes d'ambiguite ou de choix. Les textes auxquels nous nous interessons ont la particularite de posseder une structure sous-jacente liee a la structure des objets decrits et qui se retrouve d'un concept a l'autre. Cette regularite aide le lecteur dans la comparaison des descriptions et varie plus ou moins selon les auteurs et le groupe de concepts decrits. Notre travail consiste tout d'abord a concevoir un modele de base adapte aux types de connaissances a acquerir. Differents scenarios d'acquisition, de complexite croissante, sont ensuite etudies. Le scenario le plus simple laisse le processus d'acquisition entierement a la charge de l'utilisateur. Le scenario le plus complexe, lui, utilise la regularite des textes pour reduire les actions et indications de l'expert dans le processus d'acquisition. Profitant de la regularite des textes etudies, la solution retenue exploite une nouvelle methode d'alignement multiple de textes sous contrainte d'un modele afin de propager efficacement les indications de l'expert d'un texte a l'autre. Le systeme d'acquisition obtenu est incremental, interactif grace a une interface resolument modeless et il garantit a chaque pas le maintien de la coherence de la base. Le domaine d'application privilegie de ce travail est sans conteste la systematique qui est un domaine ou la sauvegarde de l'expertise apparait cruciale aujourd'hui et dont les ecrits sont accumules depuis plusieurs siecles. Les descriptions de concepts naturels tels qu'on les trouve dans les monographies de la systematique, qui decrivent la biodiversite vegetale et animale, sont des sources importantes d'applications. Cependant des textes de description de concepts presentant des regularites se retrouvent dans d'autres domaines scientifiques comme la medecine, la geologie ou la mineralogie.
Knowledge acquisition from structured texts
Pas de résumé disponible.