Recherche des tendances thématiques dans les publications scientifiques : définition d'une méthodologie fondée sur la linguistique
Auteur / Autrice : | Fidelia Ibekwe-Sanjuan |
Direction : | Jacques Rouault |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences de l'information |
Date : | Soutenance en 1997 |
Etablissement(s) : | Grenoble 3 |
Mots clés
Résumé
La problematique de la these est d'elaborer une methodologie, qui a partir d'un corpus de textes scientifiques courts en anglais, extrait les unites d'information pertinentes qui sont des termes et qui sont soumis d'abord a une etape de recherche de variantes syntaxiques et ensuite a une etape de classification afin de mettre en evidence les tendances thematiques. L'extraction des termes passe par une analyse morpho-syntaxique de la proposition et ensuite par une analyse syntaxique locale des syntagmes nominaux. Avant l'extraction des termes candidats, l'analyse morpho-syntaxique cherche a traiter des phenomenes linguistiques tels que la coordination et l'anaphorisation qui empechent l'extraction des unites syntaxiques elidees ou substituees. Les unites extraites sont des termes candidats qui sont soumis a une etape de filtrage pour eliminer les candidats les plus improbables. Les termes retenus font l'objet d'une recherche de relations de variations syntaxiques. . . .