Thèse soutenue

Bibliosémantique : une technique linguistique et informatique par exploration contextuelle
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Marc Bertin
Direction : Jean-Pierre Desclès
Type : Thèse de doctorat
Discipline(s) : Informatique - Linguistique
Date : Soutenance le 21/01/2011
Etablissement(s) : Paris 4
Ecole(s) doctorale(s) : École doctorale Concepts et langages (Paris)
Partenaire(s) de recherche : Equipe de recherche : Sens, texte, informatique, histoire (Paris)
Jury : Président / Présidente : Véronique Richard
Examinateurs / Examinatrices : Jean-Pierre Desclès, Stefan Gradmann, Mohamed Hassoun, Frédérique Segond, Brigitte Gay
Rapporteurs / Rapporteuses : Stefan Gradmann, Mohamed Hassoun

Résumé

FR  |  
EN

Nous avons défini la bibliosémantique comme appartenant aux domaines de l'informatique et de la linguistique. Les objectifs sont sensiblement les mêmes que ceux prônés par la scientométrie, l'infométrie ou la bibliométrie, à savoir classifier, organiser et évaluer. Le cœur de notre implémentation repose sur l’utilisation des corpora annotés sémantiquement par la plateforme EXCOM. La mise en œuvre de la méthode de l'exploration contextuelle a conduit à une implémentation informatique de la bibliosémantique qui repose donc sur une sémantique du discours à défaut d'être une application purement métrique dans le contexte de cette étude menée autour des références bibliographiques. C’est la reconnaissance des références indexées ou abrégées, au sein de corpus d’articles scientifiques, qui permet d’identifier les segments textuels candidats pour l’annotation. La thèse présente également des marqueurs discursifs organisés sous la forme d’une carte sémantique, constituant les ressources linguistiques nécessaires et permettant l’automatisation de l'ensemble des traitements sémantiques. Afin de proposer une interface de navigation conviviale et adaptée à notre problématique, le système a été développé sous forme de service web. De nouveaux produits documentaires comme une notice bibliographique augmentée ont été mis en œuvre afin de faciliter l’exploitation des annotations par l’utilisateur. Enfin, nous proposons une évaluation du système et nous explicitons le protocole utilisé. Ce travail se termine par la présentation d’un certain nombre de recommandations, notamment la mise en place d’une cellule de veille.