Bibliosémantique : une technique linguistique et informatique par exploration contextuelle

by Marc Bertin

Doctoral thesis in Informatique - Linguistique

Under the supervision of Jean-Pierre Desclès.

defended on 21-01-2011

in Paris 4 , under the authority of École doctorale Concepts et langages (Paris) , in a partnership with Sens, texte, informatique, histoire (Paris) (équipe de recherche) .

  • Alternative Title

    Bibliosémantic : a linguistic and computational method by contextual exploration


  • Abstract

    We have defined Bibliosemantics as belonging to both fields of Computing and Linguistics. Its objectives are essentially the same as those advocated by the Scientometrics, Informetrics and Bibliometrics, i. e. classify, organize, evaluate. The core of our implementation is based on the use of semantically annotated corpora by EXCOM platform. The application of the Contextual Exploration method has led to a computer implementation of Bibliosemantics based on discourse semantics, as it is not a purely metric application in the context of this study about bibliographic references. The identification of indexed or abbreviated references in a corpus of scientific papers allows to establish the textual segments candidates for annotation. This thesis also presents the discourse markers, organised in a semantic map, which constitute the necessary linguistic resources making possible the automatic semantic processing. The system has been developed as a web service, with the aim to provide a navigation interface which is user-friendly and adapted to our problem. New documentary products such as a enriched bibliographic records have been implemented in order to facilitate the exploitation of annotations by the user. Finally, we propose an evaluation of the system and we explain the used protocol. This work culminates with the presentation of a number of recommendations such as setting up a monitoring unit.


  • Abstract

    Nous avons défini la bibliosémantique comme appartenant aux domaines de l'informatique et de la linguistique. Les objectifs sont sensiblement les mêmes que ceux prônés par la scientométrie, l'infométrie ou la bibliométrie, à savoir classifier, organiser et évaluer. Le cœur de notre implémentation repose sur l’utilisation des corpora annotés sémantiquement par la plateforme EXCOM. La mise en œuvre de la méthode de l'exploration contextuelle a conduit à une implémentation informatique de la bibliosémantique qui repose donc sur une sémantique du discours à défaut d'être une application purement métrique dans le contexte de cette étude menée autour des références bibliographiques. C’est la reconnaissance des références indexées ou abrégées, au sein de corpus d’articles scientifiques, qui permet d’identifier les segments textuels candidats pour l’annotation. La thèse présente également des marqueurs discursifs organisés sous la forme d’une carte sémantique, constituant les ressources linguistiques nécessaires et permettant l’automatisation de l'ensemble des traitements sémantiques. Afin de proposer une interface de navigation conviviale et adaptée à notre problématique, le système a été développé sous forme de service web. De nouveaux produits documentaires comme une notice bibliographique augmentée ont été mis en œuvre afin de faciliter l’exploitation des annotations par l’utilisateur. Enfin, nous proposons une évaluation du système et nous explicitons le protocole utilisé. Ce travail se termine par la présentation d’un certain nombre de recommandations, notamment la mise en place d’une cellule de veille.


The full text of this thesis is unavailable online.
It's available in the institution of thesis defence.

Consult library

Version is available

Where is this thesis?

  • Library : Université de Paris-Sorbonne. Service commun de la documentation. Bibliothèque électronique.
See the Sudoc catalog libraries of higher education and research.