Etude expérimentale de la segmentation d'un texte en paragraphes

par Evelyne Mounier

Thèse de doctorat en Sciences de l'information

Sous la direction de Jacques Rouault et de André Bisseret.

Soutenue en 1996

à l'Université Stendhal (Grenoble) .


  • Résumé

    La recherche qu'on présente ici concerne la notion de paragraphe. On cherche a recueillir expérimentalement des connaissances sur les sujets en situation de production de textes. L'étude est centrée sur les raisons qui poussent les sujets à introduire des marques de paragraphes. Trois expériences ont été faites. Dans la première expérience, on demande à des sujets placés en situation de correcteurs de réinstaller des marques de paragraphes dans un texte duquel elles ont été enlevées et d'expliquer oralement leurs choix. Les résultats montrent que les sujets distinguent le sous-paragraphe et le paragraphe et qu'il existe des parties de texte dans lesquelles aucune marque de paragraphe n'est insérée. Un ensemble de raisons semblent concourir à l'introduction d'une marque de paragraphe (taille, intention de l'auteur, etc. ). Dans la seconde expérience, on demande à un sujet auteur d'un article d'expliciter les raisons qui le conduisent à introduire ou non une marque de paragraphe dans son texte. Une liste de règles de type si alors a été déduite. L'une des raisons qui poussent le sujet à changer de paragraphe c'est qu'il change d'idée. Dans la troisième expérience, on tente de préciser cette règle en tenant compte des facteurs cognitifs (hypothèse de Fayol). On montre que l'utilisation de la marque de paragraphe s'insère dans le cadre plus général des signes de ponctuation et qu'elle est liée à deux facteurs : la représentation mentale propre au sujet et au volume d'informations à traduire. Deux types de développement sont envisagés : la recherche d'information dans les documents techniques en texte intégral et la génération de textes.


  • Résumé

    This research is concerned with the notion of paragraph. We try to collect experimental knowledge about subjects producing texts. The study is focused on the reasons that induce the subjects to insert paragraph marks. Three experiments are presented. In the first one, subjects were asked to correct a text by reinserting paragraph marks in a text where they had been removed and then to orally explain theirs choices. The results show that subjects make a distinction between paragraph marks and sub-paragraph marks and we find whole parts of texts where no mark of paragraph at all is inserted. Introducing of paragraph mark seems to be the result of a whole combinaison of reasons (length of paragraph, writer's intention, etc. ). In the second experiment, a subject who wrote a paper is asked to explain the reasons that induced him to insert or not insert a paragraph mark in his text. A set of "if then" type rules was deducted. The main reason to insert a mark of paragraph is that the subject wants to insert a new idea. In the third experiment, we try to be more specific about this rule by including cognitive aspects (Fayol's hypothesis). We show that using paragraph marks must be considered in the context of all punctuation marks and that it is linked to two factors : the subject's mental representation and the size of the text to be produced. Two developments are considered : information retrieval in technical documents and text generation.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (252 f., [1] dépl.)
  • Notes : Publication autorisée par le jury

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Grenoble Alpes (Saint-Martin-d'Hères, Isère). Bibliothèque et appui à la science ouverte. Bibliothèque universitaire Droit-Lettres.
  • Accessible pour le PEB
  • Bibliothèque : Université Grenoble Alpes (Saint-Martin-d'Hères, Isère). Bibliothèque et appui à la science ouverte. Bibliothèque universitaire Droit-Lettres.
  • Disponible pour le PEB
  • Cote : TL 205143/1996/44
  • Bibliothèque : Université Grenoble Alpes (Echirolles, Isère). Bibliothèque Yves de la Haye.
  • Disponible pour le PEB
  • Cote : TH 96/11
  • Bibliothèque : Ecole nationale supérieure des sciences de l'information et des bibliothèques (Villeurbanne, Rhône). Bibliothèque.
  • Non disponible pour le PEB
  • Cote : TH 170

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Université de Lille. Service commun de la documentation. Bibliothèque universitaire de Sciences Humaines et Sociales.
  • Non disponible pour le PEB
  • Cote : 1996GRE39044
  • Bibliothèque : Université Paris-Est Créteil Val de Marne. Service commun de la documentation. Section multidisciplinaire.
  • PEB soumis à condition
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.