Thèse de doctorat en Linguistique
Sous la direction de Jean-Pierre Desclès.
Soutenue en 2004
à Paris 4 .
Le présent travail est centré sur le problème du repérage automatique des propositions dans des textes écrits. La solution proposée comprend deux grandes parties. D'une part, une analyse orientée vers l'identification des faits linguistiques pertinents pour l'identification des propositions dans une phrase et le calcul des relations entre celles-ci. D'autre part, la conception et réalisation d'un système informatique dans lesquels les faits linguistiques pertinents sont décrits et le repérage des propositions est réalisé. Comme composante du système informatique un langage de règles, les règles contextuelles, a été défini, étudié et implémentée. Deux versions du système existent à présent: une pour le français et une autre pour l'espagnol. Par le type d'analyse qui est fait, le découpage en propositions obtenu est particulièrement intéressant pour les textes élaborés, qui présentent souvent des phrases de taille et complexité considérables.
Automatic identification of propositions using contextual exploration method
This work focalizes on the automatic recognition of propositions in written texts. Two main parts may be distinguished : an analysis of linguistic relevant facts for identifying the propositions and computing the relations between them, and the design and realization of a computer system devoted to their recognition in texts. As a part of this system, a rule language, the contextual rules, has been defined, studied and implemented. By now, the system runs on two languages: French and Spanish. Its use is particularly interesting in elaborated texts, where long sentences with a high amount of internal structure are usually found.