Analyse textuelle des procédures judiciaires : pour une méthodologie et un outillage linguistique d'aide à l'interprétation et à la décision

par Lucie Gianola

Projet de thèse en Sciences du langage - Cergy

Sous la direction de Julien Longhi.

Thèses en préparation à Cergy-Pontoise , dans le cadre de ED DSH - Droit et Sciences Humaines , en partenariat avec AGORA (laboratoire) depuis le 01-12-2016 .


  • Résumé

    Ce projet vise à instaurer une collaboration entre des chercheurs de l'UCP et des criminologues du PJGN, et à proposer une recherche innovante en analyse textuelle de corpus liés aux questions de sécurité. Inscrit dans le cadre de l'analyse outillée du discours, et en interaction avec la fouille de données textuelles, ce projet concerne d'une manière générale l'analyse des informations : il s'agit donc d'un travail sur les données textuelles à objectiver pour servir les questions de sécurité, afin de pourvoir opérer des déductions plutôt que des interprétations. Les données considérées étant sensibles, l'importance d'outils et de critères objectifs est un enjeu fort pour asseoir des décisions qui pourraient être prises. Sur la base de données de procédures judiciaires numérisées (auditions, perquisitions, rapports d'expertises, données téléphoniques et bancaires, investigations, etc.), il s'agira de pouvoir traiter ce matériau textuel efficacement, en articulant des critères linguistiques qualitatifs, et des méthodes quantitatives (extraction automatique d'entités, notion de liens entre des entités déterminées à travers l'analyse des données contextuelles de proximité, élaboration d'un lexique adapté à la thématique, etc.). Ces éléments pourraient impacter directement le travail des agents concernés par la sécurité, en leur donnant des outils ou méthodologies pour les assister dans la prise de décision.

  • Titre traduit

    Textual analysis of judicial proceedings for the creation of methodologies and linguistic tools to assist interpretation and decision making


  • Résumé

    This project aims to establish a cooperation between UCP's researchers and criminal analysts from PJGN, and to propose an innovative textual analysis method in relation to security issues. In the frame of computer-aided discourse analysis and text mining, this project will use textual data to help security issues, in order to make inferences instead of interpretations. As we will be using sensitive data, objective tools and criteria are a strong challenge in decision-making process. On the basis of digital judicial proceedings data (interviews, searches, reports, telephone and banking data, investigations, etc.), we will process this textual data efficiently, using both qualitative linguistic criteria and quantitative methods (named-entities recognition, links between entities defined through contextual data analysis, definition of a specialized lexicon, etc.). These factors could have a direct impact on the work of agents involved in security issues, providing them with tools and methodology to help decision-making.