Identification et exploitation de paraphrases sous-phrastiques extraites de l'historique des révisions de Wikipédia

par Yuming Zhai

Projet de thèse en Informatique

Sous la direction de Anne Vilnat et de Aurélien Max.

Thèses en préparation à Paris Saclay , dans le cadre de École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne) , en partenariat avec LIMSI - Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur (laboratoire) , ILES - Information, Langue Ecrite et Signée (equipe de recherche) et de Université Paris-Sud (établissement de préparation de la thèse) depuis le 01-10-2016 .


  • Résumé

    Ce sujet de thèse vise à explorer et développer de nouvelles approches pour identifier des réécritures sans changement de sens dans de grands ensembles de réécritures extraites automatiquement de l'historique de révisions de Wikipédia, apprendre des patrons de réécriture, et exploiter les connaissances acquises pour proposer de nouveaux types d'aides à la rédaction pour les contributeurs de Wikipédia.

  • Titre traduit

    Identification and exploitation of sub-sentential paraphrases extracted from Wikipedia's revision history


  • Résumé

    This PhD project aims to develop and evaluate innovative approaches to identify meaning-preserving rewritings from large sets of rewritings automatically collected from Wikipedia's revision history, to infer paraphrasing patterns, and to leverage the collected knowledge to provide a new type of authoring assistance to Wikipedia contributors.