Comment les Big Data nous informent sur l'état de Santé de la population

par Florian Baudin

Projet de thèse en Médecine, pathologie cardiorespiratoire et vasculaire

Sous la direction de Catherine Creuzot garcher et de Catherine Quantin.

Thèses en préparation à Bourgogne Franche-Comté , dans le cadre de École doctorale Environnements, Santé (Dijon ; Besançon ; 2012-....) , en partenariat avec Physiopathologie Epidémiologie Cérébro-Cardiovasculaires (laboratoire) depuis le 01-11-2018 .


  • Résumé

    Si l'épidémiologie utilise depuis longtemps des méthodes d'analyse quantitatives, l'apparition des technologies numériques a bouleversé notre manière d'acquérir et de traiter ces données. Le volume de données disponibles augmente chaque jour considérablement et ces BIG DATA nous offrent aujourd'hui de nouvelles opportunités. Prenons par exemple le sur-risque de cancer du poumon lié au tabagisme. Avant 1950 et les travaux de Hammond et Horn, les études ne portaient pas sur un panel assez large pour détecter un évènement d'occurrence peu fréquente, ou avaient un recul insuffisant pour mettre en évidence ce sur-risque. Ces deux chercheurs ont été à l'origine de la première étude d'envergure disposant de données suffisamment volumineuses pour détecter un lien entre tabagisme et cancer du poumon. Cette approche préfigurait l'utilité des BIG DATA. A l'ère de la numérisation et de l'expansion des données collectées, l'intérêt de l'étude des données des Big Data prend tout son sens en Santé afin d'offrir une médecine de plus en plus sécuritaire et actualisée. Le nombre exponentiel de publications utilisant les bases de données est symptomatique de l'intérêt que leur porte la communauté scientifique. Par ailleurs, de nombreuses questions sont soulevées à la fois par l'utilisation et l'interprétation des BIG DATA mais aussi par l'enjeu de leur influence sur les dynamiques sociales et économiques. L'objectif de cette thèse de science sera d'étudier la survenue de complications locales ou systémiques à la suite de prises en charges ophtalmologiques dont l'occurrence, trop faible, est à l'origine de débat au sein de la communauté scientifique. Ces facteurs de risques ne peuvent être étudiés qu'à l'aide de bases de données suffisamment volumineuses. Nous faisons l'hypothèse que l'apport des BIG DATA est aujourd'hui essentiel. En effet, elle permettrait de réduire les coûts de traitements, de prédire les ruptures épidémiologiques, de prévenir les complications évitables et d'améliorer la qualité de vie des patients en général.

  • Titre traduit

    How Big Data Informs Us About the Population Health Status


  • Résumé

    If epidemiology has long used quantitative analysis methods, the emergence of digital technology has revolutionized the way we acquire and process data. The volume of data increases every day, and BIG DATA offers us new opportunities today. For example, consider the increased risk of lung cancer associated with smoking. Before 1950 and the work of Hammond and Horn, the studies did not involve a wide enough range to detect an event of rare occurrence or had an insufficient follow-up to prove this increased risk. These two researchers were responsible for the first major study, providing sufficiently large data for detecting a link between smoking and lung cancer. This approach foreshadowed the usefulness of BIG DATA studies. In the era of the digitization and expansion of the data collected, the interest of the study using big data makes sense in Health to offer a safer and updated medicine. The exponential number of publications using databases is symptomatic of the scientific community interest. Also, many questions are raised both by the use and interpretation of BIG DATA but also by the issue of their influence on social and economic dynamics. The objective of this science thesis will be to study the occurrence of local or systemic complications following ophthalmological care, whose occurrence, too low, is the source of debate within the scientific community. These risk factors can only be studied using large enough databases. We assume that the contribution of BIG DATA is essential today. It would reduce treatment costs, predict epidemiological outbreaks and preventable complications and improve the quality of life of patients in general.