Thèse soutenue

Tests d'adéquation à la loi de Newcomb-Benford comme outils de détection de fraudes

FR  |  
EN
Auteur / Autrice : Komlavi Vovor-Dassu
Direction : Gilles Ducharme
Type : Thèse de doctorat
Discipline(s) : Biostatistique
Date : Soutenance le 06/12/2021
Etablissement(s) : Montpellier
Ecole(s) doctorale(s) : École doctorale Information, Structures, Systèmes (Montpellier ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Institut Montpelliérain Alexander Grothendieck (Montpellier ; 2003-....)
Jury : Examinateurs / Examinatrices : Gilles Ducharme, Marcel Ausloos, Jean-Michel Marin, Catherine Trottier, Élise Janvresse
Rapporteurs / Rapporteuses : Jean-Paul Delahaye, Marcel Ausloos

Mots clés

FR  |  
EN

Mots clés contrôlés

Résumé

FR  |  
EN

Je vous propose le pari suivant : ouvrons le journal, choisissons une page au hasard et notons le premier nombre que nous rencontrons ; si le premier chiffre significatif de ce nombre est supérieur à 3, je vous donnerai 100 euros, sinon c'est vous qui me donnerez 100 euros. La proposition vous est, semble-t-il, nettement favorable : il n'y a en effet que trois chiffres qui me font gagner (1,2,3), alors qu'il y en a six pour vous (4,5,6,7,8,9); le 0 ne compte pas, car il ne peut pas être un premier chiffre significatif. Vous pensez donc gagner environ deux fois sur trois. Serais-je idiot de vous proposer un tel pari ? Eh bien non : si vous acceptez, je gagnerai dans plus de 60 pour cent des cas. Aussi étonnant que cela paraisse, le premier chiffre significatif d'un nombre rencontré dans un article de journal n'a pas autant de chances d'être un 1, un 2, un 3, ..., ou un 9 (la probabilité serait alors 1/9, ou 11,11 pour cent). La loi de Newcomb-Benford indique que, dans un contexte général comme celui d'un article de journal, les probabilités p de rencontrer les différents chiffres comme premier chiffre significatif sont, exprimées en pourcentage : p(1)=30,1; p(2)=17,6 ;p(3)=12,5; p(4)=9,7;p(5)=7,9;p(6)=6,7;p(7)=5,8 ; p(8)=5,1;p(9)=4,6. Puisque 30,1+17,6+2,5=60,2, je gagnerai mon pari dans 60,2 pour cent des cas. Comment tester la qualité de l'ajustement des données à cette loi si contraire à l'intuition ? Wong (2010) apporta des réponses à cette question en utilisant le premier et deuxième chiffre significatif basée sur les travaux de Lesperance et al. (2016) sur le premier chiffre significatif. Mais Cerioli et al. (2018) fournit une motivation pour de nouveaux tests de conformité à la loi de Newcomb-Benford. Le but de ce travail est donc de proposer de nouveaux tests d'adéquations basés sur les tests lisses de Neyman (1937). Nous étudions la puissance de nos tests sous différentes alternatives et nous arrivons à la conclusion que notre test est globalement préférable aux tests existants