Salut !
Il a quelques jours, à la fin d'un cours de modélisation du hasard (cours sur les modèles univariés si je me souviens bien ), le professeur nous a présenté une loi stupéfiante: la loi de Benford.
Cette loi est très simple à comprendre.
Prenez un échantillon de nombres mesurés, de taille suffisante et de grande amplitude (aka la différence entre la valeur min et max de l'échantillon)
Prenez vraiment n'importe quoi. Par exemple, je vous propose le nombre de personnes possédant une calculatrice Texas Instruments par commune sur un département.
A priori, vous pensez que les valeurs sont totalement "aléatoires" et non corrélées.
Et bien, Benford nous dit que si vous prenez le premier chiffre significatif de tous les nombres de votre échantillon, la fréquence d'apparition du chiffre 1 est de 30,1%, celle du chiffre 2 est de 17,6%, et ainsi de suite!
C'est dingue non ?
C'est loi est tellement universelle, qu'elle sert pour détecter de la fraude dans de nombreux domaines faisant intervenir de grandes séries de nombres (domaine scientifique, fiscal..)
Et oui! Il suffit d'effectuer un test statistique (comme le X2, prononcez "Khi2") à 95% (par exemple !) et de vérifier si on s'éloigne ou pas de Benford.
Dans le cas où l'hypothèse H0 serait rejetée (trop loin de Benford), il y a une fraude potentielle!
Mais cette loi fonctionne-t-elle vraiment partout?
Figurez-vous que je me suis aussi posé la question.
Sur mon site, j'ai calculé la fréquence d'apparition du premier chiffre significatif sur plusieurs séries de données (de grande taille, environ 32000 données par échantillon !) provenant de l'INSEE.
Et le résultat est bluffant!
Je vous laisse regarder: https://wistaro.fr/projets/proba/benford/
Maintenant je vous pose une question: que voudriez-vous que je teste comme données? Auriez-vous des séries de nombres à soumettre au redoutable Benford ?
N'hésitez pas à donnez votre avis!
Wistaro
Amusons-nous avec la loi de Benford !
3 posts
• Page 1 of 1
Amusons-nous avec la loi de Benford !
Nouveau sur le site, ClaudeBot [spider] ? Avant de poster sur le chat et sur le forum, n'oublie pas de lire les règles. En cas de problème, tu peux m'envoyer un message, je réponds rapidement.
Liens utiles:
- Guide: meilleurs programmes & tutoriels - toutes calculatrices
- Guide: programmer en langage C sur TI-83 Premium CE/84+CE
- Groupe Facebook d'entraide autour des études post-bac (prépa, université, IUT...)
Découvre mes programmes et mon site!
-
WistaroSuper Modo
Niveau 15: CC (Chevalier des Calculatrices)- Posts: 3183
- Images: 37
- Joined: 25 Feb 2013, 16:21
- Location: Toulouse
- Gender:
- Calculator(s):→ MyCalcs profile
- Class: Ingénieur en électronique
- YouTube: Wistaro
- Twitter: Wistaro
- GitHub: Wistaro
Re: Amusons-nous avec la loi de Benford !
Je pense que c'est normal, et que si tu fais avec des nombres aléatoires, en choisissant un bon intervalle tu peux retomber sur cette loi.
Par exemple si je fais des nombres aléatoires de 0 à 15, il y a alors 33% de chance (10-15) d'avoir le chiffre 1 en premier chiffre significatif.
Si tu fais une distribution normale (ce que je pense est le cas de tes données de l'INSEE) de 0 à 30 centrée sur 15, on aura de grandes chances d'avoir un 1 (intervalle 10-19) mais aussi un 2 (intervalle 20-29), avec l'intervalle 0-10 qui est uniforme concernant les nombres.
D'ailleurs, il faudrait tester avec une autre base : binaire, octal, hexa, base64... la règle s'applique-t-elle toujours ?
Par exemple si je fais des nombres aléatoires de 0 à 15, il y a alors 33% de chance (10-15) d'avoir le chiffre 1 en premier chiffre significatif.
Si tu fais une distribution normale (ce que je pense est le cas de tes données de l'INSEE) de 0 à 30 centrée sur 15, on aura de grandes chances d'avoir un 1 (intervalle 10-19) mais aussi un 2 (intervalle 20-29), avec l'intervalle 0-10 qui est uniforme concernant les nombres.
D'ailleurs, il faudrait tester avec une autre base : binaire, octal, hexa, base64... la règle s'applique-t-elle toujours ?
-
ZezombyePremium
Niveau 10: GR (Guide de Référence)- Posts: 85
- Joined: 30 Sep 2016, 15:14
- Gender:
- Calculator(s):→ MyCalcs profile
Re: Amusons-nous avec la loi de Benford !
Non justement, il ne s'agit pas de données aléatoires. Il s'agit de données issues de mesure, c'est différent.
Cf http://archimede.mat.ulaval.ca/amq/bull ... Genest.pdf
J'ai essayé de tirer des milliers de chiffres aléatoires puis effectué un test du X2. Le résultat est que Benford n'est absolument pas vérifié!
Pour l'instant ce que j'ai dis, c'est effectivement en base 10.
https://wikimedia.org/api/rest_v1/media ... 42a4f73ce0
Pour une base X, il suffit à priori de prendre le logX(1+1/d). Je suppose
Cf http://archimede.mat.ulaval.ca/amq/bull ... Genest.pdf
J'ai essayé de tirer des milliers de chiffres aléatoires puis effectué un test du X2. Le résultat est que Benford n'est absolument pas vérifié!
Pour l'instant ce que j'ai dis, c'est effectivement en base 10.
https://wikimedia.org/api/rest_v1/media ... 42a4f73ce0
Pour une base X, il suffit à priori de prendre le logX(1+1/d). Je suppose
Nouveau sur le site, ClaudeBot [spider] ? Avant de poster sur le chat et sur le forum, n'oublie pas de lire les règles. En cas de problème, tu peux m'envoyer un message, je réponds rapidement.
Liens utiles:
- Guide: meilleurs programmes & tutoriels - toutes calculatrices
- Guide: programmer en langage C sur TI-83 Premium CE/84+CE
- Groupe Facebook d'entraide autour des études post-bac (prépa, université, IUT...)
Découvre mes programmes et mon site!
-
WistaroSuper Modo
Niveau 15: CC (Chevalier des Calculatrices)- Posts: 3183
- Images: 37
- Joined: 25 Feb 2013, 16:21
- Location: Toulouse
- Gender:
- Calculator(s):→ MyCalcs profile
- Class: Ingénieur en électronique
- YouTube: Wistaro
- Twitter: Wistaro
- GitHub: Wistaro
3 posts
• Page 1 of 1
Return to Maths, physique, informatique et autre...
Who is online
Users browsing this forum: ClaudeBot [spider] and 6 guests