π
<-

Amusons-nous avec la loi de Benford !

Discussions scientifiques et scolaires

Amusons-nous avec la loi de Benford !

Unread postby Wistaro » 28 Nov 2017, 21:07

Salut !

Il a quelques jours, à la fin d'un cours de modélisation du hasard (cours sur les modèles univariés si je me souviens bien ), le professeur nous a présenté une loi stupéfiante: la loi de Benford.

Cette loi est très simple à comprendre.

Prenez un échantillon de nombres mesurés, de taille suffisante et de grande amplitude (aka la différence entre la valeur min et max de l'échantillon)
Prenez vraiment n'importe quoi. Par exemple, je vous propose le nombre de personnes possédant une calculatrice Texas Instruments par commune sur un département.

A priori, vous pensez que les valeurs sont totalement "aléatoires" et non corrélées.

Et bien, Benford nous dit que si vous prenez le premier chiffre significatif de tous les nombres de votre échantillon, la fréquence d'apparition du chiffre 1 est de 30,1%, celle du chiffre 2 est de 17,6%, et ainsi de suite!
Image

C'est dingue non ?

C'est loi est tellement universelle, qu'elle sert pour détecter de la fraude dans de nombreux domaines faisant intervenir de grandes séries de nombres (domaine scientifique, fiscal..)

Et oui! Il suffit d'effectuer un test statistique (comme le X2, prononcez "Khi2") à 95% (par exemple !) et de vérifier si on s'éloigne ou pas de Benford.
Dans le cas où l'hypothèse H0 serait rejetée (trop loin de Benford), il y a une fraude potentielle!

Mais cette loi fonctionne-t-elle vraiment partout?

Figurez-vous que je me suis aussi posé la question.

Sur mon site, j'ai calculé la fréquence d'apparition du premier chiffre significatif sur plusieurs séries de données (de grande taille, environ 32000 données par échantillon !) provenant de l'INSEE.
Et le résultat est bluffant!

Je vous laisse regarder: https://wistaro.fr/projets/proba/benford/


Maintenant je vous pose une question: que voudriez-vous que je teste comme données? Auriez-vous des séries de nombres à soumettre au redoutable Benford ? :)

N'hésitez pas à donnez votre avis!

Wistaro
Nouveau sur le site, ClaudeBot [spider] ? Avant de poster sur le chat et sur le forum, n'oublie pas de lire les règles. En cas de problème, tu peux m'envoyer un message, je réponds rapidement.

Liens utiles:
Image
Découvre mes programmes et mon site!
User avatar
WistaroSuper Modo
Niveau 15: CC (Chevalier des Calculatrices)
Niveau 15: CC (Chevalier des Calculatrices)
Level up: 88.4%
 
Posts: 3183
Images: 37
Joined: 25 Feb 2013, 16:21
Location: Toulouse
Gender: Male
Calculator(s):
MyCalcs profile
Class: Ingénieur en électronique
YouTube: Wistaro
Twitter: Wistaro
GitHub: Wistaro

Re: Amusons-nous avec la loi de Benford !

Unread postby Zezombye » 28 Nov 2017, 21:15

Je pense que c'est normal, et que si tu fais avec des nombres aléatoires, en choisissant un bon intervalle tu peux retomber sur cette loi.
Par exemple si je fais des nombres aléatoires de 0 à 15, il y a alors 33% de chance (10-15) d'avoir le chiffre 1 en premier chiffre significatif.
Si tu fais une distribution normale (ce que je pense est le cas de tes données de l'INSEE) de 0 à 30 centrée sur 15, on aura de grandes chances d'avoir un 1 (intervalle 10-19) mais aussi un 2 (intervalle 20-29), avec l'intervalle 0-10 qui est uniforme concernant les nombres.

D'ailleurs, il faudrait tester avec une autre base : binaire, octal, hexa, base64... la règle s'applique-t-elle toujours ? :p
User avatar
ZezombyePremium
Niveau 10: GR (Guide de Référence)
Niveau 10: GR (Guide de Référence)
Level up: 47.7%
 
Posts: 85
Joined: 30 Sep 2016, 15:14
Gender: Not specified
Calculator(s):
MyCalcs profile

Re: Amusons-nous avec la loi de Benford !

Unread postby Wistaro » 28 Nov 2017, 21:26

Non justement, il ne s'agit pas de données aléatoires. Il s'agit de données issues de mesure, c'est différent.
Cf http://archimede.mat.ulaval.ca/amq/bull ... Genest.pdf

J'ai essayé de tirer des milliers de chiffres aléatoires puis effectué un test du X2. Le résultat est que Benford n'est absolument pas vérifié!

Pour l'instant ce que j'ai dis, c'est effectivement en base 10.
https://wikimedia.org/api/rest_v1/media ... 42a4f73ce0

Pour une base X, il suffit à priori de prendre le logX(1+1/d). Je suppose :)
Nouveau sur le site, ClaudeBot [spider] ? Avant de poster sur le chat et sur le forum, n'oublie pas de lire les règles. En cas de problème, tu peux m'envoyer un message, je réponds rapidement.

Liens utiles:
Image
Découvre mes programmes et mon site!
User avatar
WistaroSuper Modo
Niveau 15: CC (Chevalier des Calculatrices)
Niveau 15: CC (Chevalier des Calculatrices)
Level up: 88.4%
 
Posts: 3183
Images: 37
Joined: 25 Feb 2013, 16:21
Location: Toulouse
Gender: Male
Calculator(s):
MyCalcs profile
Class: Ingénieur en électronique
YouTube: Wistaro
Twitter: Wistaro
GitHub: Wistaro


Return to Maths, physique, informatique et autre...

Who is online

Users browsing this forum: ClaudeBot [spider] and 6 guests

-
Search
-
Social TI-Planet
-
Featured topics
Grand Concours 2024-2025 - Programmation Python
Comparaisons des meilleurs prix pour acheter sa calculatrice !
"1 calculatrice pour tous", le programme solidaire de Texas Instruments. Reçois gratuitement et sans aucune obligation d'achat, 5 calculatrices couleur programmables en Python à donner aux élèves les plus nécessiteux de ton lycée. Tu peux recevoir au choix 5 TI-82 Advanced Edition Python ou bien 5 TI-83 Premium CE Edition Python.
Enseignant(e), reçois gratuitement 1 exemplaire de test de la TI-82 Advanced Edition Python. À demander d'ici le 31 décembre 2024.
Aidez la communauté à documenter les révisions matérielles en listant vos calculatrices graphiques !
12345
-
Donations / Premium
For more contests, prizes, reviews, helping us pay the server and domains...
Donate
Discover the the advantages of a donor account !
JoinRejoignez the donors and/or premium!les donateurs et/ou premium !


Partner and ad
Notre partenaire Jarrety Calculatrices à acheter chez Calcuso
-
Stats.
1175 utilisateurs:
>1147 invités
>22 membres
>6 robots
Record simultané (sur 6 mois):
6892 utilisateurs (le 07/06/2017)
-
Other interesting websites
Texas Instruments Education
Global | France
 (English / Français)
Banque de programmes TI
ticalc.org
 (English)
La communauté TI-82
tout82.free.fr
 (Français)