34.1 Descoperirea lui Frank Benford

Frank Benford a fost fizician de cercetare la General Electric în anii 1930, când a observat ceva neobișnuit cu privire la o carte cu tabele logaritmice. Primele pagini au arătat mai multă uzură decât ultimele pagini, indicând că numerele care încep cu cifra 1 au fost privite mai des decât numerele care încep cu 2 până la 9. Benford a confiscat această idee și a petrecut ani de zile colectând date pentru a arăta că acest model a fost larg răspândit în natură. În 1938, Benford și-a publicat rezultatele, citând mai mult de 20.000 de valori, cum ar fi greutățile atomice, numerele în articolele din reviste, statisticile de baseball și ariile râurilor.

Acest model de numere este neașteptat și contraintuitiv. De fapt, mulți nu cred că este adevărat până când nu vor face un experiment pentru ei înșiși. De exemplu, treceți prin mai multe pagini ale ziarului de astăzi și examinați prima cifră a fiecărui număr. Adică începeți din stânga fiecărui număr și ignorați semnul, virgula și orice zerouri. De exemplu, 3 este prima cifră din 37,3447, iar 6 este prima cifră semnificativă din -0,06345. Deoarece există nouă cifre posibile, v-ați aștepta ca unu/nouă (11,11%) din numere să aibă pe 1 în poziția de vârf. Cu toate acestea, acest lucru nu este ceea ce veți găsi - aproximativ 30,1% din numere vor începe cu 1. Este chiar mai necunoscut de aici.

Figura 34-1

Frank Albert Benford, Jr., (1883-1948) a fost un inginer și fizician american. În 1938 a publicat o lucrare intitulată "The Law of Anomalous Numbers''. Aceasta este acum numită Legea lui Benford.

Figura 34-2 prezintă două exemple ale legii lui Benford. Histograma din stânga este pentru 14.414 numere preluate din declarațiile de impozit pe venit ale companiilor americane. Modelul de aici este evident și foarte repetabil. Cifra de început în aceste numere este 1 aproximativ 30,1% din timp, 2 aproximativ 17,6% din timp, și așa mai departe. Matematicienii recunosc imediat că aceste valori corespund spațierii de pe linia numerelor logaritmice. Aceasta este, distanța între 1 și 2 pe scara log este log (2) - log (1) = 0,301. Distanța dintre 2 și 3 este log (3) - log(2) = 0,176 și așa mai departe. Benford ne-a arătat că acest tipar logaritmic al cifrelor de început este extrem de comun în natură și în activitățile umane. De fapt, chiar și constantele fizice ale universului urmează acest model - uitați-vă doar la tabelele dintr-un manual de fizică.

Pe de altă parte, nu toate seturile de numere respectă legea lui Benford. De exemplu, histograma din figura 34-2b a fost generată prin preluarea unui număr mare de eșantioane de la un generator de numere aleatorii din calculator. Aceste numere speciale au o distribuție normală cu o medie de cinci și o deviație standard de trei. Schimbarea oricăror dintre acești parametri va schimba drastic forma acestei histograme, cu o poezie sau rațiune aparent puțină. Evident, aceste numere nu urmează distribuția logaritmică a primei cifre. De asemenea, majoritatea distribuțiilor obișnuite despre care ați învățat în clasele de statistici nu respectă legea lui Benford. Unul dintre principalele mistere ale legii lui Benford a fost acest comportament aparent imprevizibil. De ce un set de numere urmează modelul logaritmic, în timp ce un alt set de numere nu?

Ca și cum acest lucru nu ar fi fost destul de misterios, legea lui Benford are o altă proprietate care este sigur că te va ține treaz noaptea. Figura 34-2a a fost creată din numerele care apar în declarațiile fiscale din SUA și, prin urmare, fiecare dintre aceste numere reprezintă o valoare în dolari. Dar ce este atât de special cu dolarul american? Să zicem că sunteți expert financiar în India și doriți să examinați acest set de date. Pentru a fi mai ușor, convertiți toate valorile dolarului în rupii indiene, multiplicând fiecare număr cu rata de conversie curentă. Este probabil ca cifra de vârf a tuturor celor 14.414 de numere să fie schimbată prin această conversie. Cu toate acestea, aproximativ 30,1% din numerele convertite vor avea în continuare o primă cifră de 1. Cu alte cuvinte, în cazul în care un set de numere urmează legea lui Benford, înmulțirea numerelor prin orice constantă posibilă va crea un alt set de numere care urmează și el legea lui Benford. Un sistem care rămâne neschimbat atunci când este înmulțit cu o constantă se numește scală invariantă. În mod specific, grupurile de numere care respectă legea lui Benford sunt scale invariabile. De asemenea, grupuri de numere care nu respectă legea lui Benford nu sunt. De exemplu, această procedură ar combate forma histogramei din figura 34-2b.

Figura 34-2

Două exemple de histograme prima-cifră. Figura din stânga arată distribuția pentru 14414 de numere luate de la restituirea taxei pe venit de la U.S. Federal. Figura din dreapta este pentru numere produse de un generator de numere aleatoare din computere (RNG). Aceasta arată unul din misterele de lungă durată ale legii lui Benford - De ce unele seturi de numere urmează legea (cum ar fi restituirea impozitului), în timp ce altele (cum ar fi RNG) nu o fac? Mulți au susținut că aceasta este un soi de cod secret ascuns în fabrica Naturii.

Acum, presupuneți că datele privind declarația fiscală sunt examinate de un străin de pe altă planetă. Deoarece are opt degete, convertește toate numerele sale în baza 8. Ca și înainte, majoritatea sau toate primele cifre se vor schimba în această procedură. Cu toate acestea, noul grup de numere respectă și el legea lui Benford (având în vedere faptul că nu există 8 sau 9 în baza 8). Această proprietate se numește invarianța bazei. În general, dacă un grup de numere respectă legea lui Benford într-o bază, va urma legea lui Benford dacă va fi convertită și într-o altă bază. Cu toate acestea, există câteva excepții la acest lucru la care ne vom uita mai târziu.

Ce înseamnă asta? În ultimele șapte decenii, legea lui Benford a realizat aproape un grup de discipoli. Acesta a fost considerat a fi o dovadă a unei proprietăți misterioase sau paranormale a universului nostru. De exemplu, Benford însuși a încercat să conecteze matematica cu Natura, pretinzând că simplul Om numără aritmetic, 1,2,3,4 ... în timp ce Natura numără e0, ex, e2x, e3x și așa mai departe. Într-o altă versiune populară, se presupune că natura conține o distribuție de bază și universală a numerelor. Deoarece este universală, ar trebui să arate la fel, indiferent de modul în care alegem să o examinăm. În special, nu ar trebui să diferențiem ce unități asociem cu numerele. Distribuția ar trebui să apară aceeași dacă o exprimăm în dolari sau rupii, picioare sau metri, Fahrenheit sau Celsius și așa mai departe. De asemenea, aspectul nu trebuie să se schimbe atunci când examinăm numerele în diferite baze. S-a demonstrat matematic că modelul logaritmic al cifrei de vârf este singura distribuție care îndeplinește aceste cerințe invariante. Prin urmare, dacă există o distribuție universală care stă la bază, legea lui Benford trebuie să fie. Pe baza acestei logici, este foarte comun să aflăm că legea lui Benford se aplică numai numerelor care au unități asociate cu ele. La celălalt capăt al spectrului, excentricii abundă, care asociază legea lui Benford cu pretenții psihice și alte paranormale.

Nu pierdeți timpul încercând să înțelegeți ideile de mai sus; ele se află pe un drum greșit. Nu există o "distribuție universală" și acest fenomen nu are nicio legătură cu "unitățile". În cele din urmă, vom constata că legea lui Benford arată mai mult ca un truc de magie bine executat decât o proprietate ascunsă a universului.

Secțiunea următoare: Procesarea omomorfă