34.7 Rezolvarea misterului # 2

Cel de-al doilea mister este: De ce un set de numere respectă legea lui Benford, în timp ce un alt set de numere nu? Din nou, putem răspunde la această întrebare examinând figura 34-5. Scopul nostru este de a găsi caracteristicile pdf(g) care au ca rezultat ost(g) cu valoare constantă de 0,301. Așa cum am arătat mai sus, valoarea medie a lui ost(g) va fi întotdeauna 0,301, indiferent dacă legea lui Benford este urmată sau nu. Așadar, singura noastră preocupare este dacă ost(g) are oscilații sau este o linie plată.

Pentru ca ost(g) să fie o linie plată, ea nu trebuie să aibă componente sinusoidale. În domeniul frecvență, acest lucru înseamnă că OST(f) trebuie să fie egal cu zero la toate frecvențele mai sus de f = 0. Dar, OST(f) = SF(f) × PSF(f), iar SF(f) este nenul numai la frecvențele întregi, f = 0, 1, 2, 3, 4 etc. Prin urmare, ost(g) va fi plat, dacă și numai dacă, PSF(f) are o valoare zero la frecvențele întregi. Exemplul particular din figura 34-5 nu îndeplinește în mod clar această condiție și, prin urmare, nu respectă legea lui Benford. În figura (d), PDF(1) are o valoare de 0,349. Înmulțind aceasta cu valoarea SF(1) = 0,516, găsim OST(1) = 0,18. Prin urmare, ost(g) are o componentă sinusoidală cu o perioadă unu și o amplitudine de 0,18. Acesta este un rezultat cheie, care descrie ce criteriu trebuie să îndeplinească o distribuție pentru a respecta legea lui Benford. Acest lucru este suficient de important pentru a-l exprima ca pe o teoremă.

Teorema de conformitate a legii lui Benford

Fie P un proces aleator generând numere în baza B pe linia numerică liniară, pdf (g) funcția sa de densitate de probabilitate exprimată pe linia numerelor logaritmice de bază B și PDF(f) transformata Fourier a pdf(g). Numerele generate de P vor urma legea lui Benford dacă și numai dacă PDF(f) = 0 la toate frecvențele întregi nenule.

Următorul pas este să examinăm ce tip de distribuții respectă această teoremă. Există două moduri distincte în care PDF(f) poate avea o valoare de zero la frecvențele întregi nenule. Așa cum este arătat în figura 34-5b, PDF(f) poate fi oscilantă, atingând periodic zero la frecvențe care includ întregii. În domeniul logaritmic, aceasta corespunde la două sau mai multe discontinuități distanțate între ele, cum ar fi fronturile ascuțite sau schimbările abrupte în pantă. Figura (a) prezintă un exemplu de acest lucru, un impuls dreptunghiular cu fronturile la -1 și 1. Aceste discontinuități pot fi create cu ușurință prin manipularea omului, dar rareori apar în procese naturale sau neforțate. Acest tip de distribuție respectă legea lui Benford, dar este în principiu doar o notă de subsol, nu cea mai mare parte a misterului.

Figura (d) prezintă o situație mult mai importantă, în care PDF(f) scade uniform cu o frecvență tot mai mare. Acest comportament este mai mult decât obișnuit, el este regula. Este ceea ce ați găsi pentru majoritatea oricărui set de numere aleatorii pe care le examinați. Parametrul cheie pe care dorim să îl examinăm este cât de repede curba scade la zero. De exemplu, curba din figura 34-6d scade atât de rapid încât are o valoare neglijabilă la f = 1 și toate frecvențele mai mari. Prin urmare, această distribuție va respecta legea lui Benford într-o foarte mare măsură. Acum, comparați acest lucru cu Fig. 34-5d, un exemplu în care PDF(f) scade mult mai încet. Deoarece are o valoare semnificativă la f = 1, această distribuție urmează legea lui Benford foarte prost.

Acum, uitați-vă la pdf(g) pentru cele două exemple de mai sus, fig. 34-6c și 34-5a. Ambele sunt distribuții normale pe scala logaritmică; singura diferență dintre ele este lățimea lor. O proprietate cheie a transformatei Fourier este compresia/extinderea între domenii. Dacă aveți nevoie să vă reîmprospătați memoria, consultați figura 10-12 din capitolul 10. Pe scurt, dacă semnalul dintr-un domeniu este mai îngust, semnalul din celălalt domeniu va deveni mai larg și invers. De exemplu, în Fig. 34-5a deviația standard pdf(g) este σg = 0,25. Rezultă astfel PDF(f) având o deviație standard de: σf = 1/(2πσg) = 0,637. În figura 34-6 domeniul log este de două ori mai larg, σg= 0,50, ceea ce face ca domeniul frecvență să fie de două ori mai restrâns, σf = 0,318. În aceste figuri lățimea distribuției este indicată ca 2σ, adică, -σ to σ. Acest lucru este obișnuit, dar cu siguranță nu este singurul mod de măsurare a lățimii.

Pe scurt, dacă pdf(g) este îngust, atunci PDF(f) va fi larg. Acest lucru are ca rezultat PDF(f) având o amplitudine semnificativă la f = 1 și, eventual, la frecvențe mai mari. Prin urmare, distribuția nu va respecta legea lui Benford. Dar, dacă pdf(g) este larg, atunci PDF(f) va fi îngust. Rezultatul este că PDF(f) se apropie de zero înainte de f = 1, iar legea lui Benford este urmată.

O problemă-cheie este cât de larg sau îngust trebuie să fie pdf(g) pentru a comuta între cele două comportamente. Pentru a respecta legea Benford, PDF(f) trebuie să scadă la aproape zero la f = 1. În plus, f = 1 în domeniul frecvență corespunde unei sinusoide cu o perioadă de unu pe scala log, făcând aceasta distanța critică. Aceasta ne dă răspunsul la întrebarea noastră. Cu câteva avertismente, legea lui Benford este urmată de distribuții care sunt largi în comparație cu distanța unitară de-a lungul scalei logaritmice. De asemenea, legea nu este urmată de distribuții care sunt înguste în comparație cu distanța unitară.

Pentru a fi clar, o excepție apare atunci când PDF(f) este oscilant, cum ar fi în figura 34-6b. Cealaltă excepție este atunci când PDF(f) nu scade uniform în valoare cu frecvența în creștere. De asemenea, definiția "lățimii" folosită aici este puțin neclară. Vom îmbunătăți acest lucru în secțiunea următoare. Cu toate acestea, acestea sunt probleme și detalii minore; nu-i lăsați să distragă atenția de la înțelegerea fenomenului principal.

Secțiunea următoare: Mai multe despre respectarea legii lui Benford