Benfordův zákon

Technology
12 hours ago
8
4
2
Avatar
Author
Albert Flores

Histogram znázorňující Benfordův zákon: jednotlivé sloupečky znamenají počáteční číslici 1 až 9 a zobrazují relativní četnost výskytu každé číslice Benfordův zákon, někdy též Newcombův-Benfordův zákon, je matematický zákon, který říká, že v mnoha souborech přirozených dat (ale ne ve všech) začínají čísla mnohem častěji číslicí 1 než jinou číslicí. Alternativní formulace: první číslice čísla pravděpodobně bude malá. Zhruba 30 % čísel začíná jedničkou. Čím vyšší počáteční číslice je, tím méně pravděpodobně se vyskytuje na začátku čísel (viz obrázek s histogramem relativní četnosti výskytu jednotlivých číslice).

Ve skupině čísel reprezentujících reálné hodnoty čehokoli je asi 30% pravděpodobnost, že první číslovkou bude jednička. Dále pak 17,6 % čísel bude začínat dvojkou, 12,5 % trojkou a jen 4,57 % devítkou. +more Nejde o žádný matematický trik, ale o skutečný přírodní zákon, jímž se řídí soubory jakýchkoli přirozených dat bez ohledu na jejich podstatu nebo fyzikální jednotky. Jedinou podmínkou je, že data musí být v minimálním rozsahu tří logaritmických intervalů (tj. v minimálním rozsahu tří desítkových řádů).

Tuto skutečnost poprvé objevil a zveřejnil kanadsko-americký matematik a astronom Simon Newcombe v článku „Note on the Frequency of Use of the Different Digits in Natural Numbers“ publikovaném v American Journal of Mathematics (1881, č. 4, s. +more 39-40). Upozornil na skutečnost, že logaritmické tabulky v technické knihovně mají mnohem více ohmatané první stránky, tzn. stránky s čísly počínajícími jedničkou, než stránky na konci, tzn. stránky s čísly začínajícími číslicí 9. Usoudil, že uživatelé logaritmických tabulek (vědci a studenti přírodovědných a společenských oborů) se při své práci častěji setkávají s čísly začínajícími číslicí 1 nebo 2 než s čísly začínajícími číslicí 8 nebo 9. Na první pohled se zdá přirozené předpokládat, že první platná číslice čísel, s nimiž se lidé setkávají, bude se stejnou pravděpodobností jednička, dvojka i devítka. S touto intuitivní představou je však Newcombovo tvrzení v rozporu.

Newcombe neuvedl žádnou analýzu konkrétních souborů dat, pokusil se však o určité matematické zdůvodnění výsledku. Článek upadl v zapomnění - autorovu tvrzení nebyla věnována pozornost několik desetiletí.

Tento z určitého hlediska přírodní jev znovu objevil v roce 1938 fyzik Frank Benford. Svá zjištění publikoval v článku „The Law of Anomalous Numbers“ v Proceedings Of The American Philosophical Society (1938, vol. +more 78, no. 4, s. 551-572). Na rozdíl od Newcomba založil svá tvrzení na empirických pozorováních. Několik let shromažďoval číselné údaje z různých zdrojů a oborů (např. plochy povodí 335 řek, měrné skupenské teplo 1389 chemických sloučenin, čísla vyskytující se na titulní stránce novin a další). Dohromady zpracoval více než 20 000 číselných údajů ve 20 různých souborech dat a ukázal, že první číslice se opravdu nevyskytují všechny stejně často. I proto se pro zmíněnou zákonitost užívá pojmenování Benfordův zákon.

Simon Newcomb i Frank Benford dospěli každý jinou cestou k vyjádření téhož.

Matematický zápis

Počáteční číslice n (n \in \{1, . , b-1\}) čísla v soustavě o základu b (b\ge 2) se objevuje s pravděpodobností \log_b(n+1)-\log_b(n). +more V desítkové soustavě (b=10) dodržují počáteční číslice podle Benfordova zákona následující rozložení:.

130,1 %
217,6 %
312,5 %
49,7 %
57,9 %
66,7 %
75,8 %
85,1 %
94,6 %

Reálné příklady

První příklad: pokud prozkoumáme seznam 58 nejvyšších staveb na světě, potom jednička je zdaleka nejčetnější vedoucí číslice, dokonce bez ohledu na to, zda výšku těchto staveb vyjádříme v metrech nebo ve stopách - i když při vyjádření výšky staveb v metrech je relativní četnost jedničky výrazně vyšší než při vyjádření ve stopách (vit Tabulka 1).

Druhý příklad (zobrazený v grafu vpravo od tabulky 1) ukazuje aplikaci Benfordova zákona na čísla, která vyjadřují velikost populace jednotlivých zemí (použita jsou data pro 237 zemí z června 2010). Červené sloupce zobrazují relativní četnost (v procentech) pro jednotlivé číslice. +more Černé tečky (nad nebo uvnitř každého sloupce) ukazují, jaká by měla být výška sloupce, pokud by relativní četnosti byly přesně podle Benfordova zákona.

PočetPodíl v %PočetPodíl v %
12441,4 %16
2915,5 %8
3712,1 %5
4610,3 %7
511,7 %10
658,6 %4
711,7 %2
846,9 %5
911,7 %1

Třetí příklad ukazkuje četnost první číslice pro mocniny čísla dvě . Pokud vezmeme sekvenci prvních číslic pro mocniny prvních 96 čísel (1, 2, 4, 8, 1, 3, 6, 1, 2, 5, 1, 2, 4, 8, 1, 3, 6, 1, . +more , což je celočíselná , relativní četnosti první číslice se opět výrazně blíží k hodnotám podle Benfordova zákona. Mnohem více, než bychom očekávali pro náhodnou posloupnost stejné délky, protože tato posloupnost prvních číslice je odvozena od geometrické posloupnosti druhých mocnin čísla dva.

Početv %
129
217
312
410
57
66
75
85
95

Aplikace

Benfordův zákon lze aplikovat při jednoduchém testování regulérnosti voleb, odhalování účetních podvodů (vč. národních účtů), při analýze zaokrouhlovacích chyb při rozsáhlých numerických výpočtech, jako doplňkový test k dalším metodám zkoumání kvality makroekonomických dat aj.

Konkrétně u voleb není Benfordův zákon sám o sobě důkazem podvodu, ale vodítkem nebo indikací k tomu, že k němu mohlo dojít, přičemž někdy mohou být „anomálie“ vysvětleny. U statistických dat je potřeba, aby se vstupní údaje lišily o několik řádů k tomu, aby se chovaly podle Benfordova zákona. +more Konkrétně k aplikaci tohoto zákona jako pomůcky pro zjišťování volebních podvodů existuje vědecká práce z univerzity v Cambridge z roku 2011, která mimo jiné říká: „Pokud dojde k vyrovnanému soupeření dvou kandidátů ve volebních okrscích s počtem voličů řádově mezi 100 až 1000 na okrsek, pak první číslice počtu hlasů u každého kandidáta nebudou 1 nebo 2, ale spíše 4, 5 nebo 6. “.

Zajímavosti

Zřejmě první významnější zmínkou o Benfordově zákoně v češtině je krátký článek Pavla Kantorka (profesora fyziky a karikaturisty) z roku 1998 v časopise Vesmír. * Benfordův zákon byl několik desetiletí po svém objevu považován za pouhou zvláštnost, nikoli za matematický fakt.

Odkazy

Reference

Literatura

BELLOS, Alex. Alex za zrcadlem: jak se čísla odrážejí v životě a život v číslech. +more Překlad Ondrej Majer. Praha: Dokořán, 2016. 286 s. . * BERGER, A. ; HILL, T. P. and E. ROGERS. Benford Online Bibliography. May 1, 2015 [url=://www. benfordonline. net/ * DVOŘÁK, Jiří. Benfordovo rozdělení. Praha, 2008. 52 s. Bakalářská práce. Ved. práce doc. Mgr. Zdeněk Hlávka, Ph. D. , oponent RNDr. Michal Pešta, Ph. D. Matematicko-fyzikální fakulta UK, Katedra pravděpodobnosti a matematické statistiky. Přístup také z:[/url]url=://is. cuni. cz/webapps/zzp/detail/47310/ * HANZAL, Petr a FALTOVÁ LEITMANOVÁ, Ivana. Ověření platnosti Benfordova modelu v oboru účetních dat podnikatelských subjektů v České republice. Acta Universitatis Bohemiae Mendionales. 2010, č. 4, s. 39-45. ISSN 1212-3285. * HANZAL, Petr; CHLÁDEK, Petr a BISKUP, Roman. ARS-Auditing Revision Systém v nadnárodních ERP systémech. Systémová integrace. 2012, č. 4, s. 70-79. * [HOUSER, Pavel]cit. 27. 7. 2019]. Dostupné z:[/url]. Taje Benfordova zákona. In: Sciencemag. cz [online] 6. 12. 2016 [cit. 28. 7. 2019]. Dostupné z: https://sciencemag. cz/taje-benfordova-zakona/ * KANTOREK, Pavel. Benfordův zákon. Vesmír. 1998, roč. 77, č. 10, s. 583. Dostupné také z: http://www. vesmir. cz/clanky/clanek/id/1890 * PLAČEK, Michal. Benfordův zákon: fakta a mýty. In: Bulletin komory certifikovaných účetních. 2013, č. 1. Praha: Komora certifikovaných účetních, 2013, s. 43-46. ISSN 2336-3576. * PLAČEK, Michal. Benfordův zákon, fakta a mýty. In: Nové trendy 2012. Sborník ze 7. mezinárodní vědecké konference. Znojmo: Soukromá vysoká škola ekonomická Znojmo, 2012, s. 193-199. . * ROSS, Kenneth A. Benford’s law, a growth industry. The American Mathematical Monthly. 2011, vol. 118, no. 8, s. 571-583. ISSN 0002-9890. * SEIBERT, Jaroslav a ZAHRÁDKA, Jaromír. O čem pojednává Benfordův zákon. Matematika - fyzika - informatika. 2016, vol. 25, iss. 2, s. 89-98. ISSN 1210-1761. Přístupné z: https://dk. upce. cz/handle/10195/67473 * SEIBERT, Jaroslav a ZAHRÁDKA, Jaromír. Zákon první číslice a jeho aplikace.

Externí odkazy

[url=https://archive.org/details/jstor-2369148/page/n1]Note on the Frequency of Use of the Different Digits in Natural Numbers by Simon Newcomb[/url]

Kategorie:Statistické zákony

5 min read
Share this post:
Like it 8

Leave a Comment

Please, enter your name.
Please, provide a valid email address.
Please, enter your comment.
Enjoy this post? Join Cesko.wiki
Don’t forget to share it
Top