为什么银行存款、河流长度等集合的首位数字更容易出现 1 而不是 9？_青世界

为什么银行存款、河流长度等集合的首位数字更容易出现 1 而不是 9？

科学工程知乎

更新于：2025-04-14 08:34:29

没错，首位数字里面，1出现的概率高达30%，而9出现概率只有4.6%，乍一看有点反直觉。

这是本福特定律，已经应用在审计领域。

比如当年安然财务造假，安然公司公布的数据中，首位数字分布严重偏离本福特定律，5和6出现的频率过高，1出现的频率远低于30%。然后就开始深入查账，发现高管通过特殊目的实体转移债务，修饰财务报表。

1881年，美国天文学家西蒙发现了一个秘密，以数字1开头的页码磨损最严重。

1938年，电气工程师本福特验证了它的普适性。

本福特定律的公式很简单

首位数字n出现的概率 = log₁₀(1 + 1/n)

数字1出现概率≈log₁₀2，有30.1%。

数字9出现概率≈log₁₀(10/9)，只有4.6%

举个通俗的例子。

假设用100万的本金炒股。

100万到200万，需要增长100%。

800万到900万，只需要增长12.5%

想要首位数字停留在高位，增长速度必须越来越慢，这在现实世界中几乎不可能。

数据天然倾向于在低位停留更久，所以1有绝对优势。

但如果是人为干涉，比如身份证号等人工编排的数据，强制均匀分布，就不符合本福特定律。

本福特定律最常见的应用，就是审计查账。

用本福特定律分析企业财务报表、发票、交易记录，虚假账目可能因人为编造数字而偏离本福特分布。

还能判断选举舞弊、论文造假、经济数据水分、偷税漏税、保险索赔。

本福特定律成立的前提是，数据需要覆盖多个数量级，无人设定范围，样本量要足够的大，至少上千。

本福特定律仅提示异常，还需结合其他证据才能判断数据造假。

什么样的燃油车，还能在 2025 年继续赢得市场？

什么样的燃油车，还能在 2025 年继续赢得市场？

2025-03-28 14:16:12

为何增程式至今未能推出“70多度电池(cltc500多)+小增程器”车型？是因为无法满足车重控制么？

为何增程式至今未能推出“70多度电池(cltc500多)+小增程器”车型？是因为无法满足车重控制么？

2025-03-28 14:33:49

王传福公布比亚迪2025年销量目标为550万辆，其中海外销量80万辆，完成这一目标有哪些挑战？

王传福公布比亚迪2025年销量目标为550万辆，其中海外销量80万辆，完成这一目标有哪些挑战？

2025-03-28 18:28:29

普林斯顿大学团队首次成功利用地球自转生成可测量电能，该研究成果有何重要意义？

普林斯顿大学团队首次成功利用地球自转生成可测量电能，该研究成果有何重要意义？

2025-03-28 20:41:07

请问按察司佥事整饬兵备道与巡按御史哪个大？

请问按察司佥事整饬兵备道与巡按御史哪个大？

2025-03-28 20:49:34

明明是第一代产品，小米为什么把自己的汽车定名 su7，而不是 su1？

明明是第一代产品，小米为什么把自己的汽车定名 su7，而不是 su1？

2025-03-29 00:30:45

比亚迪宋家族为什么在国内 SUV 市场销量这么好？

比亚迪宋家族为什么在国内 SUV 市场销量这么好？

2025-03-29 00:44:49

《水浒传》中有哪些不易发现的妙笔与巧思？

《水浒传》中有哪些不易发现的妙笔与巧思？

2025-03-29 06:37:24

能大致讲一下 DeepSeek 的原理吗？

能大致讲一下 DeepSeek 的原理吗？

2025-03-29 22:55:41

百度地图核心 API 兼容 MCP 协议，方便大模型快速接入，你对该产品都有哪些评使用感受？

百度地图核心 API 兼容 MCP 协议，方便大模型快速接入，你对该产品都有哪些评使用感受？

2025-03-29 23:02:12

某平台多位科学博主与 AI 共创「数学日专题科普视频」，这类用 AI 做的科普可能有哪些风险或问题？

某平台多位科学博主与 AI 共创「数学日专题科普视频」，这类用 AI 做的科普可能有哪些风险或问题？

2025-03-30 09:21:03

新一代人造太阳「中国环流三号」突破「双亿度」，中国聚变挺进燃烧实验，意味着什么？哪些技术细节值得关注？

新一代人造太阳「中国环流三号」突破「双亿度」，中国聚变挺进燃烧实验，意味着什么？哪些技术细节值得关注？

2025-03-30 13:34:43

夷陵之战后，蜀汉内部为何不肯体谅刘备难处，执意发动叛乱？

夷陵之战后，蜀汉内部为何不肯体谅刘备难处，执意发动叛乱？

2025-03-30 23:51:13

请假如我们生活在虚拟世界里，我们如何联系上层世界，或者获得上层世界的权限？

请假如我们生活在虚拟世界里，我们如何联系上层世界，或者获得上层世界的权限？

2025-03-31 06:57:14

为什么西湖醋鱼从一道名菜变成了难吃的代名词？

为什么西湖醋鱼从一道名菜变成了难吃的代名词？

2025-03-31 07:28:36

为什么AI到来不能让医生，老师，律师失业？

为什么AI到来不能让医生，老师，律师失业？

2025-03-31 12:12:14

英语地名中的 New 什么时候翻译成「纽」，什么时候翻译成「新」？

英语地名中的 New 什么时候翻译成「纽」，什么时候翻译成「新」？

2025-03-31 19:15:35

为什么《三国演义》可以成为四大名著，而《隋唐演义》不行？

为什么《三国演义》可以成为四大名著，而《隋唐演义》不行？

2025-04-01 08:37:02

是不是《明史》中几乎没有提到过西域？为什么？

是不是《明史》中几乎没有提到过西域？为什么？

2025-04-01 08:43:15

网传台湾渔民捕捞到一头三米长的儒艮，此前在我国「功能性灭绝」的儒艮「打赢复活赛」了吗？

网传台湾渔民捕捞到一头三米长的儒艮，此前在我国「功能性灭绝」的儒艮「打赢复活赛」了吗？

2025-04-01 08:51:43

缅甸最后一个王朝的宫殿曼德勒皇宫在地震中坍塌，为世界最大宫殿，受损情况如何？还有修复的可能性吗？

缅甸最后一个王朝的宫殿曼德勒皇宫在地震中坍塌，为世界最大宫殿，受损情况如何？还有修复的可能性吗？

2025-04-01 08:57:57

长安汽车实名羡慕「我们上 1 次热搜像过次年一样，结果小米雷军天天过年」，你认为品牌怎样和流量结合？

长安汽车实名羡慕「我们上 1 次热搜像过次年一样，结果小米雷军天天过年」，你认为品牌怎样和流量结合？

2025-04-01 15:12:32

汤加附近发生 7.3 级地震，为何近期强震连发？它们有关联吗？未来地震会更频繁吗？

汤加附近发生 7.3 级地震，为何近期强震连发？它们有关联吗？未来地震会更频繁吗？

2025-04-01 18:43:35

为什么林如海病逝是贾琏陪林黛玉回扬州而不是贾宝玉？

为什么林如海病逝是贾琏陪林黛玉回扬州而不是贾宝玉？

2025-04-01 19:55:09