Page protected with pending changes

벤포드의 법칙

Benford's law
A sequence of decreasing blue bars against a light gray grid background
벤포드의 법칙에 따라 첫 번째 숫자의 분포.각 막대는 숫자를 나타내며 막대의 높이는 해당 숫자로 시작하는 숫자의 백분율입니다.
벤포드의 법칙에 대해 표시된 물리 상수의 첫 번째 유효 자릿수의 빈도

벤포드의 법칙, 또는 뉴컴-벤포드 법칙, 변칙수의 법칙 또는 첫 자리수의 법칙은 실제 숫자 데이터 집합에서 앞자리가 작을 가능성이 높다는 관측입니다.[1]법을 준수하는 집합에서 1은 약 30%의 시간 동안 선두 유효숫자로 나타나고 9는 5% 미만의 시간 동안 선두 유효숫자로 나타납니다.자릿수가 균일하게 분포되어 있다면 각각의 경우 약 11.1%씩 발생합니다.[2]벤포드의 법칙은 또한 두 번째 숫자, 세 번째 숫자, 숫자 조합의 분포 등을 예측합니다.

오른쪽 그래프는 임의의 (정수) 기저로 표현되는 수에 대한 무한히 많은 일반화된 법칙 중 하나인 기저 10에 대한 벤포드의 법칙을 보여주며, 이는 현상이 기저 10 수 체계의 인공물일 가능성을 배제합니다.1995년에[3] 발표된 추가 일반화는 n번째 선두 자리와 n번째 선두 자리의 공동 분포에 대한 유사한 문장을 포함했으며, 이 중 후자는 유의한 자리가 통계적으로 종속적인 양으로 나타나는 결과로 이어집니다.

이 결과는 전기 요금, 도로 주소, 주가, 주택 가격, 인구 수, 사망률, 하천 길이, 물리 상수 및 수학 상수를 포함한 다양한 데이터 세트에 적용되는 것으로 나타났습니다.[4]자연 데이터에 대한 다른 일반적인 원리(예를 들어, 많은 데이터 집합이 정규 분포에 의해 근사화된다는 사실)와 마찬가지로 벤포드의 법칙이 적용되는 많은 경우를 다루는 예시적인 예와 설명이 있지만, 간단한 설명에 저항하는 벤포드의 법칙이 적용되는 다른 많은 경우도 있습니다.[5][6]벤포드의 법칙은 값이 여러 크기의 순서에 걸쳐 분포될 때, 특히 수를 생성하는 과정이 (자연에서 일반적인) 거듭제곱 법칙에 의해 설명될 때 가장 정확한 경향이 있습니다.

법칙은 물리학자 프랭크 벤포드(Frank Benford)[8][9]의 이름을 따서 지어졌는데, 프랭크 벤포드는 1938년에 "이상한 수의 법칙"이라는 제목의 기사에서 이 법칙을 언급했습니다.[7]

그 법은 개념은 동일하지 않지만 Zipf의 법과 유사합니다.

정의.

Rectangle with offset bolded axis in lower left, and light gray lines representing logarithms
로그 축척 막대.이 숫자 선에서 임의의 x 위치를 균일하게 선택하면, 숫자의 첫 자리가 1이 될 때의 약 30%가 됩니다.

만약 앞자리 d(∈ {1, ..., 9})가 확률과 함께 일어난다면, 수들의 집합은 벤포드의 법칙을 만족시킨다고 합니다.

따라서 이러한 집합의 선두 자리 수는 다음과 같은 분포를 갖습니다.

d 의 상대 크기
1 30.1% 30.1
2 17.6% 17.6
3 12.5% 12.5
4 9.7% 9.7
5 7.9% 7.9
6 6.7% 6.7
7 5.8% 5.8
8 5.1% 5.1
9 4.6% 4.6

수량 () (는) 로그 스케일에서 d + 1 사이의 공간에 비례합니다.따라서 이는 숫자의 로그(숫자 자체는 제외)가 균일하고 무작위로 분포될 경우 예상되는 분포입니다.

예를 들어, 1과 10 사이에 놓이도록 제한된 숫자 x는 1< 2인 경우 숫자 1로 시작하고 9< 10인 경우 숫자 9로 시작합니다.따라서 xlog 1 log x< log 2인 경우 숫자 1로 시작하고 log 9 log x < log 10인 경우 9로 시작합니다.[log 1, log 2] 구간은 [log 9, log 10] 구간보다 훨씬 넓습니다(각각 0.30 및 0.05). 따라서 로그 x가 균일하고 무작위로 분포되어 있으면 좁은 구간보다 넓은 구간에 속할 가능성이 훨씬 높습니다. 즉, 9에서 시작하는 것보다 1에서 시작하는 것이 더 높습니다. 확률은 구간 폭에 비례합니다.hs, 위의 방정식을 제공합니다. (10진수 이외의 다른 기본에 대한 일반화도 마찬가지입니다.)

Benford의 법칙은 때때로 더 강한 형태로 언급되며, 데이터 로그의 부분 부분이 일반적으로 0과 1 사이에 균일하게 분포되어 있다고 주장합니다. 이로부터 첫 번째 숫자의 분포에 대한 주요 주장을 도출할 수 있습니다.[5]

다른루에서

다양한 기저에서 초기 숫자 d에 대한 P(d)[11] 그래프.점선은 P(d)가 분포가 균일했음을 나타냅니다. (SVG 이미지에서 그래프 위를 맴돌아 각 점에 대한 값을 표시합니다.)

벤포드의 법칙의 확장은 십진법 이외의 다른 기본에서 첫 번째 숫자의 분포를 예측합니다. 실제로 모든 기본 b ≥ 2.일반적인 형태는[12]

b = 2, 1 (이진단항) 수 체계의 경우 벤포드의 법칙은 사실이지만 사소합니다.(0이나 빈 집합을 제외하고) 모든 이진수와 단항수는 숫자 1로 시작합니다. (반면 벤포드 법칙을 두 번째와 이후의 숫자로 일반화하는 것은 이진수의 경우에도 사소하지 않습니다.)[13]

2010년 7월 현재 세계 237개국 인구에서 첫 번째 숫자(%, 빨간색 막대)의 분포.검은 점들은 벤포드의 법칙에 의해 예측된 분포를 나타냅니다.

세계에서 가장 높은 58개 구조물의 높이 목록을 범주별로 조사하면 측정 단위에 관계없이 1이 가장 일반적인 선두 자리임을 알 수 있습니다(아래 "규모 불변성" 참조).

이끄는
숫자를
m ft
벤포드의 법칙
세어보세요 공유하다 세어보세요 공유하다
1 23 39.7 % 15 25.9 % 30.1 %
2 12 20.7 % 8 13.8 % 17.6 %
3 6 10.3 % 5 8.6 % 12.5 %
4 5 8.6 % 7 12.1 % 9.7 %
5 2 3.4 % 9 15.5 % 7.9 %
6 5 8.6 % 4 6.9 % 6.7 %
7 1 1.7 % 3 5.2 % 5.8 %
8 4 6.9 % 6 10.3 % 5.1 %
9 0 0 % 1 1.7 % 4.6 %

또 다른 예는 2n 앞자리입니다.첫 96개의 선행 숫자(1, 2, 4, 8, 1, 3, 6, 1, 2, 5, 1, 2, 4, 8, 1, 3, 6, 4, 1, 3, 6, 1, 1, ...(OEIS의 시퀀스 A008952)의 시퀀스는 기하학적 시퀀스에서 도출되기 때문에 동일한 길이의 임의 시퀀스에서 예상되는 것보다 벤포드의 법칙에 더 밀접하게 부합합니다.[14]

이끄는
숫자를
발생
벤포드의 법칙
세어보세요 공유하다
1 29 30.2 % 30.1 %
2 17 17.7 % 17.6 %
3 12 12.5 % 12.5 %
4 10 10.4 % 9.7 %
5 7 7.3 % 7.9 %
6 6 6.3 % 6.7 %
7 5 5.2 % 5.8 %
8 5 5.2 % 5.1 %
9 5 5.2 % 4.6 %

역사

벤포드의 법칙의 발견은 1881년으로 거슬러 올라가는데, 캐나다계 미국 천문학자 사이먼 뉴컴은 로그표에서 (1로 시작한) 초기 페이지가 다른 페이지보다 훨씬 더 마모되었다는 것을 알아차렸습니다.[8]Newcomb의 발표된 결과는 이 관측치의 첫 번째 알려진 사례이며 두 번째 자리에도 분포가 포함되어 있습니다.뉴컴은 한 숫자 N이 숫자의 첫 자리일 확률이 log(N + 1) - log(N)와 같다는 법칙을 제시했습니다.

이 현상은 1938년 물리학자 프랭크 벤포드(Frank Benford)에 의해 다시 주목되었으며,[7] 그는 20개의 다른 영역의 데이터에 이 현상을 실험하여 인정받았습니다.그의 데이터 세트에는 335개 강의 표면적, 미국 인구 3259명의 크기, 104개의 물리 상수, 1800개의 분자량, 수학 핸드북의 5000개 항목, 리더스 다이제스트 호에 수록된 308개의 숫자, 미국 오브 사이언스에 등재된 최초 342명의 거리 주소 및 418명의 사망률이 포함되었습니다.논문에 사용된 총 관측치 수는 20,229개였습니다.이 발견은 나중에 벤포드의 이름을 따서 지어졌습니다 (스티글러의 법칙의 본보기가 됨).

1995년에 Ted Hill아래에 언급된 혼합 분포에 대한 결과를 증명했습니다.[15][16]

설명

Benford의 법칙은 몇십 개의 크기에 걸쳐 있는 데이터에 가장 정확하게 적용되는 경향이 있습니다.경험칙상 데이터가 균등하게 다루는 규모의 순서가 많을수록 벤포드의 법칙이 더 정확하게 적용됩니다.예를 들어, 벤포드의 법칙이 영국 정착지의 인구를 나타내는 숫자 목록에 적용될 것이라고 예상할 수 있습니다.그러나 만약 "정착지"가 300에서 999 사이의 인구를 가진 마을로 정의된다면, 벤포드의 법칙은 적용되지 않을 것입니다.[17][18]

로그 척도를 참조하여 아래에 표시된 확률 분포를 고려합니다.각 경우 빨간색의 총 면적은 첫 번째 숫자가 1일 상대적 확률이고 파란색의 총 면적은 첫 번째 숫자가 8일 상대적 확률입니다.첫 번째 분포의 경우 빨간색과 파란색 영역의 크기는 각 빨간색과 파란색 막대의 너비에 거의 비례합니다.따라서 이 분포에서 추출된 숫자는 대략 Benford의 법칙을 따릅니다.반면, 두 번째 분포의 경우 빨간색과 파란색의 면적 비율은 빨간색과 파란색 막대의 너비 비율과 매우 다릅니다.오히려 빨간색과 파란색의 상대적인 영역은 폭보다 막대의 높이에 의해 더 많이 결정됩니다.따라서 이 분포의 첫 번째 숫자는 벤포드의 법칙을 전혀 만족시키지 못합니다.[18]

로그 척도로 표시되는 변수의 로그에 대한 광범위한 확률 분포입니다.Benford의 법칙은 파란색(첫 번째 숫자 8) 음영에 비해 빨간색(첫 번째 숫자 1)으로 덮인 더 큰 영역에서 볼 수 있습니다.
로그 척도에 표시된 변수의 로그에 대한 좁은 확률 분포입니다.좁은 분포가 벤포드의 법칙의 기준을 충족하지 못하기 때문에 벤포드의 법칙을 따르지 않습니다.

따라서 몇 개의 규모에 걸쳐 있는 실제 분포(예: 주식 시장 가격 및 마을, 마을 및 도시의 인구)는 벤포드의 법칙을 매우 정확하게 만족시킬 가능성이 있습니다.반면에, 대부분 또는 전체적으로 크기의 한 순서 이내의 분포(예: 인간 성인의 IQ 점수 또는 키)는 벤포드의 법칙을 매우 정확하게 만족시키지 못할 것입니다.[17][18]그러나 적용 가능한 레짐과 적용 불가능한 레짐의 차이는 급격한 컷오프가 아닙니다. 분포가 좁아질수록 벤포드의 법칙에서 벗어나는 것은 점차 증가합니다.

(이 논의는 Benford 법칙에 대한 완전한 설명은 아닙니다. 왜냐하면 데이터 집합이 매우 자주 발생하여 변수의 로그에 대한 확률 분포로 표시되었을 때 크기가 수 배 이상으로 비교적 균일한 이유에 대해 설명하지 않았기 때문입니다.)[19]

크리거-카프리 엔트로피 설명

1970년 볼프강 크리거는 현재 크리거 발생 정리라고 불리는 것을 증명했습니다.[20][21]Krieger 생성자 정리는 고정된 숫자 0, 1, ..., B - 1 {\displaystyle 을 가진 주어진 B에서숫자 nn개의 상호작용하지 않는 공을 포함하는 Kafri 상자와 같다는 가정에 대한 정당화로 간주될 수 있습니다.다른 많은 과학자들과 통계학자들은 벤포드의 법칙에 대한 엔트로피 관련 설명을 제시했습니다.[22][23][10][24]

곱셈 변동

벤포드의 법칙에 대한 많은 실제 사례들은 곱셈 변동에서 비롯됩니다.[25]예를 들어, 주가가 $100에서 시작하여 매일 0.99에서 1.01 사이의 임의로 선택된 요인에 곱해진다면, 오랜 기간 동안 가격의 확률 분포는 점점 더 높은 정확도로 벤포드 법칙을 만족합니다.

그 이유는 주가의 로그값랜덤 워크(random walk)를 거치고 있기 때문에 시간이 지남에 따라 확률 분포는 점점 더 광범위해지고 매끄러워지기 때문입니다( 참조).[25](더 기술적으로, 중심 극한 정리는 점점 더 많은 확률 변수를 곱하면 분산이 점점 더 커지는 로그 정규 분포가 생성되므로 결국에는 크기가 거의 일정하게 많은 차수를 포함하게 됩니다.)Benford의 법칙과 대략적으로 일치하려면 분포가 최대 10개의 인자로 확장될 때 대략적으로 불변해야 합니다. 광범위한 분산을 가진 로그 정규 분포 데이터 집합은 이러한 대략적인 특성을 갖습니다.

곱셈 변동과 달리 가산 변동은 벤포드의 법칙으로 이어지지 않습니다.이들은 대신 벤포드의 법칙을 만족시키지 못하는 정규 확률 분포로 이어집니다.반대로 위에서 설명한 가상의 주가는 많은 임의 변수(즉, 하루의 가격 변동 요인)의 곱으로 작성될 수 있으므로 벤포드의 법칙을 상당히 잘 따를 가능성이 높습니다.

다중 확률 분포

Anton Formann은 유의한 숫자의 분포관측 변수의 분포 사이의 상호관계에 주의를 기울임으로써 대안적인 설명을 제공했습니다.그는 모의실험 연구에서 랜덤 변수의 긴 오른쪽 꼬리 분포가 뉴컴-벤포드 법칙과 양립할 수 있으며, 두 랜덤 변수의 비율 분포의 경우 일반적으로 적합도가 향상된다는 것을 보여주었습니다.[26]어떤 분포(IQ 점수, 사람의 키)에서 추출된 숫자에 대해서는 벤포드의 법칙이 성립하지 않습니다. 왜냐하면 이러한 변수들은 벤포드의 법칙을 만족하지 않는 것으로 알려진 정규분포를 따르기 때문입니다.[9]정규 분포는 몇 개의 크기를 초과할 수 없고 로그의 맨티스는 (심지어 대략적으로) 균일하게 분포되지 않기 때문입니다.그러나, 예를 들어 신문 기사에서 숫자를 가져와 그러한 분포에서 숫자를 "혼합"하면 벤포드의 법칙이 다시 나타납니다.이것은 수학적으로도 증명될 수 있습니다. 만약 어떤 사람이 (상관없는 집합에서) 확률분포를 반복적으로 "무작위적으로" 선택한 다음 그 분포에 따라 임의로 숫자를 선택한다면 결과적인 숫자 목록은 벤포드의 법칙을 따를 것입니다.[15][27]일상 생활 수치에서 벤포드의 법칙이 나타나는 것에 대한 유사한 확률적 설명은 균일한 분포의 혼합물을 고려할 때 자연스럽게 발생한다는 것을 보여줌으로써 발전되었습니다.[28]

불변성

길이 목록에서 모든 길이가 미터, 야드, 피트, 인치 등으로 표현되는지 여부에 관계없이 목록의 첫 자리 숫자 분포는 일반적으로 유사할 수 있습니다.화폐 단위도 마찬가지입니다.

항상 그렇지는 않습니다.예를 들어, 성인 인간의 키는 미터로 측정할 때 거의 항상 1 또는 2로 시작하고, 발로 측정할 때는 거의 항상 4, 5, 6 또는 7로 시작합니다.그러나 길이의 목록은 수 많은 크기에 걸쳐 고르게 퍼져 있습니다. 예를 들어, 분자, 박테리아, 식물의 측정을 포함하는 과학 논문에 언급된 1000개의 길이의 목록입니다.그리고 은하—길이를 미터 단위로 쓰든, 피트 단위로 쓰든 첫 번째 숫자의 분포는 동일할 것으로 예상하는 것이 타당합니다.

데이터 집합의 첫 자릿수 분포가 척도 불변인 경우(데이터가 표현되는 단위와는 무관함), 항상 Benford의 법칙에 따라 제공됩니다.[29][30]

예를 들어, 앞서 언급한 길이 목록의 첫 번째(0이 아닌) 자리는 측정 단위가 피트이든 야드든 동일한 분포를 가져야 합니다.하지만 야드에 길이의 첫 자리가 1일 확률은 길이의 첫 자리가 3, 4, 5일 확률과 같아야 합니다. 마찬가지로 길이의 첫 자리가 2일 확률은 길이의 첫 자리가 2일 확률과 같아야 합니다.6, 7, 8.이것을 모든 가능한 측정 척도에 적용하면 벤포드 법칙의 로그 분포를 얻을 수 있습니다.

벤포드의 첫 번째 숫자에 대한 법칙은 수 체계에 대한 기본 불변성입니다.합 불변성, 역 불변성, 덧셈과 뺄셈 불변성의 조건과 증명이 있습니다.[31][32]

적용들

분식회계 적발

1972년, Hal Varian은 공공 계획 결정을 지지하기 위해 제출된 사회 경제 데이터 목록에서 발생 가능한 사기를 탐지하기 위해 이 법이 사용될 수 있다고 제안했습니다.수치를 조작하는 사람들이 자신의 숫자를 상당히 균일하게 분포시키는 경향이 있다는 그럴듯한 가정에 기초하여, 벤포드의 법칙에 따라 예상되는 분포와 데이터의 첫 자리 빈도 분포를 간단히 비교하면 변칙적인 결과가 나타날 것입니다.[33]

형사재판에 사용

미국에서는 연방, 주, 지방 차원의 형사사건에서 벤포드의 법칙에 근거한 증거가 인정되고 있습니다.[34]

선거자료

미시간 대학의 정치학자이자 통계학자인 월터 메베인선거 포렌식에서 두 번째 숫자인 벤포드의 법 검사(2BL-test)를 처음으로 적용했습니다.[35]이 같은 분석은 선거 결과의 부정 행위를 찾아내는 단순한 방법은 아니지만 확실한 방법으로 여겨지고 있습니다.[36]선거에 대한 벤포드의 법칙의 적용 가능성을 뒷받침하는 과학적 합의는 문헌에서 이루어지지 않았습니다.정치학자 조셉 데커트, 미하일 마이아그코프, 피터 C의 2011년 연구. Ordeshook은 Benford의 법칙이 선거부정의 통계적 지표로서 문제가 있고 오해의 소지가 있다고 주장했습니다.[37]그들의 방법은 선거 데이터에 벤포드의 법칙을 적용하는 것에 많은 주의가 있다는 것에 동의했지만, 그의 응답에서 Mebane에 의해 비판을 받았습니다.[38]

벤포드의 법칙은 2009년 이란 선거에서 사기의 증거로 사용되었습니다.[39]메베인의 분석에 따르면 선거의 승자인 마흐무드 아마디네자드 대통령의 득표수에서 두 번째 숫자는 벤포드의 법이 예상했던 것과 크게 다른 경향을 보였으며, 무효표가 거의 없는 투표함이 결과에 더 큰 영향을 미쳤으며, 이는 광범위한 투표용지 채우기를 시사합니다.[40]또 다른 연구는 부트스트랩 시뮬레이션을 사용하여 후보자인 Mehdi Karroubi가 벤포드의 법칙에 따라 예상되는 숫자인 7로 시작하는 투표수의 거의 두 배를 받은 것을 발견했습니다.[41] 반면 콜롬비아 대학교의 분석은 공정한 선거가 너무 적은 인접하지 않은 숫자와 t를 둘 다 만들어 낼 확률이 너무 적다고 결론지었습니다.2009년 이란 대통령 선거에서 발견된 그의 마지막 자리 주파수 편차는 0.5% 미만입니다.[42]벤포드의 법칙은 또한 2003년 캘리포니아 주지사 선거,[43] 2000년2004년 미국 대통령 선거,[44] 그리고 2009년 독일 연방 선거의 데이터에 대한 법의학적 감사와 사기 탐지를 위해 적용되었습니다.[45] 벤포드의 법칙 테스트는 "사기에 대한 통계적 테스트로서 진지하게 받아들일 가치가 있다"고 밝혀졌습니다." 비록 "우리가 알고 있는 왜곡에 민감하지는 않지만 많은 표에 상당한 영향을 미쳤습니다."[44][further explanation needed]

벤포드의 법칙은 부정선거를 주장하는 데도 잘못 적용되었습니다.2020년 미국 대선에서 조 바이든 후보의 시카고, 밀워키 등 지역구 당선 신고에 법을 적용할 때 첫 자리 숫자 분포는 벤포드의 법을 따르지 않았습니다.오적용은 범위 내에서 엄격하게 구속된 데이터를 살펴본 결과였는데, 이는 데이터의 범위가 크다는 벤포드의 법칙에 내재된 가정에 위배됩니다.첫 번째 숫자 테스트는 선거구 수준의 데이터에 적용되었지만, 선거구가 몇 천 개 이상의 표를 받거나 수십 개 미만의 표를 받는 경우는 드물기 때문에 벤포드의 법칙이 적용될 것으로 기대할 수 없습니다.메베인은 "선거구 개표의 첫 자리가 부정선거를 진단하는 데 유용하지 않다는 것은 널리 알려진 사실"이라고 말했습니다.[46][47]

거시경제자료

마찬가지로, 그리스 정부가 유로존에 가입하기 전 유럽연합에 보고한 거시경제 데이터는 국가가 가입한 지 수년이 지났지만 벤포드의 법칙을 이용해 아마도 부정한 것으로 드러났습니다.[48][49]

가격자리분석

가격 숫자 조사를 위한 벤치마크로서의 벤포드의 법칙은 가격 연구의 맥락에 성공적으로 도입되었습니다.가격의 부정을 감지하기 위한 이 벤치마크의 중요성은 유로 도입 전후의 소비자 가격 수치를 조사한 유럽 전역의 연구에서[50] 처음 입증되었습니다.2002년 유로화의 도입은 다양한 환율과 함께 기존의 명목가격 패턴을 왜곡시키는 동시에 실질가격을 유지시켰습니다.벤포드의 법칙에 따라 명목가격의 첫 번째 숫자가 분포되어 있는 반면, 이 연구는 유로화 도입의 명목 충격 이후 심리적 가격결정의 경향이 뚜렷한 명목시장가격의 두 번째와 세 번째 숫자에 대해 이 벤치마크로부터 분명한 편차를 보여주었습니다.

유전체 데이터

열린 읽기 프레임의 수와 게놈 크기에 대한 그들의 관계는 진핵생물과 원핵생물 사이에 차이가 있고 전자는 로그-선형 관계를 보이고 후자는 선형 관계를 보여줍니다.Benford의 법칙은 두 경우 모두에서 데이터에 매우 적합하게 이 관측치를 검정하는 데 사용되었습니다.[51]

과학적 부정 탐지

발표된 논문에서 회귀 계수를 검정한 결과 벤포드의 법칙과 일치하는 것으로 나타났습니다.[52]비교 그룹 피실험자들에게 통계적 추정치를 조작하도록 요청했습니다.조작된 결과는 첫 번째 숫자에서는 벤포드의 법칙에 부합했지만 두 번째 숫자에서는 벤포드의 법칙을 따르지 못했습니다.

통계 검정

카이-제곱 검정은 벤포드의 법칙을 준수하는지 검정하는 데 사용되었지만, 작은 표본에 사용할 경우 통계적 검정력이 낮습니다.

Kolmogorov-Smirnov 검정Kuiper 검정은 표본 크기가 작을 때, 특히 Stephens의 보정 계수가 사용될 때 더 강력합니다.[53]이러한 검정은 이산 분포에 적용할 경우 지나치게 보수적일 수 있습니다.Benford 검정의 값은 Morrow에서 생성했습니다.[54]검정 통계량의 임계 값은 다음과 같습니다.

시험
0.10 0.05 0.01
카이퍼 1.191 1.321 1.579
콜모고로프-스미르노프 1.012 1.148 1.420

이러한 임계값은 주어진 유의 수준에서 벤포드의 법칙을 준수한다는 가설을 기각하는 데 필요한 최소 검정 통계량 값을 제공합니다.

이 법에 특화된 두 가지 대체 테스트가 발표되었습니다.먼저, 최대(m) 통계량은[55] 다음과 같이 주어집니다.

선두 인자 은(는) Leemis가 원래 공식에 나타나지 않습니다. [55]Morrow가 나중에 논문에서 추가했습니다.[54]

둘째, 거리(d) 통계는[56] 다음과 같이 주어집니다.

여기서 FSD는 첫 번째 유효숫자이고 N은 표본 크기입니다.Morrow는 아래에 표시된 이 두 통계치 모두에 대한 임계 값을 결정했습니다.[54]

통계
0.10 0.05 0.01
레미스 m 0.851 0.967 1.212
조앤게인스 d 1.212 1.330 1.569

또한 Morrow는 임의의 임의 변수 X(연속 PDF 포함)를 표준 편차(σ)로 나눈 값에 대해 일부 값 A를 찾을 수 있으므로 임의X /σAdisplaystyle X/\sigma ^{A}가 벤포드의 법칙 ε > 0보다 작게 다를 것입니다.A의 값은 ε의 값과 랜덤 변수의 분포에 따라 달라집니다.

부트스트래핑(bootstrapping)과 회귀(regression)를 기반으로 하는 회계 부정 탐지 방법이 제안되었습니다.[57]

반대가 아니라 벤포드의 법칙에 동의하는 것이 목표라면 위에서 언급한 적합도 검정은 부적절합니다.이 경우 동등성에 대한 특정 검정을 적용해야 합니다.경험적 분포는 확률 질량 함수들 사이의 거리(예를 들어, 총 변동 거리 또는 통상적인 유클리드 거리)가 충분히 작으면 벤포드 법칙과 동등하다고 불립니다.벤포드의 법칙을 적용하여 테스트하는 이 방법은 오스트로프스키에 설명되어 있습니다.[58]

적용가능범위

벤포드의 법칙을 따르는 것으로 알려진 배포물

잘 알려진 일부 무한 정수 시퀀스는 벤포드의 법칙을 정확하게 만족시킬 수 있습니다(순서의 용어가 점점 더 많이 포함됨에 따라 점근적 한계에서).이들 중에는 피보나치 수,[59][60] 인수,[61] 2의 거듭제곱 및 [62][14]거의 모든 다른 수의 거듭제곱이 있습니다.[62]

마찬가지로, 몇몇 연속적인 과정들은 벤포드의 법칙을 정확히 만족합니다. (과정이 시간을 통해 지속됨에 따라 점근적 한계에서).하나는 기하급수적인 성장 또는 쇠퇴 과정입니다.시간에 따라 수량이 기하급수적으로 증가하거나 감소하는 경우, 각 첫 번째 숫자를 갖는 시간의 백분율은 점근적으로 벤포드 법칙을 만족합니다(즉, 시간이 지남에 따라 정확도가 증가함).

벤포드의 법칙에 불복하는 것으로 알려진 배포.

연속되는 자연수의 제곱근역수는 이 법칙을 따르지 않습니다.[63]유한 범위의 소수는 범위의 크기가 무한대에 가까워짐에 따라 균일성에 접근하는 일반화된 벤포드의 법칙을 따릅니다.[64]지역 전화번호 목록은 벤포드의 법에 위배됩니다.[65]벤포드의 법칙은 1960년과 1970년 인구조사에 따르면 미국 5개 주에서 최소 2500명의 인구를 가진 모든 지역의 인구에 의해 위반됩니다. 이 지역에서 숫자 1로 시작하는 인구는 19%에 불과하지만 숫자 2로 시작하는 인구는 20%에 달합니다. 2500에서 잘라내기하면 통계적 편향이 발생하기 때문입니다.[63]병리학 보고서의 말단 숫자는 반올림으로 인해 벤포드의 법칙에 위배됩니다.[66]

규모가 몇 배가 되지 않는 분포는 Benford의 법칙을 따르지 않을 것입니다.키, 몸무게, 아이큐 점수 등이 그 예입니다.[9][67]

Benford의 법칙을 따를 것으로 예상되는 분배와 따르지 않을 것으로 예상되는 분배의 기준

Benford의 법칙이 적용될 것으로 예상되는 곳에는 특히 회계 데이터에 적용할 수 있는 많은 기준이 제시되었습니다.[68]

벤포드의 법칙을 따를 것으로 예상할 수 있는 분배
  • 평균이 중앙값보다 크고 스큐가 양일 때
  • 숫자의 수학적 조합으로 발생하는 숫자: 예를 들어 수량 × 가격
  • 거래수준 데이터: 지출, 매출
벤포드의 법칙을 따를 것으로 예상되지 않는 분배.
  • 번호가 순차적으로 할당되는 경우(예: 조회 번호, 송장 번호)
  • 숫자가 인간의 생각에 의해 영향을 받는 경우: 예를 들어 심리적 임계값($9.99)에 의해 설정된 가격
  • 회사별 번호가 많은 계정: 예를 들어 100달러 환불을 기록하도록 설정된 계정
  • 기본 제공되는 최소 또는 최대 계정 수
  • 숫자의 크기 순서에 걸쳐 있지 않은 분포입니다.

벤포드의 법칙 준수 정리

수학적으로, 벤포드의 법칙은 시험되는 분포가 "벤포드의 법칙 준수 정리"에 맞는 경우에 적용됩니다.[17]유도는 확률 밀도 함수의 로그의 푸리에 변환이 모든 정수 값에 대해 0이면 벤포드의 법칙을 따른다고 말합니다.특히 n개의 ≥ 1에 대해 푸리에 변환이 0(또는 무시 가능)인 경우 이는 충족됩니다.분포가 넓은 경우 이는 충족됩니다(넓은 분포는 좁은 푸리에 변환을 의미하므로).스미스는 다음과 같이 요약합니다(p. 716).

Benford의 법칙은 로그 스케일을 따라 단위 거리와 비교하여 넓은 분포를 따릅니다.마찬가지로, 단위 거리에 비해 좁은 분포는 법칙을 따르지 않습니다 … 로그 축의 단위 거리에 비해 분포가 넓으면, 검사 중인 숫자 집합의 퍼짐이 10보다 훨씬 크다는 것을 의미합니다.

간단히 말해서, 벤포드의 법칙은 측정되는 분포의 숫자가 적어도 크기의 순서에 걸쳐 퍼져야 한다고 요구합니다.

공통 분포를 사용한 검정

벤포드의 법칙은 균일 분포, 지수 분포, 정규 분포 등 여러 중요한 분포에 의해 생성된 숫자(10자리까지의 숫자)에 대해 경험적으로 테스트되었습니다.[9]

예상했던 대로 일률적인 분배는 벤포드의 법칙을 따르지 않습니다.이와는 대조적으로, 두 균일 분포비율 분포는 벤포드의 법칙에 의해 잘 설명됩니다.

정규 분포와 두 정규 분포(코시 분포)의 비율 분포 모두 벤포드의 법칙을 따르지 않습니다.반정규 분포는 Benford의 법칙을 따르지 않지만 두 반정규 분포의 비율 분포는 준수합니다.벤포드의 법칙에 의해 두 개의 오른쪽으로 절단된 정규 분포의 비율 분포와 오른쪽으로 절단된 정규 분포 모두 잘 설명되지 않습니다.이 분포는 더 큰 숫자를 대상으로 가중치가 부여되므로 놀라운 일이 아닙니다.

벤포드의 법칙은 두 지수 분포의 지수 분포와 비율 분포도 잘 설명합니다.카이 squared 분포의 적합도는 df = 1과의 일치도가 양호하고 df가 증가함에 따라 일치도가 감소하는 자유도(df)에 따라 달라집니다.F-분포는 자유도가 낮은 경우에 적합합니다.dfs가 증가하면 적합도는 감소하지만 카이제곱 분포보다 훨씬 느립니다.로그 정규 분포의 적합도는 평균과 분포의 분산에 따라 달라집니다.분산은 평균보다 적합도에 훨씬 더 큰 영향을 미칩니다.두 모수의 값이 클수록 법칙과 더 잘 일치합니다.두 로그 정규 분포의 비율이 로그 정규 분포이므로 이 분포를 조사하지 않았습니다.

검토된 다른 분포로는 Muth 분포, Gompertz 분포, Weibull 분포, 감마 분포, 로그 로지스틱 분포, 지수 멱급수 분포 등이 있으며, 이들은 모두 법과 합당한 일치를 보이고 있습니다.[55][69]임의 변수의 값이 증가함에 따라 밀도가 증가하는 Gumbel 분포는 이 법칙과 일치하지 않습니다.[69]

첫 번째 숫자를 초과하는 숫자로 일반화

Benford의 법칙을 만족하는 분포에 대해 숫자 n으로 시작할 확률을 나타내는 로그-로그 그래프입니다.점은 정확한 공식인 P(n) = log(1 + 1/n)을 나타냅니다.그래프는 로그-로그 스케일에서 기울기 -1과 함께 (1, 로그10 )를 통과하는 점선 점근선 방향으로 경향이 있습니다.노란색 예제는 숫자가 314로 시작할 확률이 약 0.00138임을 보여줍니다.점선은 비교를 위해 균일 분포에 대한 확률을 보여줍니다. (SVG 이미지에서 한 점 위를 맴돌면서 값을 표시합니다.)

첫 번째 숫자를 넘어 숫자로 법을 확장하는 것이 가능합니다.[70]특히, 주어진 숫자의 숫자에 대하여, 그 길이의 숫자 n의 문자열로 시작하는 숫자와 마주칠 확률은 다음과 같이 주어집니다.

따라서 숫자가 숫자 3, 1, 4로 시작할 확률(일부 예는 3.14, 3.142, π, 314280.7 및 0.00314005)은 오른쪽에 로그-로그 그래프가 있는 상자에 있는 것처럼 log(1 + 1/314) ≈ 0.00138입니다.

이 결과는 특정 숫자가 숫자 내의 특정 위치에서 발생할 확률을 찾는 데 사용될 수 있습니다.예를 들어, "2"를 두 번째 숫자로 만날 확률은 다음과[70] 같습니다.

그리고 d (d = 0, 1, ..., 9)가 n번째 (n > 1) 자리가 될 확률은

n번째 자리의 분포는 n이 증가함에 따라 아래와 같이 10자리마다 10%씩 균일한 분포에 빠르게 접근합니다.[70]네 자리는 종종 "0"이 네 번째 자리에서 시간의 10.0176%로 나타나는 반면, "9"는 시간의 9.9824%로 나타나므로 10%의 균일한 분포를 가정하기에 충분합니다.

숫자 0 1 2 3 4 5 6 7 8 9
첫 번째 30.1% 17.6% 12.5% 9.7% 7.9% 6.7% 5.8% 5.1% 4.6%
두번째 12.0% 11.4% 10.9% 10.4% 10.0% 9.7% 9.3% 9.0% 8.8% 8.5%
3번째 10.2% 10.1% 10.1% 10.1% 10.0% 10.0% 9.9% 9.9% 9.9% 9.8%

모먼트

이 법칙에 따라 1부터 9까지의 숫자에 대한 확률 변수의 평균모멘트를 계산했습니다.[71]

Benford의 법칙에 따라 2자리 분포의 경우 다음 값도 알려져 있습니다.[72]

벤포드의 법칙에 따라 처음 두 자리의 합동 발생에 대한 정확한 확률 표를 이용할 수 있으며, 첫 번째 자리와 두 번째 자리 사이의 모집단 상관 관계인 ρ = 0.0561도 이용할 수 있습니다.

대중문화에서

벤포드의 법칙은 일부 21세기 대중 오락물에 줄거리 장치로 등장했습니다.

  • TV 범죄 드라마 NUM3RS는 2006년 에피소드 "런닝맨"에서 벤포드의 법칙을 사용하여 일련의 강도 사건을 해결하는데 도움을 주었습니다.[30]
  • 2016년 영화 회계사는 로봇 회사의 자금 도난을 폭로하기 위해 벤포드의 법칙에 의존했습니다.
  • 2017년 넷플릭스 시리즈 오자크는 벤포드의 법칙을 이용해 카르텔 조직원의 재무제표를 분석하고 사기를 밝혀냈습니다.
  • 2021년 제레미 로빈슨 소설 인피니트 2는 등장인물들이 모의실험인지 실제인지를 테스트하기 위해 벤포드의 법칙을 적용했습니다.

참고 항목

참고문헌

  1. ^ 아르노 버거와 테오도어 P.힐, 벤포드의 법칙 반격: 수학적 보석에 대한 간단한 설명은 보이지 않습니다, 2011.
  2. ^ Weisstein, Eric W. "Benford's Law". MathWorld, A Wolfram web resource. Retrieved 7 June 2015.
  3. ^ Hill, Theodore (1995). "A Statistical Derivation of the Significant-Digit Law". Statistical Science. 10 (4). doi:10.1214/ss/1177009869.
  4. ^ Paul H. Kvam, Brani Vidakovic, 과학과 공학에 대한 응용을 포함한 비모수 통계, p. 158
  5. ^ a b Berger, Arno; Hill, Theodore P. (30 June 2020). "The mathematics of Benford's law: a primer". Stat. Methods Appl. 30 (3): 779–795. arXiv:1909.07527. doi:10.1007/s10260-020-00532-8. S2CID 202583554.
  6. ^ Cai, Zhaodong; Faust, Matthew; Hildebrand, A. J.; Li, Junxian; Zhang, Yuan (15 March 2020). "The Surprising Accuracy of Benford's Law in Mathematics". The American Mathematical Monthly. 127 (3): 217–237. arXiv:1907.08894. doi:10.1080/00029890.2020.1690387. ISSN 0002-9890. S2CID 198147766.
  7. ^ a b Frank Benford (March 1938). "The law of anomalous numbers". Proc. Am. Philos. Soc. 78 (4): 551–572. JSTOR 984802.
  8. ^ a b Simon Newcomb (1881). "Note on the frequency of use of the different digits in natural numbers". American Journal of Mathematics. 4 (1/4): 39–40. Bibcode:1881AmJM....4...39N. doi:10.2307/2369148. JSTOR 2369148. S2CID 124556624.
  9. ^ a b c d Formann, A. K. (2010). Morris, Richard James (ed.). "The Newcomb–Benford Law in Its Relation to Some Common Distributions". PLOS ONE. 5 (5): e10541. Bibcode:2010PLoSO...510541F. doi:10.1371/journal.pone.0010541. PMC 2866333. PMID 20479878.
  10. ^ a b Miller, Steven J., ed. (9 June 2015). Benford's Law: Theory and Applications. Princeton University Press. p. 309. ISBN 978-1-4008-6659-5.
  11. ^ 그들은 엄격하게 막대여야 하지만 명확한 선으로 표시됩니다.
  12. ^ Pimbley, J. M. (2014). "Benford's Law as a Logarithmic Transformation" (PDF). Maxwell Consulting, LLC. Archived (PDF) from the original on 9 October 2022. Retrieved 15 November 2020.
  13. ^ Khosravani, A. (2012). Transformation Invariance of Benford Variables and their Numerical Modeling. Recent Researches in Automatic Control and Electronics. pp. 57–61. ISBN 978-1-61804-080-0.
  14. ^ a b 랠프 레이미는 2의 첫 100개의 거듭제곱이 벤포드의 법칙을 대략적으로 만족한다고 언급했습니다.
  15. ^ a b Theodore P. Hill (1995). "A Statistical Derivation of the Significant-Digit Law". Statistical Science. 10 (4): 354–363. doi:10.1214/ss/1177009869. MR 1421567.
  16. ^ Hill, Theodore P. (1995). "Base-invariance implies Benford's law". Proceedings of the American Mathematical Society. 123 (3): 887–895. doi:10.1090/S0002-9939-1995-1233974-8. ISSN 0002-9939.
  17. ^ a b c Steven W. Smith. "Chapter 34: Explaining Benford's Law. The Power of Signal Processing". The Scientist and Engineer's Guide to Digital Signal Processing. Retrieved 15 December 2012.
  18. ^ a b c Fewster, R. M. (2009). "A simple explanation of Benford's Law" (PDF). The American Statistician. 63 (1): 26–32. CiteSeerX 10.1.1.572.6719. doi:10.1198/tast.2009.0005. S2CID 39595550. Archived (PDF) from the original on 9 October 2022.
  19. ^ 아르노 버거와 테오도어 P.힐, 벤포드의 법칙 반격: 수학적 보석에 대한 간단한 설명은 보이지 않습니다, 2011.저자들은 이 주장에 대해 설명하지만 "왜 스프레드 자체와 반대로, 즉 로그 스프레드가 커야 한다고 가정하는 것이 타당한지에 대한 의문을 여전히 열어둔다"며 "로그 스케일에서 큰 스프레드가 [벤포드 l]과 대략적으로 일치한다고 가정하는 것과 같다"고 말합니다.aw]"(이탤릭체가 추가됨), 그들은 "simple한 설명"이 부족하다고 말합니다.
  20. ^ Krieger, Wolfgang (1970). "On entropy and generators of measure-preserving transformations". Transactions of the American Mathematical Society. 149 (2): 453. doi:10.1090/S0002-9947-1970-0259068-3. ISSN 0002-9947.
  21. ^ Downarowicz, Tomasz (12 May 2011). Entropy in Dynamical Systems. Cambridge University Press. p. 106. ISBN 978-1-139-50087-6.
  22. ^ Smorodinsky, Meir (1971). "Chapter IX. Entropy and generators. Krieger's theorem". Ergodic Theory, Entropy. Lecture Notes in Mathematics. Vol. 214. Berlin, Heidelberg: Springer. doi:10.1007/BFb0066096.
  23. ^ Jolion, Jean-Michel (2001). "Images and Benford's Law". Journal of Mathematical Imaging and Vision. 14 (1): 73–81. doi:10.1023/A:1008363415314. ISSN 0924-9907. S2CID 34151059.
  24. ^ Lemons, Don S. (2019). "Thermodynamics of Benford's first digit law". American Journal of Physics. 87 (10): 787–790. arXiv:1604.05715. Bibcode:2019AmJPh..87..787L. doi:10.1119/1.5116005. ISSN 0002-9505. S2CID 119207367.
  25. ^ a b L. Pietronero; E. Tosatti; V. Tosatti; A. Vespignani (2001). "Explaining the uneven distribution of numbers in nature: the laws of Benford and Zipf". Physica A. 293 (1–2): 297–304. arXiv:cond-mat/9808305. Bibcode:2001PhyA..293..297P. doi:10.1016/S0378-4371(00)00633-6.
  26. ^ Formann, A. K. (2010). "The Newcomb–Benford law in its relation to some common distributions". PLOS ONE. 5 (5): e10541. Bibcode:2010PLoSO...510541F. doi:10.1371/journal.pone.0010541. PMC 2866333. PMID 20479878.
  27. ^ Theodore P. Hill (July–August 1998). "The first digit phenomenon" (PDF). American Scientist. 86 (4): 358. Bibcode:1998AmSci..86..358H. doi:10.1511/1998.4.358. S2CID 13553246.
  28. ^ Janvresse, Élise; Thierry (2004). "From Uniform Distributions to Benford's Law" (PDF). Journal of Applied Probability. 41 (4): 1203–1210. doi:10.1239/jap/1101840566. MR 2122815. Archived from the original (PDF) on 4 March 2016. Retrieved 13 August 2015.
  29. ^ Pinkham, Roger S. (1961). "On the Distribution of First Significant Digits". Ann. Math. Statist. 32 (4): 1223–1230. doi:10.1214/aoms/1177704862.
  30. ^ a b Weisstein, Eric W. "Benford's Law". mathworld.wolfram.com.
  31. ^ Jamain, Adrien (September 2001). "Benford's Law" (PDF). Imperial College of London. Archived (PDF) from the original on 9 October 2022. Retrieved 15 November 2020.
  32. ^ Berger, Arno (June 2011). "A basic theory of Benford's Law". Probability Surveys. 8 (2011): 1–126.
  33. ^ Varian, Hal (1972). "Benford's Law (Letters to the Editor)". The American Statistician. 26 (3): 65. doi:10.1080/00031305.1972.10478934.
  34. ^ "From Benford to Erdös". Radio Lab. Episode 2009-10-09. 30 September 2009.
  35. ^ 월터 R.메베인 주니어 "선거법 포렌식: 개표와 벤포드의 법칙"(2006년 7월 18일).
  36. ^ "선거 포렌식", 이코노미스트 (2007년 2월 22일).
  37. ^ Deckert, Joseph; Myagkov, Mikhail; Ordeshook, Peter C. (2011). "Benford's Law and the Detection of Election Fraud". Political Analysis. 19 (3): 245–268. doi:10.1093/pan/mpr014. ISSN 1047-1987.
  38. ^ Mebane, Walter R. (2011). "Comment on "Benford's Law and the Detection of Election Fraud"". Political Analysis. 19 (3): 269–272. doi:10.1093/pan/mpr024.
  39. ^ 스테판 타자스비 통계, 이란 선거 사기 암시 2009년 6월 24일 뉴사이언티스트
  40. ^ 월터 R.Mebane, Jr., "이란 대통령 선거에 관한 노트, 2009년 6월 29일"(미시간 대학교, 2009년 6월 29일), 22-23쪽.
  41. ^ Roukema, Boudewijn F. (2014). "A first-digit anomaly in the 2009 Iranian presidential election". Journal of Applied Statistics. 41: 164–199. arXiv:0906.2789. Bibcode:2014JApS...41..164R. doi:10.1080/02664763.2013.838664. S2CID 88519550.
  42. ^ 베른트 베버와 알렉산드라 스카코, "악마는 숫자 속에 있습니다. 이란의 선거가 조작되었다는 증거", 워싱턴 포스트(2009년 6월 20일).
  43. ^ Mark J. Nigini, Benford's Law: 법의학적 회계, 감사 사기 탐지를 위한 응용(Hoboken, NJ: Wiley, 2012), 132-35쪽.
  44. ^ a b 월터 R.메베인 주니어 "선거법 포렌식:선거 사기 사건의 두 번째 숫자 벤포드의 법률 시험과 최근 미국 대통령 선거: R이 편집한 선거 조작 탐지저지Michael Alvarez et al. (Washington, D.C: Brookings Institute Press, 2008), pp. 162-81. PDF
  45. ^ Shikano, Susumu; Mack, Verena (2011). "When Does the Second-Digit Benford's Law-Test Signal an Election Fraud? Facts or Misleading Test Results". Jahrbücher für Nationalökonomie und Statistik. 231 (5–6): 719–732. doi:10.1515/jbnst-2011-5-610. S2CID 153896048.
  46. ^ "Fact check: Deviation from Benford's Law does not prove election fraud". Reuters. 10 November 2020.
  47. ^ Dacey, James (19 November 2020). "Benford's law and the 2020 US presidential election: nothing out of the ordinary". Physics World.
  48. ^ 윌리엄 굿맨, 벤포드 법칙의 약속과 함정, 의의, 왕립통계학회(2016년 6월), 38쪽.
  49. ^ Goldacre, Ben (16 September 2011). "The special trick that helps identify dodgy stats". The Guardian. Retrieved 1 February 2019.
  50. ^ Sehity, Tarek el; Hoelzl, Erik; Kirchler, Erich (1 December 2005). "Price developments after a nominal shock: Benford's Law and psychological pricing after the euro introduction". International Journal of Research in Marketing. 22 (4): 471–480. doi:10.1016/j.ijresmar.2005.09.002. S2CID 154273305.
  51. ^ Friar, JL; Goldman, T; Pérez-Mercader, J (2012). "Genome sizes and the benford distribution". PLOS ONE. 7 (5): e36624. arXiv:1205.6512. Bibcode:2012PLoSO...736624F. doi:10.1371/journal.pone.0036624. PMC 3356352. PMID 22629319.
  52. ^ Diekmann, A (2007). "Not the First Digit! Using Benford's Law to detect fraudulent scientific data". J Appl Stat. 34 (3): 321–329. doi:10.1080/02664760601004940. hdl:20.500.11850/310246. S2CID 117402608.
  53. ^ Stephens, M. A. (1970). "Use of the Kolmogorov–Smirnov, Cramér–von Mises and related statistics without extensive tables". Journal of the Royal Statistical Society, Series B. 32 (1): 115–122.
  54. ^ a b c d Morrow, John (August 2014). Benford's Law, families of distributions and a test basis. London, UK. Retrieved 11 March 2022.{{cite book}}: CS1 유지 관리: 위치 누락 게시자(링크)
  55. ^ a b c Leemis, L. M.; Schmeiser, B. W.; Evans, D. L. (2000). "Survival distributions satisfying Benford's Law". The American Statistician. 54 (4): 236–241. doi:10.1080/00031305.2000.10474554. S2CID 122607770.
  56. ^ Cho, W. K. T.; Gaines, B. J. (2007). "Breaking the (Benford) law: Statistical fraud detection in campaign finance". The American Statistician. 61 (3): 218–223. doi:10.1198/000313007X223496. S2CID 7938920.
  57. ^ Suh, I. S.; Headrick, T. C.; Minaburo, S. (2011). "An effective and efficient analytic technique: A bootstrap regression procedure and Benford's Law". J. Forensic & Investigative Accounting. 3 (3).
  58. ^ Ostrovski, Vladimir (May 2017). "Testing equivalence of multinomial distributions". Statistics & Probability Letters. 124: 77–82. doi:10.1016/j.spl.2017.01.004. S2CID 126293429.
  59. ^ Washington, L. C. (1981). "Benford's Law for Fibonacci and Lucas Numbers". The Fibonacci Quarterly. 19 (2): 175–177.
  60. ^ Duncan, R. L. (1967). "An Application of Uniform Distribution to the Fibonacci Numbers". The Fibonacci Quarterly. 5: 137–140.
  61. ^ Sarkar, P. B. (1973). "An Observation on the Significant Digits of Binomial Coefficients and Factorials". Sankhya B. 35: 363–364.
  62. ^ a b 일반적으로 수열 k1, k2, k3 등은 log10 k무리수라는 조건하에서 벤포드의 법칙을 정확히 만족합니다.이것은 등분포 정리의 간단한 결과입니다.
  63. ^ a b Raimi, Ralph A. (August–September 1976). "The first digit problem". American Mathematical Monthly. 83 (7): 521–538. doi:10.2307/2319349. JSTOR 2319349.
  64. ^ Zyga, Lisa; Phys.org. "New Pattern Found in Prime Numbers". phys.org. Retrieved 23 January 2022.
  65. ^ Cho, Wendy K. Tam; Gaines, Brian J. (2007). "Breaking the (Benford) Law: Statistical Fraud Detection in Campaign Finance". The American Statistician. 61 (3): 218–223. doi:10.1198/000313007X223496. ISSN 0003-1305. JSTOR 27643897. S2CID 7938920. Retrieved 8 March 2022.
  66. ^ Beer, Trevor W. (2009). "Terminal digit preference: beware of Benford's law". J. Clin. Pathol. 62 (2): 192. doi:10.1136/jcp.2008.061721. PMID 19181640. S2CID 206987736.
  67. ^ 싱글턴, 토미 W. (2011년 5월 1일)"벤포드의 법칙의 이해와 적용", ISACA 저널, 정보 시스템 감사 및 통제 협회2020년 11월 9일 회수.
  68. ^ Durtschi, C; Hillison, W; Pacini, C (2004). "The effective use of Benford's law to assist in detecting fraud in accounting data". J Forensic Accounting. 5: 17–34.
  69. ^ a b Dümbgen, L; Leuenberger, C (2008). "Explicit bounds for the approximation error in Benford's Law". Electronic Communications in Probability. 13: 99–112. arXiv:0705.4488. doi:10.1214/ECP.v13-1358. S2CID 2596996.
  70. ^ a b c Hill, Theodore P. (1995). "The Significant-Digit Phenomenon". The American Mathematical Monthly. 102 (4): 322–327. doi:10.1080/00029890.1995.11990578. JSTOR 2974952.
  71. ^ Scott, P.D.; Fasli, M. (2001) "벤포드의 법칙: 경험적 조사와 참신한 설명" 2014년 12월 13일 웨이백 머신에서 보관.CSM 기술 보고서 349, Univ 컴퓨터 과학부에섹스
  72. ^ a b c Suh, I. S.; Headrick, T. C. (2010). "A comparative analysis of the bootstrap versus traditional statistical procedures applied to digital analysis based on Benford's law" (PDF). Journal of Forensic and Investigative Accounting. 2 (2): 144–175.

추가열람

외부 링크