허위적용률

False coverage rate

통계에서 거짓 적용률(FCR)은 선택한 간격 중 실제 매개변수를 포함하지 않는, 거짓 적용의 평균 비율이다.

FCR은 문제에서 고려된 모든 파라미터에 대해 (1 - α)×100% 수준에서 동시 커버리지를 제공한다.FCR은 허위 발견률(FDR)과 강한 연관성을 가지고 있다.두 방법 모두 다중 비교, 신뢰 구간(CI)의 FCR 및 P-값의 관점에서 FDR 문제를 다룬다.

선택적 추론에 의한 위험 때문에 FCR이 필요했다.연구자들과 과학자들은 고려된 다양한 가설을 명확하게 나타내지 않고 유의하다고 여겨지는 부분만을 보고하거나 강조하려는 경향이 있다.따라서 어떻게 데이터가 허위로 커버되는지 이해할 필요가 있다.CI 길이 – Bonferroni-Selected-Bonferroni-Selected,[citation needed] Adjusted BH-Selected CIs (벤자미니와 예쿠티엘리 2005[1])에 따라 사용할 수 있는 FCR 절차가 많다.다른 절차보다 한 절차를 선택하는 동기는 CI가 가능한 한 좁은지 확인하고 FCR을 유지하는 것이다.마이크로 어레이 실험과 기타 현대 응용의 경우, 엄청난 수의 매개변수가 존재하며, 종종 수만 개 이상이며 가장 강력한 절차를 선택하는 것이 매우 중요하다.

FCR은 2001년 다니엘 예쿠티엘리에 의해 박사학위 논문에서 처음 소개되었다.[2]


정의들

FCR을 유지하지 않는 것은 > 가긍정적 판단의 고속 세라믹로 계획}}>q} 때 q=VR)α m0R{\displaystyle q={\frac{V}{R}}={\frac{\alpha m_{0}}{R}}}거부된 가설의 진정한 null가설의 m0{\displaystyle m_{0}}은 수, R{R\displaystyle}을 몇번이나 V{V\displaystyle}은 수와 α{\displa.yst(가) 유의 수준임.동시 범위 확률이 - {\인 간격은 에 의해 경계되는 FCR을 제어할 수 있다

다중 가설 검정 분류

다음 표는 여러 귀무 가설을 검정할 때 가능한 결과를 정의한다.H1, H2, ..., Hm 표시된 귀무 가설의 숫자 m이 있다고 가정합시다. 통계적 테스트를 사용하여 해당 검정이 유의하다고 선언되면 귀무 가설을 기각한다.만약 검정이 중요하지 않다면 우리는 귀무 가설을 기각하지 않는다.모든 Hi 걸쳐 각 유형의 결과를 합산하면 다음과 같은 랜덤 변수가 발생한다.

귀무 가설 참(H0) 대립 가설 참(HA) 합계
테스트가 유의하다고 선언됨 V S R
검정이 중요하지 않은 것으로 선언됨 U T
합계 m
  • m은 가설을 검정한 총 수입니다.
  • (는) 알 수 없는 모수인 참 귀무 가설의 수입니다.
  • - (는) 진정한 대립 가설의 수입니다.
  • V잘못된 긍정(Type I error)의 수입니다("허위 검색"이라고도 함).
  • S는 참 긍정("참 발견"이라고도 함)의 수입니다.
  • T거짓 부정의 수입니다(타입 II 오류).
  • U진정한 부정의 수입니다.
  • = + (는) 거부된 귀무 가설의 수입니다(참 또는 거짓이라고도 함).

참 귀무 가설인 m 가설 검정에서 R은 관측 가능한 랜덤 변수, S, T, U, V는 관측할 수 없는 랜덤 변수다.

FCR에 의해 해결된 문제들

선택

선택으로 평균 커버리지가 감소한다.선택은 데이터에 의해 정의된 사건에 대한 조건화로 제시될 수 있으며 단일 파라미터에 대한 CI의 적용 가능성에 영향을 미칠 수 있다.동등하게 선택 문제는 P-값의 기본 감각을 변화시킨다.FCR 절차에서는 매개변수에 대한 (알 수 없는) 값 집합에 대한 선택 규칙에 따른 조건부 적용의 목표를 달성할 수 없다고 간주한다.선택적 CI에 관한 한 더 약한 부동산은 가능하며, 허위 커버리지 명세서를 피할 것이다.FCR은 선택 후 간격 범위 측정이다.따라서 1 - α CI가 선택적(조건적) 커버리지를 제공하지 않더라도, 커버리지 없는 CI를 구성할 확률은 최대 α에 달한다.

선택 및 다중성

다중 파라미터에 대한 추론)과 선택 모두에 직면할 때, 1-α에서 선택된 파라미터에 대한 예상 적용 범위가 α에서 무 적용 범위의 예상 비율과 같지 않을 뿐만 아니라, 선택된 각 파라미터에 대해 한계 CI를 구성하여 후자를 더 이상 보장할 수 없다.FCR 절차는 선택된 파라미터 중 CI에서 다루지 않는 파라미터의 예상 비율을 취함으로써 이를 해결한다. 여기서 파라미터가 선택되지 않은 경우 비율은 0이다.이 잘못된 적용 범위 진술 비율(FCR)은 매개변수를 선택하는 방법과 다중 구간을 구성하는 방법에 의해 정의되는 모든 절차의 속성이다.

제어 절차

동시 CI에 대한 Bonferroni 절차(Bonferroni 선택-Bonferroni 조정)

우리가 m 파라미터를 가지고 있을 때 Bonferroni 절차를 가진 동시 CI, 각 한계 CI는 1 - α/m 수준에서 생성된다.선택권이 없는 경우, 이들 CI는 모든 CI가 각각의 파라미터를 커버할 확률은 최소 1 - α라는 점에서 동시 적용범위를 제공한다. 불행하게도, 그러한 강력한 속성도 선택 이후 조건부 신뢰 속성을 보장하지는 않는다.

Bonferroni 선택-Bonferroni 조정 동시 CI용 FCR

Bonferroni-Bonferroni 절차는 조건부 커버리지를 제공할 수 없지만, FCR을 <α>로 제어한다. 사실 FCR이 θ의 큰 값에 비해 너무 0에 가깝다는 점에서 너무 잘한다.구간 선택은 Bonferroni 시험을 기반으로 하며, Bonferroni CI가 구성된다.FCR은 생성된 CI 중에서 각 매개변수를 포함하지 않는 구간의 비율을 계산하는 것으로 추정한다(아무것도 선택하지 않은 경우 비율을 0으로 설정).조정되지 않은 개별 시험에 기초하고 조정되지 않은 CI를 구성하는 경우.

FCR 조정 BH 선택 CI

PP(1) ≤ • • ( P(m)를 정렬하고 R = max{ j(j) • j • q/m}을 계산한 후 FDR에 대한 BH 절차에서 P(i) ≤ Rq/m이 기각되는 R 귀무 가설.Bonferroni 절차를 사용하여 테스트를 수행할 경우 FCR 하한이 원하는 레벨 q 이하로 떨어져 간격이 너무 길다는 것을 암시할 수 있다.이와는 대조적으로 BH 절차에서 일반 절차와 FDR 제어 시험을 결합한 다음 절차를 적용하면 FCR에 대한 하한인 Q/2 f FCR도 산출된다.이 절차는 일부 구성의 경우 FCR이 q에 접근한다는 점에서 예리하다.

1. 매개변수 P(1) ≤ • • ≤P(m)에 관한 m 가설의 시험에 사용되는 p 값을 정렬한다.

2. R = max{i : P(i) ≤ iq/m}을 계산한다.

3. 거부된 가설에 해당하는 P(i) ≤ Rq/m의 R 매개변수를 선택한다.

4. 선택한 각 파라미터에 대해 1 - R • Q/m CI를 구축한다.

참고 항목

참조

각주

  1. ^ Benjamini, Yoav; Yekutieli, Daniel (March 2005). "False Discovery Rate–Adjusted Multiple Confidence Intervals for Selected Parameters" (pdf). Journal of the American Statistical Association. 100 (469): 71–93. doi:10.1198/016214504000001907.
  2. ^ 통계 문제에서 허위 발견 비율을 적용하기 위해 필요한 이론적 결과.2001년 4월 (제3.2절, 제51페이지)

기타 출처