Z-인자

Z-factor

Z-요인통계적 효과 크기의 척도다.고투과 스크리닝(Z-prime이라고도[1] 함)에 사용하기 위해 제안되었으며, 일반적으로 Z'로 표기되어 특정 검사에서 반응이 더 주의를 기울일 수 있을 정도로 큰지 여부를 판단한다.

배경

고투과 스크린에서 실험자들은 종종 알려지지 않은 샘플에 대한 많은 수의 단일 측정치(수십만에서 수천만까지)를 양성 및 음성 대조 검체에 비교한다.실험 조건과 측정의 특정한 선택을 검사라고 한다.대형 스크린은 시간과 자원이 비싸다.따라서 대형 스크린을 시작하기 전에 검사 품질을 평가하기 위해 더 작은 테스트(또는 파일럿) 스크린을 사용한다.Z-요인은 특정 검사의 적합성을 정량화하기 위한 시도로, 풀 스케일, 고투과 스크린에 사용된다.

정의

The Z-factor is defined in terms of four parameters: the means () and standard deviations () of both the positive (p) and negative (n) controls (, , and , 이러한 값을 고려할 때 Z-요인은 다음과 같이 정의된다.

실제로 Z-요인은 표본 평균과 표본 표준 편차로부터 추정된다.

해석

Z-요인에 대한 다음과 같은 해석은 다음과 같다.[2]

Z-인자 해석
1.0 이상. Z-요인은 절대 1을 초과할 수 없다.
0.5에서 1.0 사이 훌륭한 검사. = 경우 0.5는 p μn {\ 사이에 12 표준 편차를 분리하는 것과 동등하다는 점에 유의한다
0.5에서 0 사이 한계 검사.
0보다 작은 검사를 유용하게 하기 위해서는 양성 대조군과 음성 대조군 사이에 너무 많은 중복이 있다.

많은 유형의 실험 표준에 따르면 Z-요인이 0이면 위에서 제시한 것과 같이 쓸모없는 결과를 경계로 하는 것이 아니라 큰 효과의 크기를 시사한다는 점에 유의한다.예를 들어 σp===σn=1이면 μp=6, μn=0이면 Z-요소가 0이 된다.그러나 이러한 매개변수가 있는 정규 분포 데이터의 경우 양의 제어 값이 음의 제어 값보다 작을 확률은 10의5 1보다 작다.수행된 시험 횟수가 많아 처리량이 많은 선별에서는 극단적 보수성이 사용된다.

제한 사항

Z-요인의 정의에 있는 상수 인자 3은 평균의 3 표준 편차 내에서 99% 이상의 값이 발생하는 정규 분포에 의해 동기가 부여된다.데이터가 매우 비정규적인 분포를 따르는 경우 기준점(예: 음수 값의 의미)은 오도될 수 있다.또 다른 문제는 평균과 표준 편차에 대한 일반적인 추정치가 견고하지 않다는 것이다. 따라서 고투입 선별 커뮤니티의 많은 사용자들은 평균을 중앙값으로 대체하고 표준 편차를 중앙값 절대 편차를 대체하는 "Robust Z-preme"을 선호한다.[3]양수 또는 음수 조정기의 극단값(특이치)은 Z-요인에 부정적인 영향을 미칠 수 있으며, 검사가 실제 선별에서 잘 수행될 경우에도 명백히 불리한 Z-요인으로 이어질 수 있다.[4]또한 동일한 분석에서 서로 다른 강점을 가진 둘 이상의 양성 대조군에 단일 Z-요인 기반 기준을 적용하면 잘못된 결과를 초래할 것이다.[5]Z-요인의 절대 부호는 Z-요인의 통계적 추론을 수학적으로 도출하는 것을 불편하게 한다.[6] 최근 제안된 통계적 매개변수, 엄격히 표준화된 평균 차이(SSMD)는 이러한 문제들을 다룰 수 있다.[6][7]SSMD의 한 추정치는 특이치에 강하다.

참고 항목

참조

  1. ^ http://planetorbitrap.com/data/uploads/4fb692e73c07b.pdf
  2. ^ Zhang JH, Chung TDY, Oldenburg KR (1999). "A simple statistical parameter for use in evaluation and validation of high throughput screening assays". Journal of Biomolecular Screening. 4: 67–73. doi:10.1177/108705719900400206. PMID 10838414.
  3. ^ Birmingham, Amanda; et al. (August 2009). "Statistical Methods for Analysis of High-Throughput RNA Interference Screens". Nat Methods. 6 (8): 569–575. doi:10.1038/nmeth.1351. PMC 2789971. PMID 19644458.
  4. ^ Sui Y, Wu Z (2007). "Alternative Statistical Parameter for High-Throughput Screening Assay Quality Assessment". Journal of Biomolecular Screening. 12: 229–34. doi:10.1177/1087057106296498. PMID 17218666.
  5. ^ a b Zhang XHD, Espeseth AS, Johnson E, Chin J, Gates A, Mitnaul L, Marine SD, Tian J, Stec EM, Kunapuli P, Holder DJ, Heyse JF, Stulovici B, Ferrer M (2008). "Integrating experimental and analytic approaches to improve data quality in genome-wide RNAi screens". Journal of Biomolecular Screening. 13: 378–89. doi:10.1177/1087057108317145. PMID 18480473.
  6. ^ a b Zhang XHD (2007). "A pair of new statistical parameters for quality control in RNA interference high-throughput screening assays". Genomics. 89: 552–61. doi:10.1016/j.ygeno.2006.12.014. PMID 17276655.
  7. ^ Zhang XHD (2008). "Novel analytic criteria and effective plate designs for quality control in genome-wide RNAi screens". Journal of Biomolecular Screening. 13: 363–77. doi:10.1177/1087057108317062. PMID 18567841.

추가 읽기