정확도 및 정밀도

Accuracy and precision

정확도와 정밀도는 관측 오차의 두 가지 측도입니다.정확도는 주어진 일련의 측정값(관측값 또는 판독값)이 실제 값에 얼마나 가깝거나 먼지를 의미하며, 정밀도는 측정값이 서로 얼마나 가깝거나 분산되어 있는지를 나타냅니다.

즉, 정밀도랜덤 오차의 설명이며 통계적 변동성의 척도입니다.정확도에는 다음 두 가지 정의가 있습니다.

  1. 더 일반적으로, 이것은 체계적 오류만을 기술하는 것으로, 중앙 경향의 특정 측정치에 대한 통계적 편향의 척도이다. 낮은 정확도는 결과와 값 사이의 차이를 일으킨다. ISO는 이것을 진실성이라고 부른다.
  2. 또는 ISO는[1] 정확성을 두 유형의 관찰 오차(랜덤 및 체계적)의 조합을 설명하는 것으로 정의하기 때문에 높은 정확도는 높은 정밀도와 높은 진실성을 필요로 한다.

위의 "정확도"에 대한 첫 번째 일반적인 정의에서는 "정확도"와는 무관하므로 특정 데이터 집합은 정확도, 정밀도, 둘 다 또는 둘 다라고 할 수 있다.

간단히 말하면, 동일한 양의 반복 측정에서 통계 샘플 또는 데이터 포인트 세트가 주어졌을 때, 표본 또는 세트의 평균이 측정되는 양의 실제 값에 가깝다면 정확하다고 할 수 있고, 표준 편차가 상대적으로 작으면 정확하다고 할 수 있다.

일반적인 기술 정의

정확도는 측정 결과가 참 값에 근접한 이며, 정밀도는 변하지 않은 조건에서 반복(또는 재현 가능) 측정 결과가 동일한 정도를 나타냅니다.

이공계 분야에서 측정 시스템의 정확도는 그 양의 실제 [2]대한 측정의 근접도이다.재현성반복성과 관련된 측정 시스템의 정밀도는 변하지 않은 조건에서 반복 측정이 동일한 [2][3]결과를 나타내는 정도를 말한다.정확성과 정확성은 구어체에서는 동의어가 될 수 있지만 과학적 방법에서는 의도적으로 대조된다.

측정의 해석이 중심적인 역할을 하는 통계학 분야는 정확성과 정확성 대신 편향과 변동성이라는 용어를 사용하는 것을 선호합니다. 편향은 부정확성의 양이고 변동성은 부정확성의 양입니다.

측정 시스템은 정확하지는 않지만 정확하지는 않을 수 있으며, 정확하지는 않지만 정확하지는 않을 수도 있습니다.예를 들어, 실험에 체계적인 오류가 포함된 경우 표본 크기를 늘리면 일반적으로 정밀도는 증가하지만 정확도는 향상되지 않습니다.그 결과는 결함이 있는 실험의 일관성이 있지만 부정확한 일련의 결과가 될 것이다.시스템 오류를 제거하면 정확도는 향상되지만 정밀도는 변경되지 않습니다.

측정 시스템은 정확하고 정확한 경우 유효한 으로 간주됩니다.관련 항에는 치우침(독립 변수와 무관한 요인 또는 요인에 의해 유발되는 비랜덤 또는 방향 효과)과 오차(랜덤 변동성)가 포함됩니다.

이 용어는 간접 측정, 즉 관측된 데이터에서 계산 절차를 통해 얻은 값에도 적용된다.

측정에는 정확도와 정밀도 외에도 측정 분해능이 있을 수 있으며, 이는 측정에서 반응을 생성하는 기본 물리적 양의 가장 작은 변화입니다.

수치 분석에서 정확도는 계산의 참값에 대한 근접도입니다. 반면 정밀도는 표현 분해능으로 일반적으로 십진수 또는 이진수로 정의됩니다.

군사용어로 정확도는 주로 사격의 정확도(Juste de tir)를 가리키며,[4] 사격의 정밀도는 표적 중심부 및 그 주변에 있는 사격 그룹의 근접성으로 표현된다.

정량화

산업 계측기에서 정확도는 계측기의 측정 공차 또는 전송이며 계측기를 정상 작동 [5]조건에서 사용할 때 발생하는 오차의 한계를 정의합니다.

측정 장치는 정확하고 정밀하며, 측정치는 모두 실제 값에 가깝고 가깝게 군집되어 있는 것이 이상적입니다.측정 프로세스의 정확성과 정밀도는 일반적으로 추적 가능한 기준 표준을 반복적으로 측정함으로써 결정됩니다.이러한 표준은 International System of Units(프랑스어: Systéme international d'unités의 약자 SI)에 정의되어 있으며, 미국 국립표준기술원(National Institute of Standards and Technology)과 같은 국가표준기관에 의해 유지되고 있다.

이는 측정을 반복하고 평균을 산출하는 경우에도 적용됩니다.이 경우 표준 오차라는 용어를 적절하게 적용합니다. 평균의 정밀도는 프로세스의 알려진 표준 편차를 평균 측정 횟수의 제곱근으로 나눈 값과 같습니다.또한 중심 한계 정리는 평균화된 측정치의 확률 분포가 개별 측정치의 확률 분포보다 정규 분포에 가깝다는 것을 보여준다.

정확도와 관련하여 다음을 구별할 수 있습니다.

  • 측정값의 평균과 기준값인 치우침 사이의 차이.보정을 위해서는 바이어스 설정 및 수정이 필요합니다.
  • 그 효과와 정밀도의 결합입니다.

과학 및 공학에서 일반적으로 사용되는 규칙은 유의한 수치를 사용하여 암묵적으로 정확성 및/또는 정밀도를 표현하는 것입니다.명시적으로 명시되지 않은 경우 오차 한계는 마지막 유효 자리 값의 1/2로 이해된다.예를 들어, 843.6m 또는 843.0m 또는 800.0m의 기록은 0.05m의 여유(마지막 유효 자릿수는 10분의 1)를 의미하며, 843m의 기록은 0.5m의 오차 한계를 의미한다(마지막 유효 자릿수는 단위).

후행 0이 있고 소수점이 없는 8,000m의 판독치는 모호하다. 후행 0은 유의한 수치로 의도되거나 의도되지 않을 수 있다.이 모호성을 피하기 위해 숫자를 과학적 표기법으로 나타낼 수 있다. 8.0 × 103 m는 첫 번째 0이 유의하다는 것을 나타낸다(따라서 여백 50 m). 반면 80003 × 10 m는 세 개의 영이 모두 유의하다는 것을 나타내 0.5 m의 여백을 준다.마찬가지로 8.0km는 8.0 × 10m에3 해당하는 기본 측정 단위의 배수를 사용할 수 있다.이는 0.05km(50m)의 여유를 나타냅니다.그러나 이 규약에 의존하면 규약을 준수하지 않는 소스로부터 데이터를 수신할 때 잘못된 정밀도 오류가 발생할 수 있습니다.예를 들어, 정밀도 +/- 5,000의 153,753과 같은 수치를 보고하는 소스는 정밀도 +/- 0.5인 것처럼 보입니다.협약에 따르면 154,000으로 반올림되었을 것이다.

또는 과학적 맥락에서 오차 한계를 더 정확하게 나타내려면 7.54398(23) × 10m−10, 즉 7.54375와 7.54421 × 10m−10 사이의 범위를 의미한다.

Precision에는 다음이 포함됩니다.

  • 반복성 - 동일한 계측기와 조작자를 사용하고 짧은 시간 동안 반복함으로써 조건을 일정하게 유지하기 위해 모든 노력을 기울일 때 발생하는 변동.
  • 재현성 — 다른 계측기와 조작자 간에 동일한 측정 프로세스를 사용하여 더 긴 기간에 걸쳐 발생하는 변동.

공학에서 정밀도는 종종 측정된 측정의 표준 편차의 3배로 측정의 99.73%가 [6]발생할 수 있는 범위를 나타냅니다.예를 들어 인체를 측정하는 인체공학자는 추출한 측정치의 99.73%가 ± 0.7cm(GRYPHON 처리 시스템을 사용하는 경우) 또는 ± 13cm([7]미처리 데이터를 사용하는 경우) 이내에 속한다고 확신할 수 있다.

ISO 정의(ISO 5725)

ISO 5725-1에 따르면 정확도는 진실성(진정한 값에 대한 측정 결과의 근접성)과 정밀도(측정 반복성 또는 재현성)로 구성된다.

이러한 용어의 의미 변화는 1994년 ISO 5725 시리즈 표준이 발표되면서 나타났으며, 이는 2008년 발행된 "BIPM 국제 도량형 어휘"(VIM) 항목 2.13 [2]및 2.14에도 반영되어 있다.

ISO 5725-1에 [1]따르면 측정의 참값에 대한 근접도를 나타내기 위해 일반 용어 '정확도'가 사용된다.동일한 측정량의 측정값 집합에 이 용어를 적용하면 랜덤 오차의 성분과 시스템 오차의 성분이 포함됩니다.이 경우 진도는 측정 결과 집합의 평균이 실제(참) 값에 근접한 값이고 정밀도는 결과 집합 간의 일치 근접도입니다.

ISO 5725-1과 VIM은 또한 BS 5497-1에 [8]명시된 "바이어스"라는 용어의 사용을 피한다. 왜냐하면 이는 의학 및 법률에서와 같이 과학 및 공학 분야 외의 다른 의미를 가지고 있기 때문이다.

분류중

이진 분류

정확도는 이진 분류 테스트가 조건을 얼마나 정확하게 식별하는지 또는 제외하는지에 대한 통계적 척도로도 사용됩니다.즉,[9] 정확도는 검사된 전체 사례 수 중 올바른 예측( 긍정과 참 부정 모두)의 비율입니다.따라서 검사 전 및 사후 확률의 추정치를 비교합니다.의미론에 의해 문맥을 명확히 하기 위해, 종종 "랜덤 정확도" 또는 "랜덤 인덱스"[10][11][12]라고 불립니다.이것은 테스트의 파라미터입니다.이진 정확도를 정량화하는 공식은 다음과 같습니다.

여기서 TP = 양성, FP = 거짓 양성, TN = 음성, FN = 거짓 음성

이 맥락에서 ISO 5725-1에서 정의한 진실성과 정밀도의 개념은 적용되지 않는다.한 가지 이유는 한 수량의 "참값"이 단일이 아니라 모든 경우에 대해 두 개의 가능한 참값이 있는 반면 정확도는 모든 경우에 평균이므로 두 값을 모두 고려하기 때문입니다.그러나 이 맥락에서 정밀도라는 용어는 정보 검색 분야에서 유래한 다른 메트릭을 의미합니다(아래 참조).

다중 클래스 분류 중

멀티클래스 분류의 정확도를 계산할 때 정확도는 올바른 [13]분류의 일부에 불과합니다.

이것은 보통 퍼센티지로 표시됩니다.예를 들어, 분류자가 10개의 예측을 하고 그 중 9개가 맞으면 정확도는 90%입니다.

정확도는 또한 컨볼루션 뉴럴 네트워크 평가에서 흔히 볼 수 있는 상위 5의 정확도와 구별하기 위해 상위 1의 정확도라고 불린다.상위 5개의 정확도를 평가하려면 분류기가 각 클래스에 상대 우도를 제공해야 합니다.이러한 분류가 정렬되면 올바른 분류가 네트워크에 의해 수행된 상위5개의 예측 범위 내에 있으면 분류가 올바른 것으로 간주됩니다.ImageNet의 과제에 의해, 정확도 톱 5가 보급되었습니다.2위부터 5위까지의 정확한 예측은 상위 1점 만점에 도움이 되지 않지만 상위 5점 만점에 도움이 되므로 보통 상위 1점 만점에 비해 높습니다.

심리측정학 및 정신물리학에서

심리측정학정신물리학에서 정확도라는 용어는 유효성과 지속적인 오류와 상호 호환된다.정밀도신뢰성가변 오차의 동의어입니다.측정기기나 심리검사의 유효성은 실험이나 행동과의 상관관계를 통해 결정된다.신뢰성은 크론바흐의 알파와 같은 내부 일관성 테스트를 통해 다양한 통계 기법으로 확립되며, 관련 질문의 집합이 관련 응답을 가지는지 확인한 다음 참조 모집단과 대상 [citation needed]모집단 간에 관련 질문을 비교한다.

논리 시뮬레이션 중

논리 시뮬레이션에서 정확한 모델을 평가할 때 흔히 있는 실수는 논리 시뮬레이션 모델을 트랜지스터 회로 시뮬레이션 모델과 비교하는 것입니다.정확도가 아니라 정밀도의 차이를 비교한 것입니다.정밀도는 디테일로 측정하고 정확도는 [14][15]현실로 측정합니다.

인포메이션 시스템

데이터베이스 및 웹 검색 엔진과 같은 정보 검색 시스템은 다양한 메트릭에 의해 평가됩니다.이 중 일부는 결과를 진정한 긍정(정확하게 검색된 문서), 진정한 부정(정확하게 검색되지 않은 문서), 잘못된 긍정(정확하게 검색된 문서) 및 f로 나누는 혼란 매트릭스에서 파생됩니다.alse negative(잘못된 검색되지 않음)일반적으로 사용되는 지표에는 정밀도와 회수 개념이 포함된다.이 맥락에서 정밀도는 인간이 선택한 일련의 지상 진실 관련 결과를 사용하여 쿼리와 관련된 검색된 문서의 비율(참 긍정(참 긍정치를 참 + 거짓 긍정으로 나눈 값)로 정의된다.리콜은 검색된 관련 문서의 총 개수와 비교한 비율로 정의된다(참 긍정 값을 참 긍정 값+거짓 부정 값으로 나눈 값).정확도 측정기준은 정확한 분류의 총수(참 긍정과 참 부정)를 문서 총수로 나눈 값으로 정의되는 경우가 적습니다.

이러한 지표 중 어느 것도 결과의 순위를 고려하지 않는다.웹 검색 엔진에서 순위를 매기는 것은 매우 중요합니다.독자가 결과의 첫 페이지를 넘기는 일은 거의 없고, 웹 상에 너무 많은 문서가 있어 검색에서 포함할지 제외할지에 대해 모든 문서를 수동으로 분류할 수 없기 때문입니다.특정 개수의 결과에 컷오프를 추가하는 것은 어느 정도 랭킹을 고려한다.예를 들어 k의 측정 정밀도는 상위 10개(k=10) 검색 결과만 살펴보는 정밀도의 척도입니다.할인된 누적 이득과 같은 보다 정교한 지표는 각 개인 순위를 고려하며, 이것이 중요한 경우에 더 일반적으로 사용된다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b BS ISO 5725-1: "측정방법 및 결과의 정확도(경도와 정밀도) - 제1부: 일반원칙 및 정의", 페이지 1(1994)
  2. ^ a b c JCGM 200:2008 도량형 국제 용어 - 기본 및 일반 개념과 관련 용어(VIM)
  3. ^ Taylor, John Robert (1999). An Introduction to Error Analysis: The Study of Uncertainties in Physical Measurements. University Science Books. pp. 128–129. ISBN 0-935702-75-X.
  4. ^ 북대서양조약기구, 나토 표준화청 AAP-6 – 용어집 및 정의, 페이지 43.
  5. ^ 크레우스, 안토니오Instrumentacion Industrial[citation needed]
  6. ^ Black, J. Temple (21 July 2020). DeGarmo's materials and processes in manufacturing. ISBN 978-1-119-72329-5. OCLC 1246529321.
  7. ^ Parker, Christopher J.; Gill, Simeon; Harwood, Adrian; Hayes, Steven G.; Ahmed, Maryam (2021-05-19). "A Method for Increasing 3D Body Scanning's Precision: Gryphon and Consecutive Scanning". Ergonomics. 65 (1): 39–59. doi:10.1080/00140139.2021.1931473. ISSN 0014-0139. PMID 34006206.
  8. ^ BS 5497-1: "시험 방법의 정밀도.표준 테스트 방법에 대한 반복성 및 재현성 결정을 위한 지침"(1979)
  9. ^ Metz, CE (October 1978). "Basic principles of ROC analysis" (PDF). Semin Nucl Med. 8 (4): 283–98. doi:10.1016/s0001-2998(78)80014-2. PMID 112681.
  10. ^ "Archived copy" (PDF). Archived from the original (PDF) on 2015-03-11. Retrieved 2015-08-09.{{cite web}}: CS1 maint: 제목으로 아카이브된 복사(링크)
  11. ^ Powers, David M. W. (2015). "What the F-measure doesn't measure". arXiv:1503.06410 [cs.IR].
  12. ^ David M W Powers. "The Problem with Kappa" (PDF). Anthology.aclweb.org. Retrieved 11 December 2017.
  13. ^ "3.3. Metrics and scoring: quantifying the quality of predictions". scikit-learn. Retrieved 17 May 2022.
  14. ^ Acken, John M. (1997). "none". Encyclopedia of Computer Science and Technology. 36: 281–306.
  15. ^ Glasser, Mark; Mathews, Rob; Acken, John M. (June 1990). "1990 Workshop on Logic-Level Modelling for ASICS". SIGDA Newsletter. 20 (1).

외부 링크