임상적 유의성

Clinical significance

의학과 심리학에서 임상적 중요성은 치료 효과의 실제적 중요성, 즉 치료 효과가 실제로 진솔하고 뚜렷하며 일상생활에 현저한 영향을 미치는지 여부다.[1]

유의 유형

통계적 유의성

통계적 유의성은 가설 검정에서 사용되며, 여기서 (변수 사이에 관계가 없다는) 귀무 가설을 검정한다.[2] 유의 수준(가장 일반적인 α = 0.05 또는 0.01)이 선택되며, 이는 참된 귀무 가설을 잘못 기각할 확률을 의미한다.[2] α = 0.05에서 두 그룹 사이에 유의한 차이가 있는 경우, 그 차이가 전적으로 우연(즉 귀무 가설은 참)에 기인한다는 가정 하에 관측된 결과를 얻을 확률은 5%에 불과하며, 차이의 크기나 임상적 중요성에 대한 징후는 제공하지 않는다.[3] 통계적으로 유의미한 결과가 나오면 귀무 가설의 거부를 선호하지만 귀무 가설이 거짓이라는 것을 증명하지는 않는다. 마찬가지로 유의하지 않은 결과는 귀무 가설이 사실이라는 것을 증명하지 못한다. 또한 연구자가 생성한 가설에 대한 진실이나 거짓에 대한 증거를 제시하지 않는다.[2] 통계적 유의성은 귀무 가설이 참이라는 가정 하에 관측된 데이터와 예상되는 데이터 사이의 호환성과만 관련이 있다.

실제적 유의성

광범위한 사용에서 "실용적 임상적 중요성"은 개입이나 치료가 얼마나 효과적인지, 또는 그 치료가 얼마나 많은 변화를 일으키는지를 묻는 질문에 대답한다. 임상 치료의 시험 측면에서, 실제적 유의성은 효과 크기, 치료에 필요한 수(NNT), 예방 분율과 같은 측정 기준을 사용하여 소견의 중요성에 대한 정량화된 정보를 최적으로 산출한다.[4] 실용적 중요성은 효용의 반정량적, 비교적 또는 타당성 평가도 전달할 수 있다.

효과 크기는 실제적인 유의성의 한 유형이다.[4][5] 그것은 표본이 기대와 다른 정도를 계량화한다.[6] 효과 크기는 연구 결과에 대한 중요한 정보를 제공할 수 있으며, 통계적 유의성 외에도 포함시킬 것을 권장한다. 효과 크기에는 고유의 치우침의 근원이 있고, 종속 변수의 모집단 변동성에 따라 변하기 쉬우며, 개별적인 변화가 아닌 집단 효과에 초점을 맞추는 경향이 있다.[5][7][8]

임상적 중요성과 실제적 중요성이 동의어로 사용되는 경우가 많지만, 보다 기술적인 제한적 사용은 이를 잘못된 것으로 나타낸다.[5] 심리학과 심리치료에서의 이러한 기술적 사용은 언어의 정확성과 특수성에서 비롯될 뿐만 아니라, 집단 효과에서 개인 내 변화의 세부사항으로 관점의 변화를 가능하게 한다.

특정 용법

이와는 대조적으로 심리치료와 심리치료 내에서 기술적 용어로 사용될 때 임상적 유의성은 치료법이 환자의 진단 라벨을 바꿀 만큼 효과적이었는지에 대한 정보를 산출한다. 임상 치료 연구의 관점에서, 임상적 유의성은 "치료법이 [해당되는 진단기준과 관련하여] 환자를 정상으로 만들 정도로 충분히 효과적인가?"라는 질문에 대답한다."

예를 들어, 치료는 우울증 증상(통계적 유의성), 그 변화는 우울증 증상의 큰 감소일 수 있으며(실용적 유의성-효과 크기), 환자의 40%가 더 이상 우울증 진단 기준을 충족하지 못할 수 있다(임상적 유의성). 현저한 차이와 중간 또는 큰 효과의 크기를 산출하지만, 기능장애에서 기능장애로 환자를 이동시키지 않는 치료법은 매우 가능성이 있다.

심리학과 심리치료에서 임상적 중요성은 제이콥슨, 폴렛트, 리벤스토르프가[9] 이 질문에 답하는 방법으로 처음 제안했는데, 고객이 진단 기준을 충족하지 못할 정도로 치료나 치료가 충분히 효과적일까? 이후 제이콥슨과 트루악스는 임상적 중요성을 "요법이 기능장애 인구의 범위 밖에서 또는 기능적 모집단의 범위 내에서 누군가를 이동하는 정도"[10]로 정의했다. 그들은 이 변화 지수의 두 가지 요소, 즉 치료가 완료된 후 환자나 의뢰인의 상태와 "치료 과정 중에 얼마나 많은 변화가 일어났는가"[10]를 제안했다.

개인의 심리 평가 결과를 해석할 때도 임상적 중요성이 고려된다. 종종, 통계적으로 유의미한 점수나 항목별 점수의 차이가 있을 것이고, 순전히 우연에 의해 발생했을 가능성이 없다. 그러나 이러한 통계적으로 유의미한 차이가 모두 임상적으로 유의적인 것은 아니며, 이는 그들이 클라이언트에 대한 기존 정보를 설명하거나 개입에 대한 유용한 방향을 제공하지 않는다는 점이다. 크기가 작은 차이는 일반적으로 실질적인 관련성이 부족하며 임상적으로 유의미할 것 같지 않다. 인구에서 공통적으로 나타나는 차이도 임상적으로 유의하지 않을 것으로 보이는데, 이는 단순히 정상적인 인간 변동의 수준을 반영할 수 있기 때문이다. 또한 임상의는 특정 시험의 성과와 개인의 보다 일반적인 기능 사이의 연관성을 확립하기 위해 평가 데이터와 고객의 이력에서 통계적 차이의 관련성을 입증하는 정보를 찾는다.[11][12]

임상적 유의성 계산

통계적 유의성과 실제적 유의성을 계산하는 방법이 많듯이 임상적 유의성을 계산하는 방법도 다양하다. 일반적인 5가지 방법은 제이콥슨-트루악스 방법, 걸릭센-로드-노빅 방법, 에드워즈-뉴널리 방법, 헤게만-아린델 방법, 계층적 선형 모델링이다.[5]

제이콥슨트룩스

Jacobson-Trux는 임상적 중요성을 계산하는 일반적인 방법이다. 신뢰성 변화 지수(RCI)를 계산하는 것이 포함된다.[10] RCI는 참가자의 시험 전 점수와 시험 후 점수의 차이를 차이의 표준 오차로 나눈 값이다. 컷오프 점수는 참가자를 RCI의 방향성 및 컷오프 점수 충족 여부에 따라 회복, 개선, 변경 또는 변질 4가지 범주 중 하나로 배치하기 위해 설정된다.

굴리센-로드-노빅

걸릭센-로드-노빅 방법은[13] 평균에 대한 회귀성을 고려한다는 점을 제외하면 제이콥슨-트룩스와 비슷하다. 이것은 모집단 평균에서 사전 시험과 사후 시험 점수를 뺀 후 모집단의 표준 편차로 나눈다.[5]

에드워드-뉴널리

임상적 유의성을 계산하는 Edwards-Nunnally 방법은[14] Jacobson-Trux 방법의 보다 엄격한 대안이다.[5] 신뢰도 점수는 시험 전 점수를 평균에 가깝게 하기 위해 사용되며, 그 다음 이 조정된 시험 전 점수에 대한 신뢰 구간이 개발된다. 사전시험에서 사후시험으로의 변화를 계산할 때 신뢰구간이 사용되기 때문에, 제이콥슨-트루악스 방법에 비해 임상적 유의성을 나타내려면 점수의 실제적인 변화가 더 많이 필요하다.

하게만아린델

임상적 유의성의 헤게만-아린델[15] 계산에는 그룹 변화와 개인 변화의 지표가 포함된다. 변화의 신뢰성은 환자가 개선되었는지, 그대로 유지되었는지, 악화되었는지 여부를 나타낸다. 변화의 임상적 중요성인 두 번째 지수는 제이콥슨-트루악스가 사용한 것과 유사한 네 가지 범주를 나타낸다. 즉 악화, 신뢰성 있게 변경되지 않음, 개선되지 않음, 회복되지 않음.

계층적 선형 모델링(HLM)

HLM은 사전 테스트 후 비교 대신 성장 곡선 분석을 수반하므로, 단 2개의 데이터 포인트(사전 테스트 및 사후 테스트) 대신 각 환자로부터 3개의 데이터 포인트가 필요하다.[5] 계층적 선형 및 비선형 모델링과[16] 같은 컴퓨터 프로그램을 사용하여 각 참가자의 변경 추정치를 계산한다. HLM은 또한 다이애드 및 그룹의 성장 곡선 모델의 분석을 허용한다.

참고 항목

참조

  1. ^ Kazdin AE (June 1999). "The meanings and measurement of clinical significance" (PDF). Journal of Consulting and Clinical Psychology. 67 (3): 332–9. CiteSeerX 10.1.1.595.9231. doi:10.1037/0022-006x.67.3.332. PMID 10369053. Archived from the original (PDF) on 6 November 2013. Retrieved 3 November 2013.
  2. ^ a b c Polit DF, Beck CT (2012). Nursing Research: Generating Evidence for Nursing Practice (9th ed.). Philadelphia: Wolters Klower/Lippincott Williams & Wilkins. ISBN 978-1-60547-782-4.
  3. ^ Haase RF, Ellis MV, Ladany N (1989). "Multiple Criteria for Evaluating the Magnitude of Experimental Effects". Journal of Counseling Psychology. 36 (4): 511–516. doi:10.1037/0022-0167.36.4.511.
  4. ^ a b Shabbir SH, Sanders AE (September 2014). "Clinical significance in dementia research: a review of the literature". American Journal of Alzheimer's Disease and Other Dementias. 29 (6): 492–7. doi:10.1177/1533317514522539. PMID 24526758.
  5. ^ a b c d e f g Peterson L (7 February 2008). Clinical" Significance: "Clinical" Significance and "Practical" Significance are NOT the Same Things. Annual Meeting of the Southwest Educational Research Association. New Orleans, LA.
  6. ^ Vacha-Haase T, Nilsson JE, Reetz DR, Lance TS, Thompson B (June 2000). "Reporting practices and APA editorial policies regarding statistical significance and effect size". Theory & Psychology. 10 (3): 413–425. doi:10.1177/0959354300103006.
  7. ^ Cohen J (1997). "The earth is round (p < 0.05)". The American Psychologist. 49 (12): 997–1003. doi:10.1037/0003-066X.49.12.997.
  8. ^ Wilkinson L (1999). "Statistical methods in psychology journals: Guidelines and explanations". American Psychologist. 54 (8): 594–604. doi:10.1037/0003-066x.54.8.594.
  9. ^ Jacobson NS, Follette WC, Revenstorf D (September 1984). "Psychotherapy outcome research: Methods for reporting variability and evaluating clinical significance". Behavior Therapy. 15 (4): 336–52. doi:10.1016/S0005-7894(84)80002-7.
  10. ^ a b c Jacobson NS, Truax P (February 1991). "Clinical significance: a statistical approach to defining meaningful change in psychotherapy research". Journal of Consulting and Clinical Psychology. 59 (1): 12–9. doi:10.1037/0022-006x.59.1.12. PMID 2002127. S2CID 28125243.
  11. ^ Sattler JM (2008). Assessment of children: Cognitive foundations (5th ed.). San Diego: Sattler Publications. ISBN 978-0-9702671-6-0.
  12. ^ Kaufman AS, Lichtenberger E (2006). Assessing Adolescent and Adult Intelligence (3rd ed.). Hoboken (NJ): Wiley. ISBN 978-0-471-73553-3. Lay summary (22 August 2010). {{cite book}}: Cite는 사용되지 않는 매개 변수를 사용한다. lay-date= (도움말)
  13. ^ Hsu LM (December 1999). "A comparison of three methods of identifying reliable and clinically significant client changes: commentary on Hageman and Arrindell". Behaviour Research and Therapy. 37 (12): 1195–202, discussion 1219-33. doi:10.1016/S0005-7967(99)00033-9. PMID 10596465.
  14. ^ Speer DC, Greenbaum PE (December 1995). "Five methods for computing significant individual client change and improvement rates: support for an individual growth curve approach". Journal of Consulting and Clinical Psychology. 63 (6): 1044–8. doi:10.1037/0022-006x.63.6.1044. PMID 8543708.
  15. ^ Hageman WJ, Arrindell WA (December 1999). "Establishing clinically significant change: increment of precision and the distinction between individual and group level of analysis". Behaviour Research and Therapy. 37 (12): 1169–93. doi:10.1016/s0005-7967(99)00032-7. PMID 10596464.
  16. ^ "SSI - Scientific Software International, Inc". Archived from the original on 2 June 2009. Retrieved 19 July 2009.