준실험

Quasi-experiment

준실험은 무작위 할당 없이 대상 모집단에 대한 개입의 인과적 영향을 추정하는 데 사용되는 경험적 개입 연구이다.준실험 연구는 전통적인 실험 설계 또는 무작위 대조 실험과 유사성을 공유하지만, 특히 치료나 대조군에 무작위로 할당되는 요소가 부족하다.대신, 준실험 설계는 일반적으로 연구자가 치료 조건에 대한 할당을 제어할 수 있지만 무작위 할당 이외의 일부 기준(예: 적격 컷오프 [1]마크)을 사용한다.

준실험은 치료 및 대조군 그룹이 기준선에서 비교 가능하지 않을 수 있기 때문에 내부 타당성에 관한 우려를 받는다.즉, 치료 조건과 관찰된 결과 사이의 인과 관계를 설득력 있게 입증하는 것이 불가능할 수 있다.통제하거나 [2]설명할 수 없는 교란 변수가 있는 경우 특히 그렇다.

임의 할당의 경우 스터디 참가자는 중재 그룹 또는 비교 그룹에 동일하게 할당될 수 있습니다.결과적으로, 관찰된 특성과 관찰되지 않은 특성 모두에 대한 그룹 간의 차이는 치료와 관련된 체계적 요인(예: 질병 심각도)보다는 우연에 의한 것일 것이다.랜덤화 자체는 그룹이 베이스라인에서 동등하다는 것을 보증하지 않습니다.간섭 후 특성 변경은 개입에 기인할 수 있습니다.

설계.

준실험 설계를 생성하는 첫 번째 부분은 변수를 식별하는 것입니다.준독립 변수는 종속 변수에 영향을 미치기 위해 조작되는 변수인 x 변수가 됩니다."X"는 일반적으로 수준이 다른 그룹화 변수입니다.그룹화는 두 개 이상의 그룹, 예를 들어 대체 치료를 받는 두 개 이상의 그룹 또는 치료 그룹과 비치료 그룹을 의미한다(위약이 투여될 수 있음 – 위약은 의료 또는 생리 실험에서 더 자주 사용된다).예측 결과는 종속 변수, 즉 y 변수입니다.시계열 분석에서 종속 변수는 시간이 지남에 따라 발생할 수 있는 모든 변화에 대해 관찰됩니다.변수를 식별하고 정의한 후에는 절차를 구현하고 그룹 차이를 [3]조사해야 한다.

랜덤 할당 실험에서는 연구 단위가 주어진 처리 조건에 할당될 확률이 동일합니다.따라서 랜덤 할당은 실험 그룹과 관리 그룹이 모두 동일함을 보장합니다.준실험 설계에서 주어진 처리 조건에 대한 할당은 무작위 할당 이외의 다른 것에 기초한다.준실험 설계의 유형에 따라, 연구자는 치료 조건에 대한 할당을 제어할 수 있지만 무작위 할당 이외의 일부 기준(예: 컷오프 점수)을 사용하여 치료를 받을 참가자를 결정하거나, 연구자가 치료 조건 할당과 요점을 제어할 수 없을 수 있다.할당에 사용된 ria를 알 수 없습니다.비용, 실현 가능성, 정치적 우려 또는 편의성과 같은 요소는 참가자가 주어진 치료 조건에 배정되는 방법과 경우에 영향을 미칠 수 있으며, 따라서 준실험은 내부 타당성에 관한 우려의 대상이 된다(즉, 실험 결과를 인과적 추론에 사용할 수 있는가?

준실험은 '사후시험'을 사용하기 때문에 효과적이다.즉, 데이터를 수집하기 전에 테스트하여 사용자의 혼란이 있는지, 참가자가 특정 경향을 가지고 있는지 여부를 확인합니다.그런 다음 실제 실험은 사후 검사 결과를 기록하여 실시합니다.이 데이터는 연구의 일부로 비교하거나 실제 실험 데이터에 대한 설명에 사전 검사 데이터를 포함할 수 있습니다.준실험에는 나이, 성별, 눈 색깔 등 이미 존재하는 독립 변수가 있습니다.이러한 변수는 연속형(나이)이거나 범주형(성별)일 수 있습니다.즉, 자연발생 변수는 준실험 [4]내에서 측정됩니다.

여러 가지 유형의 준실험 설계가 있으며, 각각 다른 강점, 약점 및 응용 분야를 가지고 있다.이러한 설계에는 다음이 포함됩니다(이에 [5]한정되는 것은 아닙니다).

이러한 모든 설계 중에서 회귀 불연속 설계는 실험자가 처리 할당에 대한 제어를 유지하고 "처리 [5]: 242 효과에 대한 편향되지 않은 추정치"를 산출하는 것으로 알려져 있으므로 실험 설계에 가장 근접합니다.그러나 기존 실험 설계와 동일한 힘을 얻기 위해서는 많은 연구 참가자와 과제와 결과 변수 사이의 기능 형식의 정확한 모델링이 필요합니다.

비록 준실험은 때때로 스스로를 실험적인 순수주의자라고 생각하는 사람들에 의해 외면당하기도 하지만, (도날드 T를 이끄는) Campbell은 이들을 [6]위해 "대기 실험"이라는 용어를 만들었으며, 실험이나 무작위 대조군 시험을 수행하는 것이 타당하지 않거나 바람직하지 않은 영역에서 특히 유용합니다.그러한 사례에는 공공정책 변경, 교육 개입 또는 대규모 보건 개입의 영향 평가가 포함된다.준실험 설계의 주요 단점은 인과적 추론을 도출하는 능력을 방해할 수 있는 교란 편향의 가능성을 제거할 수 없다는 것이다.이 단점은 종종 준실험 결과를 경시하는 데 사용됩니다.그러나 교란 변수를 식별하고 측정할 수 있는 경우 다중 회귀와 같은 다양한 통계 기법을 사용하기 위해 그러한 편견을 제어할 수 있다.이러한 기법은 교란 변수 기법의 효과를 모델링하고 부분적으로 배제하는 데 사용될 수 있으며, 따라서 준실험에서 얻은 결과의 정확성을 향상시킬 수 있다.또한, 치료 선택 과정에 중요한 변수에 대해 참가자를 일치시키기 위해 성향 점수 매칭을 개발하는 것도 준실험 결과의 정확도를 향상시킬 수 있다.실제로 준실험 분석에서 도출된 데이터는 다른 기준을 [7]사용하더라도 특정 사례에서 실험 데이터와 밀접하게 일치하는 것으로 나타났다.요약하자면, 준실험은 특히 응용 연구자에게 귀중한 도구이다.준실험 설계는 그 자체로는 명확한 인과관계를 추론할 수 없지만, 실험 방법만으로는 얻을 수 없는 필요하고 가치 있는 정보를 제공한다.특히 응용 연구 질문을 조사하는 데 관심이 있는 연구자는 기존의 실험 설계를 벗어나 준실험 [5]설계에 내재된 가능성을 활용해야 한다.

윤리

를 들어, 실제 실험은 다른 모든 변수를 제어하기 위해 아이들을 장학금에 랜덤하게 할당하는 것입니다.준실험은 사회과학, 공중보건, 교육정책 분석에서 일반적으로 사용되며, 특히 치료 조건에 따라 연구 참가자를 무작위로 추출하는 것이 실용적이지 않거나 합리적이지 않은 경우에 사용된다.

예를 들어, 가구를 두 가지 범주로 나눈다고 가정해 보자.부모가 아이를 때리는 가정, 부모가 아이를 때리지 않는 가정.우리는 선형 회귀 분석을 통해 부모의 엉덩이와 자녀의 공격적인 행동 사이에 긍정적인 상관관계가 있는지 확인할 수 있습니다.하지만, 단순히 부모에게 엉덩이를 때리거나 때리지 않는 것은 현실적이거나 윤리적이지 않을 수 있다. 왜냐하면 일부 부모들은 자녀들을 때리고 참여를 거부하는 것이 도덕적으로 잘못되었다고 생각할 수 있기 때문이다.

몇몇 저자들은 자연실험과 "준실험"[1][5]을 구분한다.차이점은 준실험에서는 할당 기준이 연구자에 의해 선택되는 반면, 자연실험에서는 할당 기준이 연구자의 개입 없이 '자연스럽게' 발생한다는 것이다.

준실험에는 결과 측도, 처리 및 실험 단위가 있지만 랜덤 할당은 사용하지 않습니다.준실험은 대부분의 사람들이 실제 실험보다 선택하는 설계입니다.실제 실험과 달리 실험 설계와 비실험 설계 모두에서 특징을 가져오기 때문에 일반적으로 쉽게 수행됩니다.측정된 변수와 조작된 변수를 가져올 수 있습니다.일반적으로 준실험은 내부 및 외부 [8]유효성을 최대화하기 때문에 실험자가 선택합니다.

이점

준실험 설계는 랜덤화가 실용적이지 않거나 비윤리적일 때 사용되므로 일반적으로 피실험자를 랜덤으로 할당해야 하는 실제[9] 실험 설계보다 설정하기가 더 쉽습니다.또한 준실험 설계를 활용하면 자연환경이 잘 통제된 실험실 [10]환경에 비해 인공성의 문제를 겪지 않기 때문에 생태적 타당성에 대한 위협을 최소화할 수 있다.준실험은 자연실험이기 때문에 하나의 연구결과는 다른 대상과 환경에 적용될 수 있으며 모집단에 대한가지 일반화가 가능하다.또한, 이 실험 방법은 다른 환경에서 추적 가능한 더 긴 기간을 수반하는 종적 연구에서 효율적이다.

준실험의 다른 장점으로는 실험자가 선택한 조작을 갖는다는 생각이 있습니다.자연실험에서, 연구원들은 조작이 스스로 일어나도록 내버려두어야 하고, 어떠한 통제도 하지 말아야 한다.또한 준실험에서 스스로 선택한 그룹을 사용하는 것은 [8]연구를 수행하는 동안 윤리적, 조건적 등의 우려에 대한 기회도 없앤다.

단점들

영향의 준실험 추정치는 교란 [1]변수에 의해 오염될 수 있다.위의 예에서, 엉덩이에 대한 아이들의 반응 변화는 쉽게 측정하고 통제할 수 없는 요인들, 예를 들어 아이의 내재적인 야성이나 부모의 짜증에 영향을 받는다.준실험 설계 방법의 무작위 할당이 부족하면 연구가 더 실현 가능해질 수 있지만, 이는 또한 내부 타당성 측면에서 조사자에게 많은 문제를 제기한다.이러한 랜덤화의 결여로 인해 교란 변수를 배제하기 어려워지고 내부 [11]유효성에 대한 새로운 위협이 발생합니다.무작위화가 없기 때문에 데이터에 대한 일부 지식은 근사치일 수 있지만, 사회적 환경에 존재하는 다양한 외부 및 교란 변수 때문에 인과 관계의 결론을 결정하기 어렵다.더욱이, 내부 타당성에 대한 이러한 위협이 평가되더라도, 실험자가 외부 [12]변수에 대한 완전한 통제력을 가지고 있지 않기 때문에 여전히 원인을 완전히 규명할 수 없다.

또한 연구 그룹이 무작위성이 부족하기 때문에 더 약한 증거를 제공할 수 있다는 단점도 있습니다.무작위성은 결과를 넓히고 따라서 모집단을 전체적으로 더 잘 표현하기 때문에 연구에 많은 유용한 정보를 가져옵니다.불평등한 그룹을 사용하는 것도 내부 유효성에 위협이 될 수 있습니다.그룹이 동일하지 않으면(때로는 유사 실험에서도 마찬가지), 실험자는 결과에 [4]대한 원인이 무엇인지에 대해 양수가 아닐 수 있습니다.

내부유효성

내부 타당성은 인과 관계 또는 인과 관계에 관한 추론에 대한 대략적인 진실이다.그렇기 때문에 준실험은 인과관계에 관한 것이기 때문에 타당성이 중요합니다.실험자가 실험 결과에 영향을 미칠 수 있는 모든 변수를 제어하려고 할 때 발생합니다.통계적 회귀, 이력 및 참가자는 모두 내부 유효성에 대한 잠재적 위협이다.내부 유효성을 높게 유지하려고 할 때 묻고 싶은 질문은 "내가 원하는 이유 외에 결과에 대해 생각할 수 있는 다른 이유가 있는가?"입니다.이 경우 내부 유효성이 그만큼 [8]강하지 않을 수 있습니다.

외부유효성

외부 유효성은 연구 표본에서 얻은 결과를 잘 지정된 관심 모집단과 사람, 시간, 맥락 및 [13]연구 방법의 하위 모집단에 걸쳐 "일반화할 수 있는" 범위이다.린치는 우리가 예측하고자 하는 인구는 정의상 [14]표본으로 추출될 수 없는 미래 행동의 척도이기 때문에 모집단을 일반화하는 것은 거의 불가능하다고 주장해 왔다.따라서 치료 효과가 연구자에게 중요하지 않을 수 있는 배경 요인에 따라 다른 하위 모집단을 일반화하는지 여부이다.외부 유효성은 치료 연구가 사람, 시간, 맥락 및 연구 방법의 서로 다른 하위 집합에 걸쳐 균질한 영향을 미치는지 또는 치료 효과의 부호 및 크기가 [15]연구자가 인정하거나 이해할 수 없는 방식으로 하위 집합에 걸쳐 변화하는지 여부에 따라 달라진다.AtheyImbens, Athey와 Wager는 이종 치료 [16][17]효과에 대한 귀납적 이해를 위한 기계 학습 기술을 개척했습니다.

설계 유형

"처리별 사람" 설계는 준실험 설계의 가장 일반적인 유형입니다.이 설계에서 실험자는 하나 이상의 독립 변수를 측정합니다.한 변수를 측정하는 것과 함께 실험자는 다른 독립 변수도 조작합니다.서로 다른 독립 변수의 조작과 측정이 있기 때문에 연구는 대부분 실험실에서 이루어집니다.사람별 처리 설계를 다룰 때 중요한 요인은 실험자가 [18]연구에 수행되는 조작을 완벽하게 제어하기 위해 랜덤 할당을 사용해야 한다는 것입니다.

이런 유형의 디자인 예는 노트르담 대학에서 행해졌다.이 연구는 당신의 직업에 대한 조언이 직업 만족도를 높이는 데 도움이 되는지 알아보기 위해 실시되었습니다.그 결과 멘토가 있는 많은 사람들이 매우 높은 직업 만족도를 보였다.하지만, 이 연구는 또한 멘토를 받지 못한 직원들도 만족스러운 직원 수를 많이 가지고 있다는 것을 보여주었다.시버트는 멘토가 있는 근로자들은 행복했지만 만족한다고 답한 비멘토 직원들이 많기 때문에 그 이유를 멘토 자신 때문이라고 추측할 수 없다고 결론지었다.그렇기 때문에 스터디의 [19]결점을 보기 전에 최소화할 수 있도록 사전 선별이 매우 중요합니다.

"자연 실험"은 연구자들이 사용하는 다른 형태의 준 실험 설계이다.실험자가 조작하는 변수가 없다는 점에서 사람별 처리와 다릅니다.실험자는 사람별 처리 설계와 같이 하나 이상의 변수를 제어하는 대신 랜덤 할당을 사용하지 않고 실험 관리를 운에 맡깁니다.이것이 "자연" 실험이라는 이름이 유래된 것이다.조작은 자연스럽게 이루어지며, 이것은 부정확한 기술처럼 보일 수 있지만, 실제로 많은 경우에 유용하다는 것이 입증되었습니다.갑자기 무슨 일이 생긴 사람에게 행해진 연구입니다.이것은 좋든 나쁘든, 트라우마나 행복감을 의미할 수 있다.예를 들어, 교통사고를 당한 적이 있는 사람과 그렇지 않은 사람에 대한 연구가 있을 수 있다.자동차 사고는 자연적으로 발생하므로, 실험 대상자들에게 정신적 충격을 주는 실험을 하는 것은 윤리적이지 않을 것이다.이러한 자연발생적인 사건들은 외상후 스트레스 장애 [18]사례들을 연구하는데 유용한 것으로 증명되었다.

레퍼런스

  1. ^ a b c Dinardo, J. (2008). "natural experiments and quasi-natural experiments". The New Palgrave Dictionary of Economics. pp. 856–859. doi:10.1057/9780230226203.1162. ISBN 978-0-333-78676-5.
  2. ^ Rossi, Peter Henry; Mark W. Lipsey; Howard E. Freeman (2004). Evaluation: A Systematic Approach (7th ed.). SAGE. p. 237. ISBN 978-0-7619-0894-4.
  3. ^ Gribbons, Barry; Herman, Joan (1997). "True and quasi-experimental designs". Practical Assessment, Research & Evaluation. 5 (14). Archived from the original on 2013-05-02.
  4. ^ a b Morgan, G. A. (2000). "Quasi-Experimental Designs". Journal of the American Academy of Child & Adolescent Psychiatry. 39 (6): 794–796. doi:10.1097/00004583-200006000-00020. PMID 10846316.
  5. ^ a b c d Shadish; Cook; Cambell (2002). Experimental and Quasi-Experimental Designs for Generalized Causal Inference. Boston: Houghton Mifflin. ISBN 0-395-61556-9.
  6. ^ Campbell, D. T. (1988). Methodology and epistemology for social science: selected papers. University of Chicago Press. ISBN 0-226-09248-8.
  7. ^ Armstrong, J. Scott; Patnaik, Sandeep (2009-06-01). "Using Quasi-Experimental Data To Develop Empirical Generalizations For Persuasive Advertising" (PDF). Journal of Advertising Research. 49 (2): 170–175. doi:10.2501/s0021849909090230. ISSN 0021-8499. S2CID 14166537. Archived (PDF) from the original on 2017-08-17.
  8. ^ a b c DeRue, Scott (September 2012). "A Quasi Experimental Study of After-Event Reviews". Journal of Applied Psychology. 97 (5): 997–1015. doi:10.1037/a0028244. hdl:1813/71444. PMID 22506721.
  9. ^ CHARM-Controlled Experiments 2012-07-22 Wayback Machine 아카이브 완료
  10. ^ http://www.osulb.edu/ ~ msaintg / ppa696 / 696 displays . htm[영구 데드링크]
  11. ^ 린다 S. 롭슨, 해리 S.섀넌, 린다 M. 골든하, 앤드류 R.헤일(2001)준실험실험 설계: 보다 강력한 평가 설계 2012년 9월 16일 Wayback Machine에 보관된 작업 상해 예방 전략의 효과 평가 가이드 4장: 안전 개입이 실제로 효과가 있는지를 나타내는 방법 2012년 3월 28일 캐나다 워크&헬스 연구소 Wayback Machine에서 아카이브되었습니다.
  12. ^ 조사 방법: 계획: 준익스펙트 2013-03-18 Wayback Machine에서 아카이브된 설계
  13. ^ 쿡, 토마스 D, 그리고 도널드 T.캠벨(1979), 준실험: 필드 설정의 설계 및 분석 문제보스턴:호튼미프린
  14. ^ Lynch, John G., Jr.(1982), "소비자 연구의 실험의 외부 타당성에 대하여", 소비자 연구 저널, 9(12월), 225-239.
  15. ^ Cronbach, Lee J. (1975) "과학심리학 두 분야를 넘어서" 미국심리학 30(2), 116.
  16. ^ Athey, Susan, Guido Imbens (2016), "이질적인 인과관계를 위한 반복적 분할"미국국립과학아카데미 113, (27), 7353–7360.
  17. ^ Wager, Stefan, Susan Athey(2018), "랜덤 포레스트를 이용한 이종 치료 효과의 추정과 추론"미국 통계 협회 저널 113 (523), 1228–1242.
  18. ^ a b Meyer, Bruce (April 1995). "Quasi & Natural Experiments in Economics" (PDF). Journal of Business and Economic Statistics. 13 (2): 151–161. doi:10.1080/07350015.1995.10524589. S2CID 56341672.
  19. ^ Seibert, Scott (1999). "The Effectiveness of Facilitated Mentoring A Longitudinal Quasi Experiment". Journal of Vocational Behavior. 54 (3): 483–502. doi:10.1006/jvbe.1998.1676.

외부 링크