오퍼런트 컨디셔닝

Operant conditioning

오퍼런트 컨디셔닝(계기적 컨디셔닝이라고도 함)은 행동의 강도가 강화 또는 처벌에 의해 변경되는 연상 학습 과정의 한 종류입니다.그것은 또한 그러한 학습을 이끌어내기 위해 사용되는 절차이다.

오퍼런트 및 클래식 컨디셔닝은 모두 환경 자극에 의해 제어되는 행동을 수반하지만 성격은 다르다.오퍼런트 컨디셔닝에서 행동은 외부 자극에 의해 제어된다.예를 들어, 아이는 과자를 안에 넣기 위해 상자를 여는 방법을 배우거나 뜨거운 난로를 만지지 않는 방법을 배울 수 있습니다. 조작 용어로 말하면, 상자와 난로는 "차별적인 자극"입니다.오퍼런트 동작은 「자발적」이라고 불립니다.반응은 유기체의 통제 하에 있으며 조작자이다.예를 들어, 아이는 상자를 여는 것과 강아지를 쓰다듬는 것 중 하나를 선택할 수 있다.

대조적으로, 고전적 조건화는 생물학적으로 중요한 사건과의 자극의 쌍에 기초한 비자발적 행동을 포함한다.반응은 적절한 자극에 의해 자동으로 유도되는 반사작용이기 때문에 일부 자극의 통제 하에 있다.예를 들어, 과자를 보면 아이가 침을 흘리거나, 도어 쾅 하는 소리가 화가 난 부모에게 신호를 보내 아이를 떨게 할 수 있습니다.침 흘리고 떨리는 것은 조작자가 아니다; 그것들은 결과에 의해 강화되지도 않고 자발적으로 선택되지도 않는다.

하지만, 두 종류의 학습 모두 행동에 영향을 미칠 수 있다.예를 들어 상자 위의 사탕 그림처럼 고전적으로 조절된 자극은 어린이가 상자에 접근하여 열도록 유도함으로써 작동자 조절을 강화할 수 있다.연구 결과, 이는 오퍼레이터의 동작이 오류 [1]발생 가능성이 높은 경우에 유익한 현상인 것으로 나타났습니다.

20세기의 동물 학습 연구는 이 두 종류의 [2]학습에 대한 분석에 의해 지배되었고, 그들은 여전히 행동 분석의 핵심에 있다.그것들은 사회심리학 연구에도 적용되어 잘못된 합의 [1]효과와 같은 특정 현상을 명확히 하는 데 도움을 주고 있다.

오퍼런트 컨디셔닝멸종
강화
동작의 증가
처벌
동작의 감소
적극적 보강
식욕을 돋우다
다음 올바른 동작
네거티브 보강긍정적인 처벌
유해 자극 추가
다음 동작
네거티브 처벌
식욕 자극 제거
다음 동작
탈출하다
유해 자극 제거
다음 올바른 동작
적극적인 회피
행동은 해로운 자극을 피한다.

이력 메모

손다이크의 효과 법칙

때때로 기구적 학습이라고 불리는 오퍼런트 컨디셔닝은 에드워드 L.의해 처음 광범위하게 연구되었다. 집에서 만든 퍼즐 [3]박스에서 탈출하려는 고양이들의 행동을 관찰한 손다이크(1874–1949)고양이는 끈을 당기거나 막대기를 밀거나 하는 간단한 반응으로 상자에서 탈출할 수 있었지만, 처음 구속되었을 때는 빠져나오는 데 시간이 오래 걸렸다.반복된 실험으로 비효율적인 대응이 덜 자주 일어나고 성공적인 대응이 더 자주 일어나 고양이들은 점점 [3]더 빨리 탈출했다.Thorndike는 그의 효과 법칙에서 이 발견을 일반화했는데, 그것은 만족스러운 결과를 초래하는 행동이 반복되는 경향이 있고 불쾌한 결과를 초래하는 행동이 반복될 가능성이 적다는 것이다.간단히 말해서, 어떤 결과는 행동을 강화하고 어떤 결과는 행동을 약화시킨다.Thorndike는 시험 [4]번호에 대한 탈출 시간을 표시함으로써 이 절차를 통해 알려진 최초의 동물 학습 곡선을 만들었습니다.

인간은 손다이크에 의해 연구된 과정을 통해 많은 단순한 행동들을 배우는 것으로 보인다. 지금은 오퍼런트 컨디셔닝이라고 불린다.즉, 반응이 성공적인 결과로 이어질 때 유지되고 그렇지 않을 때 또는 혐오 효과를 낼 때 폐기된다.이것은 보통 어떤 "선생님"에 의해 계획되지 않고 일어나지만, 오퍼런트 컨디셔닝은 수천 [5]년 동안 부모들에 의해 그들의 아이들을 가르치는데 사용되어 왔다.

B. F. 스키너

1950년경 하버드 심리학과의 B.F. 스키너

B.F. 스키너(1904–1990)는 오퍼런트 컨디셔닝의 아버지로 불리며, 그의 연구는 이 주제와 관련하여 자주 인용된다.1938년 그의 책 "생물의 행동:"실험적 분석"[6]은 오퍼런트 컨디셔닝과 인간과 동물의 행동에 대한 적용에 대한 그의 평생 연구를 시작했다.에른스트 마하의 생각에 따라, 스키너는 만족과 같은 관찰할 수 없는 정신 상태에 대한 손다이크의 언급을 거부했고, 관찰할 수 있는 행동과 똑같이 관찰할 수 있는 [7]결과에 대한 그의 분석을 구축했습니다.

스키너는 고전적 조건화가 인간의 행동처럼 복잡한 것을 묘사하는데 사용되기에는 너무 단순하다고 믿었다.오퍼런트 컨디셔닝은 의도적인 행동의 원인과 결과를 조사하면서 인간의 행동을 더 잘 묘사했다고 그는 생각한다.

스키너는 자신의 경험적 접근 방식을 구현하기 위해 비둘기와 쥐와 같은 피험자가 격리되어 조심스럽게 통제된 자극에 노출될 수 있는 오퍼런트 컨디셔닝 챔버 또는 "스키너 박스"를 발명했다.Thorndike의 퍼즐 박스와 달리, 이 배열은 실험 대상자가 한두 개의 간단하고 반복 가능한 응답을 할 수 있게 해주었고, 그러한 응답의 비율이 스키너의 주요 행동 [8]척도가 되었다.또 다른 발명품인 누적 레코더는 이러한 응답률을 추정할 수 있는 그래픽 기록을 생성했다.이러한 기록은 Skinner와 그의 동료들이 다양한 강화 [9]스케줄의 응답률에 대한 영향을 탐구하는 데 사용한 주요 데이터였다.강화 스케줄은 "확실히 정의된 [10]규칙에 따라 유기체에 강화를 전달하는 절차"로 정의할 수 있다.스케쥴의 효과는 스키너가 오퍼런트 컨디셔닝에 대한 그의 설명을 발전시킨 기본적인 발견이 되었습니다.그는 또한 인간과 동물의 [11]행동에 대한 덜 공식적인 관찰을 많이 이용했다.

스키너의 많은 글들은 인간 [12]행동에 오퍼런트 컨디셔닝의 적용에 전념하고 있다.1948년에 그는 그의 조건화 [13]원칙을 중심으로 조직된 평화롭고 행복하며 생산적인 공동체의 소설인 월든 투를 출판했다.1957년 스키너는 언어학자와 다른 사람들에 의해 상당히 다르게 분석되었던 인간 행동의 형태인 오퍼런트 조건의 원리를 언어로 확장한 언어 [14]행동을 출판했다.스키너는 언어의 몇 가지 핵심을 포착하기 위해 "명령"과 "법"과 같은 새로운 기능적 관계를 정의했지만, 그는 언어 행동을 화자의 청중의 반응을 포함한 결과에 의해 통제되는 다른 행동과 같이 취급하면서 새로운 원칙을 도입하지 않았다.

개념과 절차

오퍼런트 동작의 발생원: 오퍼런트 가변성

오퍼런트 행동은 "방출"된 것으로 알려져 있다. 즉, 처음에는 어떤 특정 자극에 의해서도 유발되지 않는다.그래서 사람들은 애초에 왜 그런 일이 일어나느냐고 물을지도 모른다.이 질문에 대한 답은 "새로운" 신체 구조의 기원에 대한 다윈의 대답, 즉 다양성과 선택과 같다.마찬가지로, 개인의 행동은 관련된 특정 운동, 가해지는 힘의 양 또는 반응의 타이밍과 같은 측면에서 순간마다 다르다.철근으로 이어지는 변형이 강화되고 철근이 일정하면 거동이 안정되는 경향이 있다.그러나 행동 변동성은 특정 [15]변수의 조작을 통해 변경될 수 있습니다.

조작자 행동 수정: 강화 및 처벌

강화와 처벌은 조작자의 행동을 수정하는 핵심 도구입니다.이러한 용어는 행동에 미치는 영향에 의해 정의됩니다.긍정적일 수도 있고 부정적일 수도 있습니다.

  • 긍정적인 강화부정적인 강화는 그들이 따르는 행동의 확률을 높이는 반면 긍정적처벌과 부정적인 처벌은 그들이 따르는 행동의 확률을 감소시킨다.

또 다른 절차는 "소멸"이라고 불립니다.

  • 소멸은 이전에 강화되었던 행동이 더 이상 양의 강화 또는 음의 강화로 강화되지 않을 때 발생합니다.멸종하는 동안 그 행동은 가능성이 낮아진다.때때로 보강을 하면 반복적인 인스턴스가 보강을 받기 위해 필요하게 되기 때문에 [16]소멸 전에 각 기회에 보강이 주어지는 것에 비해 행동 소멸 전에 훨씬 더 오래 지연될 수 있습니다.

총 5가지 결과가 있습니다.

  1. 긍정적인 강화는 어떤 행동(반응)이 보상을 받을 때 또는 그 행동이 보상을 받을 수 있는 또 다른 자극이 뒤따를 때 발생하며, 그 행동의 [17]빈도를 증가시킨다.예를 들어, 스키너 상자에 있는 쥐가 레버를 누를 때 먹이를 얻으면, 쥐의 누르는 속도는 올라갈 것이다.이 절차를 보통 단순 보강이라고 합니다.
  2. 부정적인 강화(일명 탈출)는 행동(반응)이 끝나고 혐오 자극이 제거될 때 발생하며, 따라서 원래 행동의 빈도가 증가한다.Skinner Box 실험에서 혐오 자극은 박스 안에서 지속적으로 큰 소음이 날 수 있습니다. 쥐가 소음을 끄기 위해 레버를 누르면 부정적인 강화가 발생합니다.
  3. 긍정적 처벌(일명 "우발적 자극에 의한 처벌"이라고도 함)은 행동(반응)에 혐오적 자극이 뒤따를 때 발생한다.예: 때리는 으로 인한 고통, 그것은 종종 그 행동을 감소시키는 결과를 초래할 것이다.긍정적인 처벌은 혼란스러운 용어이기 때문에, 그 절차는 보통 "처벌"이라고 불립니다.
  4. 부정적인 처벌(벌금)은 행동(반응)이 뒤따르고 자극이 제거될 때 발생한다.예: 아이의 장난감을 빼앗는 것은 아이의 바람직하지 않은 행동을 감소시킨다.
  5. 소멸은 이전에 강화되었던 행동(응답)이 더 이상 효과가 없을 때 발생합니다.예: 실험자가 더 이상 먹이를 주지 않을 때까지 쥐는 레버를 누르기 위해 여러 번 먹이를 받는다.쥐는 일반적으로 레버를 덜 누르고 나서 멈춘다.그러면 레버 누르는 기능이 "소멸"되었다고 할 수 있습니다.

배우(예: 쥐)는 강화, 처벌 또는 소멸된 것으로 언급되지 않으며, 강화, 처벌 또는 소멸된 행위이다.강화, 처벌, 소멸은 실험실에 국한된 용어가 아니다.자연발생적인 결과도 행동을 강화, 처벌 또는 소멸시킬 수 있으며, 항상 의도적으로 계획되거나 전달되는 것은 아닙니다.

보강일정

보강일정표란 철근의 전달을 제어하는 규칙이다.규칙은 철근 배근을 사용할 수 있는 시간 또는 수행할 응답 수를 지정하거나 둘 다 지정합니다.많은 규칙이 가능하지만 가장 기본적이고 일반적으로[18][9] 사용되는 규칙은 다음과 같습니다.

  • 고정 간격 스케줄 : 이전 철근 후 일정 시간이 경과한 후 첫 번째 응답 후 철근이 발생합니다.이 스케줄은 "break-run" 반응 패턴을 생성합니다. 즉, 이 스케줄에 대한 훈련 후 유기체는 일반적으로 강화 후 일시 중지하고 다음 강화 시간이 다가오면 신속하게 반응하기 시작합니다.
  • Variable interval schedule : 철근은 이전 철근에서 가변시간이 경과한 후 첫 번째 응답 이후에 발생합니다.이 스케줄은 일반적으로 비교적 안정된 응답률을 산출하며, 이는 보강 사이의 평균 시간에 따라 달라진다.
  • 고정비율 일정 : 전번 보강 이후 일정수의 응답을 방출한 후 보강합니다.이 일정에 따라 훈련된 유기체는 일반적으로 강화 후 잠시 멈춘 후 높은 속도로 반응한다.반응 요구량이 낮을 경우 일시정지하지 않을 수 있으며, 반응 요구량이 높을 경우 유기체는 반응을 완전히 중단할 수 있다.
  • Variable Ratio Schedule : 이전 보강 이후 변동된 수의 응답을 방출한 후 보강합니다.이 스케줄은 일반적으로 매우 높은 영속적인 응답률을 산출합니다.
  • 연속보강 : 반응 후 철근이 발생한다.유기체는 일반적으로 강화 효과를 얻고 소비하는 데 걸리는 시간을 고려할 때 포화 상태가 될 때까지 가능한 한 빠르게 반응한다.

강화 및 처벌 효과 변화 요인

강화 및 처벌의 효과는 변경될 수 있습니다.

  1. 포화/부족:개인이 식욕을 만족시키기 위해 충분한 자극을 받았다면 긍정적이거나 "매력적인" 자극의 효과는 감소할 것이다.만약 개인이 그 자극을 박탈당한다면 반대의 효과가 발생할 것이다: 결과의 효과는 증가할 것이다.배가 부른 피험자는 배고픈 [19]피험자만큼 의욕을 느끼지 못할 것이다.
  2. 즉시성:지연된 결과보다 즉각적인 결과가 더 효과적이다.5초 이내에 앉아 있는 개에게 간식을 주면 30초 [20]후에 간식을 주는 것보다 더 빨리 배울 수 있다.
  3. 만일의 경우:가장 효과적인 방법으로, 보강은 다른 시간이 아니라 응답 후에 일관되게 이루어져야 한다.강화가 간헐적으로 발생하는 경우, 즉 동일한 응답의 일부 사례만 따르는 경우 학습 속도가 느려질 수 있습니다.간헐적으로 강화되는 응답은 [19]항상 강화되는 응답보다 소멸 속도가 느립니다.
  4. 크기: 자극의 크기 또는 양은 종종 강화제로서의 그것의 효력에 영향을 미칩니다.인간과 동물은 비용 편익 분석에 관여한다.레버 프레스가 10개의 식품 펠릿을 가져오는 경우, 레버 프레스는 1개의 펠릿만 가져오는 경우보다 더 빨리 학습할 수 있습니다.슬롯머신에서 쿼터 더미가 쌓이면 도박꾼이 레버를 1쿼터보다 더 오래 당길 수 있습니다.

이러한 요인의 대부분은 생물학적 기능을 한다.예를 들어, 포화의 과정은 유기체가 안정된 내부 환경(항상성)을 유지하도록 돕는다.예를 들어, 유기체가 설탕을 빼앗겼을 때, 설탕의 맛은 효과적인 강화제이다.유기체의 혈당이 최적의 수준에 도달하거나 초과하면 설탕의 맛은 덜 효과적이거나 심지어 혐오감을 느끼게 된다.

쉐이핑

조형술은 동물 훈련과 비언어적 인간을 가르치는 데 많이 사용되는 조절법이다.위에서 설명한 바와 같이 조작자의 가변성과 보강에 따라 달라집니다.강사가 원하는 최종(또는 "대상") 동작을 식별하는 것부터 시작합니다.다음으로, 조련사는 동물이나 사람이 이미 어떤 확률로 발산하는 행동을 선택한다.이 동작의 형태는 대상 동작에 근접하는 동작을 강화함으로써 연속적인 테스트에 걸쳐 서서히 변화합니다.대상 거동이 최종적으로 방출될 때 보강 스케줄을 이용하여 강화 및 유지할 수 있다.

부적합 철근

부적합 강화는 유기체의 행동에 관계없이 강화 자극을 전달하는 것이다.비적합성 보강은 목표 [21]응답을 소화하는 동안 복수의 대체 응답을 보강함으로써 바람직하지 않은 목표 동작을 감소시키려는 시도에 사용할 수 있다.강화된 것으로 확인된 측정 거동이 없기 때문에 부적합한 "강화"[22]라는 용어의 사용을 둘러싼 논란이 있다.

오퍼런트 동작의 자극 제어

초기에는 특정 자극에 대한 식별된 참조 없이 운영자 행동이 방출되지만, 운영자 조절 중 운영자는 행동이 강화될 때 존재하는 자극의 통제 하에 놓인다.이러한 자극을 "차별적 자극"이라고 부릅니다.이른바 '3선 만일의 사태'가 그 결과다.즉, 차별적 자극은 보상이나 처벌을 낳는 반응의 계기를 마련한다.예: 쥐는 불이 켜질 때만 레버를 누르도록 훈련받을 수 있다; 개는 먹이 봉지의 덜컹거리는 소리를 듣고 부엌으로 달려간다; 아이는 식탁 위에 있는 사탕을 보면 손을 뻗는다.

식별, 일반화 및 컨텍스트

대부분의 행동은 자극 통제 하에 있다.여기에는 다음과 같은 몇 가지 측면이 있습니다.

  • 차별은 일반적으로 특정 자극이 존재하는 경우에만 반응이 강화될 때 발생한다.예를 들어, 비둘기는 녹색 불빛이 아닌 빨간 불빛을 쪼아먹기 위해 먹이를 줄 수 있다. 그 결과, 비둘기는 빨간 불빛을 쪼아 먹고 녹색 쪼아먹기를 멈춘다.자극과 다른 조건의 많은 복잡한 조합이 연구되었다. 예를 들어 유기체는 하나의 자극이 존재할 때 간격 일정에 따라 그리고 다른 자극이 있을 때 비율 일정에 따라 강화될 수 있다.
  • 일반화는 이전에 훈련받은 차별적 자극과 유사한 자극에 반응하는 경향이다.예를 들어, 비둘기가 "빨간색"을 쪼는 훈련을 받는 것은 보통 덜 강하지만 "분홍색"을 쪼는 것일 수도 있습니다.
  • 문맥은 방의 벽, 테이블, 의자 등 또는 조작실 내부와 같은 상황에서 지속적으로 존재하는 자극을 말한다.문맥 자극은 차별적 자극처럼 행동을 통제하기 위해 올 수 있지만, 대개는 더 약하다.어떤 컨텍스트에서 학습된 동작은 다른 컨텍스트에서 존재하지 않거나 변경될 수 있습니다.치료 환경에서 학습된 행동이 다른 상황에서는 발생하지 않을 수 있기 때문에 이는 행동 치료에 어려움을 초래할 수 있습니다.

행동 시퀀스: 조건부 보강 및 체인

대부분의 행동은 일일이 강화된 개별 응답으로 쉽게 설명할 수 없다.연산자 분석의 범위는 위에서 정의한 3개 기간의 우발상황에 의해 결합된 반응의 연속인 행동 사슬의 개념을 통해 확장된다.체인은, 실험적으로 증명된, 차별적 자극이 이후의 행동에 대한 계기를 마련할 뿐만 아니라, 그것보다 앞선 행동을 강화할 수 있다는 사실에 근거하고 있다.즉, 차별적 자극은 "조건부 강화제"이기도 하다.예를 들어, 레버 누름의 계기를 마련하는 조명은 소음 발생 시 "회전"을 강화하기 위해 사용될 수 있다.그 결과 "소음 – 턴어라운드 – 라이트 – 프레스 레버 – 음식"이라는 시퀀스가 발생합니다.더 많은 자극과 반응을 더함으로써 훨씬 더 긴 체인을 만들 수 있다.

탈출과 회피

도피 학습에서 행동은 (반대적인) 자극을 중단시킨다.예를 들어 햇빛으로부터 눈을 보호하면 밝은 빛의 (반대적인) 자극이 사라집니다.(이것은 위에서 정의한 부정적인 강화의 예입니다.)예를 들어, 야외에 나가기 전에 선글라스를 끼는 것과 같이, 자극을 방지함으로써 유지되는 행동을 "회피"라고 합니다.회피행동은 소위 말하는 "회피 역설"을 제기하는데, 자극의 비발생이 어떻게 강화제 역할을 할 수 있느냐는 질문을 받을 수 있다.이 질문은 몇 가지 회피 이론에 의해 해결된다(아래 참조).

일반적으로 두 가지 종류의 실험 설정이 사용됩니다. 차별적 학습과 자유 운영자 회피 학습입니다.

차별적 회피 학습

차별적 회피 실험은 빛과 같은 중성 자극이 뒤이어 충격과 같은 혐오 자극이 뒤따르는 일련의 시험을 포함한다.중립 자극이 나타난 후 레버 누름과 같은 조작적 반응이 혐오 자극을 방지하거나 종료합니다.초기 실험에서는 기피 자극이 올 때까지 피실험자가 반응을 보이지 않기 때문에 이러한 초기 실험을 "도피" 실험이라고 합니다.학습이 진행됨에 따라, 피험자는 중립적인 자극 동안 반응하기 시작하고, 따라서 혐오적인 자극이 일어나는 것을 막는다.이러한 재판을 회피 재판이라고 합니다.이 실험은 중성 CS(조건부 자극)가 혐오적 US(조건부 자극)와 쌍으로 이루어지기 때문에 고전적 조건부여를 수반한다고 한다. 이 아이디어는 아래에 설명된 회피 학습의 2요소 이론의 기초가 된다.

프리 오퍼레이터 회피 학습

자유 수술 회피에서는 수술자 반응이 이루어지지 않는 한 환자는 주기적으로 혐오 자극(종종 전기 충격)을 받는다. 그 반응은 쇼크의 시작을 지연시킨다.이 상황에서는 차별적 회피와 달리 사전 자극은 충격을 예고하지 않는다.두 가지 중요한 시간 간격이 회피 학습 속도를 결정합니다.첫 번째는 S-S(쇼크-쇼크) 간격입니다.이 시간은 응답이 없을 때 연속되는 충격 사이의 시간입니다.두 번째 간격은 response-shock 간격입니다.오퍼런트 응답이 다음 충격의 시작을 지연시키는 시간을 지정합니다.피험자가 오퍼런트 응답을 실행할 때마다 충격이 없는 R-S 간격이 새로 시작됩니다.

이중 과정 회피 이론

이 이론은 원래 유기체가 그 자극에 대한 신호로부터 탈출함으로써 혐오적인 자극을 피하는 것을 배우는 차별적인 회피 학습을 설명하기 위해 제안되었다.두 가지 프로세스가 관련되어 있습니다.신호의 고전적인 조정에 이어 이스케이프 응답의 오퍼런트 조정입니다.

a) 공포의 고전적 조건화처음에 유기체는 CS와 혐오적인 US의 페어링을 경험한다.이 이론은 이 쌍이 고전적 조건화를 통해 CS와 미국 사이의 연관성을 만들고, 미국의 혐오적 성격 때문에 CS는 조건부 감정 반응(CER) – "공포"를 이끌어낸다고 가정한다.b) 공포 감소에 의한 조작자 반응 강화첫 번째 과정의 결과로, CS는 이제 공포의 신호를 보낸다; 이 불쾌한 감정 반응은 오퍼런트 반응에 동기를 부여하는 역할을 하고 CS를 끝내는 반응은 공포의 종단에 의해 강화된다.이 이론은 유기체가 미국을 예상한다는 의미에서 "회피한다"고 말하는 것이 아니라, 유기체가 CS에 의해 야기되는 혐오적인 내부 상태를 "회피한다"고 말하는 것에 주목하십시오.몇 가지 실험 결과가 이중 요인 이론과 배치되는 것 같다.예를 들어, 회피 행동은 초기 CS-US 쌍이 다시 발생하지 않을 때에도 종종 매우 느리게 소멸되므로 공포 반응은 소멸될 것으로 예상된다(고전 조건화 참조).게다가, 피하는 법을 배운 동물들은 종종 두려움의 증거를 거의 보이지 않는데, 이것은 두려움으로부터의 탈출이 회피 [23]행동을 유지하기 위해 필요하지 않다는 것을 암시한다.

연산자 또는 "일요인" 이론

몇몇 이론가들은 회피 행동이 단순히 그것의 결과에 의해 유지되는 조작적 행동의 특별한 경우일 수도 있다고 제안한다.이 관점에서는 "결과"의 개념이 사건의 패턴에 대한 민감성을 포함하도록 확장된다.따라서 회피에서 반응의 결과는 혐오 자극 속도의 감소이다.실제로, 실험 증거는 "실종 충격"이 자극으로 감지되고 강화제 역할을 할 수 있다는 것을 암시한다.인지적 회피 이론은 이 아이디어를 한 걸음 더 나아가게 한다.예를 들어, 쥐는 레버를 누르지 못하면 '충격 예상'이 되고, 누르면 '충격 예상 없음'이 되며, 이러한 예상이 [23]확인되면 회피 행동이 강화된다.

오퍼런트 사재기

오퍼런트 사재기는 특정 방식으로 강화된 쥐가 먹이 알갱이를 회수하는 대신 먹이 쟁반에 쌓을 수 있다는 관찰을 말한다.이 절차에서 펠릿의 회수는 항상 1분간의 멸종 기간을 발생시켰으며, 이 기간 동안 추가적인 식품 펠릿은 사용할 수 없었지만 이전에 축적된 펠릿은 소비할 수 있었다.이 발견은 쥐가 당장 작은 먹이 개체와 약간의 지연 후에 더 큰 먹이 개체 사이에서 선택을 하는 상황에서 충동적으로 행동한다는 일반적인 발견과 모순되는 것으로 보입니다.보강 [24]일람표를 참조한다.

신경생물학적 상관관계

뉴런이 조건부 자극에 대해 부호화하는 방식으로 반응하는 최초의 과학적 연구는 말론 드롱과[25][26] R.T. 리처드슨의 연구에서 나왔다.[26]그들은 대뇌피질 전체에 아세틸콜린을 광범위하게 방출하는 핵 기저 신경세포가 조건부 자극 직후 또는 조건부 자극이 존재하지 않으면 1차 보상 후에 활성화된다는 것을 보여주었다.이들 뉴런은 양성 및 음성 강화제에 대해 동일하게 활성화되며, 많은 피질 영역에서 [27]신경 가소성과 관련이 있는 것으로 나타났습니다.도파민이 비슷한 시기에 활성화된다는 증거도 존재한다.도파민이 강화 학습과 혐오 [28]학습에 모두 참여한다는 상당한 증거가 있다.도파민 경로는 전두피질 부위에 훨씬 더 촘촘하게 투영됩니다.반대로 콜린 작동성 돌기는 1차 시각 피질과 같은 후피질 영역에서도 밀도가 높습니다.도파민 작용이 부족한 질환인 파킨슨병 환자를 대상으로 한 연구는 양성 [29]강화에서 도파민의 역할을 더욱 잘 보여준다.이는 약물치료를 중단하는 동안 환자들이 긍정적인 강화보다는 혐오적인 결과를 통해 더 쉽게 학습한다는 것을 보여주었다.약을 복용하고 있는 환자들은 그 반대의 경우로 나타났는데, 양성 강화는 도파민 활성이 높을 때 더 효과적인 학습 형태임이 입증되었다.

도파민을 포함한 신경화학적 과정이 강화의 기초가 된다고 제안되어 왔다.유기체가 강화 자극을 경험할 때, 의 도파민 경로가 활성화된다.이 경로 네트워크는 "많은 수상돌기에 짧은 도파민의 펄스를 방출하여 시냅스[30]뉴런에 전역 강화 신호를 전달합니다."이를 통해 최근에 활성화된 시냅스가 효율(외향으로 전도) 신호에 대한 민감도를 높일 수 있으며, 따라서 강화 이전에 발생한 최근 응답에 대한 발생 확률이 높아집니다.이러한 반응은 통계적으로 강화를 성공적으로 달성하는 데 책임이 있는 행동일 가능성이 가장 높습니다.그러나 강화의 적용이 덜 즉각적이거나 덜 일관적일 때, 적절한 시냅스에 작용하는 도파민의 능력은 감소한다.

효과의 법칙에 관한 질문

많은 관찰 결과, 위에서 정의한 의미에서의 강화 없이 오퍼런트 동작이 확립될 수 있는 것으로 보입니다.가장 많이 인용되는 것은 자극이 반복적으로 강화되고 그 결과 그 자극에 반응하기 시작하는 오토샤핑 현상이다.예를 들어, 응답 키에 불이 들어오고 나서 음식을 제공한다.이런 일이 몇 번 반복되면 새가 쪼아대든 말든 먹이가 오더라도 비둘기 피험자는 열쇠를 쪼아대기 시작한다.비슷하게, 쥐들은 음식이 근처에 [31][32]있을 때 레버와 같은 작은 물체를 다루기 시작한다.놀랍게도, 비둘기와 쥐는 열쇠를 쪼거나 레버를 눌러도 이러한 행동을 계속하여 먹이를 덜 먹게 됩니다.[33][34]강화 없이 나타나는 또 다른 명백한 오퍼레이터 행동은 콘트라프릴로딩이다.

이러한 관찰과 다른 관찰은 효과의 법칙과 모순되는 것으로 보이며, 일부 연구자들이 조작자 강화의 새로운 개념화를 제안하도록 자극했다(예:).[35][36][37]보다 일반적인 견해는 오토샤핑이 고전적인 조건의 한 예라는 것입니다.오토샤핑 절차는 사실 고전적인 조건을 측정하는 가장 일반적인 방법 중 하나가 되었습니다.이 관점에서, 많은 행동들은 고전적인 우발상황(자극-반응)과 연산자 우발상황(반응-강제)의 영향을 받을 수 있으며, 실험자의 과제는 이것들이 어떻게 [38]상호작용하는지 알아내는 것이다.

적용들

강화와 처벌은 인간의 사회적 상호작용에 어디에나 존재하며, 운영 원칙의 많은 응용이 제안되고 실행되어 왔다.다음은 몇 가지 예입니다.

중독과 의존

양성 및 음성 강화는 중독 및 약물 의존의 발달과 유지에 중심적인 역할을 한다.중독성 있는 약은 본질적으로 가치가 있다; 즉, 그것은 약물 사용에 대한 일차적인 긍정적인 강화제 역할을 한다.뇌의 보상 시스템은 그것에 인센티브를 부여합니다. 그래서 중독이 발달함에 따라,[39][40][41] 약물의 결핍은 갈망으로 이어집니다.또한 약물 사용과 관련된 자극(예: 주사기의 시각 및 사용 위치)은 [39][40][41]약물에 의해 유도되는 강도 강화와 관련된다.이전에 중립적이었던 이러한 자극은 몇 가지 특성을 획득합니다. 즉, 그들의 외형은 갈망을 유발하고, 그들은 지속적인 [39][40][41]사용을 위한 조건화된 긍정적인 강화제가 될 수 있습니다.따라서 중독된 개인이 이러한 약물 신호 중 하나를 접하게 되면 관련 약물에 대한 갈망이 다시 나타날 수 있다.예를 들어, 마약 단속 기관들은 이전에 마약 사용의 위험성을 보여주기 위한 시도로 마약 소지품의 이미지가 있는 포스터를 사용했다.그러나 이러한 포스터는 포스터에 설명된 자극을 보고 재발하는 인센티브 향상의 효과 때문에 더 이상 사용되지 않는다.

약물 의존성 개인에서 음성 강화는 약물 [39]금단 상태에서 발생하는 신체적 의존증(예: 떨림 및 땀) 및/또는 심리적 의존증(예: 무호흡증, 불안감, 과민성 및 불안감)의 증상을 완화 또는 "회피"하기 위해 약물 자가 투여 시 발생한다.

동물 훈련

동물 조련사와 애완동물 주인들은 이러한 아이디어들이 명명되고 연구되기 훨씬 전에 오퍼런트 컨디셔닝의 원칙과 관행을 적용하고 있었고, 동물 조련은 여전히 오퍼런트 컨트롤의 가장 명확하고 설득력 있는 예 중 하나를 제공한다.이 기사에 설명된 개념과 절차 중 가장 중요한 몇 가지는 다음과 같다. (a) 1차 보강의 가용성(예: 개 유미 한 봉지), (b) 2차 보강의 사용(예: 원하는 응답 직후 클릭 소리를 낸 후 맛있는 소리를 내는 것), (c) 그러한 보강을 보장하는 우발성(예: 개 유미). 클릭커(clicker)는 다른 것이 아닌 원하는 동작을 따른다. (d) 개를 점점 더 높이 점프시키는 것과 같은 형상화, (e) 포화 없이 지속적인 동작을 유도하기 위한 강화 빈도를 점진적으로 감소시키는 것과 같은 간헐적 강화, (f) SM에서 점차적으로 복잡한 동작이 구성되는 체인화얼러 [42]유닛

오퍼런트 컨디셔닝과 관련된 Seawold의 동물 훈련 사례

동물 훈련은 긍정적인 강화와 부정적인 강화에 영향을 미친다.증원 일정이 동물 훈련 사례에 큰 역할을 할 수 있습니다.

적용 거동 분석

응용 행동 분석은 B에 의해 시작된 학문이다. F. 사회적으로 중요한 인간 행동의 수정에 조건화 원리를 적용하는 스키너.그것은 조건부 자극(SC), 차별적 자극(Sd), 반응(R), 강화 자극(강화자는rein S 또는 Sr, 때로는 혐오ave 자극은 [23]S)을 포함한 조건 이론의 기본 개념을 사용한다.조건부 자극은 감정 반응과 같은 응답자(고전적) 조건화를 통해 발달된 행동을 통제한다.다른 세 가지 용어는 스키너의 "3선 임시변통"을 형성하기 위해 결합된다: 차별적 자극은 강화로 이어지는 반응을 위한 기회를 만든다.연구진은 오퍼런트 컨디셔닝 도구를 사용하여 인간의 [citation needed]행동을 수정할 때 다음과 같은 프로토콜이 효과적이라는 것을 발견했습니다.

  1. 국가 목표 정확히 어떤 변화가 일어나야 하는지 명확히 한다.예를 들어, "무게를 30파운드 줄인다"는 식입니다.
  2. 동작 모니터링 원하는 효과가 발생하고 있는지 확인할 수 있도록 동작을 추적합니다.예를 들어, 일별 체중 차트를 보관합니다.
  3. 원하는 행동을 강화하세요. 예를 들어, 체중 감량에 대해 개인의 축하를 받으세요.인간에게는 행동의 기록이 보강 역할을 할 수 있다.예를 들어, 참가자가 체중 감량의 패턴을 볼 때, 이는 행동 체중 감량 프로그램의 연속성을 강화할 수 있다.그러나 개인은 양성으로 의도된 보강을 음으로 인식할 수 있으며 그 반대도 마찬가지입니다.예를 들어, 체중 감소 기록은 개인이 실제로 얼마나 무거운지를 상기시켜준다면 부정적인 강화로 작용할 수 있다.토큰 이코노미는 토큰이 원하는 행동에 대한 보상으로 주어지는 교환 시스템입니다.토큰은 나중에 권력, 명성, 상품 또는 서비스와 같은 원하는 경품 또는 보상으로 교환될 수 있습니다.
  4. 바람직하지 않은 행동을 하기 위한 인센티브를 줄인다. 예를 들어, 사탕과 기름진 과자를 부엌 선반에서 치워라.

응용 행동 분석(ABA)의 실무자들은 이러한 절차와 그 많은 변형과 개발을 사회적으로 중요한 다양한 행동과 문제와 관련짓는다.많은 경우, 실무자들은 비정상적인 행동을 대체하기 위해 건설적이고 사회적으로 용인되는 행동을 개발하기 위해 오퍼런트 기법을 사용한다.ABA의 기술 효과적으로 일찍 집중적인 행동 개입은 같은 것을 한 자폐증 스펙트럼 장애를 가진 아이들에게 적용되(ASD)[44]연구에 관한 원칙에 영향을 주는 범죄 행위, HIVprevention,[45]보존의 자연 resources,[46]education,[47]gerontology,[48]건강과 exercise,[49]indust.리알 safety,[50]언어 획득,[51] 쓰레기 [52]버리기, 의료 절차,[53] 육아,[54] 심리 치료,[citation needed] 안전 벨트 사용,[55] 심각한 정신 장애,[56] 스포츠,[57] 약물 남용, 공포증, 소아 섭식 장애, [58]동물원의 관리관리.이러한 어플리케이션의 일부는 다음에 설명되어 있습니다.

자녀 행동 – 부모 관리 훈련

적절한 자녀 행동에 대한 긍정적인 강화를 제공하는 것이 부모 관리 교육의 주요 초점입니다.전형적으로, 부모들은 구체적인 보상(예: [59]어린이와 공동으로 만들어진 인센티브 시스템의 일부로서 더 큰 보상을 향한 스티커나 포인트)뿐만 아니라 사회적 보상(예: 칭찬, 미소, 포옹)을 통해 적절한 행동에 보상하는 것을 배운다.또한 부모는 간단한 행동을 첫 번째 초점으로 선택하여 자녀가 더 큰 목표에 도달하기 위해 달성한 작은 단계 하나하나에 대해 보상하는 것을 배운다(이 개념을 "계속적인 근사치"[59][60]라고 한다.

경제학

심리학자와 경제학자 모두 시장에서의 인간의 행동에 오퍼런트 개념과 발견을 적용하는 데 관심을 갖게 되었다.예를 들어, 구매 상품의 금액에 따라 지수화된 소비자 수요의 분석이 있다.경제학에서 가격이 소비에 영향을 미치는 정도를 "수요의 가격 탄력성"이라고 한다.어떤 상품들은 다른 상품들보다 더 탄력적이다; 예를 들어, 특정 식품의 가격 변화는 구매량에 큰 영향을 미칠 수 있는 반면, 휘발유와 다른 일상 소모품들은 가격 변동의 영향을 덜 받을 수 있다.운영자 분석의 관점에서 이러한 효과는 소비자의 동기 부여 및 [61]강화제로서의 상품의 상대적 가치 측면에서 해석될 수 있다.

도박 – 가변 비율 스케줄링

본 기사의 앞부분에서 설명한 바와 같이, 예측 불가능한 수의 응답을 방출한 후 가변 비율 스케줄은 보강을 산출한다.이 스케줄은 일반적으로 신속하고 지속적인 응답을 생성합니다.슬롯 머신은 변동 비율 스케줄에 따라 성과를 내고 도박꾼들에게서 이런 종류의 지속적인 레버 당기기 동작을 일으킵니다.슬롯머신과 다른 형태의 도박에서 발생하는 변동 비율의 보상은 도박 [62]중독의 근저에 있는 요인으로 종종 언급되어 왔다.

군사심리학

인간은 살인에 대한 타고난 거부감을 가지고 있고 심지어 생명을 구하기 위해서도 그들 종족을 향해 직접적이고 공격적인 행동을 하는 것을 꺼린다.이러한 살인에 대한 저항으로 인해 보병들은 군사전 [63]역사를 통해 현저하게 비효율적이었습니다.

이 현상은 전투 직후 S.L.A. Marshall (Brigadier General이자 군사 역사가)이 제2차 세계대전 보병에 대한 인터뷰 연구에 착수할 까지 이해되지 않았다.마샬의 잘 알려져 있고 논란이 되고 있는 책인 "불에 맞선 남자"는 오직 15%의 군인만이 전투 [64]중 살인의 목적으로 소총을 발사했다고 밝혔다.1946년 미국 육군에 의해 마샬의 연구를 받아들인 후, 미 육군의 인사 연구 사무소는 오퍼런트 컨디셔닝 방법과 유사한 새로운 훈련 프로토콜을 시행하기 시작했다.이후 이러한 방법을 적용함에 따라 한국에서는 약 50%,[63] 베트남에서는 약 90% 이상의 병사들이 살상할 수 있게 되었다.훈련의 혁명은 기존의 팝업 사격장을 명중 시 쓰러지는 3차원, 사람 모양의 팝업 사격장으로 교체하는 것을 포함했다.이것은 즉각적인 피드백을 제공했고 [65]군인의 행동에 긍정적인 강화로 작용했다.군사 훈련 방법에 대한 다른 개선 사항으로는 시간별 사격 코스, 보다 현실적인 훈련, 높은 반복, 상관으로부터의 칭찬, 사격술 보상, 그리고 단체 인정이 있었다.네거티브 강화에는 동료의 설명 책임이나 재수강 요건이 포함됩니다.현대 군사 훈련 조건은 주로 파블로프의 고전적 조건과 스키너식 오퍼란트 조건([63]두 가지 행동주의 형태)을 사용하여 실제 전투를 면밀히 시뮬레이션함으로써 전투 압력에 대한 중뇌 반응이다.

현대의 사격 훈련은 행동주의의 훌륭한 예로서 웨스트 포인트에 있는 미 육군 사관학교의 모든 생도들에게 가르치는 심리학 입문 과정에 오랜 세월 사용되어 왔다.1980년대에 웨스트포인트를 방문했을 때 B.F.Skinner는 현대 군사 사격 훈련은 오퍼런트 [65]컨디셔닝의 거의 완벽한 적용이라고 생각했습니다.

중령님 Dave Grossman은 오퍼런트 컨디셔닝과 미군 훈련에 대해 다음과 같이 말합니다.

이 지역의 병사들을 훈련시키기 위해 조작자 조절이나 행동 수정 기술을 사용하기 위해 일부러 자리에 앉는 사람이 아무도 없었을 가능성이 큽니다.하지만 역사학자이자 직업군인인 심리학자의 관점에서 보면, 이것이 정확히 [63]달성된 것이라는 것이 점점 더 분명해지고 있습니다.

넛지 이론

Nudge 이론(또는 nudge)은 행동과학, 정치이론 경제학에서 비강제 준수를 달성하기 위한 간접적 제안이 직접적인 지시, 입법 또는 e보다 적어도 효과적으로 그룹 및 개인의 동기, 인센티브 및 의사결정에 영향을 미칠 수 있다고 주장하는 개념입니다.강제.

칭찬하다

행동 강화 수단으로서의 칭찬의 개념은 B.F.에 뿌리를 두고 있다.스키너의 오퍼런트 컨디셔닝 모델.이 렌즈를 통해 칭찬은 우연히 칭찬함으로써 관찰된 행동을 [66]더 잘 발생시키는 긍정적인 강화의 수단으로 여겨져 왔다.수백 개의 연구가 긍정적인 행동을 촉진하는 데 있어서 칭찬의 효과를 증명하고 있으며, 특히 교사나 부모가 개선된 행동과 학업 [67][68][69]성취도를 촉진하는 데 있어 칭찬의 사용을 연구하는데 있어서도 그러하다.칭찬은 또한 대리 강화를 [70]통해 칭찬 대상자의 동급생과 같이 칭찬받지 않은 인접 개인의 긍정적인 행동을 강화하는 것으로 입증되었다.칭찬은 그 형태, 내용, 전달에 따라 행동을 바꾸는 데 어느 정도 효과적일 수 있습니다.칭찬이 긍정적인 행동 변화를 일으키기 위해서는 긍정적인 행동(즉, 목표한 행동이 제정된 후에만 시행됨)에 따라 달라져야 하며, 강화해야 할 행동의 세부사항을 명시해야 하며, 성실하고 신뢰할 [71]수 있게 전달되어야 한다.

긍정적인 강화 전략으로서의 칭찬의 효과를 인정하면서,[72][73] 수많은 행동 및 인지적 행동 개입은 칭찬의 사용을 프로토콜에 포함시켰다.칭찬의 전략적 사용은 종종 전략적 주의와 [68]행동 보상과 같은 전략을 포함하는 긍정적인 강화의 더 큰 범주에 대한 개입 연구에 포함되지만, 칭찬은 교실 관리와[72] 육아 훈련 개입 모두에서 증거에 기초한 관행으로 인식된다.

인지-행동요법과 조작자-행동요법이 서로 다른 의학적 조건에 미치는 영향에 대한 여러 연구가 수행되었다.환자가 행동, 태도 및 감정을 변화시키는 인지 및 행동 기술을 개발했을 때 고통의 심각도가 감소했습니다.이러한 연구의 결과는 통증 인식에 대한 인식의 영향을 보여주었고 제시된 영향은 인지-행동치료(CBT)와 운영-행동치료(Operant-Behavioral Therapy)의 일반적인 효과를 설명했다.

심리 조작

브레이커는 조작자들이 피해자를 [74]통제하는 다음과 같은 방법을 알아냈다.

  • 긍정적인 강화: 칭찬, 피상적인 매력, 피상적동정(악어의 눈물), 과도한 사과, 돈, 승인, 선물, 주의력, 억지 웃음이나 웃음과 같은 표정, 그리고 대중의 인정을 포함합니다.
  • 네거티브 강화: 네거티브 상황에서 네거티브 강화 제거가 필요할 수 있습니다.
  • 간헐적 또는 부분적 보강: 부분적 또는 간헐적 네거티브 보강은 효과적인 공포 및 의심 환경을 조성할 수 있습니다.부분적 또는 간헐적 긍정적인 강화는 피해자에게 지속성을 장려할 수 있습니다. 예를 들어 대부분의 도박 형태에서 도박꾼은 때때로 이길 가능성이 높지만 전반적으로 여전히 손해를 볼 수 있습니다.
  • 처벌: 잔소리, 소리 지르기, 묵살, 협박, 협박, 욕설, 감정적 협박, 죄책감 여행, 삐치고 울며 피해자 행세포함한다.
  • 트라우마적인 한 번의 시험 학습: 지배력이나 우월성을 확립하기 위해 언어 폭력, 폭발적 분노 또는 다른 위협적인 행동을 사용한다; 그러한 행동의 단 한 번의 사건이라도 피해자들이 조작자를 화나게 하거나 맞서거나 반박하지 않도록 조건화하거나 훈련시킬 수 있다.

외상 결합

외상적 유대감은 지속적인 남용의 결과로서 발생하는데, 그 결과 보상과 처벌의 간헐적 강화는 [75][76]변화에 저항하는 강력한 감정적 유대감을 형성한다.

다른 정보원은 '외상적 유대감을 위해 필요한 조건은 한 사람이 다른 사람을 지배해야 하고 만성적으로 학대의 정도가 치솟았다가 가라앉는 것이다.[77]그 관계는 지배적인 사람으로부터 관용적이고 동정적이며 심지어 애정어린 행동을 하는 기간으로 특징지어지며, 심한 학대의 간헐적인 에피소드로 중단된다.피해자는 우위를 유지하기 위해 피해자의 행동을 조작하고 피해자의 선택권을 제한하여 힘의 불균형을 지속시킨다.지배와 굴종의 균형에 대한 어떠한 위협도 격앙된 위협에서 격렬한 폭발에 이르기까지 처벌의 증가 주기에 직면할 수 있다.피해자는 또한 피해자를 다른 지원원으로부터 격리시키고, 이는 탐지 및 개입 가능성을 감소시키고, 상충되는 자기반대적 피드백을 받을 수 있는 피해자의 능력을 손상시키며, 일방적인 의존감을 강화시킨다.이러한 학대적인 관계의 정신적 영향은 정확한 자기 평가를 위한 피해자의 능력의 손상을 포함할 수 있으며, 개인적인 능력 부족감과 지배적인 사람에 대한 종속적인 의존감을 초래할 수 있습니다.피해자들은 또한 비록 그들이 침략의 수혜자였더라도 공격적인 행동을 한 누군가와 감정적이고 행동적인 관계를 맺음으로써 다양한 불쾌한 사회적, 법적 결과를 직면할 수 있다.'.

비디오 게임

대부분의[citation needed] 비디오 게임은 플레이어의 플레이를 유지하기 위해 변동 환율 스케줄을 통해 일종의 긍정적인 강화 기능을 추가하여 강제 루프를 중심으로 설계되었습니다.이것은 비디오 게임 [78]중독의 병리학으로 이어질 수 있다.

2010년대 비디오 게임의 수익화 추세의 일부로서 일부 게임들은 약탈 상자를 보상이나 실제 세계 펀드로 구입할 수 있는 아이템으로 제공하였다.상자에는 게임 내 아이템이 임의로 선택됩니다.이 관행은 슬롯머신이나 다른 도박기기가 변동 요금표를 따르기 때문에 보상을 지급하는 것과 같은 수법으로 이어져 왔다.약탈 상자는 도박의 한 형태라는 일반적인 인식이 있는 반면, 그 관행은 몇몇 국가에서만 그렇게 분류된다.그러나 이들 아이템을 온라인 도박이나 실제 세계 화폐와 거래할 수 있는 가상화폐로 사용하는 수법은 법적 [79]평가를 받는 피부 도박 시장을 만들어냈다.

직장에서의 공포 문화

Ashforth는 리더십의 잠재적인 파괴적인 측면에 대해 논의했고 그가 말하는 소폭군, 즉 폭압적인 경영 스타일을 행사하여 직장에서 [80]공포 분위기를 일으키는 리더를 식별했습니다.부분적 또는 간헐적 네거티브 강화는 효과적인 공포 및 [74]의심 환경을 조성할 수 있습니다.직원들이 괴롭힘이 용인된다는 것을 알게 되면,[81] 그 결과는 공포의 분위기가 될 수도 있다.

보상, 처벌, 동기 부여에 대한 개인의 민감도 차이는 강화 민감도 이론의 전제 하에 연구되어 왔으며, 또한 직장 성과에도 적용되어 왔다.

의료와 관련된 막대한 비용에 대해 제안된 많은 이유 중 하나는 방어적 의료의 실천입니다.Prabhu는 Cole의 기사를 리뷰하고 두 그룹의 신경외과 의사들의 반응이 어떻게 전형적인 수술 행동인지에 대해 논의합니다.한 그룹은 의료 소송에 대한 제한이 있는 주에서, 다른 그룹은 제한이 없는 주에서 연습을 한다.신경외과 의사 그룹은 그들의 진료 패턴에 대해 익명으로 질문을 받았다.의사들은 [82]의료 소송에 제한이 없는 주(州)에서 시행하는 부정적인 피드백(소송에 대한 두려움)에 대응하여 관행을 바꿨다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b Tarantola, Tor; Kumaran, Dharshan; Dayan, Peters; De Martino, Benedetto (10 October 2017). "Prior preferences beneficially influence social and non-social learning". Nature Communications. 8 (1): 817. Bibcode:2017NatCo...8..817T. doi:10.1038/s41467-017-00826-8. ISSN 2041-1723. PMC 5635122. PMID 29018195.
  2. ^ H. M. Jenkins, H. M. "동물 학습과 행동 이론" E. 허스트의 5장. "실험 심리학 1세기" 힐스데일 N. J., 얼바움, 1979.
  3. ^ a b Thorndike, E.L. (1901). "Animal intelligence: An experimental study of the associative processes in animals". Psychological Review Monograph Supplement. 2: 1–109.
  4. ^ Miltenberger, R. G. "행동 수정: 원칙과 절차"Thomson/Wadsworth, 2008. 페이지 9.
  5. ^ Miltenberger, R. G., & Crossland, K. A. (2014년)육아.와일리 블랙웰 조작 및 고전적 조절 핸드북. (509–531) 와일리 블랙웰. doi:10.1002/9781118468135.ch20
  6. ^ 스키너, B.F. "생물의 행동:실험분석", 1938년 뉴욕: Appleton- Century-Crofts
  7. ^ Skinner, B. F. (1950). "Are theories of learning necessary?". Psychological Review. 57 (4): 193–216. doi:10.1037/h0054367. PMID 15440996. S2CID 17811847.
  8. ^ 젝터, 다니엘 L., 다니엘 T. 길버트, 다니엘 M.베그너."B. F. 스키너:"강화와 처벌의 역할", 심리학, 제2판의 하위 섹션.뉴욕: Worth, Incorporated, 2011, 278–288.
  9. ^ a b Ferster, C. B. & Skinner, B. F. "Schedules of Enforcement", 1957년 뉴욕: Appleton- Century-Crofts
  10. ^ Staddon, J. E. R; D. T Cerutti (February 2003). "Operant Conditioning". Annual Review of Psychology. 54 (1): 115–144. doi:10.1146/annurev.psych.54.101601.145124. PMC 1473025. PMID 12415075.
  11. ^ 메카 치에사(2004) 급진적 행동주의:철학과 과학은
  12. ^ 스키너, B.F. "과학과 인간의 행동", 1953.뉴욕: 맥밀런
  13. ^ 스키너, B.F. (1948년)월든 투인디애나폴리스:해켓
  14. ^ 스키너, B.F. "언어적 행동", 1957.뉴욕: 애플턴 센추리 크로프츠
  15. ^ Neuringer, A (2002). "Operant variability: Evidence, functions, and theory". Psychonomic Bulletin & Review. 9 (4): 672–705. doi:10.3758/bf03196324. PMID 12613672.
  16. ^ Skinner, B.F. (2014). Science and Human Behavior (PDF). Cambridge, MA: The B.F. Skinner Foundation. p. 70. Retrieved 13 March 2019.
  17. ^ Schultz W (2015). "Neuronal reward and decision signals: from theories to data". Physiological Reviews. 95 (3): 853–951. doi:10.1152/physrev.00023.2014. PMC 4491543. PMID 26109341. Rewards in operant conditioning are positive reinforcers. ... Operant behavior gives a good definition for rewards. Anything that makes an individual come back for more is a positive reinforcer and therefore a reward. Although it provides a good definition, positive reinforcement is only one of several reward functions. ... Rewards are attractive. They are motivating and make us exert an effort. ... Rewards induce approach behavior, also called appetitive or preparatory behavior, and consummatory behavior. ... Thus any stimulus, object, event, activity, or situation that has the potential to make us approach and consume it is by definition a reward.
  18. ^ Schacter et al. 2011 심리학 2nd. 280–284 전체 섹션 원칙 버전 130317 참조
  19. ^ a b Miltenberger, R. G. "행동 수정: 원칙과 절차"Thomson/Wadsworth, 2008. 페이지 84.
  20. ^ Miltenberger, R. G. "행동 수정: 원칙과 절차"Thomson/Wadsworth, 2008. 페이지 86.
  21. ^ Tucker, M.; Sigafoos, J.; Bushell, H. (1998). "Use of noncontingent reinforcement in the treatment of challenging behavior". Behavior Modification. 22 (4): 529–547. doi:10.1177/01454455980224005. PMID 9755650. S2CID 21542125.
  22. ^ Poling, A.; Normand, M. (1999). "Noncontingent reinforcement: an inappropriate description of time-based schedules that reduce behavior". Journal of Applied Behavior Analysis. 32 (2): 237–238. doi:10.1901/jaba.1999.32-237. PMC 1284187.
  23. ^ a b c Pierce & Cheney (2004)행동분석 및 학습
  24. ^ Cole, M.R. (1990). "Operant hoarding: A new paradigm for the study of self-control". Journal of the Experimental Analysis of Behavior. 53 (2): 247–262. doi:10.1901/jeab.1990.53-247. PMC 1323010. PMID 2324665.
  25. ^ "운동 중 팔리달 뉴런의 활동", M.R. DeLong, J. Neurophysiol, 34:414~27, 1971.
  26. ^ a b Richardson RT, DeLong MR(1991) :영장류의 기저핵 기능에 대한 전기생리학 연구.Napier TC, Kalivas P, Hamin I(eds), 기초 전뇌: 해부학에서 기능(실험의학과 생물학에서의 어드밴스), 제295권.뉴욕, 플레넘, 페이지 232~252
  27. ^ PNAS 93:11219-24 1996, 과학 279:1714-8 1998
  28. ^ 뉴런 63:244~253, 2009, 행동신경과학의 프런티어, 3: 2009년 제13조
  29. ^ 마이클 J. 프랭크, 로렌 C시버거, 그리고 랜달 C.오라일리(2004) "당근이냐 채찍이냐: 파킨슨병의 인지 강화 학습", 사이언스 4, 2004년 11월
  30. ^ Schultz, Wolfram (1998). "Predictive Reward Signal of Dopamine Neurons". The Journal of Neurophysiology. 80 (1): 1–27. doi:10.1152/jn.1998.80.1.1. PMID 9658025.
  31. ^ Timberlake, W (1983). "Rats' responses to a moving object related to food or water: A behavior-systems analysis". Animal Learning & Behavior. 11 (3): 309–320. doi:10.3758/bf03199781.
  32. ^ Neuringer, A.J. (1969). "Animals respond for food in the presence of free food". Science. 166 (3903): 399–401. Bibcode:1969Sci...166..399N. doi:10.1126/science.166.3903.399. PMID 5812041. S2CID 35969740.
  33. ^ Williams, D.R.; Williams, H. (1969). "Auto-maintenance in the pigeon: sustained pecking despite contingent non-reinforcement". Journal of the Experimental Analysis of Behavior. 12 (4): 511–520. doi:10.1901/jeab.1969.12-511. PMC 1338642. PMID 16811370.
  34. ^ Peden, B.F.; Brown, M.P.; Hearst, E. (1977). "Persistent approaches to a signal for food despite food omission for approaching". Journal of Experimental Psychology: Animal Behavior Processes. 3 (4): 377–399. doi:10.1037/0097-7403.3.4.377.
  35. ^ Gardner, R.A.; Gardner, B.T. (1988). "Feedforward vs feedbackward: An ethological alternative to the law of effect". Behavioral and Brain Sciences. 11 (3): 429–447. doi:10.1017/s0140525x00058258. S2CID 143876403.
  36. ^ 가드너, R.A. & Gardner B.T.(1998). 수화 자극에서 수화까지 학습하는 구조.Mahwah NJ: Lawrence Elbaum Associates.
  37. ^ Baum, W. M. (2012). "Rethinking reinforcement: Allocation, induction and contingency". Journal of the Experimental Analysis of Behavior. 97 (1): 101–124. doi:10.1901/jeab.2012.97-101. PMC 3266735. PMID 22287807.
  38. ^ 로쿠르토, C.M., 테라스, H.S. & Gibbon, J.(1981) 오토샤핑 및 컨디셔닝 이론.뉴욕: 학술 출판사.
  39. ^ a b c d Edwards S (2016). "Reinforcement principles for addiction medicine; from recreational drug use to psychiatric disorder". Neuroscience for Addiction Medicine: From Prevention to Rehabilitation - Constructs and Drugs. Prog. Brain Res. Progress in Brain Research. Vol. 223. pp. 63–76. doi:10.1016/bs.pbr.2015.07.005. ISBN 9780444635457. PMID 26806771. Abused substances (ranging from alcohol to psychostimulants) are initially ingested at regular occasions according to their positive reinforcing properties. Importantly, repeated exposure to rewarding substances sets off a chain of secondary reinforcing events, whereby cues and contexts associated with drug use may themselves become reinforcing and thereby contribute to the continued use and possible abuse of the substance(s) of choice. ...
    An important dimension of reinforcement highly relevant to the addiction process (and particularly relapse) is secondary reinforcement (Stewart, 1992). Secondary reinforcers (in many cases also considered conditioned reinforcers) likely drive the majority of reinforcement processes in humans. In the specific case of drug [addiction], cues and contexts that are intimately and repeatedly associated with drug use will often themselves become reinforcing ... A fundamental piece of Robinson and Berridge's incentive-sensitization theory of addiction posits that the incentive value or attractive nature of such secondary reinforcement processes, in addition to the primary reinforcers themselves, may persist and even become sensitized over time in league with the development of drug addiction (Robinson and Berridge, 1993). ...
    Negative reinforcement is a special condition associated with a strengthening of behavioral responses that terminate some ongoing (presumably aversive) stimulus. In this case we can define a negative reinforcer as a motivational stimulus that strengthens such an “escape” response. Historically, in relation to drug addiction, this phenomenon has been consistently observed in humans whereby drugs of abuse are self-administered to quench a motivational need in the state of withdrawal (Wikler, 1952).
  40. ^ a b c Berridge KC (April 2012). "From prediction error to incentive salience: mesolimbic computation of reward motivation". Eur. J. Neurosci. 35 (7): 1124–1143. doi:10.1111/j.1460-9568.2012.07990.x. PMC 3325516. PMID 22487042. When a Pavlovian CS+ is attributed with incentive salience it not only triggers ‘wanting’ for its UCS, but often the cue itself becomes highly attractive – even to an irrational degree. This cue attraction is another signature feature of incentive salience. The CS becomes hard not to look at (Wiers & Stacy, 2006; Hickey et al., 2010a; Piech et al., 2010; Anderson et al., 2011). The CS even takes on some incentive properties similar to its UCS. An attractive CS often elicits behavioral motivated approach, and sometimes an individual may even attempt to ‘consume’ the CS somewhat as its UCS (e.g., eat, drink, smoke, have sex with, take as drug). ‘Wanting’ of a CS can turn also turn the formerly neutral stimulus into an instrumental conditioned reinforcer, so that an individual will work to obtain the cue (however, there exist alternative psychological mechanisms for conditioned reinforcement too).
  41. ^ a b c Berridge KC, Kringelbach ML (May 2015). "Pleasure systems in the brain". Neuron. 86 (3): 646–664. doi:10.1016/j.neuron.2015.02.018. PMC 4425246. PMID 25950633. An important goal in future for addiction neuroscience is to understand how intense motivation becomes narrowly focused on a particular target. Addiction has been suggested to be partly due to excessive incentive salience produced by sensitized or hyper-reactive dopamine systems that produce intense ‘wanting’ (Robinson and Berridge, 1993). But why one target becomes more ‘wanted’ than all others has not been fully explained. In addicts or agonist-stimulated patients, the repetition of dopamine-stimulation of incentive salience becomes attributed to particular individualized pursuits, such as taking the addictive drug or the particular compulsions. In Pavlovian reward situations, some cues for reward become more ‘wanted’ more than others as powerful motivational magnets, in ways that differ across individuals (Robinson et al., 2014b; Saunders and Robinson, 2013). ... However, hedonic effects might well change over time. As a drug was taken repeatedly, mesolimbic dopaminergic sensitization could consequently occur in susceptible individuals to amplify ‘wanting’ (Leyton and Vezina, 2013; Lodge and Grace, 2011; Wolf and Ferrario, 2010), even if opioid hedonic mechanisms underwent down-regulation due to continual drug stimulation, producing ‘liking’ tolerance. Incentive-sensitization would produce addiction, by selectively magnifying cue-triggered ‘wanting’ to take the drug again, and so powerfully cause motivation even if the drug became less pleasant (Robinson and Berridge, 1993).
  42. ^ 맥그리비, P&Boakes, R. "당근과 막대기: 동물 조련의 원리"(Sydney: "Sydney University Press", 2011년)
  43. ^ "All About Animal Training - Basics SeaWorld Parks & Entertainment". Animal training basics. Seaworld parks.
  44. ^ Dillenburger, K.; Keenan, M. (2009). "None of the As in ABA stand for autism: dispelling the myths". J Intellect Dev Disabil. 34 (2): 193–95. doi:10.1080/13668250902845244. PMID 19404840. S2CID 1818966.
  45. ^ DeVries, J.E.; Burnette, M.M.; Redmon, W.K. (1991). "AIDS prevention: Improving nurses' compliance with glove wearing through performance feedback". Journal of Applied Behavior Analysis. 24 (4): 705–11. doi:10.1901/jaba.1991.24-705. PMC 1279627. PMID 1797773.
  46. ^ Brothers, K.J.; Krantz, P.J.; McClannahan, L.E. (1994). "Office paper recycling: A function of container proximity". Journal of Applied Behavior Analysis. 27 (1): 153–60. doi:10.1901/jaba.1994.27-153. PMC 1297784. PMID 16795821.
  47. ^ Dardig, Jill C.; Heward, William L.; Heron, Timothy E.; Nancy A. Neef; Peterson, Stephanie; Diane M. Sainato; Cartledge, Gwendolyn; Gardner, Ralph; Peterson, Lloyd R.; Susan B. Hersh (2005). Focus on behavior analysis in education: achievements, challenges, and opportunities. Upper Saddle River, NJ: Pearson/Merrill/Prentice Hall. ISBN 978-0-13-111339-8.
  48. ^ Gallagher, S.M.; Keenan M. (2000). "Independent use of activity materials by the elderly in a residential setting". Journal of Applied Behavior Analysis. 33 (3): 325–28. doi:10.1901/jaba.2000.33-325. PMC 1284256. PMID 11051575.
  49. ^ De Luca, R.V.; Holborn, S.W. (1992). "Effects of a variable-ratio reinforcement schedule with changing criteria on exercise in obese and nonobese boys". Journal of Applied Behavior Analysis. 25 (3): 671–79. doi:10.1901/jaba.1992.25-671. PMC 1279749. PMID 1429319.
  50. ^ Fox, D.K.; Hopkins, B.L.; Anger, W.K. (1987). "The long-term effects of a token economy on safety performance in open-pit mining". Journal of Applied Behavior Analysis. 20 (3): 215–24. doi:10.1901/jaba.1987.20-215. PMC 1286011. PMID 3667473.
  51. ^ Drasgow, E.; Halle, J.W.; Ostrosky, M.M. (1998). "Effects of differential reinforcement on the generalization of a replacement mand in three children with severe language delays". Journal of Applied Behavior Analysis. 31 (3): 357–74. doi:10.1901/jaba.1998.31-357. PMC 1284128. PMID 9757580.
  52. ^ Powers, R.B.; Osborne, J.G.; Anderson, E.G. (1973). "Positive reinforcement of litter removal in the natural environment". Journal of Applied Behavior Analysis. 6 (4): 579–86. doi:10.1901/jaba.1973.6-579. PMC 1310876. PMID 16795442.
  53. ^ Hagopian, L.P.; Thompson, R.H. (1999). "Reinforcement of compliance with respiratory treatment in a child with cystic fibrosis". Journal of Applied Behavior Analysis. 32 (2): 233–36. doi:10.1901/jaba.1999.32-233. PMC 1284184. PMID 10396778.
  54. ^ Kuhn, S.A.C.; Lerman, D.C.; Vorndran, C.M. (2003). "Pyramidal training for families of children with problem behavior". Journal of Applied Behavior Analysis. 36 (1): 77–88. doi:10.1901/jaba.2003.36-77. PMC 1284418. PMID 12723868.
  55. ^ Van Houten, R.; Malenfant, J.E.L.; Austin, J.; Lebbon, A. (2005). Vollmer, Timothy (ed.). "The effects of a seatbelt-gearshift delay prompt on the seatbelt use of motorists who do not regularly wear seatbelts". Journal of Applied Behavior Analysis. 38 (2): 195–203. doi:10.1901/jaba.2005.48-04. PMC 1226155. PMID 16033166.
  56. ^ Wong, S.E.; Martinez-Diaz, J.A.; Massel, H.K.; Edelstein, B.A.; Wiegand, W.; Bowen, L.; Liberman, R.P. (1993). "Conversational skills training with schizophrenic inpatients: A study of generalization across settings and conversants". Behavior Therapy. 24 (2): 285–304. doi:10.1016/S0005-7894(05)80270-9.
  57. ^ Brobst, B.; Ward, P. (2002). "Effects of public posting, goal setting, and oral feedback on the skills of female soccer players". Journal of Applied Behavior Analysis. 35 (3): 247–57. doi:10.1901/jaba.2002.35-247. PMC 1284383. PMID 12365738.
  58. ^ Forthman, D.L.; Ogden, J.J. (1992). "The role of applied behavior analysis in zoo management: Today and tomorrow". Journal of Applied Behavior Analysis. 25 (3): 647–52. doi:10.1901/jaba.1992.25-647. PMC 1279745. PMID 16795790.
  59. ^ a b Kazdin AE(2010).반항적 장애 및 행동 장애에 대한 문제 해결 능력 훈련과 부모 관리 훈련.아동 청소년을 위한 증거 기반 심리치료(2차 편집), 211–226.뉴욕: 길퍼드 프레스.
  60. ^ MS, Patterson GR(2010)을 용서하십시오.부모 관리 트레이닝 - 오리건 모델:아동과 청소년의 반사회적 행동에 대한 개입.아동 청소년을 위한 증거 기반 심리치료(2차 편집), 159–78.뉴욕: 길퍼드 프레스.
  61. ^ 돔잔, M. (2009년)학습과 행동의 원리워즈워스 출판사제6판(244~249페이지)
  62. ^ Bleda, Miguel Ángel Pérez; Nieto, José Héctor Lozano (2012). "Impulsivity, Intelligence, and Discriminating Reinforcement Contingencies in a Fixed-Ratio 3 Schedule". The Spanish Journal of Psychology. 3 (15): 922–929. doi:10.5209/rev_SJOP.2012.v15.n3.39384. PMID 23156902. S2CID 144193503. ProQuest 1439791203.
  63. ^ a b c d Grossman, Dave (1995). On Killing: the Psychological Cost of Learning to Kill in War and Society. Boston: Little Brown. ISBN 978-0316040938.
  64. ^ Marshall, S.L.A. (1947). Men Against Fire: the Problem of Battle Command in Future War. Washington: Infantry Journal. ISBN 978-0-8061-3280-8.
  65. ^ a b Murray, K.A., Grossman, D., & Kentridge, R.W. (21 October 2018). "Behavioral Psychology". killology.com/behavioral-psychology.{{cite web}}: CS1 maint: 여러 이름: 작성자 목록(링크)
  66. ^ Kazdin, Alan (1978). History of behavior modification: Experimental foundations of contemporary research. Baltimore: University Park Press. ISBN 9780839112051.
  67. ^ Strain, Phillip S.; Lambert, Deborah L.; Kerr, Mary Margaret; Stagg, Vaughan; Lenkner, Donna A. (1983). "Naturalistic assessment of children's compliance to teachers' requests and consequences for compliance". Journal of Applied Behavior Analysis. 16 (2): 243–249. doi:10.1901/jaba.1983.16-243. PMC 1307879. PMID 16795665.
  68. ^ a b Garland, Ann F.; Hawley, Kristin M.; Brookman-Frazee, Lauren; Hurlburt, Michael S. (May 2008). "Identifying Common Elements of Evidence-Based Psychosocial Treatments for Children's Disruptive Behavior Problems". Journal of the American Academy of Child & Adolescent Psychiatry. 47 (5): 505–514. doi:10.1097/CHI.0b013e31816765c2. PMID 18356768.
  69. ^ Crowell, Charles R.; Anderson, D. Chris; Abel, Dawn M.; Sergio, Joseph P. (1988). "Task clarification, performance feedback, and social praise: Procedures for improving the customer service of bank tellers". Journal of Applied Behavior Analysis. 21 (1): 65–71. doi:10.1901/jaba.1988.21-65. PMC 1286094. PMID 16795713.
  70. ^ Kazdin, Alan E. (1973). "The effect of vicarious reinforcement on attentive behavior in the classroom". Journal of Applied Behavior Analysis. 6 (1): 71–78. doi:10.1901/jaba.1973.6-71. PMC 1310808. PMID 16795397.
  71. ^ Brophy, Jere (1981). "On praising effectively". The Elementary School Journal. 81 (5): 269–278. doi:10.1086/461229. JSTOR 1001606. S2CID 144444174.
  72. ^ a b Simonsen, Brandi; Fairbanks, Sarah; Briesch, Amy; Myers, Diane; Sugai, George (2008). "Evidence-based Practices in Classroom Management: Considerations for Research to Practice". Education and Treatment of Children. 31 (1): 351–380. doi:10.1353/etc.0.0007. S2CID 145087451.
  73. ^ Weisz, John R.; Kazdin, Alan E. (2010). Evidence-based psychotherapies for children and adolescents. Guilford Press.
  74. ^ a b Braiker, Harriet B. (2004). Who's Pulling Your Strings ? How to Break The Cycle of Manipulation. ISBN 978-0-07-144672-3.
  75. ^ Dutton; Painter (1981). "Traumatic Bonding: The development of emotional attachments in battered women and other relationships of intermittent abuse". Victimology: An International Journal (7).
  76. ^ 크리시 샌더슨.가정폭력 생존자 상담제시카 킹슬리 출판사; 2008년 6월 15일.ISBN 978-1-84642-811-1. 페이지 84.
  77. ^ "Traumatic Bonding Encyclopedia.com". www.encyclopedia.com.
  78. ^ John Hopson:행동 게임 디자인, Gamasutra, 2001년 4월 27일
  79. ^ Hood, Vic (12 October 2017). "Are loot boxes gambling?". Eurogamer. Retrieved 12 October 2017.
  80. ^ 조직의 사소한 횡포, 애쉬포스, 블레이크, 인간관계, 제47권, 제7호, 755~778(1994년)
  81. ^ Helge H, Sheehan MJ, Cooper CL, Einarsen S "직장 내 괴롭힘과 괴롭힘에 대한 조직적 영향:이론, 연구, 실무의 발전(2010년)
  82. ^ 오퍼런트 컨디셔닝과 방어 의학 실습.비크람 CPrabhu 월드 신경외과, 2016-07-01, 제9권, 603-605쪽

외부 링크