효율적인 코딩 가설

Efficient coding hypothesis

효율적인 코딩 가설은 1961년 호레이스 바를로우가 뇌 감각 코딩의 이론적 모델로서 제안하였다.[1]뇌 안에서 뉴런행동전위나 스파이크로 불리는 전기적 자극을 보내면서 서로 의사소통을 한다.감각 신경 과학의 한 가지 목표는 뇌가 외부 세계에 대한 정보를 어떻게 표현하고 처리하는지를 이해하기 위해 이러한 스파이크의 의미를 해독하는 것이다.바로우는 감각계의 스파이크가 감각 정보를 효율적으로 나타내기 위한 신경 코드를 형성했다는 가설을 세웠다.효율적인 Barlow는 코드가 주어진 신호를 전송하는 데 필요한 스파이크의 수를 최소화한다는 것을 의미했다.이것은 주어진 이미지를 전송하기 위해 다른 파일 형식을 사용할 수 있는 인터넷을 통해 정보를 전송하는 것과 다소 유사하다.다른 파일 형식은 주어진 왜곡 수준에서 동일한 이미지를 나타내기 위해 서로 다른 수의 비트를 필요로 하며, 일부는 다른 파일 형식보다 특정 클래스의 이미지를 나타내기 위해 더 적합하다.이 모델에 따르면, 뇌는 유기체의 자연 환경을 대표하는 시각적, 청각적 정보를 표현하는 데 적합한 코드를 사용하는 것으로 생각된다.null

라벨이 붙은 뉴런

효율적인 코딩 및 정보 이론

바로우의 가설의 발전은 불과 10년 전에 클로드 섀넌이 도입한 정보 이론의 영향을 받았다.정보이론은 통신 시스템을 분석하기 위한 수학적 체계를 제공한다.정보, 채널 용량, 중복성 등의 개념을 정식으로 규정한다.Barlow의 모델은 감각 경로를 뉴런 스파이킹이 감각 신호를 표현하는 효율적인 코드인 통신 채널로 취급한다.스파이킹 코드는 대표 단위 간 중복성을 최소화하여 가용 채널 용량을 최대화하는 것을 목표로 한다.H. Barlow는 그 아이디어를 처음 소개한 사람이 아니었다: 그것은 F가 쓴 1954년 기사에 이미 등장한다.앗트니브.[2]null

효율적인 코딩 가설의 핵심 예측은 뇌의 감각 처리를 자연 자극에 적응시켜야 한다는 것이다.시각(또는 청각) 시스템의 뉴런은 자연에서 발견되는 뉴런을 대표하는 영상(또는 소리) 코딩에 최적화되어야 한다.연구자들은 자연 이미지 코딩에 최적화된 필터가 V1의 단순 셀 수용 분야와 유사한 필터로 이어진다는 것을 밝혀냈다.[3]청각영역에서 자연음을 코딩하기 위한 네트워크의 최적화는 내이에서 발견되는 달팽이관 필터의 충동반응과 유사한 필터로 이어진다.[4]null

시각적 시스템 제약

뉴런의 수와 '신경활동'에 필요한 신진대사 에너지 등 시각 시스템의 제약으로 인해 시각 처리 시스템은 가능한 한 많은 정보를 전달하기 위한 효율적인 전략이 있어야 한다.[5]정보는 망막에서 시각피질로 다시 이동할 때 압축되어야 한다.망막 수용체는 10^9비트/s로 정보를 수신할 수 있는 반면, 1비트/sec로 전송되는 100만 개의 갱년세포로 구성된 시신경은 10^6비트/s의 전송능력에 불과하다.[5]전체 전송을 40비트/s로 제한하여 주의력 실명을 초래하는 추가 감소가 발생한다.[5]따라서 신경자원을 극대화하기 위해서는 뉴런이 가능한 한 효율적으로 정보를 인코딩해야 한다는 가설이다.[6]예를 들어, 눈에 띄는 정보 손실 없이 시각 데이터를 최대 20배까지 압축할 수 있는 것으로 나타났다.[5]null

우리의 시각적 처리 시스템이 상향식 선택에 관여한다는 증거가 있다.예를 들어 부주의한 시각장애는 시각적 경로상 초기에 데이터 삭제가 있어야 함을 시사한다.[5]이러한 상향식 접근법은 우리가 예상치 못한 그리고 두드러진 사건에 더 빨리 대응할 수 있게 해주며 종종 주의력 선택에 의해 지시된다.이것은 또한 우리의 시각 시스템에 목표 지향적인 특성을 부여한다.[5]많은 사람들은 영상을 구별되는 요소로 분해함으로써 시각 시스템이 효율적으로 작동할 수 있다고 제안했다.[6]또한, 시각 시스템은 입력의 중복성을 이용하여 가장 적은 자원을 사용하면서 가능한 많은 정보를 전송한다는 주장이 제기되었다.[5]null

진화기반 신경계

Simoncelli와 Olshausen은 시스템 신경 과학의 개발에 관여한다고 가정되는 세 가지 주요 개념을 개략적으로 설명한다.

  1. 유기체는 수행해야 할 특정한 임무를 가지고 있다.
  2. 뉴런은 능력과 한계를 가지고 있다.
  3. 유기체는 특정한 환경에 있다.[7]

Efficient Coding 가설을 테스트하는 데 사용되는 한 가지 가정은 뉴런이 환경의 자연 신호에 진화적으로 그리고 발전적으로 적응해야 한다는 것이다.[7]지각 체계가 "환경 자극"에 반응할 때 가장 빠를 것이라는 생각이다.시각 시스템은 감각 입력의 중복을 제거해야 한다.[8]null

자연 이미지 및 통계

Barlow의 가설의 중심은 정보 이론인데, 이 이론은 신경 과학에 적용되었을 때 효율적으로 코딩하는 신경 시스템이 "그들이 나타내는 신호의 통계와 일치해야 한다"[9]고 주장한다.따라서 이러한 신호를 생성하는 자연 영상의 통계를 결정할 수 있어야 한다.연구원들은 휘도 대비, 색상, 시간이 지남에 따라 이미지가 어떻게 등록되는지를 포함한 자연 이미지의 다양한 요소들을 살펴보았다.[8]디지털 카메라, 분광도계, 레인지 찾기 등을 통해 자연경관 특성을 분석할 수 있다.[10]null

연구자들은 휘도 대비가 이미지에서 공간적으로 어떻게 분포하는지 살펴본다: 휘도 대비는 측정할 수 있는 거리에 가까울수록 높은 상관관계를 가지며 픽셀과 멀리 떨어져 있을수록 덜 상관관계를 갖는다.[8]독립 성분 분석(ICA)은 "주어진 (감지) 입력을 독립 출력(시냅스 전류)으로 선형 변환하려고 시도하는 알고리즘 시스템이다.[11]ICA는 자연스러운 이미지의 픽셀을 장식함으로써 중복성을 제거한다.[8]따라서 자연 이미지를 구성하는 개별 요소는 통계적으로 독립적으로 렌더링된다.[8]그러나 연구자들은 ICA가 신경반응이 선형이라고 가정하고, 따라서 자연영상의 복잡성을 불충분하게 설명하기 때문에 제한적이라고 생각해 왔다.그들은 ICA에 의거하여 가정되는 것에도 불구하고 자연 이미지의 구성요소는 구성요소들 간의 상관관계를 수반하는 "고차적인 구조"를 가지고 있다고 주장한다.[8]대신, 연구원들은 이제 자연 이미지에서 성분들 사이에 발생하는 복잡한 상관관계를 더 잘 나타내는 시간적 독립 성분 분석(TICA)을 개발했다.[8]또한 카클린과 르위키에 의해 개발된 "계층적 공분산 모델"은 희박한 코딩 방법으로 확장되며 "객체 위치, 척도, 질감"과 같은 자연 이미지의 추가 구성요소를 나타낼 수 있다.[8]null

색도 스펙트럼은 자연광에서 나오지만 '천연물질'에서 반사돼 주성분 분석(PCA)으로 쉽게 특성화할 수 있다.[10]원뿔이 자연 이미지에서 특정 양의 광자를 흡수하고 있기 때문에, 연구원들은 원뿔 반응을 자연 이미지를 설명하는 방법으로 사용할 수 있다.연구자들은 망막에 있는 원추 수용기의 세 종류는 자연 영상을 정확하게 코딩할 수 있으며, 색상은 이미 LGN에 장식되어 있다는 것을 발견했다.[8][10]시간 또한 모델링 되었다: 자연 이미지는 시간이 지남에 따라 변화하고, 우리는 시각적 입력이 시간이 지남에 따라 어떻게 변화하는지 보기 위해 이러한 변형을 사용할 수 있다.[8]null

효율적인 공간 코딩, 컬러 코딩, 시간/모션 코딩, 스테레오 코딩, 이들의 조합 등 시각 처리에서 효율적인 코딩에 대한 이론적 검토는 제3장 "비전 이해: 이론, 모델, 데이터"에 수록되어 있다.[12]입력 노이즈로 인해 중복 감소가 더 이상 적절하지 않게 되었을 때 얼마나 효율적인 코딩이 실현되는지, 그리고 서로 다른 상황에서의 코딩이 얼마나 서로 관련되거나 서로 다른지 설명한다.null

효율적인 코드화 가설을 검정하기 위한 가설

만약 뉴런이 효율적인 코딩 가설에 따라 인코딩을 한다면, 개별 뉴런은 그들의 전체 출력 용량을 표현해야 한다.[6]이 가설을 시험하기 전에 신경 반응으로 간주되는 것을 정의할 필요가 있다.[6]사이먼첼리와 올하우젠은 효율적인 뉴런에 최대 반응 값을 부여해 뉴런이 최대 수준을 효율적으로 충족하는지 측정할 수 있도록 할 필요가 있다고 제안한다.[7]둘째로, 뉴런의 집단은 신호를 전송하는데 있어 중복되지 않아야 하며 통계적으로 독립적이어야 한다.[6]효율적인 코딩 가설이 정확하다면, 연구자들은 뉴런 반응에 첨예성이 있다는 것을 관찰해야 한다. 즉, 한 번에 몇 개의 뉴런만이 입력을 위해 발포해야 한다.[8]null

가설 검정을 위한 방법론적 접근법

한 가지 접근방식은 자연 이미지의 통계에 기초하여 초기 감각 처리를 위한 모델을 설계한 다음 이 예측 모델을 실제 뉴런이 자연 이미지에 실제로 어떻게 반응하는지와 비교하는 것이다.[6]두 번째 접근방법은 자연환경에 반응하는 신경계를 측정하고, 그 결과를 분석하여 이 반응에 통계적 특성이 있는지 확인하는 것이다.[6]null

이러한 접근법의 예

1. 예측 모델 접근법

2012년 Doi 등의 한 연구에서 연구원들은 소음과 생물학적 제약을 고려하면서 사용된 자연 영상의 통계에 기초할 망막 갱년세포의 예측 반응 모델을 만들었다.[13]그런 다음, 그들은 효율을 결정하기 위해 실제 망막 갱내 세포에서 관찰된 실제 정보 전송을 이 최적의 모델과 비교했다.연구자들은 망막 갱내 세포의 정보 전송이 전체 효율이 약 80%에 달한다는 것을 발견하고 "망막 갱내 세포와 망막 갱내 세포 사이의 기능적 연결성은 코딩 효율성과 일관성이 있는 독특한 공간 구조를 보인다"고 결론지었다.[13]null

1998년 판 하이트렌과 루더맨의 연구는 비디오 시퀀스를 분석하기 위해 ICA를 이용했고 컴퓨터가 어떻게 이미지의 독립적인 요소들을 분석했는지 DelAngelis et al. 1993년에 고양이로부터 얻은 시각적 처리를 위한 데이터와 비교했다.연구진은 비디오 시퀀스에서 얻은 독립적 구성요소를 "신호의 기본 구성요소"라고 설명했으며, 독립적 구성요소 필터(ICF)는 "각 건물 블록이 얼마나 강한지"[14]를 측정했다.그들은 시간이 지남에 따라 영상의 "밑바닥 구조"를 선택하기 위해 단순한 세포가 조직된다면, 세포는 독립적인 구성요소 필터와 같은 역할을 해야 한다고 가설을 세웠다.[14]그들은 컴퓨터가 결정한 ICF가 실제 뉴런에서 관찰된 "수용장"과 유사하다는 것을 발견했다.[14]null

우측 1차 시각 피질 위치

2. 자연영상에 대응한 실제 신경계 분석

2000년 사이언스지에 실린 보고서에서 윌리엄 E.Vinje와 Jack Gallant는 효율적인 코딩 가설의 요소들을 테스트하는 데 사용되는 일련의 실험을 간략히 설명했는데, 여기에는 비표준 수용장(NCRF)이 1차 시각 피질로부터의 투영을 장식한다는 이론이 포함된다.이를 테스트하기 위해, 그들은 자연적인 시력 조건을 시뮬레이션한 "자연적인 영상과 조건의 자유로운 보기" 동안 깨어있는 마카크에 있는 V1 뉴런의 녹음을 가져갔다.[15]연구원들은 V1이 최소 중복성과 "측정이 더 효율적"[15]희소성 코드를 사용한다는 가설을 세웠다.그들은 또한 이러한 자연 장면을 보는 동안 고전적 수용 분야(CRF)와 NCRF 사이의 상호작용이 이러한 희소 코딩 패턴을 생성한다고 가정했다.이를 테스트하기 위해 아이 스캔 경로를 만들고 CRF 직경의 1~4배에 이르는 크기의 패치를 추출하기도 했다.그들은 패치의 크기에 따라 코딩의 스패시즘이 증가한다는 것을 발견했다.더 큰 패치는 더 많은 NCRF를 포함했다. 즉, 이 두 영역 사이의 상호작용이 희박한 코드를 생성했음을 의미한다.게다가 자극의 크기가 증가함에 따라 첨사성도 증가하였다.이는 자연 영상이 전체 시야에 걸쳐 있을 때 V1이 희박한 코드를 사용함을 시사한다.CRF는 자극이 작용 잠재력을 유발하는 위치를 둘러싼 원형 영역으로 정의되었다.그들은 또한 무작위로 뉴런 쌍을 선택함으로써 NCRF의 자극이 V1 뉴런으로부터 반응의 독립성을 증가시켰는지 여부를 시험했다.그들은 실제로 NCRF의 자극에 따라 뉴런들이 더 크게 분리된다는 것을 발견했다.결론적으로, Vinje와 Gallant의 실험은 자연 영상을 볼 때 CRF와 NCRF를 모두 사용함으로써 V1이 희박한 코드를 사용한다는 것을 보여주었고, NCRF는 뉴런이 가지고 있는 독립적인 정보의 양을 증가시킴으로써 뉴런의 효율을 높일 수 있는 결정적인 장식 효과를 보여주었다.그들은 세포가 패턴 인식[15] 기여할 수 있는 주어진 자연 장면의 개별 성분을 나타낼 수 있다고 제안한다.

배들리 외 연구진이 수행한 또 다른 연구.고양이 시각영역 V1 뉴런과 원숭이 추계(IT) 뉴런의 발화율 분포는 자연주의 조건에서 기하급수적이라는 것을 보여주었는데, 이는 일정한 평균 발화율에 대한 최적의 정보 전달을 의미한다.원숭이 IT 뉴런에 대한 후속 연구는 오직 소수만이 기하급수적인 발화 분포에 의해 잘 묘사된다는 것을 발견했다.드 폴라비에야는 나중에 이러한 불일치는 지수적 해결책이 무소음 사례에 대해서만 정확하기 때문이라고 주장했고, 소음을 고려함으로써 관측된 결과를 설명할 수 있다는 것을 보여주었다.[6]null

1996년 댄, 애틱, 리드에 의한 연구는 시각 경로 초기에 들어오는 시각 신호들이 효율성을 최적화하기 위해 장식될 것이라는 가설을 시험하기 위해 자연적인 이미지를 사용했다.이러한 장식은 뉴런 신호의 시간 및 공간 동력 스펙트럼의 '휘파람'으로 관찰할 수 있다."[16]연구진은 고양이 앞에서 자연 영상 영화를 상영하고 다극단 배열로 신경 신호를 녹화했다.이것은 고양이의 눈을 굴절시킨 다음 콘택트 렌즈를 끼움으로써 달성되었다.그들은 LGN에서 자연 이미지가 장식과 관련이 있다는 것을 발견했고 "초기의 시각적 경로가 진화 및/또는 개발 중에 자연 시각 정보의 효율적인 부호화를 위해 특별히 조정되었다"[16]고 결론지었다.null

확장

효율적인 코딩 가설의 의미 중 하나는 신경 코딩이 감각 신호의 통계에 따라 결정된다는 것이다.이러한 통계는 환경(예: 자연 환경의 통계)뿐만 아니라 유기체의 행동(예: 그 환경 내에서 어떻게 움직이는가)의 기능이다.그러나 인식-행동 사이클에서는 인식과 행동이 밀접하게 얽혀 있다.예를 들어, 시력의 과정은 다양한 종류의 눈 움직임을 포함한다.AEC(Active Efficient Coding)라고 불리는 효율적인 코딩 가설의 확장은 효율적인 코딩을 능동 인식으로 확장한다.그것은 생물학적 작용제가 환경의 효율적인 감각 표현에 기여하기 위해 그들의 신경 코딩뿐만 아니라 그들의 행동도 최적화한다고 가설을 세운다.이러한 선들을 따라 능동 쌍안경 개발과 능동 시각적 추적을 위한 모델들이 제안되었다.[17] [18] [19] [20]

뇌는 정보를 처리할 수 있는 제한된 자원을 가지고 있는데, 시각에서 이것은 시각적 주의력 병목현상으로 나타난다.[21]단지 정보를 효율적으로 코딩하는 것만으로는 더 이상 충분하지 않기 때문에 병목현상은 뇌가 추가 처리를 위해 시각적 입력 정보의 극히 일부만을 선택하도록 강요한다.후속 이론인 V1 Salibility Guysis는 1차 시각피질에서 상향식 Salibility Map에 의해 유도된 추가 처리를 위한 시각적 입력 정보의 외생적인 선택으로 개발되었다.[22]null

비평

연구자들은 시각적 정보가 어떻게 사용되는지를 고려해야 한다.이 가설은 시각적 장면의 정보가 어떻게 사용되는지를 설명하지 않는다. 그것은 시각적 시스템의 주요 목적이다.이것은 궁극적으로 이 정보가 어떻게 처리되는지와 관련이 있을 수 있기 때문에 왜 우리가 환경으로부터 이미지 통계를 처리하고 있는지 이해할 필요가 있어 보인다.그러나 일부 연구자들은 Barlow의 이론에서 시력의 목적이 부적절하다고 실험 설계의 장점으로 볼 수도 있다.[6]null

몇몇 실험은 뉴런들 사이의 상관관계를 보여준다.한 번에 여러 개의 뉴런을 고려할 때, 녹음은 "뉴런들 사이의 상관관계, 동기화 또는 다른 형태의 통계적 의존성을 보여준다"[6]고 한다.그러나 이러한 실험의 대부분은 이러한 반응을 유발하기 위해 자연적인 자극을 사용하지 않았다는 점에 유의해야 한다: 이 가설은 자연적인 이미지 통계와 관련이 있기 때문에 효율적인 코딩 가설과 직접 들어맞지 않을 수 있다.[6]그의 리뷰 기사에서 Simoncelli는 효율적인 코딩 가설에서 중복성을 조금 다르게 해석할 수 있다고 언급한다: 그는 통계적 의존성이 감각 경로의 한 영역만이 아니라 "처리 성공 단계"에 걸쳐 감소될 수 있다고 주장한다.

관찰된 중복성: 1차 시각피질 내 뉴런 수와 망막 갱년세포의 수를 비교한 결과 망막에 비해 피질 내 감각 신경세포의 수가 증가하는 것을 알 수 있다.Simoncelli는 감각 경로상 높은 곳에 있는 비평가들의 주요 논거 중 하나는 감각 정보의 처리를 처리하는 뉴런의 수가 더 많기 때문에 이것이 중복성을 만들어내야 한다고 지적했다.[6]그러나 뉴런의 신경 부호화가 다르기 때문에 이 관찰은 완전히 관련이 없을 수도 있다.시몬첼리는 리뷰에서 "고딕 뉴런은 망막 뉴런에 비해 발화율이 낮은 경향이 있으며 다른 형태의 코드를 사용할 수도 있다"[6]고 지적했다.또한 피질 뉴런은 망막보다 더 오랜 기간에 걸쳐 정보를 인코딩하는 능력을 가질 수 있다.청각 시스템에서 행해진 실험은 중복성이 감소하는 것을 확인했다.[6]null

시험하기 어려움: 정보-이론적 수량의 추정은 엄청난 양의 데이터를 필요로 하기 때문에 실험적인 검증에 비현실적이다.또한 정보 평가자는 편향된 것으로 알려져 있다.하지만, 몇몇 실험적인 성공이 일어났다.[6]null

무엇을 측정할 것인지에 대한 명확한 기준이 필요하다.이 비평은 그 가설의 가장 근본적인 문제들 중 하나를 예시하고 있다.여기서, 시스템의 입력과 출력의 정의에 대해 가정한다.[6]시각 시스템에 대한 입력은 완전히 정의되지는 않지만, 자연 영상의 집합에 포함되는 것으로 가정한다.출력은 가설을 테스트하기 위해 정의되어야 하지만, 어떤 유형의 뉴런을 측정할 것인지, 어디에 위치하는지, 그리고 어떤 유형의 반응(예: 발화율이나 스파이크 시간)을 측정할 것인지에 대한 선택에 기초하여 여기서도 가변성이 발생할 수 있다.[6]null

소음을 고려하는 방법:어떤 사람들은 소음이나 시스템의 다른 물리적 제약조건을 무시하는 실험은 너무 단순하다고 주장한다.[6]그러나 일부 연구자들은 이러한 요소들을 분석에 통합할 수 있었고, 따라서 보다 정교한 시스템을 만들어냈다.[6]null

그러나, 적절한 제형을 통해 효율적인 코딩은 위에서 제기된 이러한 문제들 중 일부를 해결할 수 있다.[23]예를 들어, 감각 입력의 신경 표현에서 일부 수량화 가능한 중복성 정도(신경 반응의 상관관계로 분석됨)는 소음 감각 입력에 효율적인 코딩이 적용될 때 발생할 것으로 예측된다.[23]거짓이 가능한 이론적 예측도 할 수 있으며,[23] 그 중 일부는 후속적으로 시험한다.[24][25][26]null

바이오메디컬 어플리케이션

달팽이관 이식

효율적인 코딩 가설의 적용 가능성에는 달팽이관 삽입물 설계가 포함된다.이러한 신경성 동토층은 전기충동에 의해 청각신경을 자극하여 청각장애가 있거나 청각장애가 있는 사람들에게 청각의 일부를 되돌려준다.임플란트는 성공적이고 효율적이며 현재 사용되고 있는 유일한 것으로 간주된다.효율적인 코딩 알고리즘에서 주파수 위치 매핑을 사용하면 향후 달팽이관 삽입물을 사용할 때 유용할 수 있다.[9]이 가설에 기초한 설계 변화는 청각 장애가 있는 환자의 언어 지능을 높일 수 있다.서로 다른 필터에 의해 처리된 발성 음성을 이용한 연구는 인간이 발성성 필터나 선형 필터와 반대로 효율적인 코드 필터를 사용하여 음성을 처리할 때 음성을 해독하는 데 있어 더 큰 정확성을 가지고 있다는 것을 보여주었다.[9]이는 소음 데이터의 효율적인 부호화가 지각적 편익을 제공하고 청취자에게 더 많은 정보를 제공했음을 보여준다.[9]달팽이관 설계에 의학적으로 관련된 변화에 현재의 연구 결과를 적용하기 위해서는 더 많은 연구가 필요하다.[9]null

참조

  1. ^ 바를로, H. (1961) MIT 프레스, 감각 통신의 "감각 메시지의 변환에 기초하는 가능한 원리"
  2. ^ Attneave, Fred (1954). "Some informational aspects of visual perception". Psychological Review. 61 (3): 183–93. doi:10.1037/h0054663. PMID 13167245.
  3. ^ Olshausen, B. A.; Field, D.J. (1997). "Sparse coding with an overcomplete basis set: A strategy employed by V1?". Vision Research. 37 (23): 3311–3325. doi:10.1016/s0042-6989(97)00169-7. PMID 9425546.
  4. ^ Lewicki, M.S. (2002). "Efficient coding of natural sounds". Nature Neuroscience. 5 (4): 356–363. CiteSeerX 10.1.1.386.3036. doi:10.1038/nn831. PMID 11896400. S2CID 1922462.
  5. ^ a b c d e f g Zhaoping, L (Dec 2006). "Theoretical understanding of the early visual processes by data compression and data selection" (PDF). Network. 17 (4): 301–334. doi:10.1080/09548980600931995. PMID 17283516. S2CID 8647120.
  6. ^ a b c d e f g h i j k l m n o p q r s t Simoncelli, Eero P. (2003). "Vision and the statistics of the visual environment". Current Opinion in Neurobiology. 13 (2): 144–149. CiteSeerX 10.1.1.8.2800. doi:10.1016/S0959-4388(03)00047-3. PMID 12744966. S2CID 14183377.
  7. ^ a b c Simoncelli, E.P.; Olshausen, B.A. (2001). "Natural image statistics and neural representation". Annual Review of Neuroscience. 24: 1193–1216. doi:10.1146/annurev.neuro.24.1.1193. PMID 11520932. S2CID 147618.
  8. ^ a b c d e f g h i j k Ma, L.B.; Wu, S. (Oct 25, 2011). "Efficient coding of natural images". Sheng li xue bao : [Acta Physiologica Sinica]. 63 (5): 463–471. PMID 22002237.
  9. ^ a b c d e Ming, Vivienne L; Holt, Lori L. (2009). "Efficient Coding in Human Auditory Perception". Journal of the Acoustical Society of America. 126 (3): 1312–1320. Bibcode:2009ASAJ..126.1312M. doi:10.1121/1.3158939. PMC 2809690. PMID 19739745.
  10. ^ a b c Geisler, W.S. (2008). "Visual perception and the statistical properties of natural scenes". Annual Review of Psychology. 59: 167–192. doi:10.1146/annurev.psych.58.110405.085632. PMID 17705683.
  11. ^ Blättler, F; Hahnloser, R.H. (2011). "An efficient coding hypothesis links sparsity and selectivity of neural responses". PLOS ONE. 6 (10): e25506. Bibcode:2011PLoSO...625506B. doi:10.1371/journal.pone.0025506. PMC 3192758. PMID 22022405.
  12. ^ 자오핑 L. 2014, 효율적인 코딩 원리, 제3장 비전 이해: 이론, 모델 데이터
  13. ^ a b Doi, E.; Gauthier, J. L.; Field, G. D.; Shlens, J.; Sher, A.; Greschner, M.; Machado, T. A.; Jepson, L. H.; Mathieson, K.; Gunning, D. E.; Litke, A. M.; Paninski, L.; Chichilnisky, E. J.; Simoncelli, E. P. (2012). "Efficient Coding of Spatial Information in the Primate Retina". Journal of Neuroscience. 32 (46): 16256–16264. doi:10.1523/JNEUROSCI.4036-12.2012. ISSN 0270-6474. PMC 3537829. PMID 23152609.
  14. ^ a b c van Hateren, J.H.; Ruderman, D.L. (Dec 7, 1998). "Independent component analysis of natural image sequences yields spatio-temporal filters similar to simple cells in primary visual cortex". Proceedings: Biological Sciences. 265 (1412): 2315–2320. doi:10.1098/rspb.1998.0577. PMC 1689525. PMID 9881476.
  15. ^ a b c Vinje, W.E.; Gallant, J.L. (Feb 18, 2000). "Sparse coding and decorrelation in primary visual cortex during natural vision". Science. 287 (5456): 1273–1276. Bibcode:2000Sci...287.1273V. CiteSeerX 10.1.1.456.2467. doi:10.1126/science.287.5456.1273. PMID 10678835.
  16. ^ a b Dan, Y; Atick, J.J.; Reid, R.C. (May 15, 1996). "Efficient coding of natural scenes in the lateral geniculate nucleus: experimental test of a computational theory". The Journal of Neuroscience. 16 (10): 3351–3362. doi:10.1523/JNEUROSCI.16-10-03351.1996. PMC 6579125. PMID 8627371.
  17. ^ Zhao, Y., Rothkopf, C. A., Triesch, J., & Shi, B. E. (2012). A unified model of the joint development of disparity selectivity and vergence control. IEEE International Conference on Development and Learning and Epigenetic Robotics. pp. 1–6. doi:10.1109/DevLrn.2012.6400876.{{cite conference}}: CS1 maint: 작성자 매개변수 사용(링크)
  18. ^ Lonini, L., Forestier, S., Teulière, C., Zhao, Y., Shi, B. E., & Triesch, J. (2013). "Robust active binocular vision through intrinsically motivated learning". Frontiers in Neurorobotics. 7: 20. doi:10.3389/fnbot.2013.00020. PMC 3819528. PMID 24223552.{{cite journal}}: CS1 maint: 작성자 매개변수 사용(링크)
  19. ^ Zhang, C., Zhao, Y., Triesch, J., & Shi, B. E. (2014). Intrinsically motivated learning of visual motion perception and smooth pursuit. IEEE International Conference on Robotics and Automation. pp. 1902–1908. arXiv:1402.3344. doi:10.1109/ICRA.2014.6907110.{{cite conference}}: CS1 maint: 작성자 매개변수 사용(링크)
  20. ^ Teulière, C., Forestier, S., Lonini, L., Zhang, C., Zhao, Y., Shi, B., & Triesch, J. (2015). "Self-calibrating smooth pursuit through active efficient coding" (PDF). Robotics and Autonomous Systems. 71: 3–12. doi:10.1016/j.robot.2014.11.006.{{cite journal}}: CS1 maint: 작성자 매개변수 사용(링크)
  21. ^ 시각적 스팽글 주의 https://en.wikipedia.org/wiki/Visual_spatial_attention
  22. ^ Li. Z. 2002 인지과학의 주요 시각피질 경향 vol. 6페이지 9-16페이지와 2014년 자오핑(Jaooping) 가설, V1 가설 - 사전 주의적 선택과 분류를 위한 상향식 편의 맵을 책 이해 비전: 이론, 모델 및 데이터
  23. ^ a b c Zhaoping, Li (2014). The efficient coding principle. Oxford University Press. doi:10.1093/acprof:oso/9780199564668.001.0001. ISBN 978-0-19-177250-4.
  24. ^ May, Keith A.; Zhaoping, Li; Hibbard, Paul B. (2012-01-10). "Perceived Direction of Motion Determined by Adaptation to Static Binocular Images". Current Biology. 22 (1): 28–32. doi:10.1016/j.cub.2011.11.025. hdl:10023/4798. ISSN 0960-9822. PMID 22177901. S2CID 16335578.
  25. ^ May, Keith A.; Zhaoping, Li (2016-06-20). "Efficient Coding Theory Predicts a Tilt Aftereffect from Viewing Untilted Patterns". Current Biology. 26 (12): 1571–1576. doi:10.1016/j.cub.2016.04.037. ISSN 0960-9822. PMID 27291055. S2CID 3909649.
  26. ^ Kingdom, Frederick A.A.; Yared, Karl-Christopher; Hibbard, Paul B.; May, Keith A. (2020-01-01). "Stereoscopic depth adaptation from binocularly correlated versus anti-correlated noise: Test of an efficient coding theory of stereopsis". Vision Research. 166: 60–71. doi:10.1016/j.visres.2019.10.009. ISSN 0042-6989. PMID 31855669. S2CID 209394495.