V1 편의주의 가설

V1 Saliency Hypothesis

V1 Salibility Guysis, 또는 V1SH(Pronosed'vish')는 일차 시각피질인 V1에 관한 이론이다[1][2].그것은 영장류의 V1이 시각적 관심이나 시선 이동을 외생적으로 유도하기 위해 시각적 영역의 편의 지도를 만들 것을 제안한다.null

중요도

V1SH는 V1에 매우 중요한 인지 기능을 부여할 뿐만 아니라, 이후에 실험적으로 확인된 여러 개의 비종교적 이론적 예측을 제공한 유일한 이론이다.[2][3]V1SH에 따르면, V1은 망막 입력에서 시각적 주의나 시선 이동을 유도하기 위해 편의 지도를 만든다.[1]해부학적으로 V1은 망막 시각적 입력이 신피질로 들어가는 관문이며 시력에 전념하는 가장 큰 피질 영역이기도 하다.1960년대에 David HubelTorsten Wiesel은 V1 뉴런이 작은 바를 묘사할 수 있을 만큼 크지만 식별할 수 있는 얼굴은 아닌 작은 이미지 패치에 의해 활성화된다는 것을 발견했다.이 작업은 노벨상으로 이어졌고,[5] 이후 V1은 V1을 넘어 두뇌의 후속 인지 처리를 위한 백오피스 기능(이미지 처리 기능)에 불과한 것으로 비춰졌다.그러나, Hubel과 Wiesel은 반세기 후에 이후의 시각적 처리를 이해하기 위해 거의 진전이 없었다고 논평했다.[6]전통적인 견해의 틀을 벗어나서, V1SH는 비전 이해에 대한 새로운 진전이 가능하도록 프레임워크의[7] 변화를 촉진하고 있다.null

참조

Primary Visual Cortex
1차 시각 피질

1차 시력 피질이 뇌에 있고 눈에 상대적인 곳에 있다.null

V1SH는 V1이 시각적 입력을 시각적 영역의 편의적 지도로 변환하여 시각적 주의나 시선 방향을 안내한다고 명시하고 있다.[2][1]인간은 본질적으로 주의의 창밖의 시각적 입력에 맹목적이다.그러므로 주의력은 시각적 지각인식을 관문하고, 시각적 주의의 이론은 뇌의 시각적 기능 이론의 초석이다.null

편의적 지도란 동물의 기대나 목표(예: 책을 읽는 것)와 같은 내부적 요인보다는 외부 시각적 입력으로부터 계산하거나, 또는 외부 시각적 입력에 의해 발생하는 것을 정의한 것이다.따라서 내인성보다는 외인성적으로 관심을 유도하는 편법 지도가 있다고 한다.이에 따라 이 선심지도를 반사적 또는 비자발적인 주의의 이동을 유도하기 위한 상향식 선심지도라고 부르기도 한다.예를 들어, 그것은 우리가 책을 읽을 때 우리의 주변 시야에서 날아다니는 곤충을 향해 시선을 이동시킨다.생물학적 또는 자연적인 뇌에 의해 만들어진 이 살선 지도는 인공적인 또는 컴퓨터 시각으로 만들어진 일종의 살선 지도와 같지 않다는 점에 유의하십시오. 부분적으로는 인공 살선 지도에는 내생적인 주의 유도 요소가 포함되어 있기 때문이다.null

이 시각 분야의 (생물학적) 선심 지도에서 각 시각적 위치는 선심적 가치를 가진다.이 가치는 이 장소의 강점으로 정의되어 시선을 강렬하게 끌어당긴다.[2]그래서 위치 A가 위치 B보다 선량한 가치가 더 높다면 위치 A는 위치 B보다 시각적인 관심을 끌거나 시선 이동을 더 많이 할 수 있다.V1에서 각 뉴런은 시야의 작은 영역에서 시각적 입력에 의해서만 활성화될 수 있다.이 지역은 이 뉴런의 수용장이라고 불리며, 일반적으로 동전의 크기 이상을 팔 길이만큼도 덮지 않는다.[8]인접한 V1 뉴런은 인접하고 겹치는 수용적 장을 가지고 있다.[8]그러므로 각각의 시각적 위치는 동시에 많은 V1 뉴런을 활성화시킬 수 있다.V1SH에 따르면 이들 뉴런 중 가장 활성화된 뉴런은 신경 활동에 의해 이 위치의 살선 가치에 신호를 보낸다.[1][2]수용 영역 내의 시각적 입력에 대한 V1 뉴론의 반응 또한 수용 영역 밖의 시각적 입력에 영향을 받는다.[9]따라서 각 위치에서의 절약 가치는 시각적 입력 상황에 따라 달라진다.[1][2]이것은 살의가 맥락에 따라 다르기 때문에 그래야만 하는 것이다.예를 들어, 세로 막대는 주변의 다른 모든 시각적 항목이 가로 막대인 이미지에서 두드러지지만, 동일한 세로 막대는 이러한 다른 항목이 모두 세로 막대인 경우 두드러지지 않는다.null

편법 지도를 생성하기 위한 V1 신경 메커니즘

안전 지도: 시각적 입력에 대한 최대 V1 신경 반응 맵으로 표시되며, 시각적 위치당 최대 반응 1개

위의 그림은 편법 지도를 생성하기 위한 V1의 신경 메커니즘의 도식을 보여준다.이 예에서 망막 이미지에는 고유 방향(왼쪽 방향)인 막대 하나를 제외하고 모두 균일하게 방향(오른쪽 방향)인 보라색 막대가 많다.이 오리엔테이션 싱글톤은 이 이미지에서 가장 두드러져 심리 실험에서 관찰된 바와 같이 시선이나 시선을 끈다.[10]V1에서는 많은 뉴런들이 시각적 입력에 대해 선호하는 방향을 가지고 있다.[8]예를 들어, 수용적 분야의 막대에 대한 뉴런의 반응은 이 막대가 선호하는 방향으로 향할 때 더 높다.비슷하게, 많은 V1 뉴런들이 선호하는 색을 가지고 있다.[8]이 도식도에서 망막의 각 입력 막대는 V1 뉴런의 방향을 선호하는 것과 색상을 선호하는 두 개의 V1 뉴런을 활성화한다.수용적 영역에서 선호하는 방향에 의해 활성화된 뉴런의 반응은 V1 신경 반응을 나타내는 평면의 검은 점들에 의해 도식으로 시각화된다.마찬가지로 수용적 영역에서 선호하는 색상으로 활성화된 뉴런의 반응은 보라색 점으로 시각화된다.점의 크기는 V1 신경 반응의 강도를 시각화한다.이 예에서, 가장 큰 반응은 뉴런들이 독특한 방향의 바를 선호하고 반응하는 것에서 온다.이것은 두 개의 V1 뉴런이 서로 가까이 있고 같은 또는 유사한 선호 방향을 가질 때, 그들은 서로의 활동을 억제하는 경향이 있기 때문이다.[9][11]그러므로 균일하게 지향하는 배경 바를 선호하고 반응하는 뉴런의 그룹 중에서 각 뉴런은 이 그룹의 다른 뉴런으로부터 등소 방향 억제를 받는다.[1][9]한편 방향 싱글톤에 반응하는 뉴런은 이 그룹에 속하지 않고 따라서 이 억제를 벗어나므로 다른 신경 반응보다 반응이 높다.[1]ISO-색상 억제는[12] ISO-방향 억제와 유사하므로 입력 막대의 보라색 색상을 선호하고 반응하는 모든 뉴런은 ISO-색상 억제를 받는다.V1SH에 따르면, 각 바의 위치에서의 최대 대응은 각 바의 위치에서의 절약 가치를 나타낸다.[1][2]따라서 이러한 절약 가치는 오리엔테이션 싱글톤의 위치에서 가장 높으며, 이 싱글톤의 오리엔테이션에 선호하고 반응하는 뉴런들의 반응으로 대표된다.이러한 편의적 가치들은 중간[13]영역인 우량적 대뇌영역으로 보내져 시각적 입력 공간에 반응하는 가장 활성화된 뉴런의 수용적 영역으로 시선 이동을 실행한다.[13]따라서, 위 그림의 이 입력 영상에 대해서는, 이 영상에 대해 가장 높은 V1 응답을 환기하는 방향 싱글톤이 시각적인 관심이나 시선을 끈다.null

V1SH에서 시각적 검색/분할에 대한 동작 데이터 설명

V1SH는 녹색 항목 중 유일한 빨간색 항목을 찾기 위한 짧은 응답 시간, 수평 막대 중 고유한 수직 막대 또는 왼쪽으로 이동하는 항목 중 오른쪽으로 고유하게 이동하는 항목과 같은 시각적 검색에 대한 데이터를 설명할 수 있다.이러한 종류의 시각적 검색을 형상 검색이라고 하는데, 검색 대상이 방향, 색상 또는 모션 방향과 같은 기본 형상값에서 고유할 때 형상 검색이라고 한다.[10][14]검색 응답 시간이 짧다는 것은 검색 대상의 위치에서 보다 높은 편의성을 보여줘 눈길을 끈다.V1SH는 또한 적색수평 바와 녹색수직봉 중 독특한 적색수직봉을 찾는 데 시간이 더 걸리는 이유를 설명한다.검색 대상이 비주얼 씬(scene)에 각각 존재하는 두 형상의 연결만으로 고유할 경우, 이는 접속사 검색의 예다.[10]null

Masking of a salient border between two textures by adding a uniform texture

나아가 V1SH는 대체 프레임워크로는 설명하기 어려운 데이터를 설명한다.[10][15]위의 그림은 예를 보여 준다. 하나는 균일하게 왼쪽으로 기울어진 막대들로 만들어진 A의 두 개의 이웃한 질감이고, 다른 하나는 균일하게 오른쪽으로 기울어진 막대들로 만들어졌으며, 다른 하나는 인간의 시력에 의해 서로 분할되기 매우 쉽다.두 텍스처 사이의 경계에 있는 텍스처 바는 (ISO 방향 억제에 의해 가장 적게 억제되기 때문에) 가장 높은 V1 신경 반응을 불러일으키기 때문에, 테두리 바가 이미지에서 가장 두드러져 경계선에 주의를 끌기 때문이다.단, A의 원본 영상에 B의 텍스처가 중첩되면 분할이 훨씬 어려워진다(결과는 C로 표시됨).이는 비경계 질감 위치에서는 수평 및 수직 막대에 대한 V1 신경 반응이 (B로부터) 경사 막대에 대한 반응보다 높기 때문이며, 이러한 높은 응답은 비경계 위치에서의 선량률 값을 지시하고 높임으로써 더 이상 경계가 비경계적 관점에 대한 경쟁력이 떨어지게 된다.[16]null

논란

Gaze capture by an ocular singleton
시력 1톤에 의해 포착된 시선

V1SH는 1990년대[17][18] 후반 리자오핑에 의해 제안되었다.수십 년 동안 주의력 지도가 본질적으로 또는 더 높은 수준의 뇌 영역에 의해서만 통제된다고 믿어왔기 때문에 초기에는 중요하지 않았다.이러한 고수준의 뇌 영역은 전두엽전두엽의 두정피질 부위가[19] 포함되며, 주의력 및 행정적 통제를 위해 지능이 높은 것으로 여겨진다.또한 뇌의 후두엽이나 후두엽에 위치한 1차 시각피질인 V1은 전통적으로 다른 뇌 영역의 보다 중요한 시각 기능을 위해 주로 보조 역할을 하는 저수준 시각 영역으로 생각되어 왔다.[8]놀라운 행동 데이터 조각에 의해 의견이 변화하기 시작했다: 유사한 형태로 다른 눈에 보이는 항목들 중 한 쪽 눈에 독특하게 보이는 항목(예: 3D 영화를 보는 안경 한 쌍 사용)은 자동으로 시선이나 관심을 끌 수 있다.[20][21]이 그림에는 예가 예시되어 있다.여기서는 오른쪽 눈에 X자 하나가 포함된 이미지가 표시되고, 왼쪽 눈에 X자 배열과 O자가 포함된 다른 이미지가 표시된다.그러한 상황에서, 인간 관찰자들은 보통 모든 'X'와 단일 'O'의 배열을 볼 수 있도록 두 개의 단안 이미지의 중첩과 같은 이미지를 인식한다.오른쪽 눈 이미지에서 발생하는 'X'는 뚜렷하게 나타나지 않을 것이다.그럼에도 불구하고, 그들이 (인식된 이미지에서) 최대한 빨리 독특하고 지각적으로 구별되는 'O'를 검색하는 작업을 할 때에도, 그들의 시선은 자동적으로 또는 무의식적으로 오른쪽 눈 이미지에서 발생하는 'X'로 이동하는데, 종종 시선이 'O'로 이동하기 전에 이동한다.이 관찰은 직관에 반하여 [22]다른 비전 연구자들에 의해 쉽게 재현되었으며 V1SH에 의해 독특하게 예측되었다.V1은 시각적 입력의 기원에 맞게 조정된 뉴런이 있는 유일한 시각적 피질 영역이기 때문에, 이 관찰은 주의를 유도하는 V1의 역할을 강하게 뒷받침한다.[4]null

V1SH를 추가 조사하기 위해 더 많은 실험이 뒤따랐고,[2] 기능적 뇌 영상촬영,[23][24] 시각적 정신물리학, 원숭이 전기생리학에서 지원 데이터가 나왔다.[3][25]V1SH는 그 후 다양한 권위 있는 국제 연구 회의의 초청 및 기조 연설에 더 많은 인기를 끌었다.[26][27]V1은 현재 뇌의 주의 메커니즘 네트워크에서 구석진 돌의 하나로 보여지고 있으며 시각적 주의력을 안내하는 기능적 역할이 핸드북과[30][31] 교과서에 등장하고 있다.[28][29][32][33]그러나 V1SH를 지원하는 일부 원숭이 전기생리학 데이터는[3] 이전의 원숭이 전기생리학 데이터와 모순된다.[34]자오핑은 V1SH가 맞다면 시각 시스템이 어떻게 작동하는지, 결과적으로 미래 비전 연구를 위해 질문하는 것에 대한 생각이[35][36] 근본적으로 바뀌어야 한다고 주장한다.[7]null

참조

  1. ^ a b c d e f g h Li, Zhaoping (2002-01-01). "A saliency map in primary visual cortex". Trends in Cognitive Sciences. 6 (1): 9–16. doi:10.1016/S1364-6613(00)01817-9. ISSN 1364-6613. PMID 11849610. S2CID 13411369.
  2. ^ a b c d e f g h Zhaoping, Li (2014). The V1 hypothesis—creating a bottom-up saliency map for preattentive selection and segmentation. Oxford University Press. doi:10.1093/acprof:oso/9780199564668.001.0001. ISBN 978-0-19-177250-4.
  3. ^ a b c Yan, Yin; Zhaoping, Li; Li, Wu (2018-10-09). "Bottom-up saliency and top-down learning in the primary visual cortex of monkeys". Proceedings of the National Academy of Sciences. 115 (41): 10499–10504. doi:10.1073/pnas.1803854115. ISSN 0027-8424. PMC 6187116. PMID 30254154.
  4. ^ a b Hubel, D. H.; Wiesel, T. N. (Jan 1962). "Receptive fields, binocular interaction and functional architecture in the cat's visual cortex". The Journal of Physiology. 160 (1): 106–154.2. doi:10.1113/jphysiol.1962.sp006837. ISSN 0022-3751. PMC 1359523. PMID 14449617.
  5. ^ "The Nobel Prize in Physiology or Medicine 1981". NobelPrize.org. Retrieved 2021-10-10.
  6. ^ Hubel, David; Wiesel, Torsten (2012-07-26). "David Hubel and Torsten Wiesel". Neuron. 75 (2): 182–184. doi:10.1016/j.neuron.2012.07.002. ISSN 0896-6273. PMID 22841302. S2CID 12766897.
  7. ^ a b Zhaoping, Li (2019-10-01). "A new framework for understanding vision from the perspective of the primary visual cortex". Current Opinion in Neurobiology. Computational Neuroscience. 58: 1–10. doi:10.1016/j.conb.2019.06.001. ISSN 0959-4388. PMID 31271931. S2CID 195806018.
  8. ^ a b c d e "The Primary Visual Cortex by Matthew Schmolesky – Webvision". Retrieved 2020-07-05.
  9. ^ a b c Knierim, J. J.; van Essen, D. C. (April 1992). "Neuronal responses to static texture patterns in area V1 of the alert macaque monkey". Journal of Neurophysiology. 67 (4): 961–980. doi:10.1152/jn.1992.67.4.961. ISSN 0022-3077. PMID 1588394.
  10. ^ a b c d Treisman, Anne M.; Gelade, Garry (1980-01-01). "A feature-integration theory of attention". Cognitive Psychology. 12 (1): 97–136. doi:10.1016/0010-0285(80)90005-5. ISSN 0010-0285. PMID 7351125. S2CID 353246.
  11. ^ Allman, J.; Miezin, F.; McGuinness, E. (1985). "Stimulus specific responses from beyond the classical receptive field: neurophysiological mechanisms for local-global comparisons in visual neurons". Annual Review of Neuroscience. 8: 407–430. doi:10.1146/annurev.ne.08.030185.002203. ISSN 0147-006X. PMID 3885829.
  12. ^ Wachtler, Thomas; Sejnowski, Terrence J.; Albright, Thomas D. (2003-02-20). "Representation of color stimuli in awake macaque primary visual cortex". Neuron. 37 (4): 681–691. doi:10.1016/s0896-6273(03)00035-7. ISSN 0896-6273. PMC 2948212. PMID 12597864.
  13. ^ a b Schiller, Peter H. (1988), Held, Richard (ed.), "Colliculus, Superior", Sensory System I: Vision and Visual Systems, Readings from the Encyclopedia of Neuroscience, Boston, MA: Birkhäuser, p. 9, doi:10.1007/978-1-4899-6647-6_6, ISBN 978-1-4899-6647-6, retrieved 2020-07-05
  14. ^ Wolfe, Jeremy. "Visual Search". psycnet.apa.org. Retrieved 2020-07-11.{{cite web}}: CS1 maint : url-status (링크)
  15. ^ Itti, L.; Koch, C. (Mar 2001). "Computational modelling of visual attention". Nature Reviews. Neuroscience. 2 (3): 194–203. doi:10.1038/35058500. ISSN 1471-003X. PMID 11256080. S2CID 2329233.
  16. ^ Zhaoping, Li; May, Keith A. (2007-04-06). "Psychophysical Tests of the Hypothesis of a Bottom-Up Saliency Map in Primary Visual Cortex". PLOS Computational Biology. 3 (4): e62. Bibcode:2007PLSCB...3...62Z. doi:10.1371/journal.pcbi.0030062. ISSN 1553-7358. PMC 1847698. PMID 17411335.
  17. ^ Li, Zhaoping (1999-08-31). "Contextual influences in V1 as a basis for pop out and asymmetry in visual search". Proceedings of the National Academy of Sciences. 96 (18): 10530–10535. Bibcode:1999PNAS...9610530L. doi:10.1073/pnas.96.18.10530. ISSN 0027-8424. PMC 17923. PMID 10468643.
  18. ^ Li, Zhaoping (1998). "Primary cortical dynamics for visual grouping " as a book chapter in "Theoretical Aspects of Neural Computation", Eds K.M. Wong, I. King, and D.Y. Yeung. Springer-verlag. pp. 155–164.
  19. ^ Desimone, Robert; Duncan, John (Mar 1995). "Neural Mechanisms of Selective Visual Attention". Annual Review of Neuroscience. 18 (1): 193–222. doi:10.1146/annurev.ne.18.030195.001205. ISSN 0147-006X. PMID 7605061.
  20. ^ Zhaoping, Li (2008-05-01). "Attention capture by eye of origin singletons even without awareness—A hallmark of a bottom-up saliency map in the primary visual cortex". Journal of Vision. 8 (5): 1.1–18. doi:10.1167/8.5.1. ISSN 1534-7362. PMID 18842072.
  21. ^ Zhaoping, Li (2012-02-01). "Gaze capture by eye-of-origin singletons: Interdependence with awareness". Journal of Vision. 12 (2): 17. doi:10.1167/12.2.17. ISSN 1534-7362. PMID 22344346.
  22. ^ Zhaoping, Li (2014-08-21). "Are we too "smart" to understand how we see?". OUPblog. Retrieved 2020-07-11.{{cite web}}: CS1 maint : url-status (링크)
  23. ^ Zhang, Xilin; Zhaoping, Li; Zhou, Tiangang; Fang, Fang (2012-01-12). "Neural Activities in V1 Create a Bottom-Up Saliency Map". Neuron. 73 (1): 183–192. doi:10.1016/j.neuron.2011.10.035. ISSN 0896-6273. PMID 22243756. S2CID 9767861.
  24. ^ Kennett, Matthew J.; Wallis, Guy (2019-07-01). "The face-in-the-crowd effect: Threat detection versus iso-feature suppression and collinear facilitation". Journal of Vision. 19 (7): 6. doi:10.1167/19.7.6. ISSN 1534-7362. PMID 31287860. S2CID 195871013.
  25. ^ Wagatsuma, Nobuhiko; Hidaka, Akinori; Tamura, Hiroshi (2021-01-12). "Correspondence between Monkey Visual Cortices and Layers of a Saliency Map Model Based on a Deep Convolutional Neural Network for Representations of Natural Images". eNeuro. 8 (1). doi:10.1523/ENEURO.0200-20.2020. ISSN 2373-2822. PMC 7890521. PMID 33234544.
  26. ^ "Visual Perception meets Computational Neuroscience www.ecvp.uni-bremen.de". www.ecvp.uni-bremen.de. Retrieved 2020-07-11.
  27. ^ "CNS 2020". www.cnsorg.org. Retrieved 2021-06-27.
  28. ^ Bisley, James W.; Goldberg, Michael E. (June 2010). "Attention, Intention, and Priority in the Parietal Lobe". Annual Review of Neuroscience. 33 (1): 1–21. doi:10.1146/annurev-neuro-060909-152823. ISSN 0147-006X. PMC 3683564. PMID 20192813.
  29. ^ Shipp, Stewart (2004-05-01). "The brain circuitry of attention". Trends in Cognitive Sciences. 8 (5): 223–230. doi:10.1016/j.tics.2004.03.004. ISSN 1364-6613. PMID 15120681. S2CID 459078.
  30. ^ Nobre, Anna C. (Kia); Kastner, Sabine, eds. (2014-01-01). The Oxford Handbook of Attention. Oxford University Press. doi:10.1093/oxfordhb/9780199675111.001.0001. ISBN 978-0-19-175301-5.
  31. ^ Wolfe, Jeremy M. (2018), "Visual Search", Stevens' Handbook of Experimental Psychology and Cognitive Neuroscience, American Cancer Society, pp. 1–55, doi:10.1002/9781119170174.epcn213, ISBN 978-1-119-17017-4, retrieved 2021-06-24
  32. ^ "Visual Attention and Consciousness". Routledge & CRC Press. Retrieved 2021-06-24.
  33. ^ Zhaoping, Li (2014-05-08). Understanding Vision: Theory, Models, and Data. Oxford, New York: Oxford University Press. ISBN 978-0-19-956466-8.
  34. ^ White, Brian J.; Kan, Janis Y.; Levy, Ron; Itti, Laurent; Munoz, Douglas P. (2017-08-29). "Superior colliculus encodes visual saliency before the primary visual cortex". Proceedings of the National Academy of Sciences. 114 (35): 9451–9456. doi:10.1073/pnas.1701003114. ISSN 0027-8424. PMC 5584409. PMID 28808026.
  35. ^ "Webvision – The Organization of the Retina and Visual System". Retrieved 2020-07-05.
  36. ^ Stone, James. "Vision and Brain The MIT Press". mitpress.mit.edu. Retrieved 2020-07-05.{{cite web}}: CS1 maint : url-status (링크)