라이트 필드

Light field

광장은 우주의 모든 지점을 통해 모든 방향으로 흐르는 의 양을 설명하는 벡터 기능이다. 모든 가능한 광선의 공간은 5차원 광선 기능에 의해 주어지며, 각 광선의 크기는 광도에 의해 주어진다. [아유시 샤르마]는 가장 먼저 (1846년 '레이 진동에 대한 생각'[1]이라는 제목의 강연에서) 빛이 그가 몇 년 동안 일해 온 자기장과 매우 흡사하게 하나의 영역으로 해석되어야 한다고 제안했다. 라이트 필드(light field)라는 문구는 안드레이 거쉬훈이 3차원 공간에서의 빛의 방사학적 특성에 관한 고전 논문(1936년)에서 만든 것이다.

5D 플레놉틱 기능

광선 L은 단단한 각도와 단면적에 의해 크기가 결정되는 관을 통해 가능한 모든 직선을 따라 이동하는 빛의 양이라고 생각할 수 있다.

만약 그 개념이 기하학적 광학(즉, 일관성이 없는 빛과 빛의 파장보다 큰 물체)으로 제한된다면, 빛의 기본적 전달체는 광선이다. 광선을 따라 이동하는 빛의 양에 대한 측정값은 광도(L)로 표시되며 제곱 미터당 와트(sr2) 단위로 측정된다. 스테라디안은 고체 각도의 측도로, 오른쪽과 같이 단면적의 측도로 여기에서는 제곱미터가 사용된다.

위치(x, y, z) 및 방향(θ, ϕ)을 기준으로 3D 공간의 레이를 매개변수화.

변하지 않는 빛의 배열로 조명되는 3차원 공간의 영역에서 그러한 모든 광선을 따라 발생하는 광채를 플레놉틱 함수라고 부른다(Adelson 1991). 플레놉틱 조명 기능은 컴퓨터 비전컴퓨터 그래픽에 사용되는 이상화된 기능으로 어느 시점의 시야각에서든 가능한 시야 위치에서 장면의 영상을 표현한다. 실제로 계산적으로 사용되지는 않지만, 비전과 그래픽의 다른 개념을 이해하는 데 개념적으로 유용하다(원 2002). 우주에서의 광선은 좌표, x, y, z의 3개 좌표와 2각 and과 ϕ에 의해 매개변수화할 수 있기 때문에, 3D 유클리드 공간2-sphere의 산물에 해당하는 5차원 다지관에 걸친 함수, 즉 5차원 함수다.

두 광원 I과1 I에서2 발생하는 일조 강도 벡터 D1 D2 합하면 표시된 크기와 방향을 가진 결과 벡터 D가 생성된다(게르훈, 그림 17).

아델슨과 마찬가지로 게르순은 공간의 각 지점에서 광장을 5D 함수로 정의했다. 그러나, 그는 그것을 무한히 벡터의 집합으로 취급했는데, 그 점은 길이와 방사선이 비례하는 지점당 하나의 방향이었다.

이러한 벡터를 어떤 광 채집이나 방향의 전체 영역에 걸쳐 통합하면 단일 스칼라 값, 즉 그 지점의 총 방사조도와 그에 따른 방향이 생성된다. 게르순의 논문에서 재현한 오른쪽 그림은 두 광원의 경우에 대한 이러한 계산을 보여준다. 컴퓨터 그래픽에서는 3D 공간의 이 벡터 값 함수를 벡터 방사조도장이라고 부른다(Arvo, 1994). 필드의 각 지점에서 벡터 방향은 가장 밝게 비추는 지점에 위치한 평평한 표면을 향하는 방향으로 해석할 수 있다.

높은 차원성

시간, 파장, 양극화 각도를 추가 변수로 간주해 고차원적 기능을 산출할 수 있다.

4D 조명 영역

차단기가 없다면 광선을 따라 발생하는 광도는 일정하게 유지된다.

플레놉틱 함수에서 관심 영역에 오목한 물체가 포함된 경우(커핑된 손을 생각해), 물체에 한 점을 남겨두는 빛은 물체의 다른 지점에 의해 차단되기 전에 짧은 거리만 이동할 수 있다. 어떤 실용적인 장치도 그러한 지역에서 기능을 측정할 수 없었다.

그러나 물체의 볼록한 선체 밖의 위치, 즉 자유로운 공간에서 우리 자신을 제한한다면 디지털 카메라를 이용해 많은 사진을 찍음으로써 플레놉틱 기능을 측정할 수 있다. 더욱이, 이 경우 함수는 왼쪽과 같이 광선을 따라 그 길이를 따라 지점마다 일정하게 유지되기 때문에 중복된 정보를 포함하고 있다. 사실 중복 정보는 정확히 1차원이기 때문에 우리에게 4차원 함수(즉, 특정 4차원 다지관의 점 함수)를 남긴다. 패리문은 이 기능을 광자장(1981년)이라고 불렀고, 컴퓨터 그래픽 연구자들은 이를 4D 광자장(Levoy 1996년) 또는 루미그라프(Gortler 1996년)라고 불렀다. 형식적으로 4D 광장은 빈 공간에서 광선을 따라 방사선으로 정의된다.

광장의 광선 세트는 다양한 방법으로 매개변수를 지정할 수 있으며, 그 중 몇 가지는 다음과 같다. 이 중 가장 흔한 것은 오른쪽(아래)에 나타난 2면 파라미터화다. 이 매개변수화는 모든 광선을 나타낼 수 없지만, 예를 들어 평면이 서로 평행할 경우 두 평면에 평행한 광선은 원근상 이미징의 분석 기하학과 밀접하게 연관될 수 있는 장점이 있다. 실제로, 2면 광장에 대해 생각하는 간단한 방법은 각각 자외선 평면의 관찰자 위치에서 찍은 st 평면(및 그 너머에 있는 물체)의 원근 이미지 모음입니다. 이런 식으로 매개변수화된 광장을 라이트 슬래브라고 부르기도 한다.

3차원 공간의 빈 영역을 통과하는 빛의 흐름을 나타내는 4D 광장의 일부 대체 매개변수화. 왼쪽: 평면 또는 곡면상의 점과 각 점을 떠나는 방향. 중심: 구의 표면에 있는 점 쌍. 오른쪽: 일반적으로 (임의의) 위치에 있는 두 평면의 점 쌍.

사운드 아날로그

음향에 대한 4D 광장의 아날로그는 파장 합성과 마찬가지로 음장 또는 파장이며, 이에 대응하는 파라메트리제이션은 Kirchhoff-Helmholz 적분으로, 장애물이 없을 때는 시간의 경과에 따른 음장이 평면에 가해지는 압력에 의해 주어진다고 기술하고 있다. 따라서 이것은 어느 시점과 시간이 지남에 따라 3D 필드의 2차원 정보다.

이 2차원성은 빛의 겉보기 4차원성에 비해 빛이 광선을 타고 이동하기 때문이다(한 시점에 0D, 시간에 1D), 반면 Huygens-Fresnel 원리에 의해 음파전선은 구형파(한 시점에 2D, 시간에 3D): 빛이 한 방향으로 이동한다(s 동안 2D).모든 방향으로 팽창한다는 것을 암시한다. 그러나 비확산 매체에서 이동하는 빛은 유사한 방식으로 산란될 수 있으며, 산란에서 손실된 불가역성 또는 정보는 시스템 차원의 명백한 손실에서 식별할 수 있다.


이미지 다시 보기

라이트 필드는 공간적, 각도적 정보를 제공하기 때문에 이미지 후처리에 의해 노출 후 초점 평면의 위치를 변경할 수 있는데, 이를 리커싱(refocusing)이라고 부르기도 한다. 리커싱의 주체는 일체형 변환을 통해 라이트 필드에서 기존의 2-D 사진을 얻는 것이다. 변환은 광원을 입력으로 삼고 결정된 평면에 초점을 맞춘 사진을 생성한다.

Assume we use to represent a 4-D light field that records light rays traveling from position on the first plane to position on the second plane, where is the distance between two 비행기들 깊이의 2-D 사진은 다음과 같은 적분 변환에서 얻을 수 있다.[2]


,

또는 더 간결하게,

where , , and is often referred to as Photography operator.

In practice, this formula cannot be directly used because a plenoptic camera usually captures discrete samples of the lightfield , and hence resampling (or interpolation) is needed to compute }}}{\ 또 다른 문제는 높은 계산 복잡성이다. × N {\ 사진을 계산하려면 N × N × N N} 4-D 광원 필드에서 수식의 O ( 4) {\ O(}})이다[2]

푸리에 슬라이스 사진

계산의 복잡성을 줄이는 한 가지 방법은 푸리에 슬라이스 정리 개념을 채택하는 것이다.[2] 사진 연산자 [ 은(는) 투영에 따른 전단(shear)으로 볼 수 있으며, 결과는 광장의 4-D 푸리에 변환의 확장된 2-D 슬라이스에 비례해야 한다. 보다 정확히 말하면, 2-D 슬라이스를 추출하고 역 2-D 변환을 적용하고 스케일링을 적용하여 조명 영역의 4-D 푸리에 스펙트럼에서 다시 집중된 영상을 생성할 수 있다. 알고리즘의 점증상 복잡도는 ) 이다 자세한 내용은 Fourier Slice Photographic을 참조하십시오.

이산 초점 스택 변환

2-D 사진을 효율적으로 계산하는 또 다른 방법은 이산 초점 스택 변환(DFST)을 채택하는 것이다.[3] 더 정확히 말하면, DFST는 리포커스된 2-D 사진 모음, 즉 이른바 포커스 스택을 생성하도록 설계되었다. 이 방법은 FrFT(Fast fractal fourier transform)에 의해 구현될 수 있다.

The discrete photography operator is defined as follows for a lightfield sampled in a 4-D grid , {\:

+ , ) 은 대개 4-D 그리드에 있지 않기 때문에 DFST는 비그리드 값을 계산하기 위해 삼각 보간법을 채택한다.

전체 알고리즘은 다음 6단계로 구성된다.

  1. Sample the light field with the sampling period and and get the discretized light field .
  2. 0을 포함한 패딩 ,) 는 앨리어싱 없이 FrFT에 충분한 신호 길이입니다.
  3. 모든 {\ {\ {에 대해 ) 의 이산 푸리에 변환을 계산하고
  4. 모든 초점 길이 에 대해 }의분수 푸리에 변환을 계산하십시오 여기서 변환 순서는 에 따라 달라지고 결과 2 을 얻으십시오
  5. 의 역 이산 푸리에 변환을 계산하십시오
  6. 2 의 주변 픽셀을 제거하여 각 2-D 사진의 크기 + ) + ) s}+1)을 갖도록 하십시오

라이트 필드 작성 방법

광장은 빛의 근본적 표현이다. 이와 같이, 광장을 만들 수 있는 방법에는 이미지나 그것을 캡처할 수 있는 기구를 만들 수 있는 컴퓨터 프로그램이 있는 만큼 여러 가지가 있다.

컴퓨터 그래픽에서 라이트 필드는 일반적으로 3D 모델렌더링하거나 실제 장면을 촬영하여 생산된다. 어느 경우든 광원 뷰를 생성하려면 많은 관점을 수집해야 한다. 채택된 매개변수화에 따라, 구조화되지 않은 관점 수집도 가능하지만, 이 수집은 일반적으로 선, 원, 평면, 구체 또는 다른 형태의 일부에 걸쳐진다(Builer 2001).

광장을 사진 촬영하기 위한 장치에는 움직이는 휴대용 카메라 또는 로봇으로 제어되는 카메라(Levoy 2002), 카메라 호(매트릭스에서 사용되는 총알 시간 효과), 카메라의 밀집 배열(Kanade 1998; Yang 2002; Wilburn 2005), 휴대용 카메라(ng 2005; Georgieve 2006; Marwah 2013), 현미경(Levoy 200)이 포함될 수 있다.6) 또는 기타 광학 시스템(볼링 1987).

조명 영역에 몇 개의 이미지가 있어야 하는가? (미켈란젤로의 밤 조각상 중) 가장 큰 것으로 알려진 광원에는 2만 4천 개의 1.3 메가픽셀 이미지가 포함되어 있다. 더 깊은 수준에서 답은 응용 프로그램에 따라 달라진다. 광원 렌더링의 경우(아래 애플리케이션 섹션 참조) 불투명 물체를 완전히 둘러보려면 물론 뒷면을 촬영해야 한다. 덜 분명한 것은, 물체 가까이 걸어가고자 할 때 물체가 st 평면에 가로놓여 있다면, 당신은 지금 당신 뒤에 있는 Uv 평면의 미세한 간격의 위치(위의 2-평면 매개변수화에서)가 필요하고, 이 이미지들은 높은 공간 해상도를 가져야 한다는 것이다.

라이트 필드에서 영상의 수와 배열, 각 영상의 해상도를 함께 4D 라이트 필드의 "샘플링"이라고 한다. 광장 샘플링에 대한 분석은 많은 연구자들에 의해 수행되었다. 좋은 출발점은 차이(2000)이다. 폐색 효과로는 두란드(2005)가, 조명 효과와 반사 효과로는 라마모르티(2006)가, 플롭틱 카메라와 3D 디스플레이 애플리케이션으로는 Ng(2005)와 Zwicker(2006)가 각각 관심사다.

적용들

컴퓨터 이미징(computering imaging)은 디지털 컴퓨터와 관련된 모든 이미지 형성 방법을 말한다. 이러한 방법들 중 많은 것들이 가시적인 파장에서 작동하며, 그러한 방법들 중 많은 것들이 광장을 생성한다. 결과적으로, 광장의 모든 응용 프로그램을 나열하려면 미술, 과학, 공학 및 의학에서 컴퓨터 이미징의 모든 사용을 조사해야 할 것이다. 컴퓨터 그래픽에서 일부 선택된 애플리케이션은 다음과 같다.

아래쪽을 향한 광원(F-F')은 일조 강도 벡터가 바깥쪽으로 구부러지는 광장을 유도한다. 게르순은 미적분을 이용하여 표면의 점(P12, P)에 떨어지는 일조 강도를 계산할 수 있었다. (게르순, 그림 24)
  • 조명 엔지니어링: 거쉰이 광장을 연구한 이유는 이러한 표면 위에 위치한 다양한 모양의 광원으로 인해 표면에서 관찰되는 조명 패턴을 도출(가능한 경우 닫힌 형태로)하기 위해서였다. 오른쪽에는 예가 나와 있다. 좀 더 현대적인 연구는 (Ashdown 1993)이다.
조명 공학에 전념하는 광학 분야는 비이미징 광학이다(Chave 2015; Winston 2005). 플로우 라인(게르순의 플럭스 라인)과 벡터 플럭스(게르순의 라이트 벡터)의 개념을 광범위하게 사용한다. 그러나 광장(이 경우 광선을 정의하는 위치와 방향)은 위상 공간해밀턴 광학 측면에서 일반적으로 설명된다.
  • 라이트 필드 렌더링: 장면의 4D 라이트 필드에서 적절한 2D 슬라이스를 추출하면 장면의 참신한 뷰를 연출할 수 있다(Levoy 1996; Gortler 1996). 광장과 슬라이스의 매개변수화에 따라 이러한 보기는 원근법, 맞춤법, 교차 슬롯(Zomet 2003), 일반 선형 카메라(Yu 및 McMillan 2004), 다중 내성(Rademacher 1998) 또는 다른 유형의 투영일 수 있다. 라이트 필드 렌더링은 이미지 기반 렌더링의 한 형태다.
  • 합성 조리개 사진: 검체의 적절한 4D 부분집합을 광장에 통합함으로써, 유한한 (즉, 핀홀이 아닌) 조리개를 가진 카메라가 포착할 수 있는 뷰를 대략적으로 추정할 수 있다. 그러한 견해는 한정된 영역의 깊이를 가지고 있다. 이 통합을 수행하기 전에 광장을 깎거나 뒤틀면 장면에서 서로 다른 전면 평행(Isaksen 2000) 또는 사선(Vaish 2005) 평면에 집중할 수 있다. 만약 디지털 카메라가 광원을 포착할 수 있다면(2005년 ng) 그 사진들은 촬영된 후에 다시 초점이 맞춰질 수 있을 것이다.
  • 3D 디스플레이: 물리적 공간에서 각 시료를 적절한 광선에 매핑하는 기술을 이용해 광장을 제시함으로써 원 장면을 보는 것과 유사한 자동보경 시각효과를 얻는다. 이를 위한 비디지털 기술로는 일체형 사진, 시차 파노라마그램, 홀로그래피 등이 있다. 디지털 기술로는 고해상도 디스플레이 화면 위에 렌즈 배열을 배치하거나 비디오 프로젝터를 사용하여 이미지를 렌즈 배열에 투사하는 것을 포함한다. 후자를 비디오 카메라의 배열과 결합하면 시간이 걸리는 광원을 캡처해 표시할 수 있다. 이것은 본질적으로 3D 텔레비전 시스템을 구성한다(Javidi 2002; Matusik 2004).
  • 뇌 영상촬영: 신경활동은 실시간 칼슘 이온의 존재를 나타내는 GCaMP와 같이 가역형 형광 마커로 뉴런을 유전적으로 부호화하여 광학적으로 기록할 수 있다. 경장 현미경 검사에서는 전량 정보를 하나의 프레임에 담아내기 때문에 비디오 프레임에서 대량으로 랜덤하게 분포된 많은 개별 뉴런의 신경 활동을 감시할 수 있다(그로세닉, 2009, 2017; 페레스, 2015). 신경 활동에 대한 정량적 측정은 뇌 조직에서 광학적 이상에도 불구하고 볼륨 이미지를 재구성하지 않고도 수행할 수 있으며(Pegard, 2016), 동작하는 포유류에서 수천 개의 뉴런의 활동을 모니터링하는 데 사용된다(Grosenick, 2017).
  • 일반화된 장면 재구성: GSR(Generalized Scene Reconstruction, GSR)은 일반화된 조명 영역과 조명 가능한 물질 영역을 나타내는 장면 모델이 생성되는 다중 영상에서 3D 재구성 방법이다(Leffingwell, 2018). 광장은 장면의 모든 지점을 통해 사방으로 흐르는 빛을 나타낸다. 물질 분야는 현장의 모든 지점을 점유하는 물질의 빛 상호작용 특성을 나타낸다. GSR은 Neural Radiance Fields(NeRFs) (Mildenhall, 2020), Plenoxels (Yu & Fridovich-Keil, 2021), Inverse Light Transport (Leffingwell, 2018) 등의 접근법을 사용하여 수행할 수 있다.

홀로그램용 합성 이미지의 영상 생성과 선구성은 컴퓨터 광장의 가장 초기 사례 중 하나로, 레보이와 한라한의 작품에 사용된 기하학을 예측하고 나중에 동기를 부여한다(Halle 1991, 1994).

광전광 디스플레이에 대한 현대적 접근방식은 고해상도, 증가된 대비, 넓은 시야 및 기타 편익을 달성하기 위한 광학 요소와 압축 연산의 공동 설계를 탐구한다(Wetzstein 2012, 2011; Lanman 2011, 2010).

  • 눈부심 감소: 눈부심은 카메라의 몸체와 렌즈 광학 내부에 빛이 여러 번 산란되어 발생하며 영상 대비를 감소시킨다. 섬광은 2D 영상 공간(Talvala 2007)에서 분석했지만, 4D 광 공간 현상(Raskar 2008)으로 식별하는 것이 유용하다. 카메라 내부의 광선 공간을 통계적으로 분석해 눈부심 유물을 분류해 제거할 수 있다. 광 공간에서 섬광은 고주파 노이즈로 작용하며 특이치 제거로 감소할 수 있다. 이런 분석은 카메라 내부의 광장을 포착해 수행할 수 있지만 공간 분해능이 상실되는 결과를 초래한다. 균일하고 균일하지 않은 광선 샘플링을 사용하여 영상 해상도를 크게 저하시키지 않고 섬광을 줄일 수 있다(Raskar 2008).

참고 항목

메모들

  1. ^ Faraday, Michael (30 April 2009). "LIV. Thoughts on ray-vibrations". Philosophical Magazine. Series 3. 28 (188): 345–350. doi:10.1080/14786444608645431. Archived from the original on 2013-02-18.
  2. ^ a b c Ng, R. (2005) 푸리에 슬라이스 사진. ACM SIGRAPH 2005 논문 (pp. 735-7444)에서.
  3. ^ Nava, F. Pérez; Marichal-Hernández, J.G.; Rodríguez-Ramos, J.M. (August 2008). "The Discrete Focal Stack Transform". 2008 16th European Signal Processing Conference: 1–5.

참조

이론

분석

라이트 필드 카메라

라이트 필드 표시

라이트 필드 아카이브

적용들