텍스처 매핑 단위

Texture mapping unit

컴퓨터 그래픽스에서 텍스처 매핑 유닛(TMU)은 최신 그래픽 처리 유닛(GPU)의 컴포넌트입니다.텍스처 매핑이라고 하는 프로세스에서 비트맵 이미지를 회전, 크기 조정 왜곡하여 텍스처로 지정된 3D 모델의 임의의 평면에 배치할 수 있습니다.최신 그래픽 카드에서는 그래픽 파이프라인의 [1]개별 스테이지로 구현되는 반면, 처음 도입되었을 때는 Voodoo2 그래픽 카드와 같이 별도의 프로세서로 구현되었습니다.

배경 및 이력

TMU는 평면 이미지( 텍스처 맵)를 샘플링하여 3D 공간에 있어야 하는 정확한 각도 및 투시도로 변환해야 하는 컴퓨팅 요구 때문에 생겨났습니다.컴퓨팅 연산은 당시의 CPU(초기 Pentium)로는 감당할 수 없는 대규모 매트릭스 곱셈입니다.

2013년에는 TMU가 셰이더 파이프라인의 일부로 ROP(Render Output Pipeline)에서 분리되었습니다.예를 들어 AMD의 Cypress GPU에서는 각 셰이더 파이프라인(20개)에 4개의 TMU가 있어 GPU에 80개의 TMU를 제공합니다.이는 칩 설계자가 셰이더와 이들이 사용할 텍스처 엔진을 긴밀하게 결합하기 위해 수행합니다.

기하학.

3D 장면은 일반적으로 3D 지오메트리와 해당 지오메트리를 덮는 텍스처라는 두 가지 요소로 구성됩니다.비디오 카드의 텍스처 유닛은 텍스처를 가져와 지오메트리에 매핑합니다.즉, 텍스처를 지오메트리에 감싼 후 화면에 쓸 수 있는 텍스처 픽셀을 생성합니다.텍스처는 실제 이미지, 라이트 맵 또는 고급 표면 조명 효과를 위한 일반 맵이 될 수 있습니다.

텍스처 채우기율

3D 장면을 렌더링하려면 텍스처가 폴리곤 메시 상단에 매핑됩니다.이것은 텍스처 매핑이라고 불리며 비디오 카드 상의 텍스처 매핑 유닛(TMU)에 의해 실현됩니다.텍스처 채우기 속도는 특정 카드가 텍스처 매핑을 수행할 수 있는 속도를 측정하는 것입니다.

픽셀 셰이더 처리가 점점 중요해지고 있지만, 이 숫자는 여전히 어느 정도 비중을 두고 있습니다.그 가장 좋은 예가 X1600 XT입니다.이 카드는 픽셀 셰이더 프로세서/텍스트 매핑 유닛의 비율이 3:1입니다.그 결과, X1600 XT는 같은 시대나 클래스의 다른 GPU(nVidia의 7600GT 등)[citation needed]에 비해 퍼포먼스가 저하됩니다.중간 범위에서는 텍스처 매핑이 여전히 병목현상이 될 수 있습니다.단, 하이엔드에서는 X1900 XTX는 3대 1의 비율로 동일하지만 화면 해상도가 향상되고 어떤 디스플레이에도 대응할 수 있는 충분한 텍스처 매핑 성능을 갖추고 있기 때문에 문제 없습니다.

세부 사항

텍스처 매핑 유닛(TMU)

텍스처는 어드레싱과 필터링이 필요합니다.이 작업은 픽셀 및 정점 셰이더 장치와 함께 작동하는 TMU에 의해 수행됩니다.픽셀에 텍스처 연산을 적용하는 것은 TMU의 일이다.그래픽스 프로세서의 텍스처 유닛 수는 텍스처 처리 성능을 위해 두 개의 다른 카드를 비교할 때 사용됩니다.TMU가 많은 카드가 텍스처 정보를 처리하는 속도가 더 빠르다고 가정하는 것이 타당합니다.최신 GPU의 TMU에는 텍스처 주소 유닛(TA)과 텍스처 필터링 유닛(TF)이 포함되어 있습니다.텍스처 주소 단위는 텍셀을 픽셀에 매핑하고 텍스처 주소 지정 모드를 수행할 수 있습니다.텍스처 필터링 유닛은 옵션으로 하드웨어 기반 텍스처 필터링을 수행합니다.

파이프라인

파이프라인은 그래픽 카드의 아키텍처로, 그래픽 프로세서의 처리 능력을 일반적으로 정확하게 파악할 수 있습니다.

파이프라인은 공식적으로 전문 용어로 받아들여지지 않는다.그래픽스 프로세서 내에는 항상 다른 기능이 수행되므로 다른 파이프라인이 있습니다.Geforce 3에는 4개의 픽셀 파이프라인이 있으며 각각 2개의 TMU가 있습니다.나머지 파이프라인은 깊이와 혼합 작업 등을 담당했습니다.

ATI Radeon 9700은 픽셀 셰이더로부터 독립된 다수의 버텍스 셰이더 엔진을 배치함으로써 이 몰드를 최초로 깨트렸습니다.Radeon 9700에 사용된 R300 GPU는 4개의 글로벌 버텍스 셰이더를 가지고 있었지만 렌더링 파이프라인의 나머지 절반(예를 들어 듀얼 코어)으로 나누어져 쿼드라고 불리며 각각 4개의 픽셀 셰이더, 4개의 TMU 및 4개의 ROP를 가지고 있었습니다.

일부 유닛은 다른 유닛보다 더 많이 사용되고 있으며 프로세서의 전체 성능을 높이기 위해 실리콘을 과도하게 사용하지 않고 최적의 효율에 필요한 유닛의 수를 "스위트 스폿"으로 찾으려 했습니다.이 아키텍처에서는 픽셀 프로세서가 더 이상 단일 TMU에 연결되어 있지 않기 때문에 픽셀 파이프라인이라는 이름이 의미를 잃었습니다.

정점 셰이더는 R300부터 오랫동안 분리되었지만 픽셀 셰이더는 컬러 데이터(예: 텍스처 샘플)가 필요했기 때문에 TMU와 긴밀하게 결합되어야 했기 때문에 그리 쉽게 분리되지 않았습니다.

이 커플링은 정점 또는 픽셀 데이터를 실행할 수 있는 유닛으로 구성된 셰이더 엔진은 TMU에 단단히 결합되어 있지만 출력과 ROP 뱅크 사이에 크로스바 디스패처가 있다.

Render Output Pipeline(ROP; 출력 파이프라인)

렌더 출력 파이프라인은 상속된 용어로, 종종 렌더 출력 단위라고 합니다.픽셀의 샘플링(각 픽셀은 무차원 포인트)을 제어하기 위해 둘 이상의 샘플이 하나의 픽셀에 병합될 때 안티앨리어싱을 제어합니다.렌더링되는 모든 데이터는 프레임 버퍼에 쓰기 위해 ROP를 통과해야 하며, 여기서 디스플레이로 전송될 수 있습니다.

따라서 ROP는 GPU의 출력을 비트맵된 이미지로 조립하여 표시할 수 있도록 합니다.

GPGPU에서 사용

GPGPU에서는 1, 2, 또는 3차원의 텍스처 맵을 사용하여 임의의 데이터를 저장할 수 있습니다.텍스처 매핑부는 보간을 제공함으로써 임의의 함수를 데이터 테이블로 근사하는 편리한 수단을 제공한다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ "Dev Hardware - The Graphics Pipeline". Retrieved 11 May 2006.

외부 링크