RSX 리얼리티 신시사이저

RSX Reality Synthesizer
PlayStation 3 마더보드의 RSX 'Reality Synthetizer'

RSX '리얼리티 신디사이저'플레이스테이션 3 게임기를 위해 엔비디아와 소니가 공동 개발한 전용 그래픽 처리 장치(GPU)이다.엔비디아 7800을 기반으로 한 GPU이다.GTX 그래픽 프로세서와 Nvidia에 따르면, G70/G71(이전에는 NV47로 알려져 있음) 하이브리드 아키텍처로 약간의 수정이 있다.RSX는 정점과 픽셀 셰이더 파이프라인이 분리되어 있다.GPU는 CPU(최대 480MB)를 통해 유효 전송 속도가 1.3GHz이고 3.2GHz XDR 메인 메모리 중 최대 224MB인 650MHz로 클럭 처리된 256MB GDDR3 RAM을 사용한다.그래픽 처리의 대부분을 운반하지만, 콘솔의 CPU인 셀 브로드밴드 엔진은 콘솔의 일부 그래픽 관련 계산 부하에도 보완적으로 사용된다.

사양

하단 칩 길이: 4.28cm

달리 명시되지 않은 한, 다음의 사양은 E3 2005년 E3 회의에서 소니가 보도자료를 내고,[1] 같은 컨퍼런스에서 슬라이드를,[2] 2006년 게임 개발자 컨퍼런스에서 소니가 발표한 슬라이드를 바탕으로 한다.[citation needed]

  • 550MHz 픽셀 셰이더 클럭 / 90nm 공정의 500MHz 정점 쉐이더 클럭(2008년[3] 65nm, 2010년[4] 40nm로 줄임), 3억개 이상의 트랜지스터
  • NV47 기반(Nvidia GeForce 7800 아키텍처)
  • 리틀 엔디안
  • 24개의 텍스처 필터링 장치(TF) 및 8개의 꼭지점 텍스처 주소 지정 장치(TA)
    • 시계당 24개의 필터링된 샘플
    • 최대 Texel 충진률: 초당 13.2 Ggatexel(24개 텍스처 * 550MHz)
    • 클럭당 32개의 필터링되지 않은 텍스처 샘플(8 TA * 4개의 텍스처 샘플)
    • 8개의 렌더 출력 장치(ROP)/픽셀 렌더링 파이프라인
      • 피크 픽셀 충진률(이론): 초당 4.4기가픽셀
      • 최대 Z 버퍼링 샘플링 속도: 초당 8.8기가샘플(Z 샘플 2개 * ROP 8개 * 550MHz)
    • 최대 도트 제품 운영: 초당 510억 개(셀 CPU와 결합)
    • 128비트 픽셀 정밀도로 하이 다이내믹 레인지 렌더링 가능
  • 650MHz에서 256MB GDDR3 RAM
    • 128비트 메모리 버스 폭
    • 20.8GB/s 읽기 및 쓰기 대역폭
  • 셀 플렉스IO 버스 인터페이스
    • Rambus XDR 메모리 인터페이스 버스 폭: 64비트 중 56비트(직렬)
    • Cell 및 XDR 메모리로 20GB/s 읽기
    • Cell 및 XDR 메모리에 15GB/s 쓰기
  • 576KB 텍스처 캐시(픽셀 파이프라인 쿼드당 96KB)
  • PSGL 지원(OpenGL ES 1.1 + Nvidia Cg)
  • S3 텍스처 압축[5] 지원

기타 기능:Bilinar, trilinar, 비등방성, Quincunx 텍스처 필터링, Quincunx Antialiasing, 최대 4xMSAA, SSAA, Alpha to Coverage 및 Alphakill 지원.

모델 번호

90nm:

  • CXD2971AGB
  • CXD2971DGB
  • CXD2971GB
  • CXD2971-1GB
  • CXD297BGB

65nm:

  • CXD2982
  • CXD2982GB
  • CXD2991GB
  • CXD2991BGB
  • CXD2991GGB
  • CXD2991CGB
  • CXD2991EGB

40nm:

  • CXD5300AGB
  • CXD5300A1GB
  • CXD5301DGB
  • CXD5302DGB
  • CXD5302A1GB

로컬 GDDR3 물리적 메모리 구조

  • 총 메모리 256MB
  • 파티션 2개(128MB)
  • 파티션당 64비트 버스
  • 파티션당 8개 뱅크(16MB)
  • 뱅크당 4096페이지(4KB) -> 12비트 행 주소
  • 페이지의 메모리 블록 -> 9비트 열 주소
  • 최소 액세스 세분성 = 8바이트 -> RSX <> GDDR 사이의 버스 폭과 동일

RSX 메모리 맵

RSX는 GDDR3 RAM 256MB를 탑재하고 있지만 모두 사용 가능한 것은 아니다.마지막 4MB는 RSX 내부 상태 및 실행된 명령을 추적하기 위해 예약되어 있다.GPU 데이터의 4MB에는 RAMIN, RAMHT, RAMFC, DMA 개체, 그래픽 개체 및 그래픽 컨텍스트가 포함되어 있다.RSX에서 256MB 이내의 주소의 내역은 다음과 같다.

주소 범위 크기 댓글
0000000-FBFFFFF 252 MB 프레임버퍼
FC00000-FFFFFF 4MB GPU 데이터
FF80000-FFFFFF 512KB RAMIN: 인스턴스 메모리
FF90000-FF93fortississimo. 16KB RAMHT: 해시 테이블
FFA0000-FFA0FFFF 4KB RAMFC: FIFO 컨텍스트
FFC0000-FFCFFFF 64KB DMA 개체
FFD0000-FFFFFF 64KB 그래픽 객체
FFE0000-FFFFFF 128KB 그래프: 그래픽 컨텍스트

로컬 GDDR3 메모리 외에도, 메인 XDR 메모리는 RSX로도 액세스할 수 있으며, 다음 중 하나로 제한된다.

  • 0MB - 256MB(0x00000000 - 0x0FFFFFFFF)
-또는-
  • 0MB - 512MB(0x00000000 - 0x1FFFFFF)

속도, 대역폭 및 대기 시간

시스템 대역폭(이론적 최대값):

  • 256MB XDR과의 셀: 25.6GB/s
  • 셀과 RSX(IOIFO): 20GB/s(실용 : 15.8GB/s @ packetize 128B)
  • RSX(IOIFI) 셀 : 15GB/s (실용 : 11.9)GB/s @ 패킷 크기 128B)
  • RSX ~ 256MB GDDR3 : 20.8GB/s(@ 650MHz)

앞서 언급한 여러 칩 사이의 통신 경로의 배치, 그리고 다양한 컴포넌트 간의 지연시간과 대역폭 차이 때문에, 소스와 목적지에 관한 접속 방향에 따라 접속 속도가 다르다.The following is a chart showing the speed of reads and writes to the GDDR3 and XDR memory from the viewpoint of the Cell and RSX. Note that these are measured speeds (rather than calculated speeds) and they should be worse if RSX and GDDR3 access are involved because these figures were measured when the RSX was clocked at 550Mhz and the GDDR3 mem오리는 700Mhz로 기록되었다.출고된 PS3는 500Mhz(화소 셰이더가 550Mhz로 내부에서 별도로 작동하지만 전면과 후면은 500Mhz)로 RSX를 클럭이 500Mhz이다.또 GDDR3 메모리도 650Mhz로 낮췄다.

스피드 테이블

프로세서 256MB XDR 256MB GDDR3
셀 읽기 16.8GB/s 16MB/s(15.6)MB/s @ 650MHz)
셀 쓰기 24.9GB/s 4GB/s
RSX 읽기 15.5GB/s 22.4GB/s(20.8)GB/s @ 650 MHz)
RSX 쓰기 10.6GB/s 22.4GB/s(20.8)GB/s @ 650 MHz)

256MB GDDR3 메모리에서 셀 읽기 속도가 매우 느리기 때문에, 셀이 XDR에서 작업한 다음 RSX가 XDR에서 데이터를 뽑아 GDDR3에 쓰도록 하여 HDMI 디스플레이로 출력하는 것이 더 효율적이다.XDR 메모리(로컬 GDDR3 메모리와 반대로)에서 데이터를 로딩할 수 있도록 RSX에 추가적인 텍스처 조회 지침이 포함된 이유다.

RSX 라이브러리

RSX는 3D 그래픽 전용으로 개발자들은 다른 API 라이브러리를 사용하여 그 기능에 접근할 수 있다.가장 쉬운 방법은 기본적으로 프로그램 가능한 파이프라인이 추가된 OpenGL ES인 고급 PSGL을 사용하는 것이지만, 상대적으로 약한 콘솔 CPU의 성능 오버헤드 때문에 인기가 없다.하위 레벨의 개발자에서는 낮은 레벨에서 RSX 명령 버퍼를 구축하는 API인 LibGCM을 사용할 수 있다.(PSGL은 실제로 LibGCM 위에 구현된다.)이는 (FIFO Context를 통해) 명령어와 DMA Objects를 설정하고 DMA 호출을 통해 RSX로 전송함으로써 이루어진다.

G70 아키텍처와의 차이점

RSX 'Reality Synthetizer'는 G70 아키텍처를 기반으로 하지만 코어에 대한 몇 가지 변화를 특징으로 한다.[6]두 칩의 가장 큰 차이는 메모리 대역폭의 작동 방식이다.G70은 로컬 메모리에 대한 렌더링만 지원하는 반면 RSX는 시스템과 로컬 메모리에 모두 렌더링할 수 있다.시스템 메모리 렌더링은 로컬 메모리 렌더링에 비해 지연 시간이 훨씬 높기 때문에 성능 저하를 피하기 위해 칩 아키텍처를 수정해야 했다.이는 그래픽 파이프라인을 가득 채우기 위해 더 큰 버퍼캐시를 수용할 수 있도록 칩 크기를 확대함으로써 달성되었다.그 결과 RSX는 G70의 로컬 메모리 대역폭의 60%에 불과해 개발자들이 성능 목표를 달성하기 위해 시스템 메모리를 사용할 필요가 있었다.[6]

차이점 RSX n비디아 7800GTX
GDDR3 메모리 버스 128비트 256비트
ROPs 8 16
변환 후 및 조명 캐시 최대 정점 63개 최대 정점 45개
픽셀 파이프의 쿼드당 총 텍스처 캐시(L1 및 L2) 96kB 48kB
CPU 인터페이스 플렉시오 PCI-Express 16x
기술 28nm/40nm/65nm/90nm 110nm

기타 RSX 특징/차이는 다음과 같다.

  • 추가 셰이더 지시사항
  • 추가 텍스처 조회 논리(XDR에서 RSX 전송 데이터 지원)
  • 빠른 벡터 정규화

보도자료

소니 직원들은 플레이스테이션 매거진에 "RSX는 G70 아키텍처를 기반으로 한 엔비디아 7800과 많은 내부 작업을 공유하고 있다"[citation needed]고 말한 것으로 전해졌다.G70은 클럭 사이클당 136개의 셰이더 연산을 수행할 수 있기 때문에 RSX는 24 화소, 8 정점 파이프라인을 포함하는 G70과 동일한 수의 병렬 픽셀과 정점 쉐이더 파이프라인을 특징으로 할 것으로 기대되었다.

엔비디아 CEO인 황젠순은 2005년 E3에서 열린 소니의 프리쇼 기자회견에서 RSX가 지포스 6800 울트라보다 두 배 위력적이라고 말했다.[2]

참고 항목

참조

  1. ^ "SONY COMPUTER ENTERTAINMENT INC. TO LAUNCH ITS NEXT GENERATION COMPUTER ENTERTAINMENT SYSTEM, PLAYSTATION3 IN SPRING 2006" (Press release). Sony Computer Entertainment Inc. 2005-05-16.
  2. ^ a b "Sony Introduces PlayStation 3, to launch in 2006". AnandTech. 2005-05-16.
  3. ^ "PS3 Graphics Chip Goes 65nm in Fall". Edge Online. 2008-06-26.
  4. ^ "Sony PS3 upgraded with cooler 40-nm RSX graphics chip, profits await (updated)". Engadget. 2010-04-26.
  5. ^ Gantayat, Anoop (2006-01-30). "New PS3 tools". IGN.com. Retrieved 2006-08-28.
  6. ^ a b "Microsoft's Xbox 360, Sony's PS3 - A Hardware Discussion". Retrieved 2014-03-08.