RTP 페이로드 형식

RTP payload formats

실시간 전송 프로토콜(RTP)은 인터넷 프로토콜(IP) 네트워크에서 디지털 미디어 스트림을 전송하기 위한 범용 데이터 형식과 네트워크 프로토콜을 지정한다. 신호 샘플링 속도, 프레임 크기 및 타이밍과 같은 미디어 인코딩의 세부사항은 RTP 페이로드 형식으로 지정된다. RTP 페이로드의 형식 매개변수는 일반적으로 SDP(Sension Description Protocol)와 전송 엔드포인트 간에 전달되지만, XMPP(Extensible Messaging and Presence Protocol)와 같은 다른 프로토콜을 사용할 수 있다.

오디오 및 비디오 페이로드 유형

RFC 3551 오디오비디오용 RTP 프로필(RTP/AVP)은 오디오 및 비디오 스트림에 대한 페이로드 형식의 기술적 매개변수를 지정한다.

표준은 또한 IANA에 새로운 페이로드 유형을 등록하는 과정을 기술한다. 추가 페이로드 형식과 페이로드 유형은 다음 사양에 정의된다.

  • 최소 제어 기능을 갖춘 오디오비디오 컨퍼런스를 위한 RFC3551, 표준 65, RTP 프로필
  • RFC 4856, 오디오비디오 회의를 위한 RTP 프로필에 페이로드 형식의 미디어 유형 등록
  • 12비트 DAT 오디오 20비트 및 24비트 선형 샘플 오디오용 RFC 3190, RTP 페이로드 형식
  • RFC 6184, H.264 비디오용 RTP 페이로드 형식
  • MPEG-4 기본 스트림 수송을 위한 RFC 3640, RTP 페이로드 형식
  • MPEG-4 오디오/비주얼 스트림을 위한 RFC 6416, RTP 페이로드 형식
  • RFC 2250, MPEG1/MPEG2 비디오용 RTP 페이로드 형식
  • RFC 7798, 고효율 비디오 부호화위한 RTP 페이로드 형식(HEVC)
  • RFC 2435, JPEG 압축 비디오용 RTP 페이로드 형식
  • RFC 4587, H.261 비디오 스트림을 위한 RTP 페이로드 형식
  • RFC 2658, PureVoice 오디오용 RTP 페이로드 형식
  • 압축되지 않은 비디오를 위한 RFC 4175, RTP 페이로드 형식
  • Opus 음성오디오 코덱을 위한 RFC 7587, RTP 페이로드 형식
  • RFC 9134, JPEG XS용 RTP 페이로드 형식

96–127 페이로드 식별자는 세션 중에 동적으로 정의된 페이로드에 사용된다. 동적으로 할당된 포트가 필요하지 않을 때는 포트 번호 5004와 5005가 프로파일 사용을 위해 등록되었지만, 동적으로 포트 번호를 할당하는 것이 좋다.

애플리케이션은 항상 PCMU(페이로드 타입 0)를 지원해야 한다. 이전에는 DVI4(페이로드 타입 5)도 권장했지만, RFC 7007에 의해 2013년에 제거되었다.

페이로드 유형(PT) 이름 유형 채널 번호 클럭 속도(Hz)[note 1] 프레임 크기(바이트) 기본 패킷 간격(ms) 설명 참조
0 PCMU 오디오의 1 8000 아무 것이나 20 ITU-T G.711 PCM μ-Law 오디오 64 kbit/s RFC 3551
1 예약됨(이전 FS-1016 CELP) 오디오의 1 8000 예약, 이전 FS-1016 CELP 오디오 4.8kbit/s RFC 3551, 이전 RFC 1890
2 예약됨(이전의 G721 또는 G726-32) 오디오의 1 8000 예약된, 이전 ITU-T G.721 ADPCM 오디오 32 kbit/s 또는 ITU-T 오디오 G.726 오디오 32 kbit/s RFC 3551, 이전 RFC 1890
3 GSM 오디오의 1 8000 20 20 유럽 GSM 레이트 오디오 13kbit/s(GSM 06.10) RFC 3551
4 G723 오디오의 1 8000 30 30 ITU-T G.723.1 오디오 RFC 3551
5 DVI4 오디오의 1 8000 아무 것이나 20 IMA ADPCM 오디오 32 kbit/s RFC 3551
6 DVI4 오디오의 1 16000 아무 것이나 20 IMA ADPCM 오디오 64 kbit/s RFC 3551
7 LPC 오디오의 1 8000 아무 것이나 20 실험 선형 예측 코딩 오디오 5.6 kbit/s RFC 3551
8 PCMA 오디오의 1 8000 아무 것이나 20 ITU-T G.711 PCM A-Law 오디오 64 kbit/s RFC 3551
9 G722 오디오의 1 8000[note 2] 아무 것이나 20 ITU-T G.722 오디오 64 kbit/s RFC 3551 - 14페이지
10 L16 오디오의 2 44100 아무 것이나 20 선형 PCM 16비트 스테레오 오디오 1411.2kbit/s,[2][3][4] 압축 해제 RFC 3551, 27페이지
11 L16 오디오의 1 44100 아무 것이나 20 선형 PCM 16비트 오디오 705.6kbit/s, 압축 해제 RFC 3551, 27페이지
12 QCEP 오디오의 1 8000 20 20 Qualcomm 코드 흥분된 선형 예측 RFC 2658, RFC 3551
13 씨엔 오디오의 1 8000 편안한 소음. G.711, G.722.1, G.722, G.726, G.727, G.728, GSM 06.10, 사이렌, RTAudio 등 코덱 자체의 일부로 편안한 소음을 지원하지 않는 오디오 코덱과 함께 사용되는 페이로드 유형. RFC 3389
14 MPA 오디오의 1, 2 90000 8–72 MPEG-1 또는 MPEG-2 오디오만 해당 RFC 3551, RFC 2250
15 G728 오디오의 1 8000 2.5 20 ITU-T G.728 오디오 16kbit/s RFC 3551
16 DVI4 오디오의 1 11025 아무 것이나 20 IMA ADPCM 오디오 44.1 kbit/s RFC 3551
17 DVI4 오디오의 1 22050 아무 것이나 20 IMA ADPCM 오디오 88.2 kbit/s RFC 3551
18 G729 오디오의 1 8000 10 20 ITU-T G.729 및 G.729a 오디오 8kbit/s; 부록 B는 다음이 아닌 한 암시되어 있다. annexb=no 매개 변수가 사용됨 RFC 3551, 20페이지, RFC 3555, 15페이지
19 예약(이전 CN) 오디오의 내성적이고 이전에 편안했던 소음 RFC 3551
25 셀비 비디오로 90000 Sun CellB 비디오[5] RFC 2029
26 JPEG 비디오로 90000 JPEG 비디오 RFC 2435
28 nv 비디오로 90000 Xerox PARC의 네트워크 비디오(nv)[6][7] RFC 3551, 32페이지
31 H261년 비디오로 90000 ITU-T H.261 비디오 RFC 4587
32 MPV 비디오로 90000 MPEG-1 및 MPEG-2 비디오 RFC 2250
33 MP2T 오디오/비디오 90000 MPEG-2 전송 스트림 RFC 2250
34 H263년 비디오로 90000 H.263 비디오, 첫 번째 버전(1996) RFC 3551, RFC 2190
72–76 내성적인 RTCP 패킷 유형 200–204는 마커 비트가 설정된 RTP 페이로드 유형 72–76과 구별할 수 없기 때문에 예약됨 RFC 3550, RFC 3551
77–95 미지정의 RTCP 패킷 유형 207(XR, Extended Reports)은 마커 비트가 설정된 RTP 페이로드 유형 79와 구분할 수 없다는 점에 유의하십시오. RFC 3551, RFC 3611
동적인 H263-1998 비디오로 90000 H.263 비디오, 두 번째 버전(1998) RFC 3551, RFC 4629, RFC 2190
동적인 H263-2000 비디오로 90000 H.263 비디오, 세 번째 버전(2000) RFC 4629
동적(또는 프로파일) H264 AVC 비디오로 90000 H.264 비디오(MPEG-4 Part 10) RFC 6184, 이전 RFC 3984
동적(또는 프로파일) H264 SVC 비디오로 90000 H.264 비디오 RFC 6190
동적(또는 프로파일) H265년 비디오로 90000 H.265 비디오(HEVC) RFC 7798
동적(또는 프로파일) 테오라 비디오로 90000 테오라 비디오 초안-초안-아프타-rtp-테오라
동적인 ILBC 오디오의 1 8000 20, 30 20, 30 인터넷 저비트율 코덱 13.33 또는 15.2 kbit/s RFC 3952
동적인 PCMA-WB 오디오의 1 16000 5 ITU-T G.711.1 A법 RFC 5391
동적인 PCMU-WB 오디오의 1 16000 5 ITU-T G.711.1 μ-법 RFC 5391
동적인 G718 오디오의 32000(초기화) 20 ITU-T G.718 초안-ietf-payload-rtp-g718
동적인 G719 오디오의 (iii) 48000 20 ITU-T G.719 RFC 5404
동적인 G7221 오디오의 16000, 32000 20 ITU-T G.722.1 및 G.722.1 부속서 C RFC 5577
동적인 G726-16 오디오의 1 8000 아무 것이나 20 ITU-T G.726 오디오 16kbit/s RFC 3551
동적인 G726-24 오디오의 1 8000 아무 것이나 20 ITU-T G.726 오디오 24kbit/s RFC 3551
동적인 G726-32 오디오의 1 8000 아무 것이나 20 ITU-T G.726 오디오 32 kbit/s RFC 3551
동적인 G726-40 오디오의 1 8000 아무 것이나 20 ITU-T G.726 오디오 40kbit/s RFC 3551
동적인 G729D 오디오의 1 8000 10 20 ITU-T G.729 부록 D RFC 3551
동적인 G729E 오디오의 1 8000 10 20 ITU-T G.729 부록 E RFC 3551
동적인 G7291 오디오의 16000 20 ITU-T G.729.1 RFC 4749
동적인 GSM-EFR 오디오의 1 8000 20 20 ITU-T GSM-EFR(GSM 06.60) RFC 3551
동적인 GSM-HR-08 오디오의 1 8000 20 ITU-T GSM-HR(GSM 06.20) RFC 5993
동적(또는 프로파일) AMR 오디오의 (iii) 8000 20 어댑티브 멀티 레이트 오디오 RFC 4867
동적(또는 프로파일) AMR-WB 오디오의 (iii) 16000 20 어댑티브 멀티 레이트 광대역 오디오(ITU-T G.722.2) RFC 4867
동적(또는 프로파일) AMR-WB+ 오디오의 1, 2 또는 생략 72000 13.3–40 확장 적응형 멀티 레이트 광대역 오디오 RFC 4352
동적(또는 프로파일) 보비스 오디오의 (iii) (iii) 보비스 오디오 RFC 5215
동적(또는 프로파일) 오푸스 오디오의 1, 2 48000[note 3] 2.5–60 20 오퍼스 오디오 RFC 7587
동적(또는 프로파일) 스피어스 오디오의 1 8000, 16000, 32000 20 스펙스 오디오 RFC 5574
동적인 mpa-pa-filency 오디오의 1, 2 90000 24–72 손실 방지 MP3 오디오 RFC 5219(기존 RFC 3119)
동적(또는 프로파일) MP4A-LATM 오디오의 9만 명 이상 MPEG-4 오디오(AAC 포함) RFC 6416(이전의 RFC 3016)
동적(또는 프로파일) MP4V-ES 비디오로 9만 명 이상 MPEG-4 비주얼 RFC 6416(이전의 RFC 3016)
동적(또는 프로파일) mpeg4-message 오디오/비디오 9만 또는 기타 MPEG-4 기본 스트림 RFC 3640
동적인 VP8 비디오로 90000 VP8 비디오 RFC 7741
동적인 VP9 비디오로 90000 VP9 비디오 초안-ietf-payload-vp9
동적인 L8 오디오의 (iii) (iii) 아무 것이나 20 128개의 오프셋이 있는 선형 PCM 8비트 오디오 RFC 3551 섹션 4.5.10 및 표 5
동적인 DAT12 오디오의 (iii) (iii) 아무 것이나 20 (L16과 유사) IEC 61119 12비트 비선형 오디오 RFC 3190 섹션 3
동적인 L16 오디오의 (iii) (iii) 아무 것이나 20 선형 PCM 16비트 오디오 RFC 3551 섹션 4.5.11, RFC 2586
동적인 L20 오디오의 (iii) (iii) 아무 것이나 20 (L16과 유사) 선형 PCM 20비트 오디오 RFC 3190 섹션 4
동적인 L24 오디오의 (iii) (iii) 아무 것이나 20 (L16과 유사) 선형 PCM 24비트 오디오 RFC 3190 섹션 4
동적인 날염의 비디오로 90000 압축되지 않은 비디오 RFC 4175
동적인 ac3 오디오의 (iii) 32000, 44100, 48000 돌비 AC-3 오디오 RFC 4184
동적인 eac3 오디오의 (iii) 32000, 44100, 48000 향상된 AC-3 오디오 RFC 4598
동적인 t140 문자 메시지를 보내다 1000 IP를 통한 텍스트 RFC 4103
동적인 EVRC
EVRC0
EVRC1
오디오의 8000 EVRC 오디오 RFC 4788
동적인 EVRCB
EVRCB0
EVRCB1
오디오의 8000 EVRC-B 오디오 RFC 4788
동적인 EVRCWB
EVRCWB0
EVRCWB1
오디오의 16000 EVRC-WB 오디오 RFC 5188
동적인 jpeg2000 비디오로 90000 JPEG 2000 비디오 RFC 5371
동적인 우엠클립 오디오의 8000, 16000 UEMCLIP 오디오 RFC 5686
동적인 ATRAC3 오디오의 44100 ATRAC3 오디오 RFC 5584
동적인 ATRAC-X 오디오의 44100, 48000 ATRAC3+ 오디오 RFC 5584
동적인 ATARAC-Advanced-Lossless 오디오의 (iii) ATRAC 고급 무손실 오디오 RFC 5584
동적인 DV 비디오로 90000 DV 비디오 RFC 6469(이전 RFC 3189)
동적인 BT656 비디오로 ITU-R BT.656 비디오 RFC 3555
동적인 BMPEG 비디오로 번들 MPEG-2 비디오 RFC 2343
동적인 SMPTE292M 비디오로 SMPTE 292M 비디오 RFC 3497
동적인 빨간색 오디오의 중복 오디오 데이터 RFC 2198
동적인 VDVI 오디오의 가변 속도 DVI4 오디오 RFC 3551
동적인 MP1S 비디오로 MPEG-1 시스템 스트림 비디오 RFC 2250
동적인 MP2P 비디오로 MPEG-2 프로그램 스트림 비디오 RFC 2250
동적인 음을 맞추다 오디오의 8000(기본값) 음을 맞추다 RFC 4733
동적인 전화 이벤트를 하다 오디오의 8000(기본값) DTMF RFC 4733
동적인 aptx 오디오의 2 – 6 (샘플링 속도에 따라 다름) 4000㎛ 샘플링 레이트 4[note 4] aptX 오디오 RFC 7310
동적인 jxsv 비디오로 90000 JPEG XS 비디오 RFC 9134
  1. ^ "클록 속도"는 RTP 헤더에 있는 타임스탬프가 증가되는 속도로 코덱의 샘플링 속도와 같을 필요가 없다. 예를 들어 비디오 코덱은 일반적으로 9만 개의 클럭 속도를 사용하므로 비디오 샘플링 속도가 초당 1-60개의 샘플 범위에 있더라도 프레임을 RTCP NTP 타임스탬프와 더 정확하게 정렬할 수 있다.
  2. ^ G.722의 샘플링 속도는 16000이지만 RFC 1890과 역호환성을 유지하기 위해 8000으로 이 값을 잘못 사용했다.[1]
  3. ^ 오퍼스는 샘플링 속도를 동적으로 변경할 수 있기 때문에 코덱을 더 낮은 샘플링 속도로 작동하더라도 클럭 속도는 48000으로 고정된다.maxplaybackrate 그리고 sprop-maxcapturerate SDP의 매개변수를 사용하여 인코딩/디코딩에 대한 최대 샘플링 속도에 대한 힌트/선호를 표시할 수 있다.
  4. ^ aptX의 경우, 패킷화 간격은 정수의 샘플 수를 포함할 수 있는 가장 가까운 패킷 간격까지 반올림해야 한다. 따라서 11025, 22050 또는 44100의 샘플링 속도에서 "4"의 패킷화 속도는 3.99로 반올림된다.

문자 메시지 페이로드

  • RFC 4103, 문자 대화를 위한 RTP 페이로드 형식

MIDI 페이로드

참고 항목

참조

  1. ^ RFC 3551, 최소 제어를 갖춘 오디오 비디오 컨퍼런스를 위한 RTP 프로필, H. Schulzrinne, S. Casner, The Internet Society(2003년 7월)
  2. ^ "RFC 2586 - The Audio/L16 MIME content type". May 1999. Retrieved 2010-03-16.
  3. ^ "RFC 3108 - Conventions for the use of the Session Description Protocol (SDP) for ATM Bearer Connections". May 2001. Retrieved 2010-03-16.
  4. ^ "RFC 4856 - Media Type Registration of Payload Formats in the RTP Profile for Audio and Video Conferences - Registration of Media Type audio/L16". March 2007. Retrieved 2010-03-16.
  5. ^ XIL 프로그래머 가이드 22장 "CellB 코덱" 1997년 8월. 2014-07-19년에 검색됨.
  6. ^ nv - 2009-07-09년 헤닝 슐즈린의 웹사이트인 The University of Toronto의 웹사이트인 Network Video에 있는 nv - 네트워크 비디오.
  7. ^ 소스코드의 론 프레데릭 기투브

외부 링크