변형 양식(유니코드)
Variant form (Unicode)변종 형태는 변종 시퀀스 메커니즘을 통해 유니코드로 인코딩되는 문자에 대한 다른 글리프(변종 선택기 문자 뒤에 변종 선택기 문자가 오는 유니코드의 시퀀스)이다.
변형 형태는 보통 그것의 기본 형태와 매우 유사한 모양과 의미를 갖는다. 이 메커니즘은 일반적으로 변형 형태를 사용할 수 없는 경우, 기본 문자를 표시해도 본문의 의미가 바뀌지 않으며, 많은 독자들이 눈에 띄지 않을 수 있는 변형 형태를 위한 것이다.
유니코드는 두 가지 유형의 변동 시퀀스를 정의한다.
- StandardedVariables에 정의된 표준화된 변동 시퀀스.txt[1]
- IVD(Ideographic Violation Database)[2][3]에 정의된 이데오그래픽 변동 시퀀스
변형 선택기 문자는 다음과 같은 여러 유니코드 블록에 위치한다.
- 가변 선택기(VS1–VS16으로 약칭된 16자
- 가변 선택기 보충판(240자 약칭 VS17–VS256)
- 몽골어(FVS1–FVS3의 약어 3자)
문맥에 따라 글립스를 대체할 수 있는 아랍어와 라틴 필기체 문자에는 변형 선택기가 필요하지 않다. 글립스는 단어의 초기 문자인지, 최종 문자인지, 내적 문자인지 또는 고립된 문자인지에 따라 서로 연결될 수 있다. 이러한 유형의 글리프 대체는 다른 저작 입력을 포함하지 않고 문자의 문맥에 의해 쉽게 처리된다. 저자는 또한 다른 방법으로 나타나지 않는 경우 대체 형태의 글리프를 강제하기 위해 조인자와 비조인자와 같은 특수 목적 문자를 사용할 수 있다. 결합은 리치 텍스트 속성으로 단순히 결합을 켜거나 끄는 것으로 글리프를 대체할 수 있는 유사한 경우다.
다른 글리프 대체의 경우, 저자의 의도는 텍스트와 암호화되어야 할 필요가 있을 수 있으며 문맥적으로 결정할 수 없다. 이는 가이지로 불리는 문자/글리프(glyph)의 경우로, 역사적으로 동일한 문자나 성(性)에 다른 글라이프(글리프)가 사용된다. 이것은 글리프와 문자를 구별하는 회색 영역 중 하나이다. 만약 가족 이름이 그것이 유래한 문자 문자와 약간 다르다면, 그것은 단순한 글리프 변종인가 아니면 문자 변종인가?
문자 대체는 예를 들어 OpenType Layout 태그와 같이 유니코드 외부에서 발생할 수 있다.[4]
표준화된 변동 시퀀스가 있는 블럭
유니코드 14.0을 기준으로, emoji/text 프레젠테이션을 위해 특별히 표준화된 변동 시퀀스는 20개 블록의 기본 문자에 대해 정의된다.[1]
- 화살표
- 기본 라틴어
- CJK 기호 및 구두점
- 딩배츠
- 이모티콘
- 동봉된 영숫자 부록
- 동봉된 영숫자
- 동봉된 CJK 편지 및 월
- 동봉된 이데오그래픽 부록
- 일반 구두점
- 기하학적 형상
- 라틴-1 보충판
- 문자 같은 기호
- 마작 타일
- 기타 기호
- 기타 기호 및 화살표
- 기타 기호 및 픽토그래프
- 기타 기술
- 보조 화살표-B
- 전송 및 지도 기호
기타 표준화된 변동 시퀀스는 다음과 같은 12개 블록에서 기본 문자로 구성된다.[1]
- CJK 통합 한자
- CJK 통합 한자 확장 A
- CJK 통합 한자 확장 B
- 절반 너비 및 전체 너비 폼
- 마니차이안
- 수리 영숫자 기호
- 수학 연산자
- 몽골어
- 미얀마
- 미얀마 확장 A
- 파그스파
- 보충수학 연산자
문자적 변동 시퀀스가 있는 블럭
2020년[update] 11월 6일 현재 8개 블록의 기본 문자에 대해 문자 변환 시퀀스가 정의된다.[2][3]
- CJK 호환성 한자
- CJK 통합 한자
- CJK 통합 한자 확장 A
- CJK 통합 한자 확장 B
- CJK 통합 한자 확장 C
- CJK 통합 한자 확장 D
- CJK 통합 한자 확장 E
- CJK 통합 한자 확장 F
참고 항목
참조
- ^ a b c "UCD: Standardized Variation Sequences". Unicode Consortium.
- ^ a b "Ideographic Variation Database". Unicode Consortium.
- ^ a b "UTS #37, Unicode Ideographic Variation Database". Unicode Consortium.
- ^ "Language system tags". Microsoft.