정보 교환을 위한 타밀 스크립트 코드
Tamil Script Code for Information InterchangeTamil Script Code for Information Interchange(TSCI; 정보 교환용 타밀 스크립트 코드)는 타밀 스크립트를 나타내는 부호화 방식입니다.하위 128개의 코드 포인트는 플레인 ASCII, 상위 128개의 코드 포인트는 TSCII 고유합니다.인터넷상에서 오랜 기간 개인 동의만으로 이용되어 2007년에 [1]IANA에 등록에 성공했습니다.
TSCII는 타밀 타이프라이터의 사용과 병행하여 문자를 시각(서면) 순서로 인코딩합니다.
Unicode는 TIS-620에 의해 그랜드퍼더링된 시각적 순서가 채택된 태국어와는 대조적으로 ISCII에 이어 타밀어에도 논리적인 순서 부호화 전략을 사용하고 있습니다.
Tamil Nadu 정부는 8비트 인코딩에 대한 자체 Tab/TAM 표준을 지지하고 있으며, 다른 오래된 인코딩 방식은 여전히 WWW에서 찾아볼 수 있습니다.
Project Maduria의 무료 텍스트 모음은 TSCII 인코딩을 사용하지만, 이미 Unicode 버전을 제공하기 시작했습니다.
역사
1990년대 중반 다양한 메일링 리스트 기반 포럼 회원들은 타밀어를 위한 공통 부호화의 필요성을 느꼈다. 왜냐하면 이러한 포럼에는 여러 개의 커스텀 부호화 글꼴이 널리 퍼져 있었기 때문이다.일부 상업적 인코딩은 다른 인코딩보다 인기가 있었지만, 상충되는 상업적 이해관계 때문에 더 넓은 커뮤니티에서 받아들여지지 않았다.Unicode가 미래의 표준으로 받아들여지고 있지만, 그 당시 데스크톱 시스템의 대부분은 여전히 Tamil 언어를 위한 Unicode를 처리할 수 없었고, 중간 8비트 인코딩이 필요했습니다.
1997년에 이러한 인코딩에 대한 논의를 위한 별도의 메일링 리스트(webmasters@tamil.net)가 작성되었으며, 이 논의는 Dr.K가 작성한 이메일을 시작으로 시작되었습니다.타밀어 [2]키보드 표준화 위원회의 위원장을 맡은 타밀어 인기 작가 스자타에게 칼리아순다람이 인사했다.이 포럼은 타밀의 저명한 학자들을 포함한 전 세계의 열성적인 참가자들을 빠르게 끌어모았습니다.이러한 논의의 아카이브는 INFITT에 [3]의해 관리된다.
TSCII 공개 이후 webmasters@tamil 멤버 대부분이 참여했습니다.넷 메일링 리스트는 INFITT의 일부가 되었습니다.INFIT는 타밀 컴퓨팅의 다양한 분야에서 표준화와 지속적인 발전을 가져오는 폭넓은 이니셔티브입니다.
코드 페이지 레이아웃
TSCII | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
8배 | ௦[a] | ௧ | ஸ்ரீ | ஜ | ஷ | ஸ | ஹ | க்ஷ | ஜ் | ஷ் | ஸ் | ஹ் | க்ஷ் | ௨ | ௩ | ௪ |
9배 | ௫ | ‘ | ’ | “ | ” | ௬ | ௭ | ௮ | ௯ | ஙு | ஞு | ஙூ | ஞூ | ௰ | ௱ | ௲ |
도끼 | NBSP | ா | ி | ீ | ு | ூ | ெ | ே | ை | © | ௗ | அ | ஆ | ஈ | உ | |
Bx | ஊ | எ | ஏ | ஐ | ஒ | ஓ | ஔ | ஃ | க | ங | ச | ஞ | ட | ண | த | ந |
Cx | ப | ம | ய | ர | ல | வ | ழ | ள | ற | ன | டி | டீ | கு | சு | டு | ணு |
Dx | து | நு | பு | மு | யு | ரு | லு | வு | ழு | ளு | று | னு | கூ | சூ | டூ | ணூ |
예 | தூ | நூ | பூ | மூ | யூ | ரூ | லூ | வூ | ழூ | ளூ | றூ | னூ | க் | ங் | ச் | ஞ் |
Fx | ட் | ண் | த் | ந் | ப் | ம் | ய் | ர் | ல் | வ் | ழ் | ள் | ற் | ன் | இ |
- ^ 2005년 3월에 Unicode 버전 4.1에 추가된 U+0BE6 TAM DIGIT ZERO
변환 도구
다음과 같이 GNU iconv 도구를 사용하여 UTF-8 인코딩된 문서를 TSCII로 변환할 수 있습니다.
$ iconv -f utf-8 -t tscii hello.utf8 > hello.tscii
TSCII에서 UTF-8로의 변환은 -f 플래그와 -t 플래그를 교환함으로써 이루어집니다.
비주얼 애플리케이션
오픈 소스 프로젝트는 AnyTaFont2에서 이용할 수 있습니다.UTF8은 Isaiyini Tamil Community에서 관리합니다.
「 」를 참조해 주세요.
- TACE16(Tamil All Character Encoding)