타밀 문자
Tamil script타밀어 தமிழ் | |
---|---|
![]() | |
스크립트 종류 | |
기간 | c. 400 CE – 현재[1][2] |
방향 | 좌우의 |
언어들 | 타밀어 카니카란 바다가 이룰라 파니야 사우라슈트라 주 |
관련 스크립트 | |
모계 | |
자매결연제도 | 그란타, 올드몬, 크메르, 참, 카위 |
ISO 15924 | |
ISO 15924 | 탐(346), 타밀어 |
유니코드 | |
유니코드 별칭 | 타밀어 |
| |
[a] 브라흐미 문자의 가정된 셈족 기원은 논쟁 중입니다. | |
브라만 문자 |
---|
브라만 문자와 그 후손들. |
타밀어 [5]문자는 인도, 스리랑카, 말레이시아, 싱가포르, 인도네시아 등 타밀어 사용자들이 타밀어를 쓸 때 사용하는 i 문자입니다.그것은 인도 공화국의 공식 대본 중 하나입니다.사우라슈트라어, 바다가어, 이루라어, 파니야어와 같은 특정 소수 언어들도 타밀 [6]문자로 쓰여져 있습니다.
특성.

타밀 문자에는 12개의 모음(உயிரெழுத்து, ḻ, ஃ, ḻ, ḻ, மெய்யெழுத்து)과 18개의 자음(ஆய்த, எழுத்து, y, ā)이 있습니다.ஃ는 "அக்கு", akku라고 불리며 타밀어 철자법에서 자음도 모음도 아닌 것으로 분류됩니다.하지만 모음집 끝에 나열되어 있습니다.대본은 알파벳이 아닌 음절문자입니다.따라서 완전한 문자는 자음과 모음, 음소 자음 또는 모음만으로 총 247개의 조합(உயிர்மெய்யெழுத்து, yyirmeyyeḻuttu, "영혼-몸 글자")에 대해 각각 독립된 형태의 31개의 문자와 216개의 조합 문자로 구성됩니다.조합문자는 자음에 모음표기를 붙여서 만들어집니다.어떤 모음들은 자음의 기본 모양을 그 모음만의 방식으로 변형할 것을 요구합니다.어떤 것들은 자음에 모음별 접미사를 붙여서 쓰지만, 어떤 것들은 접미사를 붙여야 하고, 또 어떤 것들은 자음에 접미사와 접미사를 붙여야 합니다.모든 경우에 모음 마커는 모음의 독립형 문자와 다릅니다.
타밀어 문자는 왼쪽에서 오른쪽으로 쓰여 있습니다.
역사


타밀 문자는 다른 브라흐미 문자와 마찬가지로 원래의 브라흐미 [8]문자에서 진화한 것으로 생각됩니다.타밀어 문자로 받아들여지는 가장 초기의 비문은 아쇼칸 시대까지 거슬러 올라갑니다.이러한 비문이 사용하는 문자는 흔히 타밀어 브라흐미 문자 또는 타밀어 문자로 알려져 있으며 표준 아쇼칸 브라흐미 문자와는 여러 면에서 다릅니다.예를 들어, 초기 타밀어-브라흐미는 아쇼칸 브라흐미와 달리, 순수 자음(이 예에서는 m)과 고유모음(이 예에서는 ma)을 구별하는 체계를 가지고 있었습니다.또한 Iravatham Mahadevan에 따르면 초기 타밀어 브라흐미는 약간 다른 모음 표지를 사용했으며 산스크리트어에서 발견되지 않는 문자를 나타내기 위해 추가 문자를 사용했으며 유성 자음과 [8]격음과 같은 타밀어에 존재하지 않는 소리에 대해 생략했습니다.2세기의 비문들은 고대 타밀어 문법인 톨카피얌에 기술된 문자 체계와 실질적으로 유사한 타밀어-브라흐미의 후기 형태를 사용합니다.특히, 그들은 고유의 모음을 억제하기 위해 푸ḷḷi를 사용했습니다.타밀 문자는 그 후 좀 더 둥근 형태로 발전했고 5세기 또는 6세기에 이르러서는 초기 바세우투(vaṭṭeḻutu)라는 형태에 이르렀습니다.
그러나 현대의 타밀 문자는 [11]그 문자에서 내려온 것이 아닙니다.4세기에 [12]팔라바 왕조는 타밀어를 위한 팔라바 문자라는 새로운 문자를 만들었고,[4] 산스크리트어를 쓸 수 없는 소리를 위해 바예우투 문자를 추가했습니다.그란사 알파벳과 유사하게 새로운 문자(촐라-팔라바 문자, 현대 타밀 문자로 진화)가 팔라바와 촐라 지역에서 다시 등장했는데, 이 문자는 그란사와 같은 문자 개발과 유사하지만, 모양이 많이 줄어들었고, 타밀어가 아닌 사람들을 능가하지 않았습니다.8세기에 이르러 새로운 문자들은 타밀어를 사용하는 지역의 북쪽에 위치한 팔라바와 촐라 왕국의 바에우투를 대체했습니다.그러나 바셰우투는 11세기까지 타밀어를 사용하는 지역의 남부 지역인 체라 왕국과 판디아 왕국에서 계속 사용되었으며, 판디아 왕국은 잠시 [3][4]팔라바스의 봉건 상태에서 상속받은 촐라족에 의해 정복되었습니다.
팔라바 왕국의 멸망과 함께 촐라 왕조는 촐라-팔라바 문자를 사실상의 문자로 추진했습니다.이후 몇 세기 동안 촐라-팔라바 문자는 현대 타밀 문자로 발전했습니다.그란타 문자와 그 모체 문자는 타밀 문자에 특히 영향을 미쳤습니다.야자잎을 글쓰기의 주요 매개체로 사용한 것이 대본의 변화를 가져온 것입니다.필경사는 구멍이 뚫린 잎이 빨리 찢어지고 부패하기 쉽기 때문에 글씨를 쓸 때 필경사가 필경사로 잎을 뚫지 않도록 주의해야 했습니다.이에 따라 순자음을 구별하기 위한 푸의 사용이 드물어졌는데, 보통 순자음은 고유의 모음이 있는 것처럼 표기됩니다.마찬가지로 모음 표식자(ஃ式者)는 다음과 같이 말했습니다.타밀어: குற்றியலுகரம், 로마자: kuṟṟiyal-ukaram, 불이 켜짐. 일부 단어의 끝과 특정 합성어의 중간 위치에서 발생하는 반음반 u인 '짧은 'u'-loud'도 사용이 중단되어 단순 u(ு)의 마커로 대체되었습니다.푸ḷḷ이(ஂṟṟ)는 인쇄술이 도입될 때까지 완전히 다시 나타나지 않았지만, 비록 그 사용이 특정 문법 개념 단어에 남아 있지만, 그 소리 자체는 여전히 존재하고 타밀 운율에서 중요한 역할을 하는 반면, 쿠ஃ이얄-우카람() (-)은 이러한 목적으로 다시는 사용되지 않았습니다.
글자의 형태는 19세기에 문자를 타이핑하기 쉽도록 단순화되었습니다.20세기에는 특수 마커와 대부분의 불규칙한 형태를 제거함으로써 자음과 함께 사용되는 모음 마커를 정규화하는 일련의 개혁에서 문자가 더욱 단순화되었습니다.
다른 Indic 스크립트와의 관계
타밀 문자는 다른 브라흐미 문자와 여러 가지 면에서 차이가 있습니다.다른 모든 브라흐마 문자와 달리 유성음이나 흡인음은 정기적으로 나타나지 않는데, 이는 유성음이나 흡인음이 타밀어의 음소가 아니기 때문입니다. 비록 유성음과 마찰음의 정지음이 구어 타밀어에 나타나기는 하지만 말입니다.따라서 문자 க் k는 예를 들어 /k/를 나타내지만 타밀어 문법의 규칙에 따라 [g] 또는 [x]로 발음할 수도 있습니다.타밀 문자가 산스크리트어나 다른 언어를 쓸 때 이러한 소리에 대해 별도의 문자 집합이 나타납니다.
또한 다른 브라흐미 문자와 달리 타밀 문자는 타밀어에서 다른 인도어보다 훨씬 덜 빈번하게 사용되는 자음을 나타내기 위해 타이포그래피 문자를 거의 사용하지 않습니다.그것들이 발생하는 곳에서, 결자음은 첫 번째 자음에 해당하는 글자를 쓰고, 고유의 모음을 억제하기 위해 푸ḷḷi를 첨가한 다음, 두 번째 자음에 해당하는 글자를 쓰는 것입니다.몇 가지 예외가 있는데, 바로 ṣ kīa와 ஶ்ரீrś입니다.
ISO 15919는 타밀어 및 기타 Indic 스크립트를 라틴 문자로 번역하기 위한 국제 표준입니다.그것은 훨씬 더 큰 브라흐마 자음과 모음 집합을 라틴 문자에 매핑하기 위해 분음법을 사용합니다.
편지들


기본자음
자음은 "몸" (mei) 문자라고 불립니다.자음은 발리남(경자음), 멜리남(연자음, 모든 비음 포함), 이타이남(중자음)의 세 가지로 분류됩니다.
단어의 형성을 위한 어휘 규칙이 있습니다.톨카피얌은 그러한 규칙들을 설명합니다.몇 가지 예를 들자면, 단어는 특정한 자음으로 끝날 수 없고 r-, l-, ḻ-를 포함한 일부 자음으로 시작할 수 없습니다. 타밀어에는 6개의 비음이 있습니다: 벨러 비음 ங், 구개 비음 ஞ், 후개 비음 ண், 치과 비음 ந், 양악 비음 ம், 치조 비음 ன், 치조 비음 ன்.
타밀어의 알파벳 순서(엄격하게 아부기다)는 브라흐미 문자의 공통된 기원을 반영하면서 위치와 언어학적으로 인근 언어의 순서와 밀접하게 일치합니다.
타밀어에는 18개의 자음이 있습니다 - 메이엘루투칼.전통적인 문법학자들은 이 18개를 각각 6자씩 3개의 그룹으로 분류했습니다.이 분류는 조음 방법에 따라 이루어지며 따라서 이 글자들의 특성에 따라 이루어집니다.발리남(하드그룹,) 멜리남(소프트그룹) 이다이이남(미드그룹).모든 자음은 고립되어 있을 때 반 단위(Mattirai) 시간 길이로 발음됩니다(모음과 결합된 자음은 모음의 시간 길이와 함께 발음됩니다).
자음 | ISO 15919 | 카테고리 | IPA |
---|---|---|---|
க் | k | 발리남 | /k/ |
ங் | ṅ | 멜리남 | /margin/ |
ச் | c | 발리남 | /t͡ʃ, s/ |
ஞ் | ñ | 멜리남 | /margin/ |
ட் | ṭ | 발리남 | /margin/ |
ண் | ṇ | 멜리남 | /margin/ |
த் | t | 발리남 | /t̪/ |
ந் | n | 멜리남 | /n̪/ |
ப் | p | 발리남 | /p/ |
ம் | m | 멜리남 | /m/ |
ய் | y | 이다이야이남 | /j/ |
ர் | r | 이다이야이남 | /margin/ |
ல் | l | 이다이야이남 | /l/ |
வ் | v | 이다이야이남 | /margin/ |
ழ் | ḻ | 이다이야이남 | /margin/ |
ள் | ḷ | 이다이야이남 | /margin/ |
ற் | ṟ | 발리남 | /r/ |
ன் | ṉ | 멜리남 | [n] |
타밀어에 쓰이는 여분의 자음
타밀어의 연설은 톨카피얌 분류에 속하지 않는 많은 음소들을 포함하고 있습니다.그란타라고 알려진 이 소리들을 쓰는 데 사용되는 글자들은 타밀어의 일부로 사용됩니다.이것들은 초등학교에서부터 가르치고 TACE16(Tamil All Character Encoding)에 통합되어 있습니다.
자음 | ISO 15919 | IPA |
---|---|---|
ஜ் | j | /d͡ʒ/ |
ஶ் | ś | /margin/ |
ஷ் | ṣ | /margin/ |
ஸ் | s | /s/ |
ஹ் | h | /h/ |
க்ஷ் | kṣ | /kʂ/ |
데바나가리에는 श्री에 해당하는 화합물 ஶ்ரீ(śrī)도 있습니다.
최근에는 ஃ를 가진 자음의 조합이 일반적으로 외국어의 음소, 특히 이슬람 문자와 기독교 문자를 쓸 때 사용됩니다.예를 들어 = அசிஃப், azarrut̠n அஃஜாருதீன் = கெங்கிஸ், 징기스칸 = ஃகான் ī ஃகான் if.
타밀어 번안 | ISO 15919 | 페르소아랍어 | 데바나가리 |
---|---|---|---|
ஃஜ | 자 | ز | ज़ |
ஃக | xa | خ | ख़ |
ஃப | fa의 | ف | फ़ |
ஃவ | 와 | و[n1] | व़ |
ஃஷ | ◦아 | ژ | झ़ |
ஃஸ | ̤a | ص | स़ |
ஃஹ | h̤ | ح | ह़ |
ஃத | t̤ | ط | त़ |
바다가어를 쓸 때는 누크타와 같은 격음 부호를 사용하고, 이룰라어는 이중점 누크타를 사용하여 [15]음을 전사합니다.
또한 첨자를 통해 유성 자음과 무성 자음을 구별하려는 노력이 있어 왔습니다 – 2, 3, 4는 각각 비성성격, 유성, 유성을 의미합니다.이것은 아래 [16][17]표와 같이 산스크리트어-타밀어 책에 산스크리트어 단어를 표기하는 데 사용되었습니다.
க 카 | க₂ 카 | க₃ 가 | க₄ 가 |
ச ca | ச₂ 차 | ஜ 네. | ஜ₂ 짜 |
ட ◦아 | ட₂ ṭ하 | ட₃ ◦아 | ட₄ ḍ하 |
த 타 | த₂ 타 | த₃ 다 | த₄ ha |
ப 파 | ப₂ 파 | ப₃ 바 | ப₄ 바하 |
유니코드 표준은 ப² pa, ப³ ba, ப⁴ bha와 같이 같은 목적으로 위첨자 숫자를 사용합니다.
모음.
모음은 또한 '생명' 또는 '영혼' 문자라고도 불립니다.자음(mei, '몸체' 문자라고 함)과 함께, 그것들은 '살아있는' 또는 '신체화된' 문자(uyir mei, 즉 '몸체'와 '영혼'을 둘 다 가진 문자)라고 불리는 복합적이고 삼단음절적인(abugida) 문자를 형성합니다.
타밀모음은 단모음과 장모음(각 유형 5개)과 두 개의 이중모음으로 나뉩니다.
독립적인 | 모음 부호 | ISO 15919 | IPA |
---|---|---|---|
அ | — | a | /margin/ |
ஆ | ா | ā | /aː/ |
இ | ி | i | /i/ |
ஈ | ீ | ī | /iː/ |
உ | ு | u | /u/ |
ஊ | ூ | 우 | /uː/ |
எ | ெ | e | /e/ |
ஏ | ே | ē | /eː/ |
ஐ | ை | ai | /ɐ̯̯/ |
ஒ | ொ | o | /o/ |
ஓ | ோ | o | /oː/ |
ஔ | ௌ | au | /ɐu̯/ |
컴파운드폼
자음 'k'를 예로 들면,
형성 | 컴파운드폼 | ISO 15919 | IPA |
---|---|---|---|
க் + அ | க | 카 | /kɐ/ |
க் + ஆ | கா | 카 | /kaː/ |
க் + இ | கி | 기 | /ki/ |
க் + ஈ | கீ | kī | /kiː/ |
க் + உ | கு | 쿠 | /쿠/ |
க் + ஊ | கூ | 쿠 | /kuː/ |
க் + எ | கெ | 키 | /ke/ |
க் + ஏ | கே | kē | /keː/ |
க் + ஐ | கை | 카이 | /kɐi̯/ |
க் + ஒ | கொ | 코 | /ko/ |
க் + ஓ | கோ | 코 | /koː/ |
க் + ஔ | கௌ | 카우 | /kɐu̯/ |
세 개의 점으로 표현되는 특별한 글자 ஃ는 ḵḻtu 또는 aḵ라고 불립니다.원래는 거의 모든 현대 드라비다어에서 소실된 드라비다어 음 ḥ의 고대 타밀어 보존을 나타냈으며, 타밀어에서는 전통적으로 순수 문법적 기능을 수행하지만, 현대에는 외래어 음을 나타내는 분음 부호로 사용되기 시작했습니다.예를 들어, ஃப는 타밀어에서 찾을 수 없는 영어 소리 f에 사용됩니다.그것은 또한 - 타밀어: குற்றியலுகரம், 로마자: kuṟṟiyal-ukaram, litted라고 불리는 짧은 u를 발음하는 규칙으로서 고유한 동의어-보웰루로 끝나는 단어의 주요 쓰기 매체가 되기 전에 사용되었습니다. '짧은 'u'자'입니다.கு, சு, டு, து, று, பு, று, , 등의 자음들이 이러한 행동을 보였습니다.예를 들어, 현대와 같이 아무런 표식 없이 쓰는 대신 (타밀어: அது, 로마자: Atu), 앞의 ஃ, 타밀어: அஃது, 로마자: 아투.
또 다른 고대 타밀 문자인 ஂ는 작은 움푹 파인 원으로 대표되며 아우바라라고 불리는 것입니다.전통적으로 자음 앞에서는 동형 비음으로 사용되었고, 문맥에 따라 단어 끝에서는 양막 비음(m) 또는 치조 비음(n)으로 사용되었습니다.
긴 모음은 짧은 모음보다 약 두 배나 더 깁니다.이중모음은 일반적으로 짧은 모음보다 1.5배 정도 길게 발음되지만, 일부 문법 문서에서는 긴 모음과 함께 배치합니다.
복합형에서 볼 수 있듯이, 모음 부호는 자음의 오른쪽, 왼쪽, 양쪽에 추가할 수 있습니다.또한 결찰을 형성할 수도 있습니다.이러한 규칙은 진화하고 있으며 오래된 사용은 현대 사용보다 더 많은 연결을 가지고 있습니다.이 페이지에서 실제로 볼 수 있는 내용은 글꼴 선택에 따라 다릅니다. 예를 들어 Code2000은 Latha보다 더 많은 연결을 표시합니다.
문자 개혁을 지지하는 사람들은 모든 연결고리를 제거하고 모든 모음 기호가 오른쪽에 나타나도록 하고 싶어합니다.
유니코드는 문자를 논리적 순서(항상 자음이 먼저)로 인코딩하는 반면, 기존의 8비트 인코딩(TSCII 등)은 쓰기 순서를 선호합니다.따라서 한 인코딩에서 다른 인코딩으로 변환할 때 순서를 바꾸어야 합니다. 한 코드 포인트 집합을 다른 인코딩에 매핑하는 것만으로는 충분하지 않습니다.
타밀 문자 복합표
다음 표는 상단에 모음(uyir 또는 생명) 문자와 측면을 따라 자음(mei 또는 body) 문자를 나열하며, 이 조합은 모든 타밀어 합성어(uyirmei) 문자를 제공합니다.
톨카피얌 자음 | 모음. | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
∅ a | ா ā | ி i | ீ ī | ு u | ூ 우 | ெ e | ே ē | ை ai | ொ o | ோ o | ௌ au | ||
∅ (독립) | அ | ஆ | இ | ஈ | உ | ஊ | எ | ஏ | ஐ | ஒ | ஓ | ஔ | |
க் | k | க | கா | கி | கீ | கு | கூ | கெ | கே | கை | கொ | கோ | கௌ |
ங் | ṅ | ங | ஙா | ஙி | ஙீ | ஙு | ஙூ | ஙெ | ஙே | ஙை | ஙொ | ஙோ | ஙௌ |
ச் | c | ச | சா | சி | சீ | சு | சூ | செ | சே | சை | சொ | சோ | சௌ |
ஞ் | ñ | ஞ | ஞா | ஞி | ஞீ | ஞு | ஞூ | ஞெ | ஞே | ஞை | ஞொ | ஞோ | ஞௌ |
ட் | ṭ | ட | டா | டி | டீ | டு | டூ | டெ | டே | டை | டொ | டோ | டௌ |
ண் | ṇ | ண | ணா | ணி | ணீ | ணு | ணூ | ணெ | ணே | ணை | ணொ | ணோ | ணௌ |
த் | t | த | தா | தி | தீ | து | தூ | தெ | தே | தை | தொ | தோ | தௌ |
ந் | n | ந | நா | நி | நீ | நு | நூ | நெ | நே | நை | நொ | நோ | நௌ |
ப் | p | ப | பா | பி | பீ | பு | பூ | பெ | பே | பை | பொ | போ | பௌ |
ம் | m | ம | மா | மி | மீ | மு | மூ | மெ | மே | மை | மொ | மோ | மௌ |
ய் | y | ய | யா | யி | யீ | யு | யூ | யெ | யே | யை | யொ | யோ | யௌ |
ர் | r | ர | ரா | ரி | ரீ | ரு | ரூ | ரெ | ரே | ரை | ரொ | ரோ | ரௌ |
ல் | l | ல | லா | லி | லீ | லு | லூ | லெ | லே | லை | லொ | லோ | லௌ |
வ் | v | வ | வா | வி | வீ | வு | வூ | வெ | வே | வை | வொ | வோ | வௌ |
ழ் | ḻ | ழ | ழா | ழி | ழீ | ழு | ழூ | ழெ | ழே | ழை | ழொ | ழோ | ழௌ |
ள் | ḷ | ள | ளா | ளி | ளீ | ளு | ளூ | ளெ | ளே | ளை | ளொ | ளோ | ளௌ |
ற் | ṟ | ற | றா | றி | றீ | று | றூ | றெ | றே | றை | றொ | றோ | றௌ |
ன் | ṉ | ன | னா | னி | னீ | னு | னூ | னெ | னே | னை | னொ | னோ | னௌ |
그란타 자음 | 모음. | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
∅ a | ா ā | ி i | ீ ī | ு u | ூ 우 | ெ e | ே ē | ை ai | ொ o | ோ o | ௌ au | ||
ஶ் | ś | ஶ | ஶா | ஶி | ஶீ | ஶு | ஶூ | ஶெ | ஶே | ஶை | ஶொ | ஶோ | ஶௌ |
ஜ் | j | ஜ | ஜா | ஜி | ஜீ | ஜு | ஜூ | ஜெ | ஜே | ஜை | ஜொ | ஜோ | ஜௌ |
ஷ் | ṣ | ஷ | ஷா | ஷி | ஷீ | ஷு | ஷூ | ஷெ | ஷே | ஷை | ஷொ | ஷோ | ஷௌ |
ஸ் | s | ஸ | ஸா | ஸி | ஸீ | ஸு | ஸூ | ஸெ | ஸே | ஸை | ஸொ | ஸோ | ஸௌ |
ஹ் | h | ஹ | ஹா | ஹி | ஹீ | ஹு | ஹூ | ஹெ | ஹே | ஹை | ஹொ | ஹோ | ஹௌ |
க்ஷ் | kṣ | க்ஷ | க்ஷா | க்ஷி | க்ஷீ | க்ஷு | க்ஷூ | க்ஷெ | க்ஷே | க்ஷை | க்ஷொ | க்ஷோ | க்ஷௌ |
기입순서
편지 | 애니매이션 |
---|---|
◦ (a) | ![]() |
◦ (ஆ) | ![]() |
◦ (i) | ![]() |
◦ (ī) | ![]() |
◦ (u) | ![]() |
◦ (u) | ![]() |
◦ (e) | ![]() |
◦ (ē) | ![]() |
◦ (ai) | ![]() |
◦ (o) | ![]() |
◦ (o) | ![]() |
◦ (au) | ![]() |
◦ (a)* | ![]() |
*ஃ는 aytam이지만 전통적으로 모음 문자와 함께 그룹을 짓습니다. |
편지 | 애니매이션 |
---|---|
◦ (k) | ![]() |
◦ (ṅ) | ![]() |
◦ (c) | ![]() |
◦ (ஞ்) | ![]() |
◦ (ṭ) | ![]() |
◦ (ṇ) | ![]() |
◦ (t) | ![]() |
◦ (n) | ![]() |
◦ (p) | ![]() |
◦ (m) | ![]() |
◦ (y) | ![]() |
◦ (r) | ![]() |
◦ (l) | ![]() |
◦ (v) | ![]() |
◦ (ḻ) | ![]() |
◦ (ḷ) | ![]() |
◦ (ṟ) | ![]() |
◦ (ṉ) | ![]() |
숫자와 기호
타밀어는 일반적인 숫자(0부터 9까지) 외에도 10, 100, 1000을 나타내는 숫자도 가지고 있습니다.분수 및 기타 숫자 기반 개념에 대한 기호도 [19]찾아볼 수 있습니다.
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 100 | 1000 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
௦ | ௧ | ௨ | ௩ | ௪ | ௫ | ௬ | ௭ | ௮ | ௯ | ௰ | ௱ | ௲ |
낮에 | 달 | 연도 | 차변 | 신용 거래 | 위와 같이 | 루피 | 수적인 | 시간을 | 양 |
---|---|---|---|---|---|---|---|---|---|
௳ | ௴ | ௵ | ௶ | ௷ | ௸ | ௹ | ௺ | ள | வ |
유니코드
타밀 문자는 1991년 10월 버전 1.0.0이 출시되면서 유니코드 표준에 추가되었습니다.타밀어의 유니코드 블록은 U+0B80입니다.–U+0BFF.회색 영역은 할당되지 않은 코드 포인트를 나타냅니다.할당되지 않은 대부분의 코드 포인트는 타밀 문자에 존재하지 않는 음소에 해당하는 다른 남아시아 문자 블록에 할당된 문자와 동일한 상대적 위치에 있기 때문에 예약된 것으로 지정됩니다.
그란타 문자를 타밀어로 통일하려는 노력이 [16][20]이루어졌지만,[21][22] 그 제안들은 일부 사람들의 불만을 촉발시켰습니다.결국, 관련된 민감도를 고려하여 [23]두 스크립트는 숫자를 제외하고 독립적으로 인코딩되어야 한다고 판단하였습니다.
타밀어[1][2] 유니코드 컨소시엄 공식 코드 차트(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+0B8x | ஂ | ஃ | அ | ஆ | இ | ஈ | உ | ஊ | எ | ஏ | ||||||
U+0B9x | ஐ | ஒ | ஓ | ஔ | க | ங | ச | ஜ | ஞ | ட | ||||||
U+0BAx | ண | த | ந | ன | ப | ம | ய | |||||||||
U+0BBx | ர | ற | ல | ள | ழ | வ | ஶ | ஷ | ஸ | ஹ | ா | ி | ||||
U+0BCx | ீ | ு | ூ | ெ | ே | ை | ொ | ோ | ௌ | ் | ||||||
U+0BDx | ௐ | ௗ | ||||||||||||||
U+0BEX | ௦ | ௧ | ௨ | ௩ | ௪ | ௫ | ௬ | ௭ | ௮ | ௯ | ||||||
U+0BFx | ௰ | ௱ | ௲ | ௳ | ௴ | ௵ | ௶ | ௷ | ௸ | ௹ | ௺ | |||||
메모들
|
전통적인 회계 관행에서 분수 값에 사용되는 문자를 인코딩하기 위한 제안서가 [24]제출되었습니다.스리랑카의 ICTA에 의해 반대되었지만,[25] 타밀나두[26] 정부가 이 제안을 인정하여 2019년 3월 버전 12.0이 출시되면서 유니코드 표준에 추가되었습니다.타밀어 보충판의 유니코드 블록은 U+11FC0입니다.–U+11FF:
타밀어보충[1][2] 유니코드 컨소시엄 공식 코드 차트(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+11FCX | 𑿀 | 𑿁 | 𑿂 | 𑿃 | 𑿄 | 𑿅 | 𑿆 | 𑿇 | 𑿈 | 𑿉 | 𑿊 | 𑿋 | 𑿌 | 𑿍 | 𑿎 | 𑿏 |
U+11FDx | 𑿐 | 𑿑 | 𑿒 | 𑿓 | 𑿔 | 𑿕 | 𑿖 | 𑿗 | 𑿘 | 𑿙 | 𑿚 | 𑿛 | 𑿜 | 𑿝 | 𑿞 | 𑿟 |
U+11FEX | 𑿠 | 𑿡 | 𑿢 | 𑿣 | 𑿤 | 𑿥 | 𑿦 | 𑿧 | 𑿨 | 𑿩 | 𑿪 | 𑿫 | 𑿬 | 𑿭 | 𑿮 | 𑿯 |
U+11FFX | 𑿰 | 𑿱 | 𑿿 | |||||||||||||
메모들 |
삼단음표
유니코드의 다른 남아시아 문자와 마찬가지로 타밀어 부호화는 원래 ISCII 표준에서 유래했습니다.ISCII와 유니코드 모두 타밀어를 아부기다로 인코딩합니다.아부기다에서 각 기본 문자는 자음과 기본 모음을 나타냅니다.모음이 다른 자음이나 맨자음은 기본 문자에 수식어 문자를 붙여서 표현합니다.유사한 음소를 나타내는 각 코드 포인트는 타밀어를 포함한 유니코드의 각 남아시아 스크립트 블록에서 동일한 상대 위치로 인코딩됩니다.유니코드는 타밀어를 아부기다(abugida)로 표현하기 때문에 아래 유니코드 타밀어 음절에서 볼 수 있듯이 타밀어의 순자음(연관모음이 없는 자음)과 음절은 여러 유니코드 코드 포인트를 조합하여 나타낼 수 있습니다.유니코드 5.1에서는 모든 타밀어 자음과 음절에 대해 명명된 순서가 추가되었습니다.
유니코드 5.1에는 타밀어 연결 SRI(śrī), ஶ்ரீ(śa)를 사용하여 작성된 ஶ(ஶ்ரீr),)이 시퀀스의 이름은 TAMIL SULI이며 유니코드 시퀀스 U+0BB6 U+0BCD U+0BB0 U+0BC0로 구성되어 있습니다.ஸ(sa)를 사용하여 유니코드 시퀀스 U+0BB8 U+0BCD U+0BB0 U+0BC0로 구성된 동일한 연결 ஸ்ரீ를 작성할 수도 있지만 유니코드 표준에서는 이를 사용하지 않습니다.
자음 | 모음. | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
அ 0B85 | ஆ 0B86 | இ 0B87 | ஈ 0B88 | உ 0B89 | ஊ 0B8A | எ 0B8E | ஏ 0B8F | ஐ 0B90 | ஒ 0B92 | ஓ 0B93 | ஔ 0B94 | |
க் 0B95 0BCD | க 0B95 | கா 0B95 0BBE | கி 0B95 0BBF | கீ 0B95 0BC0 | கு 0B95 0BC1 | கூ 0B95 0BC2 | கெ 0B95 0BC6 | கே 0B95 0BC7 | கை 0B95 0BC8 | கொ 0B95 0BCA | கோ 0B95 0BCB | கௌ 0B95 0BCC |
ங் 0B99 0BCD | ங 0B99 | ஙா 0B99 0BBE | ஙி 0B99 0BBF | ஙீ 0B99 0BC0 | ஙு 0B99 0BC1 | ஙூ 0B99 0BC2 | ஙெ 0B99 0BC6 | ஙே 0B99 0BC7 | ஙை 0B99 0BC8 | ஙொ 0B99 0BCA | ஙோ 0B99 0BCB | ஙௌ 0B99 0BCC |
ச் 0B9A 0BCD | ச 0B9A | சா 0B9A 0BBE | சி 0B9A 0BBF | சீ 0B9A 0BC0 | சு 0B9A 0BC1 | சூ 0B9A 0BC2 | செ 0B9A 0BC6 | சே 0B9A 0BC7 | சை 0B9A 0BC8 | சொ 0B9A 0BCA | சோ 0B9A 0BCB | சௌ 0B9A 0BCC |
ஞ் 0B9E 0BCD | ஞ 0B9E | ஞா 0B9E 0BBE | ஞி 0B9E 0BBF | ஞீ 0B9E 0BC0 | ஞு 0B9E 0BC1 | ஞூ 0B9E 0BC2 | ஞெ 0B9E 0BC6 | ஞே 0B9E 0BC7 | ஞை 0B9E 0BC8 | ஞொ 0B9E 0BCA | ஞோ 0B9E 0BCB | ஞௌ 0B9E 0BCC |
ட் 0B9F 0BCD | ட 0B9F | டா 0B9F 0BBE | டி 0B9F 0BBF | டீ 0B9F 0BC0 | டு 0B9F 0BC1 | டூ 0B9F 0BC2 | டெ 0B9F 0BC6 | டே 0B9F 0BC7 | டை 0B9F 0BC8 | டொ 0B9F 0BCA | டோ 0B9F 0BCB | டௌ 0B9F 0BCC |
ண் 0BA3 0BCD | ண 0BA3 | ணா 0BA3 0BBE | ணி 0BA3 0BBF | ணீ 0BA3 0BC0 | ணு 0BA3 0BC1 | ணூ 0BA3 0BC2 | ணெ 0BA3 0BC6 | ணே 0BA3 0BC7 | ணை 0BA3 0BC8 | ணொ 0BA3 0BCA | ணோ 0BA3 0BCB | ணௌ 0BA3 0BCC |
த் 0BA4 0BCD | த 0BA4 | தா 0BA4 0BBE | தி 0BA4 0BBF | தீ 0BA4 0BC0 | து 0BA4 0BC1 | தூ 0BA4 0BC2 | தெ 0BA4 0BC6 | தே 0BA4 0BC7 | தை 0BA4 0BC8 | தொ 0BA4 0BCA | தோ 0BA4 0BCB | தௌ 0BA4 0BCC |
ந் 0BA8 0BCD | ந 0BA8 | நா 0BA8 0BBE | நி 0BA8 0BBF | நீ 0BA8 0BC0 | நு 0BA8 0BC1 | நூ 0BA8 0BC2 | நெ 0BA8 0BC6 | நே 0BA8 0BC7 | நை 0BA8 0BC8 | நொ 0BA8 0BCA | நோ 0BA8 0BCB | நௌ 0BA8 0BCC |
ப் 0 BAA 0BCD | ப 0 BAA | பா 0 BAA 0BBE | பி 0 BAA 0BBF | பீ 0 BAA 0BC0 | பு 0 BAA 0BC1 | பூ 0 BAA 0BC2 | பெ 0 BAA 0BC6 | பே 0 BAA 0BC7 | பை 0 BAA 0BC8 | பொ 0 BAA 0BCA | போ 0 BAA 0BCB | பௌ 0 BAA 0BCC |
ம் 0BAE 0BCD | ம 0BAE | மா 0BAE 0BBE | மி 0BAE 0BBF | மீ 0BAE 0BC0 | மு 0BAE 0BC1 | மூ 0BAE 0BC2 | மெ 0BAE 0BC6 | மே 0BAE 0BC7 | மை 0BAE 0BC8 | மொ 0BAE 0BCA | மோ 0BAE 0BCB | மௌ 0BAE 0BCC |
ய் 0BAF 0BCD | ய 0BAF | யா 0BAF 0BBE | யி 0BAF 0BBF | யீ 0BAF 0BC0 | யு 0BAF 0BC1 | யூ 0BAF 0BC2 | யெ 0BAF 0BC6 | யே 0BAF 0BC7 | யை 0BAF 0BC8 | யொ 0BAF 0BCA | யோ 0BAF 0BCB | யௌ 0BAF 0BCC |
ர் 0BB0 0BCD | ர 0BB0 | ரா 0BB0 0BBE | ரி 0BB0 0BBF | ரீ 0BB0 0BC0 | ரு 0BB0 0BC1 | ரூ 0BB0 0BC2 | ரெ 0BB0 0BC6 | ரே 0BB0 0BC7 | ரை 0BB0 0BC8 | ரொ 0BB0 0BCA | ரோ 0BB0 0BCB | ரௌ 0BB0 0BCC |
ல் 0BB2 0BCD | ல 0BB2 | லா 0BB2 0BBE | லி 0BB2 0BBF | லீ 0BB2 0BC0 | லு 0BB2 0BC1 | லூ 0BB2 0BC2 | லெ 0BB2 0BC6 | லே 0BB2 0BC7 | லை 0BB2 0BC8 | லொ 0BB2 0BCA | லோ 0BB2 0BCB | லௌ 0BB2 0BCC |
வ் 0BB5 0BCD | வ 0BB5 | வா 0BB5 0BBE | வி 0BB5 0BBF | வீ 0BB5 0BC0 | வு 0BB5 0BC1 | வூ 0BB5 0BC2 | வெ 0BB5 0BC6 | வே 0BB5 0BC7 | வை 0BB5 0BC8 | வொ 0BB5 0BCA | வோ 0BB5 0BCB | வௌ 0BB5 0BCC |
ழ் 0BB4 0BCD | ழ 0BB4 | ழா 0BB4 0BBE | ழி 0BB4 0BBF | ழீ 0BB4 0BC0 | ழு 0BB4 0BC1 | ழூ 0BB4 0BC2 | ழெ 0BB4 0BC6 | ழே 0BB4 0BC7 | ழை 0BB4 0BC8 | ழொ 0BB4 0BCA | ழோ 0BB4 0BCB | ழௌ 0BB4 0BCC |
ள் 0BB3 0BCD | ள 0BB3 | ளா 0BB3 0BBE | ளி 0BB3 0BBF | ளீ 0BB3 0BC0 | ளு 0BB3 0BC1 | ளூ 0BB3 0BC2 | ளெ 0BB3 0BC6 | ளே 0BB3 0BC7 | ளை 0BB3 0BC8 | ளொ 0BB3 0BCA | ளோ 0BB3 0BCB | ளௌ 0BB3 0BCC |
ற் 0BB1 0BCD | ற 0BB1 | றா 0BB1 0BBE | றி 0BB1 0BBF | றீ 0BB1 0BC0 | று 0BB1 0BC1 | றூ 0BB1 0BC2 | றெ 0BB1 0BC6 | றே 0BB1 0BC7 | றை 0BB1 0BC8 | றொ 0BB1 0BCA | றோ 0BB1 0BCB | றௌ 0BB1 0BCC |
ன் 0BA9 0BCD | ன 0BA9 | னா 0BA9 0BBE | னி 0BA9 0BBF | னீ 0BA9 0BC0 | னு 0BA9 0BC1 | னூ 0BA9 0BC2 | னெ 0BA9 0BC6 | னே 0BA9 0BC7 | னை 0BA9 0BC8 | னொ 0BA9 0BCA | னோ 0BA9 0BCB | னௌ 0BA9 0BCC |
ஶ் 0BB6 0BCD | ஶ 0BB6 | ஶா 0BB6 0BBE | ஶி 0BB6 0BBF | ஶீ 0BB6 0BC0 | ஶு 0BB6 0BC1 | ஶூ 0BB6 0BC2 | ஶெ 0BB6 0BC6 | ஶே 0BB6 0BC7 | ஶை 0BB6 0BC8 | ஶொ 0BB6 0BCA | ஶோ 0BB6 0BCB | ஶௌ 0BB6 0BCC |
ஜ் 0B9C 0BCD | ஜ 0B9C | ஜா 0B9C 0BBE | ஜி 0B9C 0BBF | ஜீ 0B9C 0BC0 | ஜு 0B9C 0BC1 | ஜூ 0B9C 0BC2 | ஜெ 0B9C 0BC6 | ஜே 0B9C 0BC7 | ஜை 0B9C 0BC8 | ஜொ 0B9C 0BCA | ஜோ 0B9C 0BCB | ஜௌ 0B9C 0BCC |
ஷ் 0BB7 0BCD | ஷ 0BB7 | ஷா 0BB7 0BBE | ஷி 0BB7 0BBF | ஷீ 0BB7 0BC0 | ஷு 0BB7 0BC1 | ஷூ 0BB7 0BC2 | ஷெ 0BB7 0BC6 | ஷே 0BB7 0BC7 | ஷை 0BB7 0BC8 | ஷொ 0BB7 0BCA | ஷோ 0BB7 0BCB | ஷௌ 0BB7 0BCC |
ஸ் 0BB8 0BCD | ஸ 0BB8 | ஸா 0BB8 0BBE | ஸி 0BB8 0BBF | ஸீ 0BB8 0BC0 | ஸு 0BB8 0BC1 | ஸூ 0BB8 0BC2 | ஸெ 0BB8 0BC6 | ஸே 0BB8 0BC7 | ஸை 0BB8 0BC8 | ஸொ 0BB8 0BCA | ஸோ 0BB8 0BCB | ஸௌ 0BB8 0BCC |
ஹ் 0BB9 0BCD | ஹ 0BB9 | ஹா 0BB9 0BBE | ஹி 0BB9 0BBF | ஹீ 0BB9 0BC0 | ஹு 0BB9 0BC1 | ஹூ 0BB9 0BC2 | ஹெ 0BB9 0BC6 | ஹே 0BB9 0BC7 | ஹை 0BB9 0BC8 | ஹொ 0BB9 0BCA | ஹோ 0BB9 0BCB | ஹௌ 0BB9 0BCC |
க்ஷ் 0B95 0BCD 0BB7 0BCD | க்ஷ 0B95 0BCD 0BB7 | க்ஷா 0B95 0BCD 0BB7 0BBE | க்ஷி 0B95 0BCD 0BB7 0BBF | க்ஷீ 0B95 0BCD 0BB7 0BC0 | க்ஷு 0B95 0BCD 0BB7 0BC1 | க்ஷூ 0B95 0BCD 0BB7 0BC2 | க்ஷெ 0B95 0BCD 0BB7 0BC6 | க்ஷே 0B95 0BCD 0BB7 0BC7 | க்ஷை 0B95 0BCD 0BB7 0BC8 | க்ஷொ 0B95 0BCD 0BB7 0BCA | க்ஷோ 0B95 0BCD 0BB7 0BCB | க்ஷெள 0B95 0BCD 0BB7 0BCC |
프로그래밍 접근
- 타밀어 스크립트는 오픈-타밀이라는 [28]파이썬 라이브러리를 사용하여 조작할 수 있습니다.
- AnyTaFont2라고 하는 Windows 오픈 소스 응용 프로그램이 있습니다.C#을 사용하는 UTF8.
참고 항목
해설서
- ^ 글자의 문맥에 따라 /v/ 또는 /w/로 발음됨
메모들
- ^ Rajan, K. (December 2001). "Territorial Division as Gleaned from Memorial Stones". East and West. Istituto Italiano per l'Africa e l'Oriente (IsIAO). 51 (3/4): 363. JSTOR 29757518. (601–800년 동안 타밀어를 일렬로 표시한 표)
- ^ Diringer, David (1948). Alphabet a key to the history of mankind. p. 385.
- ^ a b 마하데반 2003, 페이지 212.
- ^ a b c 마하데반 2003, 페이지 213.
- ^ Allen, Julie (2006), The Unicode 5.0 Standard (5 ed.), Upper Saddle River, NJ: Addison-Wesley, ISBN 0-321-48091-0 324쪽에
- ^ Lewis, M. Paul, ed. (2009), Ethnologue: Languages of the World (16th ed.), Dallas, Tex.: SIL International, retrieved 28 August 2009
- ^ 마드라스 타밀어 어휘 대학, 148페이지: "அலியெழுத்து [ aliyḻutun ali-y-eḻutu. < அலி¹ + . 1.모음도 자음도 아닌 것으로 간주되는 ஃ글자; ஆய்தம். (வெண்பாப். ◦. 6, உரை.) 2.자음; மெய்யெ ழுத்து பிங். (பிங்.)"]
- ^ a b 마하데반 2003, 173쪽.
- ^ 마하데반 2003, 230쪽.
- ^ 마하데반 2003, 211쪽.
- ^ 마하데반 2003, 페이지 209.
- ^ Griffiths, Arlo (2014). "Early Indic Inscriptions of Southeast Asia".
- ^ https://en.wikiversity.org/wiki/Tamil_Language/Letters . 오류: 없음:en.wikiversity.org/wiki/Tamil_Language/Letters (
- ^ a b c 스티버 1996, 페이지 426-430.
- ^ 유니코드 표준 버전 13.0 – 핵심 사양, 남아시아 및 중앙아시아-I, 인도 공식 스크립트 페이지 498
- ^ a b 샤르마, 슈리라마나.(2010a).확장 타밀어의 문자를 인코딩하는 제안입니다.
- ^ 샤르마, 슈리라마나.(2010c).타밀어 제안서의 후속편 #2입니다.
- ^ 유니코드 컨소시엄 (2019).타밀어의유니코드 표준 버전 12.0 (페이지 489–498).
- ^ 셀바쿠마르, V. (2016)타밀 지역의 수와 분수, 산술 계산의 역사:일부 관찰.HuSS: 국제 인문사회과학연구저널, 3(1), 27-35https://doi.org/10.15613/HIJRH/2016/V3I1/111730
- ^ 샤르마, 슈리라마나.(2010b).확장 타밀 제안 L2/10-256R의 후속 조치입니다.
- ^ 에라이야라산, B. B. 에라이야라산 박사의 타밀 유니코드 및 그랜샘 제안에 대한 논평.
- ^ 나랑킬리, 탄자이.(2018).그란타 문자로 타밀어 유니코드를 "오염" 시키려는 시도입니다.타밀 트리뷴.2019년 3월 12일 http://www.tamiltribune.com/18/1201.html 에서 검색했습니다.
- ^ 인도 정부.(2010).그랜사 스크립트의 유니코드 표준.
- ^ 샤르마, 슈리라마나.(2012).타밀어의 분수와 기호를 부호화하는 제안.
- ^ 스리랑카의 ICTA (2014).타밀어 기호와 분수를 부호화하는 제안에 대한 의견.
- ^ 타밀나두 정부.(2017).타밀어의 분수와 기호를 인코딩하는 제안서가 완성되었습니다.
- ^ Pournader, Roozbeh (24 January 2018). "The two ways to represent Tamil Shri". Unicode. Archived from the original on 4 April 2023.
- ^ "Open-Tamil 0.65 : Python Package Index".
참고문헌
- Mahadevan, Iravatham (2003), Early Tamil Epigraphy from the Earliest Times to the Sixth Century A.D., Harvard Oriental Series, Volume 62, Cambridge: Harvard University Press, ISBN 0-674-01227-5
- Steever, Sanford B. (1996), "Tamil Writing", in Bright, William; Daniels, Peter T. (eds.), The World's Writing Systems, New York: Oxford University Press, pp. 426–430, ISBN 0-19-507993-0