한자 전체

Chinese whole characters

한자 전체 또는 한자 전체(핀인: 한즈 ì즈 ě; 번체: 漢字整字; 간체: 汉字整字)는 완전한 한자입니다.그것은 획-성분-문자 구성의 마지막 단계에 있습니다.[1]

한자는 그 구조에 따라 분해할 수 없는 문자(独体字)와 분해할 수 있는 문자(合体字)로 나눌 수 있습니다.분해 불가능한 문자는 하나의 원시 성분에 의해 형성되며 단일 성분 문자라고도 하며, 분해 가능한 문자는 둘 이상의 원시 성분으로 분해될 수 있으며, 다중 성분 문자라고도 합니다.

분해할 수 없는 문자

분해할 수 없는 문자는 획으로 직접 형성되며, 더 작은 구성 요소로 분해할 수는 없지만, 분해할 수 있는 문자의 구성 요소일 수도 있습니다. 예를 들어, 人는 획 ㇓과 ㇏에 의해 형성되는 분해 불가능한 문자이며, 문자 丛을 형성하는 데 사용됩니다.

분해할 수 없는 등장인물 목록

다음은 다른 작성자가 작성한 분해 불가능한 문자 목록입니다.

"한자정보사전"(漢字信息字典)에는 중국 본토의 표준화된 글자가 총 7,785개 수록되어 있습니다.정적 통계에 따르면, 4.149%를 차지하는 323개의 분해 불가능한 문자가 있습니다.동적 통계에 따르면, 분해할 수 없는 문자가 말뭉치의 25.910%를 차지합니다.많은 단일 성분 문자가 자주 사용되는 문자이기 때문입니다.분해할 수 없는 문자 목록은 다음과 같습니다(핀 순서대로).

凹八巴白百办半贝本匕币必卞丙秉卜不步才册叉产长厂车臣辰成丞承尺彳斥赤虫丑川巛串垂匆寸大歹丹刀氐电刁丁丢东斗厾不(重)儿而耳发乏凡方飞非丰夫弗甫钆玍丐干甘戈革个艮更工弓瓜广龟果亥禾乎户互幻奂火丌乩及几己夹甲戋兼柬见孑巾斤今堇井九久韭旧臼巨孓开孔口来乐耒礼里力吏隶良两了〇令龙甪乱马买毛矛么门米芈丏免面灭民皿末母木目乃内年廿乜牛农女丬乓皮匹片氕乒平七妻气千羌且丘求虬曲犬冉人壬刃日乳入卅伞丧山上勺少申身甚升生尸失虱十石史豕士氏世事手书术戍束甩水厶司巳肃太天头凸土兔彖屯乇瓦丸万亡王韦为囗卫未我乌无毋五兀勿戊夕西习系下乡象小心戌血丫牙轧亚严央羊么夭也业页曳一夷乙已以乂义弋亦尹引永用尤尢由酉又于予臾禺雨禹玉聿曰月再扎札乍丈爪兆争正之止豸中重舟州朱竹主专隹子自 [a]

Su는 일반적으로 사용되는 7,000개의 문자를 분할하고 233개의 분해 불가능한 문자를 획득하여 3.4%를 차지했습니다.분해할 수 없는 문자 목록은 다음과 같습니다(획 기준 순서).

一乙二十丁厂七卜八人入乂儿九匕几刁了乃刀力又乜三干亍于亏士土工才下寸丈大兀万弋上小口山巾千川彳个么久丸夕凡及广亡门丫义之尸已巳弓己卫孑子孓也女飞刃习叉乡么丰王井开夫天无韦专丐廿木五卅不太犬歹尤车牙屯戈互瓦止少曰日中内水手牛毛气壬升夭长片币爪乏月氏勿丹火为户心尹尺夬丑爿巴书毋玉未末戋正甘世本术丙龙戊平灭东凸业目且甲申电田由央史冉皿凹四生失矢禾丘白斥瓜乎用甩氐乐册主半必永弗出母耒耳亚臣吏再西夹夷曳虫曲朱丢乒乓臼自血甪舟米州聿严甫更束两酉来里串我身系事雨果垂秉臾柬韭禺重禹

"현대 중국어에서 흔히 사용되는 난분해성 문자의 명세"(现代常用独体字规范)에서 현대 한자의 범위 내에서 256개의 현대적 난분해성 문자가 확인되어 "현대적 난분해성 문자 목록"을 구성하고 있습니다.[6] 분해할 수 없는 문자 목록은 다음과 같습니다(획 기준 순서).

一乙二十丁厂七卜八人入儿匕几九刁了刀力乃又三干于工土士才下寸大丈与万上小口山巾千川个歹久么凡丸及广亡门丫义之尸己已巳弓子卫也女刃飞习叉马乡丰王开井天夫无云专丐木五不犬太歹尤车巨牙屯戈互瓦止少曰日中贝内水见午牛手气毛壬升夭长片斤爪父月氏勿丹鸟六文方火为斗户心尺丑巴办予书玉未末击正甘世本术丙石戊龙平东卡凸业木且甲申电田由史央冉皿凹四生矢失乍禾丘白斥瓜乎用甩乐匆册鸟主立半头必永民弗出矛母耳亚臣吏再西百而页夹夷虫曲肉年朱臼自血卤舟亦衣产亥羊米州农严求甫更束两酉来卤里串我身囱言羌弟事雨果垂秉肃隶承革柬面重鬼禹首兼象鼠

"일반 현대 한자 성분 및 성분명 명세(现代常用字部件及部件名称规范)"의 "일반적으로 사용되는 문자 성분 목록"에는 일반적으로 사용되는 문자 성분, 즉 압축할 수 없는 문자가 총 311개 포함되어 있습니다.[7] 분해할 수 없는 문자 목록은 다음과 같습니다(핀 순서대로).

凹八巴白百办半卑贝本匕必丙秉卜不才册叉产长厂车臣辰承尺斥赤虫丑出川串垂匆囱寸大歹丹单刀弟电刁丁鼎东兜斗豆儿而耳二发凡方飞非丰凤夫弗甫父丐干甘高戈革个更工弓谷瓜广龟鬼果亥禾黑后乎互户黄火击及几己夹甲兼柬见角巾斤今金京井九久韭臼巨具卡开口来老乐里力立吏丽隶两了六龙卤鹿卵仑马毛矛卯么门米免面民皿末母木目乃南内年鸟牛农女乓皮片乒平七妻其气千欠且丘求曲去犬冉人壬刃日肉入三伞色山上勺少舌申身升生尸失十石食史矢士氏示世事手首书鼠术束甩永司丝巳四肃太天田头凸土屯瓦丸万亡王卫为未文我乌无五午勿戊夕西习下乡向象小心辛戌穴血熏丫牙亚严言央羊夭也业页一衣夷乙已义亦庸永用尤由酉又于鱼与予雨禹玉曰月云再乍丈爪兆争正之直止至中重舟州朱竹主专子自

이상의 실험 결과를 바탕으로 현대 한자의 불분해 문자 수는 대략 4%를 차지하는 것으로 추정됩니다.

각 실험 패밀리는 구성 요소에 대한 이해가 약간 다르며 종종 다른 문자 집합을 사용하기 때문에 분해할 수 없는 문자의 수에 차이가 있습니다.하지만 일반적으로 말하면 결과는 200에서 300 사이로 상당히 비슷합니다.

성분 수에 따른 한자 분포

다음 자료는 "한자 정보 사전"에서 발췌한 것입니다.여기서 구성요소란 원시 구성요소를 말합니다.

성분 수에 따른 한자 분포
구성 요소들 성격. % 캐릭터 발생 상황 총 문자 발생률 %
1 323 4.149 5611317 25.910
2 2650 34.040 10191803 47.061
3 3139 40.321 4652330 21.482
4 1276 16.391 1046913 4.834
5 323 4.149 142005 0.656
6 70 0.899 11192 0.052
7 3 0.038 1017 0.005
8 1 0.013 1 0.002
7785 100 21656578 100

정적 분포는 주로 성분 2, 3, 4의 개수에 집중되어 있고, 동적 분포는 주로 성분 1, 2, 3의 개수에 집중되어 있습니다.동적 분포 및 정적 분포 통계량에서 문자의 99% 이상이 5개 미만의 원시 성분을 가지고 있습니다.성분 번호 1과 5의 정적 성분 수는 동일하지만 동적 성분 수는 매우 다릅니다.

분해 가능 문자

분해 가능한 문자는 둘 이상의 구성요소로 구성됩니다.한자 구조 연구에서 자주 사용되는 성분 조합 방식은 1단계 성분 조합원시 성분 조합 두 가지가 있습니다.[10]

일급성분조합

1급 성분 조합 모드 또는 패턴은 사람들이 한자의 구조라고 부르는 것입니다.이 분석에 따르면 분해 가능한 캐릭터의 구조는 크게 4개의 카테고리와 13개의 하위 카테고리로 구분할 수 있습니다.[11][12]

좌~우 구조

  • 왼쪽에서 오른쪽으로(⿰, 2FF0), 예: 部, 件, 結 및 構.
  • 좌중우(⿲, 2FF2): 衡, 班, 辯.

구조물 위에서 아래로

  • 위에서 아래로(⿱, 2FF1): 要, 思 및 想.
  • 위에서 중하(⿳, 2FF3): 鼻, 曼 및 率.

주변구조물

전체 서라운드:

  • 4개의 측면(⿴, 2FF4)에서 둘러싸임: 圍, 國 및 國

3면으로 둘러쌓임

  • 위에서 서라운드(⿵, 2FF5): 問, 同 및 同
  • 아래로부터의 서라운드(⿶, 2FF6): 凶, 画 및 画
  • 왼쪽에서 서라운드(⿷, 2FF7): 匡, 匠 및 匠

양면에서 둘러싸임

  • 좌측 상단에서 서라운드(⿸, 2FF8): 廣, 居 및 病.
  • 우측 상단에서 서라운드(⿹, 2FF9): 句, 可 및 氧.
  • 좌측 하단에서 서라운드(⿺, 2FFA): 這, 建 및 題.
  • 우측 하단(N/A)에서 서라운드: 斗 및 头

중첩구조

  • 중첩(⿻, 2FFB): 巫, 爽 및 承.

구조물별 한자 분포

다음 자료는 "한자 정보 사전"에서 발췌한 7785 본토 표준 한자입니다.

구조물별 한자 분포
구조물들 성격. % 인물의 출현. 총 문자 발생률 %
분해할 수 없는 323 4.149 5611317 25.910
상하로 1643 21.105 4189687 19.346
좌우로 5055 64.933 8682108 40.091
에워싸다 715 19.184 2882097 13.308
덧씌우기 49 0.629 291369 1.345
7785 100 21656578 100

중첩 구조의 문자 목록

"한자 정보 사전"(p1072)의 통계에 따르면, 사전의 7785개 본토 표준 문자 중 중첩(또는 완전히 둘러싸인 것을 포함하여 중첩)된 구조의 문자는 총 49개입니다.

哀褒乘囱囤固国裹回困圃囚圈衰爽四田图团围巫因幽园圆衷噩囟胤兖袤亵裒囝囡囵囫囹囿圄圊圉圜豳囮囷奭圐㘥

전체 테두리 문자를 테두리 범주로 이동하면 겹쳐진 문자 수가 훨씬 적습니다.

원시 성분 조합

원시 성분에 의한 평면 분석에 따르면 한자 구조는 다음과 같은 모드 또는 패턴을 포함합니다.[13]

  • 가. 두 개의 원시적 요소로 구성된 캐릭터의 경우 9개의 다른 구조가 있으며, 이는 다음의 예시적인 캐릭터 吕认压达勾问区凶团로 표시됩니다.
  • 나. 3가지 구성으로 구성된 캐릭터의 경우 荣花型培树缠抛挺润抠捆部庶厢逞逊闾圄幽乖巫 등 21가지 구조가 있습니다.
  • C. 네 개의 구성 요소로 구성된 캐릭터의 경우 营蕊蓝寤嫠筐辔椁摄燃游榧额韶欧剩腐遮阔匿와 같은 20개의 다른 구조가 있습니다.
  • D. 5개의 구성 요소로 구성된 캐릭터의 경우 赢蒿膏寝蘧嚣篮樊搞澡缀渤漉髂齁敲酃戳魔噩와 같은 20개의 다른 구조가 있습니다.
  • E. 6개의 구성 요소로 구성된 캐릭터의 경우 臀翳麓瀛灌骥歌豁豌衢와 같은 10개의 다른 구조가 있습니다.
  • F. 일곱 개의 구성 요소로 구성된 캐릭터의 경우 戆麟饕와 같은 세 개의 다른 구조가 있습니다.
  • G. 8개의 구성 요소로 구성된 캐릭터의 경우 齉와 같은 1개의 구조가 있습니다.
  • H. 9개의 구성 요소로 구성된 캐릭터의 경우 懿와 같은 1개의 구조가 있습니다.

한자 구성요소를 어느 정도로 나눌지는 구체적인 필요에 따라 결정되어야 합니다.예를 들어, 한자 교육은 간결하게 하기 위해 종종 더 거친 수준의 분석을 사용하지만, 요소 인코딩 입력 방법은 코딩 요소를 줄이기 위해 비교적 상세한 분석을 사용하는 경우가 많습니다.

한자 글꼴

글꼴

종류와 대본 스타일이 다른 Thousand Character Classic의 첫 번째 네 캐릭터.오른쪽에서 왼쪽으로: 봉인 문자, 성직자 문자, 일반 문자, , 산세리프.

현대 한자의 인기 있는 글꼴은 송이나 명(宋體, 明體), 팽송(仿宋體), 카이(정규, 楷體), 리(정규, 隸體), 헤이(흑, 산세리프, 黑體), 웨이(魏體)가 있습니다.

공식 표준 글꼴은 다음과 같습니다.

글꼴 크기

국제적으로 글자 크기는 일반적으로 "점"으로 측정됩니다.중국에서는 '점' 측정 시스템 외에 한자에 대해서도 고유한 '숫자' 시스템을 사용하고 있습니다.예를 들어, 중국어 버전의 MS Word는 글꼴 크기를 포인트 또는 숫자로 설정할 수 있습니다.[20]

포인트 시스템

거의 300년의 발전과 개선 끝에, 이제 세계에서 가장 영향력 있는 필기 포인트 표준은 유럽 대륙의 디도 포인트 시스템(1점은 약 0.3759mm)과 영미 포인트 시스템(1점은 약 0.3515mm)을 포함합니다.중국은 후자의 포인트 제도를 사용합니다.MS Word에서 사용 가능한 점 값은 모두 0.5, 즉 집합 {1, 1.5, 2, 2.5, ..., 1637, 1637.5, 1638}로 구분되는 1점과 1638점 사이의 숫자입니다.이 규정들은 컴퓨터에서 직접 확인할 수 있습니다.

수 체계

중국어 버전의 Windows 및 Word에서 제공하는 글꼴 크기 옵션은 글꼴 크기의 오름차순으로 정렬됩니다.

8호(八号), 7호(七号), 소형 6호(小六号), 소형 6호(六号), 소형 5호(小五号), 소형 5호(五号), 소형 4호(小四号), 소형 4호(四号), 소형 3호(三号), 소형 2호(小二号), 소형 2호(二号), 소형 2호(小一号), 소형 1호(一号), 소형 초성수(小初号), 소형 초성수(初号), 초성수(小三号).

"8번"(또는 크기 8)이 가장 작으며, 5점(영미식)에 해당하며, 글자 높이는 약 1.757mm이고, "초대수"(또는 크기 A)가 가장 크며, 글자 높이는 약 14.761mm입니다.

번호-점 대응

다음은 장 박사가 만든 한자 글꼴 크기의 '숫자점' 대응표입니다.

한자 글꼴 크기 "number-dot" 해당 표
사이즈번호 한자이름 포인트
8 八号 5
7 七号 5.5
6소 小六号 6.5
6 六号 7.5
5소 小五号 9
5 五号 10.5
작은4 小四号 12
4 四号 14
작은3 小三号 15
3 三号 16
작은2 小二号 18
2 二号 22
작은1 小一号 24
1 一号 26
작은 A 小初号 36
A 初号 42

참고 항목

참고문헌

  1. ^ Su 2014, 페이지 74.
  2. ^ a b 국가언어위원회 2009a, p. 1.
  3. ^ 북경대학교 2004, 페이지 148.
  4. ^ a b 리 1988, 페이지 1071.
  5. ^ Su 2014, 페이지 95-96.
  6. ^ 국가언어위원회 2009a, 페이지 2-3.
  7. ^ 국가언어위원회 2009b.
  8. ^ Su 2014, 페이지 96.
  9. ^ 리 1988, 페이지 1010.
  10. ^ Su 2014, 페이지 98.
  11. ^ Su 2014, 페이지 98-99.
  12. ^ https://www.unicode.org/charts/PDF/U2FF0.pdf
  13. ^ Fu 1999, 페이지 39-41.
  14. ^ Su 2014, 페이지 89.
  15. ^ Li 2013, 62쪽.
  16. ^ 国务院关于公布《通用规范汉字表》的通知. Gov.cn (in Chinese). State Council of the People's Republic of China. 5 June 2013.
  17. ^ https://zh.wikipedia.org/w/index.php?title= 常用國字標準字體表&variant= zh-cn
  18. ^ http://www.edbchinese.hk/lexlist_ch/
  19. ^ https://www.unicode.org/charts/PDF/U4E00.pdf
  20. ^ a b c 장 2006.

인용작품

  • Fu, Yonghe (傅永和) (1999). 中文信息处理 (Chinese Information Processing) (in Chinese) (3rd ed.). Guangzhou: 广东教育出版社 (Guangdong Education Press). p. 84. ISBN 9-787540-640804.
  • Li, Dasui (李大遂) (2013). 简明实用汉字学 (Concise and Practical Chinese Characters) (in Chinese) (3rd ed.). Beijing: Peking University Press. ISBN 978-7-301-21958-4.
  • Li, Gongyi (李公宜,劉如水 (主編)) (1988). 漢字信息字典 (Chinese Character Information Dictionary) (in Chinese). Beijing: 科学出版社 (Science Press). ISBN 7-03-000862-6.
  • National Language Commission, Ministry of Education, China (2009a). Specification of the Undecomposable Characters Commonly Used in the Modern Chinese (现代常用独体字规范) (PDF). Beijing: National Language Commission. Retrieved September 8, 2023.{{cite book}}: CS1 유지 : 여러 이름 : 저자 목록 (링크)
  • National Language Commission, Ministry of Education, China (2009b). Specification of Common Modern Chinese Character Components and Component Names ( 现代常用字部件及部件名称规范) (PDF). Beining: National Language Commission. Retrieved 3 September 2023.{{cite book}}: CS1 유지 : 여러 이름 : 저자 목록 (링크)
  • Peking University, Modern Chinese Language Teaching and Research Office (2004). Modern Chinese (现代汉语) (in Chinese). Beijing: Commercial Press. ISBN 7-100-00940-5.
  • Su, Peicheng (苏培成) (2014). 现代汉字学纲要 (Essentials of Modern Chinese Characters) (in Chinese) (3rd ed.). Beijing: 商务印书馆 (Commercial Press). ISBN 978-7-100-10440-1.
  • Zhang, Xiaoheng (张小衡) (2006). "The Number, Point and Metric Systems of Font Size (字形的"号制""点制"与"米制")". Computer Engineering and Applications (计算机工程与应用). 42 (2006) (10): 175–177 & p 215.

메모들

  1. ^ 여기서 다중 구성 요소 문자의 구성 요소는 두 번 이상의 스트로크를 갖는 것으로 규정됩니다.
  2. ^ Unicode 2FF0, IDC(이념 설명 문자) Left to Right
  3. ^ 21,656,578자의 말뭉치로.

외부 링크