한중일 통합 한자

위키백과 ― 우리 모두의 백과사전.

유니코드
부호화 형식
UCS
양방향 텍스트
BOM
한중일 통합 한자
유니코드 범위 목록

한중일 통합 한자 또는 한중일/베트남 통합 한자유니코드에 담겨 있는 한자들의 집합으로, 한국, 중국, 일본에서 사용되는 한자를 묶은 것이기 때문에 머리 글자를 취해 한중일(CJK) 통합 한자라고 부른다. 최근에는 베트남에서 사용되고 있는 한자도 추가되었기에 CJKV라고 부르기도 한다.

처음에 유니코드에는 65,536(=216)자만 들어갈 수 있었기 때문에, 가장 많은 문자가 배당되는 한자를 위해서 한국, 중국, 일본에서 사용하는 한자 중에 모양이 유사하며 그 의미가 같은 글자를 같은 코드로 통합했다. 따라서 문자 코드만으로 그 한자가 사용되는 언어를 알아 낼 수 없는데, 다만 중국의 간체자나 번체자, 일본의 구자체신자체 등 분명하게 모양이 다른 글자는 별도의 부호를 할당하고 있다. 이런 문자 할당 정책에 반발하여 TRON과 같은 인코딩이 만들어지기도 했으나, 실제로 통합된 한자의 차이가 별로 크지 않기 때문에 문제가 되지 않는다는 의견도 있다.

ISO 10646 버전 유니코드 버전 내용 위치 개수 누계
1993 1.1 한중일 통합 한자 기본 다국어 평면(BMP, U+4E00부터 U+9FA5) 20,902 20,902
1993 1.1 기본 다국어 평면 12 20,914
2000 3.0 한중일 통합 한자 확장 A 기본 다국어 평면(U+3400부터 U+4DB5) 6,582 27,496
2001 3.1 한중일 통합 한자 확장 B 보조 상형 문자 평면(SIP, U+20000부터 U+2A6D6) 42,711 70,207
2003 4.1 HKSCS-2004와 GB 18030-2000에 없었던 ISO 10646 한자 기본 다국어 평면(U+9FA6부터 U+9FBB) 22 70,229
2007년 2월(예정) 6.0(예정) 한중일 통합 한자 확장 C 보조 상형 문자 평면(예정) 약 2만자 약 10만자

[편집] 같이 보기

[편집] 바깥 고리