한중일 통합 한자
위키백과 ― 우리 모두의 백과사전.
유니코드 |
---|
부호화 형식 |
UCS |
양방향 텍스트 |
BOM |
한중일 통합 한자 |
유니코드 범위 목록 |
한중일 통합 한자 또는 한중일/베트남 통합 한자는 유니코드에 담겨 있는 한자들의 집합으로, 한국, 중국, 일본에서 사용되는 한자를 묶은 것이기 때문에 머리 글자를 취해 한중일(CJK) 통합 한자라고 부른다. 최근에는 베트남에서 사용되고 있는 한자도 추가되었기에 CJKV라고 부르기도 한다.
처음에 유니코드에는 65,536(=216)자만 들어갈 수 있었기 때문에, 가장 많은 문자가 배당되는 한자를 위해서 한국, 중국, 일본에서 사용하는 한자 중에 모양이 유사하며 그 의미가 같은 글자를 같은 코드로 통합했다. 따라서 문자 코드만으로 그 한자가 사용되는 언어를 알아 낼 수 없는데, 다만 중국의 간체자나 번체자, 일본의 구자체나 신자체 등 분명하게 모양이 다른 글자는 별도의 부호를 할당하고 있다. 이런 문자 할당 정책에 반발하여 TRON과 같은 인코딩이 만들어지기도 했으나, 실제로 통합된 한자의 차이가 별로 크지 않기 때문에 문제가 되지 않는다는 의견도 있다.
ISO 10646 버전 | 유니코드 버전 | 내용 | 위치 | 개수 | 누계 |
---|---|---|---|---|---|
1993 | 1.1 | 한중일 통합 한자 | 기본 다국어 평면(BMP, U+4E00부터 U+9FA5) | 20,902 | 20,902 |
1993 | 1.1 | 기본 다국어 평면 | 12 | 20,914 | |
2000 | 3.0 | 한중일 통합 한자 확장 A | 기본 다국어 평면(U+3400부터 U+4DB5) | 6,582 | 27,496 |
2001 | 3.1 | 한중일 통합 한자 확장 B | 보조 상형 문자 평면(SIP, U+20000부터 U+2A6D6) | 42,711 | 70,207 |
2003 | 4.1 | HKSCS-2004와 GB 18030-2000에 없었던 ISO 10646 한자 | 기본 다국어 평면(U+9FA6부터 U+9FBB) | 22 | 70,229 |
2007년 2월(예정) | 6.0(예정) | 한중일 통합 한자 확장 C | 보조 상형 문자 평면(예정) | 약 2만자 | 약 10만자 |