위키백과:제목 선택하기/기술적 한계
위키백과 ― 우리 모두의 백과사전.
미디어위키는 기술적인 이유로 인해 표제어 제목에 여러 가지 제한이 걸려 있습니다. 예를 들면 알파벳의 소문자로 시작하는 제목이 불가능하거나, 유니코드에 없는 문자는 제목으로 사용할 수 없습니다. 이러한 경우에는 다른 대안을 제목으로 사용하여야 합니다.
목차 |
[편집] 안내 틀
제목을 실제 표제어와 다르게 사용하는 경우에는 다음의 틀을 문서의 윗부분에 붙여주세요.
- {{잘못된 제목}}
- {{잘못된 제목/유니코드}} - 문서의 제목이 유니코드에 없는 경우에 사용합니다.
[편집] 사용할 수 없는 문자
미디어위키 문법에서 사용하는 다음 문자들과, 제어 문자에 해당하는 U+0000부터 U+001F까지와 U+007F는 문서 제목으로 사용할 수 없습니다.
# < > [ ] | { }
이 문자가 들어 간 제목을 쓰려 하면 ‘잘못된 제목’이라는 오류가 발생합니다.
[편집] 사용에 문제가 있는 문자
[편집] 사선 문자
사선 문자(/)는 제목 맨 앞에 올 수 있지만, [[/dev/null]]와 같이 연결을 할 때 맨 첫 글자를 /로 하면 원하는 문서가 아닌 다른 문서(현재 제목이 ‘위키백과’라면, ‘위키백과/dev/null’라는 문서로)로 연결됩니다. 이를 막기 위해서는 사선 문자 앞에 쌍점(:)을 붙이거나 첫 글자를 HTML 엔티티로 써야 합니다. 예를 들어서, [[:/dev/null]], [[/dev/null]] 등은 모두 /dev/null이라는 문서로 연결됩니다.
맨 처음이 아닌 다른 곳에 나타난 사선 문자는 문서 제목으로 쓸 수 있긴 하지만 제목 아래에 원하지 않는 내용(예를 들어 ‘< 위키백과’)이 나타나는 효과가 나타날 수 있습니다. (한국어 위키백과에서는 적용되지 않습니다.) 이는 문서가 부문서로 처리되기 때문이며, 제목 아래에 나타나는 내용 빼고는 다른 영향을 미치지 않습니다.
[편집] URL에서 사용하는 문자
물음표(?)와 + 문자를 제목에 쓸 때는 주의가 필요합니다. 이들 문자는 [[…]] 안에 쓰면 원하는 문서로 연결되지만, 외부에서 위키백과로 들어 오는 주소를 쓸 때는 URL에서 별도의 처리를 하기 때문에 그대로 쓸 수 없으며, 각각 %3F와 %2B를 대신 사용해야 합니다. 예를 들어 C++로 링크하려면 http://ko.wikipedia.org/wiki/C%2B%2B를 써야 합니다.
[편집] 공백 문자와 밑줄
공백과 밑줄 문자(_)는 똑같은 문자로 취급됩니다. URL에서 사용되는 밑줄 문자는 영어권에서 공백을 포함한 문서 제목을 좀 더 읽기 쉽게 하기 위해 사용됩니다. 맨 앞이나 맨 뒤에 붙는 공백과 밑줄 문자는 모두 지워지고, 중간에 둘 이상의 공백이나 밑줄 문자가 연속된 것은 모두 하나의 밑줄 문자로 합쳐지며, 공백이나 밑줄 문자만으로 이루어진 제목은 사용할 수 없습니다.
제목에 밑줄 문자가 들어 있을 경우 time_t와 같이 그냥 쓰거나, Shift-JIS와 같이 밑줄을 포함하지 않은 다른 표제어를 쓰는 방법이 있습니다.
[편집] 온점
‘.’나 ‘..’라는 제목과, ‘./’나 ‘../’로 시작하는 제목은 사용할 수 없습니다. 이런 제목은 부문서를 링크하는 데 쓰입니다.
[편집] 백분율 기호
미디어위키의 위키 문법에서는 URL과 마찬가지로 백분율 기호(%) 뒤에 두 자리의 16진수가 붙으면 한 글자로 해석합니다. 즉 %25는 %와 똑같은 문서를 가리킵니다. ‘%25’와 같이 이런 식으로 해석되는 글자들이 들어 있는 제목은 사용할 수 없습니다. 예를 들어서 [[%2542]]는 '%42'라는 페이지로 연결되어야 하지만 실제로는 전혀 연결되지 않습니다. 만약 이런 글자들을 사용해야 한다면 %와 똑같이 보이는, 예를 들어서 전각문자 %(U+FF05)를 사용할 수 있지만, 옛 웹 브라우저들에서 문제를 일으킬 수도 있습니다.
‘%XX’와 같이 백분율 기호 뒤에 두 자리의 16진수가 나타나지 않는다면, 별도의 처리가 일어나지 않기 때문에 예상한 대로 동작합니다.
[편집] 쌍점
맨 처음에 위키백과의 네임스페이스과 그 뒤에 쌍점(:)이 붙은 제목은 해당 네임스페이스의 제목으로 해석됩니다. 예를 들어서 위키백과:소개는 항상 위키백과 네임스페이스에 위치하게 됩니다. 또한 쌍점으로 시작하는 제목은 위키 문법에서 특수한 용도로 사용되기 때문에 사용할 수 없습니다.
[편집] 유니코드 관련
미디어위키는 유니코드를 기본으로 사용하기 때문에 유니코드의 제한을 그대로 갖고 있습니다.
[편집] 윗첨자와 아랫첨자
현재는 <sup> 같은 태그를 써서 윗첨자나 아랫첨자를 직접 제목으로 사용하는 방법이 없습니다. 따라서 보통은 TEX와 같이 연결 텍스트에서만 태그로 윗첨자나 아랫첨자를 지정하는 방법을 사용합니다. 소행성 이름과 같이 소문자가 빈번하게 등장하는 경우 {{mpl}}과 같은 별도의 틀을 링크에 사용하는 경우가 많습니다. (예: 2003 UB313)
유니코드에서 지원하는 윗첨자와 아랫첨자 문자를 사용할 수도 있으나 이는 운영체제와 설치된 글꼴에 따라서 모든 브라우저에서 동작하지 않을 수 있으며, 유니코드에서 지원하는 문자들도 그렇게 많은 건 아닙니다. (예를 들어서 eiπ + 1 = 0를 이런 식으로 표시할 수는 없습니다.) 하지만 ISO 8859-1 인코딩에도 있는 ¹, ², ³은 큰 문제 없이 사용할 수 있습니다. (예: E=mc²)
[편집] 유니코드에 없는 글자
미디어위키에서는 유니코드로 표현되지 않는 표제어를 제목으로 사용할 수 없습니다. 이 경우에는 {{잘못된 제목}} 대신 {{잘못된 제목/유니코드}}를 사용해 주세요. 여기에 속하는 표제어로는 프린스 (가수)가 있는데, 그는 한동안 유니코드에 포함되지 않은 문자를 정식 이름으로 썼습니다.
[편집] 발음 구별 기호
발음 구별 기호를 표제어로 쓸 때는 한 글자로 합쳐진 형태를 써야 합니다. 발음 구별 기호만 별도의 문자로 떨어져 있는 문자(combining mark)는 현재 몇몇 브라우저에서 제대로 출력할 수 없기 때문에 사용하지 않는 것이 좋습니다.
[편집] 옛한글
현재 미디어위키는 표제어를 저장할 때 유니코드 정규화 형태 KC(NFKC)를 사용하고 있습니다. 이 방법은 옛한글을 저장할 때 다소 문제가 될 수 있는데, 예를 들어 한글 자모 영역 문자로 표기한 듀ᇰ는 NFKC에 따라 ‘듀+ᇰ’으로 변환됩니다. {{첫가끝}} 틀에서는 여러 개의 문자열을 붙일 수 있는 기능을 통해 이 문제를 해결하고 있고, ZERO WIDTH JOINER 문자(U+200D, ‍)를 사용해 조합을 막는 방법도 있습니다.
현실적으로 옛한글을 보려면 보통 별도의 글꼴이 필요하기도 하므로, 옛한글을 포함한 표제어는 (한글 자모 영역이든 한양 사용자 영역이든) 쓰지 않는 것이 좋습니다.
[편집] 제목의 길이
제목의 길이는 UTF-8로 부호화했을 때 256글자거나 그 이하여야 합니다. 이는 한글만 썼을 때는 85글자, 어떠한 유니코드 문자라도 쓸 수 있다면 64글자에 해당합니다.
[편집] 설정으로 바꿀 수 있는 제한
다음 제한들은 미디어위키 소프트웨어가 아니라 한국어 위키백과의 설정 때문에 만들어진 것들입니다. 미디어위키를 쓰는 다른 사이트에서는 이 제한이 바뀌거나 없을 수도 있습니다.
[편집] 첫 글자가 알파벳 소문자인 경우
한국어 위키백과에서는 첫 글자가 알파벳 소문자로 시작할 수 없으며, 소문자로 시작하는 제목은 자동으로 대문자로 바뀝니다. 이는 영어권에서 문서 제목이 문장의 맨 처음에 올 경우와 그렇지 않은 경우에 따라서 첫 글자가 소문자이냐 대문자이냐가 결정되기 때문에 이로 인한 모호함을 없애기 위해서 만들어진 것입니다. 예를 들어 time_t라는 제목의 문서는 Time t에 위치해 있습니다.