Кодування символів
Матеріал з Вікіпедії — вільної енциклопедії.
Набір символів, кодування символів (англ. character set, character encoding) - певна таблиця кодування кінцевої множини символів. Така таблиця зіставляє кожному символу послідовність довжиною в один або більше байт. Нерідко замість терміна набір символів неправильно вживають термін кодова сторінка, що означає насправді окремий випадок набору символів з однобайтовим кодуванням. Термін кодування (в комп'ютерному контексті) є синонімом терміна «набір символів».
У цей час в основному використаються кодування двох типів: сумісні з ASCII і сумісні з EBCDIC, із гнітючою перевагою перших. Подання UTF-8 Юнікода сумісне з ASCII. Кодування на базі EBCDIC (наприклад, ДКОИ-8) використаються тільки на деяких мейнфреймах. Спочатку в кожної операційної системи використався один набір символів. Тепер використовувані набори символів стандартизовані, залежать від типу операційної системи лише за традицією й установлюються згідно локалі.
В вікіпедії й інших проектах фонда Вікімедія використовується Юнікод UTF-8.