Назад Далі Зміст

Кодування

Кодування (encoding), або кодова таблиця — це однозначна відповідність між підмножиною цілих чисел і певним набором символів.

ASCII

Це восьмибітне кодування, але воно охоплює лише 128 символів, тому використовує лише сім значущих бітів (старший, восьмий біт завжди дорівнює нулю). Важливість цього кодування — у включенні латинського алфавіту, цифр і основних розділових знаків. Більшість інших (більш об’ємних) кодувань сумісні з ним, тобто розміщують на перших 128 позиціях ті самі символи в тому ж порядку.

Перші 32 позиції в ASCII зайняті керівними символами (control characters), які не передають текст, а керують пристроями. Лише деякі з них (переведення каретки, новий рядок, табуляція) ще використовуються. Інші вже давно вийшли з ужитку.

Якщо використати старший біт, то отримуємо ще 128 позицій — цього достатньо для кирилиці або спеціальних символів. Існує набагато більше 8-бітних кодувань, ніж самих наборів символів. Для кирилиці існує кілька однобайтових таблиць.

Однобайтові кодування

КОІ8

Одним із перших стандартів кодування кирилиці був КОІ8 («Код обміну інформацією, 8-бітний»), який використовувався ще на ЕОМ. Зараз КОІ8 є однією з обов’язкових кодувань для російськомовних веб-сторінок.

Windows-1251

Друге за значенням кодування в Рунеті й перше за використанням у Windows — це стандартне кириличне кодування Microsoft Windows, позначається як СР1251 (СР — "Code Page", кодова сторінка). Завдяки популярності Windows, СР1251 поряд з КОІ8 — мінімум, який повинна підтримувати кожна російськомовна веб-сторінка.

Двобайтове кодування Unicode

Два байти дозволяють закодувати 65536 різних символів. Таке кодування називається Юнікодом.

Переваги використання Юнікоду:

Недоліки використання Юнікоду:

Вказівка кодування документа

Ось популярні кодування для веб-сторінок:

Способи вказати кодування на сторінці (зазвичай використовують обидва одночасно):

Елемент <meta> розміщується в блоці <head>. Він є порожнім (не має вмісту) і записується як самозакривний тег.

Назад Далі Зміст