Что такое кодировка текста? Юникод и кодировки Utf-8, ANSI, Windows-1251

кодировки Utf-8, ANSI, Windows-1251

  Charsets

Часто в веб-программировании и вёрстке html-страниц приходится думать о кодировке редактируемого файла — ведь если кодировка выбрана неверная, то есть вероятность, что браузер не сможет автоматически её определить и в результате пользователь увидит т.н. «кракозябры».

Возможно, вы сами видели на некоторых сайтах вместо нормального текста непонятные символы и знаки вопроса. Всё это возникает тогда, когда кодировка html-страницы и кодировка самого файла этой страницы не совпадают.

Вообще, что такое кодировка текста? Это просто набор символов, по-английски «charset » (character set). Нужна она для того, чтобы текстовую информацию преобразовывать в биты данных и передавать, например, через Интернет.

Собственно, основные параметры, которыми различаются кодировки — это количество байтов и набор спец.символов, в которые преобразуется каждый символ исходного текста.

Краткая история кодировок:

Одной из первых для передачи цифровой информации стало появление кодировки ASCII — American Standard Code for Information Interchange — Американская стандартная кодировочная таблица, принятая Американским национальным институтом стандартов — American National Standards Institute (ANSI).

В этих аббревиатурах можно запутаться :). Для практики же важно понимать, что исходная кодировка создаваемых текстовых файлов может не поддерживать все символы некоторых алфавитов (к примеру, иероглифы), потому идёт тенденция к переходу к т.н. стандарту Юникод (Unicode), который поддерживает универсальные кодировки — Utf-8, Utf-16, Utf-32 и др.

Самая популярная из кодировок Юникода — кодировка Utf-8. Обычно в ней сейчас верстаются страницы сайтов и пишутся разные скрипты. Она позволяет без проблем отображать различные иероглифы, греческие буквы и прочие мыслимые и немыслимые символы (размер символа до 4-х байт). В частности, все файлы WordPress и Joomla пишутся именно в этой кодировке. А также некоторые веб-технологии (в частности, AJAX) способны нормально обрабатывать только символы utf-8.

Установка кодировок файла

  Установка кодировок текстового файла при создании его обычным блокнотом. Кликабельно

В Рунете же ещё можно встретить сайты, написанные с расчётом на кодировку Windows-1251 (или cp-1251). Это специальная кодировка, предназначенная специально для кириллицы.

Почему вообще необходимо иметь представление о разных кодировках? Дело в том, что нередко на том же WordPress можно встретить, например, в Footer’е знаки вопроса вместо нормального текста. Это просто говорит о том, что php-файл Footer’а сохранён в одной кодировке, а в заголовке html-страницы указана совсем другая кодировка. Прочитайте — как сменить кодировку файла и что в этом поможет.

1 Star2 Stars3 Stars4 Stars5 Stars (4 оценок, среднее: 5,00 из 5)
Loading...
Случайные публикации:
  • Какой хостинг выбрать? На что обратить внимание, выбирая хостинг для сайта (мощность сервера, технологии, цены, uptime...)Какой хостинг выбрать? На что обратить внимание, выбирая хостинг для сайта (мощность сервера, технологии, цены, uptime...)Выбирая хостинг для своего будущего проекта в Интернете, желательно определиться,...
  • Как активировать карту Яндекс.Денег и получить пин-код? Снятие наличных в банкоматах и комиссииКак активировать карту Яндекс.Денег и получить пин-код? Снятие наличных в банкоматах и комиссии...вязан" к вашему аккаунту Я.Д. Подробнее - здесь. Ничего сложного нет -
  • Что делать, если Twitter запрещает переход по ссылке или её добавление?Что делать, если Twitter запрещает переход по ссылке или её добавление?Сегодня заметил интересную вещь для одного своего сайта - серви...
  • Как узнать историю домена и сайта на нём?Как узнать историю домена и сайта на нём?Некоторое время назад я опубликовал здесь статью о том, почему Я...
  • Как узнать, сколько страниц проиндексировано? Страницы в индексе Яндекса, Google, BingКак узнать, сколько страниц проиндексировано? Страницы в индексе Яндекса, Google, Bing...таксис запроса почти такой же, как и в Гугле site:домен: Число
Оставьте комментарий:
комментария 2
  1. Ярослав:

    спасибо очень выручили
    =) *THUMBS UP* *DANCE* *YAHOO*

    Ответить
  2. Евгений:

    Спасибо. Чаще всего такую проблему можно встретить в инете. Да и так в блокноте некоторые нестандартные символы немецкого или испанского языка теряются в кодировке ANSI.

    Ответить
Я не спамлю...