Что такое кодировка текста? Юникод и кодировки Utf-8, ANSI, Windows-1251

кодировки Utf-8, ANSI, Windows-1251

  Charsets

Часто в веб-программировании и вёрстке html-страниц приходится думать о кодировке редактируемого файла – ведь если кодировка выбрана неверная, то есть вероятность, что браузер не сможет автоматически её определить и в результате пользователь увидит т.н. “кракозябры”.

Возможно, вы сами видели на некоторых сайтах вместо нормального текста непонятные символы и знаки вопроса. Всё это возникает тогда, когда кодировка html-страницы и кодировка самого файла этой страницы не совпадают.

Вообще, что такое кодировка текста? Это просто набор символов, по-английски “charset ” (character set). Нужна она для того, чтобы текстовую информацию преобразовывать в биты данных и передавать, например, через Интернет.

Собственно, основные параметры, которыми различаются кодировки – это количество байтов и набор спец.символов, в которые преобразуется каждый символ исходного текста.

Краткая история кодировок:

Одной из первых для передачи цифровой информации стало появление кодировки ASCII – American Standard Code for Information Interchange – Американская стандартная кодировочная таблица, принятая Американским национальным институтом стандартов – American National Standards Institute (ANSI).

В этих аббревиатурах можно запутаться :). Для практики же важно понимать, что исходная кодировка создаваемых текстовых файлов может не поддерживать все символы некоторых алфавитов (к примеру, иероглифы), потому идёт тенденция к переходу к т.н. стандарту Юникод (Unicode), который поддерживает универсальные кодировки – Utf-8, Utf-16, Utf-32 и др.

Самая популярная из кодировок Юникода – кодировка Utf-8. Обычно в ней сейчас верстаются страницы сайтов и пишутся разные скрипты. Она позволяет без проблем отображать различные иероглифы, греческие буквы и прочие мыслимые и немыслимые символы (размер символа до 4-х байт). В частности, все файлы WordPress и Joomla пишутся именно в этой кодировке. А также некоторые веб-технологии (в частности, AJAX) способны нормально обрабатывать только символы utf-8.

Установка кодировок файла

  Установка кодировок текстового файла при создании его обычным блокнотом. Кликабельно

В Рунете же ещё можно встретить сайты, написанные с расчётом на кодировку Windows-1251 (или cp-1251). Это специальная кодировка, предназначенная специально для кириллицы.

Почему вообще необходимо иметь представление о разных кодировках? Дело в том, что нередко на том же WordPress можно встретить, например, в Footer’е знаки вопроса вместо нормального текста. Это просто говорит о том, что php-файл Footer’а сохранён в одной кодировке, а в заголовке html-страницы указана совсем другая кодировка. Прочитайте – как сменить кодировку файла и что в этом поможет.

web-ru.net - всё о продвижении сайтов
Случайные публикации:
  • Проверка бэклинков сайта сервисами MajesticSEO.com и Ahrefs.comПроверка бэклинков сайта сервисами MajesticSEO.com и Ahrefs.com...Yahoo, причём справа есть возможность выбора региональной зоны для анализа позиций
  • Яндекс и шокирующие тизеры-баннеры в 2014.. Реальный пример с ухудшением ранжированияЯндекс и шокирующие тизеры-баннеры в 2014.. Реальный пример с ухудшением ранжирования...облем" будет не так заметно на сайте ;). Яндексу Если вебмастера,
  • Информер Яндекс Метрики. НастройкаИнформер Яндекс Метрики. Настройка...Настройка информера Яндекс Метрики Для того, чтобы его настраивать, надо
  • Будет ли конец Света в 2012? Опрос!Будет ли конец Света в 2012? Опрос!Решил подвести итог опросам на интернет-маркетинговую тему: Гугл или...
  • Какое оформление рекламного объявления РСЯ эффективнее?Какое оформление рекламного объявления РСЯ эффективнее?...и этом размер и семейство шрифта текста объявления должны быть те же, что и у
Оставьте комментарий:
Отзывов всего: 2
Через сайт Через ВКонтакте Через Facebook
  1. Ярослав пишет:

    спасибо очень выручили
    =) *THUMBS UP* *DANCE* *YAHOO*

    Ответить
  2. Евгений пишет:

    Спасибо. Чаще всего такую проблему можно встретить в инете. Да и так в блокноте некоторые нестандартные символы немецкого или испанского языка теряются в кодировке ANSI.

    Ответить
сайт web-ru.net
Я не спамлю...