Убедитесь, что ваш веб – сайт отображает правильную кодировку
Зачем беспокоиться о кодировке?
Кодировка символов, связанных с веб-страницами определяет, как страница оказывает в веб-браузере. Одним из важных различий в понимании концепции является разница между кодировкой символов и набор символов.
Сайт Dictionary.com определяет набор символов частности сопоставление символов и байтов строки (т. е. набор символов, необходимых для определенного языка). Кодировка является набор символов, для которых уникальный номер был присвоен каждого символа. Кодировка символов, как эти абстрактные символы отображаются в байтах для манипуляций в компьютере. Подводя итог, кодировка символов сообщает веб-браузер, какой набор символов, используемый при преобразовании биты в символы.
Вот несколько причин по которым, вы должны указать кодировку:
- Вы должны беспокоиться о кодировке поскольку его заявление стало требование с HTML 4.01 спецификацию.
- Если кодировка не указана в веб-страницe, браузер будет догадываться, что кодировка должна быть использован для отображения содержимого веб-страницы. Это догадки может привести к неправильной схемы кодирования.
- Браузеры позволяют пользователям выбрать кодировку по умолчанию. Этот выбор может не совпадать с местом для веб-страницы.
Что имеется в наличии?
Кодировки поддерживаются в HTML определяется с Unicode набор символов. Юникод поддерживает все алфавита с возможностью представлять миллионов символов, включая знаки ударения. Каждый символ присваивает два байта кода. Это идет вразрез с популярной кодировкой ASCII используемой в Соединенных Штатах, который использует один байт.
Вот примеры доступных кодировок символов:
- ISO 8859-1: Это стандартная кодировка латинским алфавитом. Как Latin1, она включает в себя латинской основе языках мира.
- UTF-8 (8-битный UCS / Unicode Transformation Format): Это кодировка символов может представлять любой символ в стандарте Юникод. Основное различие состоит в начальной кодировки байт-код и характер заданий для UTF-8 имеет обратную совместимость с ASCII.
- UTF-16 (16-битный Unicode Transformation Format): Это длины кодировки Unicode для переменной, которая способна кодировки каждого символа Unicode.
- US-ASCII: Это подмножество UTF-8, который охватывает стандартные ASCII набор символов.
Полный список параметров кодирования символов можно ознакомиться в Интернете, но UTF-8 является рекомендуемой и самые популярные схемы кодирования используется и сегодня.
Выбор кодировки
Основная проблема с выбора персонажа кодирования необходимо использовать тот, который охватывает все различные языки и потребности целевой аудитории. Кодировка символов имеет решающее значение при работе с многоязычными приложениями, которые могут использовать различные языки, которые используют различные схемы кодирования символов.
При выборе схемы кодировки символов, вы должны быть осведомлены о символов, которые вы будете использовать, наряду кодировка поддерживается браузером и любые другие приложения, которые могут быть использованы для работы с файлами. Стандартов UTF-8 (который я придерживаться для моей работы) и US-ASCII широко поддерживаются браузерами. Вы должны сделать свое исследование при работе с другими стандартами, чем эти два.
Использование кодировки
При доступе к веб-приложениям, веб-браузер будет использовать следующие шаги, чтобы определить его кодировку:
HTTP Content-Type заголовка, отправленных сервером по умолчанию способ определения кодировки символов. Это предпочтительный метод, и он имеет приоритет над другими пунктами в этом списке. Вот пример Content-Type линии направлены как часть заголовка HTTP:
Content-Type: text/html; charset=utf-8
Веб-разработчики могут указать Content-Type заголовок для страницы с помощью синтаксиса для разработчика.Например, разработчик ASP.NET может использовать следующую строку:
%Response.charset=»utf-8″%
Разработчик PHP может использовать эту строку:
header('Content-type: text/html; charset=utf-8');
XHTML доцентов может использовать декларации XML в первой строке страницы, чтобы указать кодировку. Вот один пример:
<?xml version="1.0" encoding="UTF-8"?>
Вы можете использовать HTML / XHTML мета Content-Type элемента. Он находится в заголовке часть страницы с кодировки, указанной в его кодировку собственности.
<meta http-equiv="content-type" content="text/html; charset=UTF-8">
CSS
Вы можете объявить кодировку внешних таблиц стилей CSS. Этот шаг не является необходимым с CSS встроенные в страницы, кодировка символов страницы заботится об этом. Вы можете назначить кодировку для CSS файл, добавив его в верхней части CSS файл. Следующий синтаксис:
@charset "utf-8";
