О кодировке UTF-8

О кодировке UTF-8

Первая строка элемента заголовка html-документа обычно

<meta charset = "UTF-8" /> 

Что оно делает?

Юникод

Unicode перечисляет символы. Каждому символу в списке соответствует номер. Кодировка UTF-8 определяет, как эти числа хранятся в файлах / памяти компьютера.

Пример 1 : Буква z указана как номер 122. Она хранится как один байт:

01111010

Первые 128 символов одинаковы во всех кодировках (базовая латиница), поэтому буква z будет сохранена без указания кодировки.

Пример 2: символ é — это номер 233 в списке Unicode, сохраненный как

11000011 10101001

Пример 3: буква каннада ಊ имеет номер 3210. Он хранится как

11100000 10110010 10001010

HTML-коды и сущности

HTML-коды используют Unicode, независимо от используемого набора символов. Поэтому, если вы наберете, &#3210;вы получите ಊ, даже если вы опустите метатег charset или выберете другой, например iso-8859

Для é вы также можете использовать HTML-код &#233;или объект HTML &eacute;.

UTF-8 используется по умолчанию?

Иногда утверждается, что UTF-8 является кодировкой символов по умолчанию для HTML5. Но это не так. Не в том смысле, что он будет активен, если вы его не укажете. Поэтому убедитесь, что тег всегда присутствует как первый дочерний элемент head.

Некоторые ссылки

https://unicode-table.com/

Источник: potatodie.nl

Оставить комментарий