Короткий огляд підтримуваних кодувань

Список підтримуваних кодувань

Название в реестре кодировок IANAЛежащий в основе набор символовОписДополнительная информация
ISO-10646-UCS-4ISO 10646Універсальний набір символів з 31 бітом для коду символу, стандартизований ISO/IEC 10646 як UCS-4. Встановлено синхронізацію зі стандартом Юнікод.Якщо ця назва використовується у засобах перетворення кодувань, конвертер спробує визначити порядок розташування байтів за BOM (мітка порядку байтів).
ISO-10646-UCS-4UCS-4Дивіться вище.В отличие отUCS-4, Рядки завжди приймаються закодованими в прямому порядку розташування байтів.
ISO-10646-UCS-4UCS-4Дивіться вище.В отличие отUCS-4, Рядки завжди приймаються закодованими в зворотному порядку розташування байтів.
ISO-10646-UCS-2UCS-2Універсальний набір символів з 16 бітом для коду символу, стандартизований ISO/IEC 10646 як UCS-2. Встановлено синхронізацію зі стандартом Юнікод.Якщо ця назва використовується у засобах перетворення кодувань, конвертер спробує визначити порядок розташування байтів за BOM (мітка порядку байтів).
ISO-10646-UCS-2UCS-2Дивіться вище.В отличие отUCS-2, Рядки завжди приймаються закодованими в прямому порядку розташування байтів.
ISO-10646-UCS-2UCS-2Дивіться вище.В отличие отUCS-2, Рядки завжди приймаються закодованими в зворотному порядку розташування байтів.
UTF-32ЮнікодФормат перетворення Юнікоду з 32-бітною шириною символу, кодовий простір якого відповідає стандарту кодової таблиці Юнікоду. Ця схема кодування не ідентична UCS-4, оскільки кодовий простір Юнікод обмежено 21-м бітом.Якщо ця назва використовується у засобах перетворення кодувань, конвертер спробує визначити порядок розташування байтів за BOM (мітка порядку байтів).
UTF-32BEЮнікодДивіться вищеВ отличие отUTF-32, Рядки завжди приймаються закодованими в прямому порядку розташування байтів.
UTF-32LEЮнікодДивіться вищеВ отличие отUTF-32, Рядки завжди приймаються закодованими в зворотному порядку розташування байтів.
UTF-16ЮнікодФормат перетворення Юнікоду з 32-бітною шириною коду символу. Специфікація UTF-16 відрізняється від UCS-2 через те, що починаючи з Юнікод 2.0 було впроваджено механізм заміщення символів і тепер UTF-16 посилається на 21-бітовий кодовий простір.Якщо ця назва використовується у засобах перетворення кодувань, конвертер спробує визначити порядок розташування байтів за BOM (мітка порядку байтів).
UTF-16BEЮнікодДивіться вище.В отличие отUTF-16, Рядки завжди приймаються закодованими в прямому порядку розташування байтів.
UTF-16LEЮнікодДивіться вище.В отличие отUTF-16, Рядки завжди приймаються закодованими в зворотному порядку розташування байтів.
UTF-8Юнікод / ​​UCSФормат перетворення Юнікоду з 32-бітною шириною коду символу.ні
UTF-7ЮнікодБезпечний для поштових програм та рішень формат перетворення Юнікоду, визначений у специфікації » RFC2152ні
(ні)ЮнікодРізновид UTF-7, спеціально розроблений для використання в » протоколі IMAPні
US-ASCII (переважне MIME-ім'я) / iso-ir-6 / ANSI_X3.4-1986 / ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCIIASCII / ISO 646ASCII (American Standard Code for Information Interchange – американський стандартний код для обміну інформацією) – широко використовується 7-бітове кодування. Також стандартизований як міжнародний стандарт ISO 646.(ні)
EUC-JP (переважне MIME-ім'я) / Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapaneseОб'єднання US-ASCII / JIS X0201:1997 (частина hankaku kana) / JIS X0208:1990 / JIS X0212:1990Як видно з назви, це кодування використовується в основному в Unix системах або подібних до них. Вихідна схема кодування Extended UNIX Code лягла основою стандарту ISO 2022.Набір символів, на який посилається EUC-JP, відрізняється від набору для IBM932/CP932, які використовуються в OS/2® та Microsoft® Windows®. Для забезпечення взаємодії між цими платформами використовуйте кодування EUCJP-WIN.
Shift_JIS (переважне MIME-ім'я) / MS_Kanji / csShift_JISОб'єднання JIS X0201:1997 / JIS X0208:1997Shift_JIS був розроблений на початку 80-х, коли Японські текстові процесори для рядових користувачів лише виходили на ринок, щоб зберегти сумісність із схемою кодування JIS X 0201:1976. Відповідно до визначення IANA, кодова таблиця Shift_JIS дещо відрізняється від IBM932/CP932. Тим не менш, назви "SJIS" / "Shift_JIS" помилково використовуються для звернення до цих кодових таблиць.Для кодової таблиці CP932 використовуйте кодування SJIS-WIN.
(none)Об'єднання JIS X0201:1997 / JIS X0208:1997 / IBM розширення / NEC розширенняНезважаючи на те, що це "кодування" використовує ту ж схему кодування, що і EUC-JP, набори символів, що лежать у їх основі, різні. Таким чином, деякі коди посилаються на символи, відмінні від EUC-JP.ні
Windows-31J / csWindows31JОб'єднання JIS X0201:1997 / JIS X0208:1997 / IBM розширення / NEC розширенняНезважаючи на те, що це "кодування" використовує ту ж схему кодування, що і Shift_JIS, набори символів, що лежить в їхній основі, різні. Таким чином, деякі коди посилаються на відмінні від Shift_JIS символи.(ні)
ISO-2022-JP (переважне MIME-ім'я) / csISO2022JPUS-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983» RFC1468(ні)
JIS
ISO-8859-1
ISO-8859-2
ISO-8859-3
ISO-8859-4
ISO-8859-5
ISO-8859-6
ISO-8859-7
ISO-8859-8
ISO-8859-9
ISO-8859-10
ISO-8859-13
ISO-8859-14
ISO-8859-15
ISO-8859-16
byte2be
byte2le
byte4be
byte4le
BASE64
HTML-ENTITIES
7bit
8bit
EUC-CN
CP936
HZ
EUC-TW
CP950
BIG-5
EUC-KR
UHC (CP949)
ISO-2022-KR
Windows-1251 (CP1251)
Windows-1252 (CP1252)
CP866 (IBM866)
KOI8-R
KOI8-U