Короткий огляд підтримуваних кодувань
Список підтримуваних кодувань
Название в реестре кодировок IANA | Лежащий в основе набор символов | Опис | Дополнительная информация |
---|---|---|---|
ISO-10646-UCS-4 | ISO 10646 | Універсальний набір символів з 31 бітом для коду символу, стандартизований ISO/IEC 10646 як UCS-4. Встановлено синхронізацію зі стандартом Юнікод. | Якщо ця назва використовується у засобах перетворення кодувань, конвертер спробує визначити порядок розташування байтів за BOM (мітка порядку байтів). |
ISO-10646-UCS-4 | UCS-4 | Дивіться вище. | В отличие отUCS-4 , Рядки завжди приймаються закодованими в прямому порядку розташування байтів. |
ISO-10646-UCS-4 | UCS-4 | Дивіться вище. | В отличие отUCS-4 , Рядки завжди приймаються закодованими в зворотному порядку розташування байтів. |
ISO-10646-UCS-2 | UCS-2 | Універсальний набір символів з 16 бітом для коду символу, стандартизований ISO/IEC 10646 як UCS-2. Встановлено синхронізацію зі стандартом Юнікод. | Якщо ця назва використовується у засобах перетворення кодувань, конвертер спробує визначити порядок розташування байтів за BOM (мітка порядку байтів). |
ISO-10646-UCS-2 | UCS-2 | Дивіться вище. | В отличие отUCS-2 , Рядки завжди приймаються закодованими в прямому порядку розташування байтів. |
ISO-10646-UCS-2 | UCS-2 | Дивіться вище. | В отличие отUCS-2 , Рядки завжди приймаються закодованими в зворотному порядку розташування байтів. |
UTF-32 | Юнікод | Формат перетворення Юнікоду з 32-бітною шириною символу, кодовий простір якого відповідає стандарту кодової таблиці Юнікоду. Ця схема кодування не ідентична UCS-4, оскільки кодовий простір Юнікод обмежено 21-м бітом. | Якщо ця назва використовується у засобах перетворення кодувань, конвертер спробує визначити порядок розташування байтів за BOM (мітка порядку байтів). |
UTF-32BE | Юнікод | Дивіться вище | В отличие отUTF-32 , Рядки завжди приймаються закодованими в прямому порядку розташування байтів. |
UTF-32LE | Юнікод | Дивіться вище | В отличие отUTF-32 , Рядки завжди приймаються закодованими в зворотному порядку розташування байтів. |
UTF-16 | Юнікод | Формат перетворення Юнікоду з 32-бітною шириною коду символу. Специфікація UTF-16 відрізняється від UCS-2 через те, що починаючи з Юнікод 2.0 було впроваджено механізм заміщення символів і тепер UTF-16 посилається на 21-бітовий кодовий простір. | Якщо ця назва використовується у засобах перетворення кодувань, конвертер спробує визначити порядок розташування байтів за BOM (мітка порядку байтів). |
UTF-16BE | Юнікод | Дивіться вище. | В отличие отUTF-16 , Рядки завжди приймаються закодованими в прямому порядку розташування байтів. |
UTF-16LE | Юнікод | Дивіться вище. | В отличие отUTF-16 , Рядки завжди приймаються закодованими в зворотному порядку розташування байтів. |
UTF-8 | Юнікод / UCS | Формат перетворення Юнікоду з 32-бітною шириною коду символу. | ні |
UTF-7 | Юнікод | Безпечний для поштових програм та рішень формат перетворення Юнікоду, визначений у специфікації » RFC2152 | ні |
(ні) | Юнікод | Різновид UTF-7, спеціально розроблений для використання в » протоколі IMAP | ні |
US-ASCII (переважне MIME-ім'я) / iso-ir-6 / ANSI_X3.4-1986 / ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII | ASCII / ISO 646 | ASCII (American Standard Code for Information Interchange – американський стандартний код для обміну інформацією) – широко використовується 7-бітове кодування. Також стандартизований як міжнародний стандарт ISO 646. | (ні) |
EUC-JP (переважне MIME-ім'я) / Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese | Об'єднання US-ASCII / JIS X0201:1997 (частина hankaku kana) / JIS X0208:1990 / JIS X0212:1990 | Як видно з назви, це кодування використовується в основному в Unix системах або подібних до них. Вихідна схема кодування Extended UNIX Code лягла основою стандарту ISO 2022. | Набір символів, на який посилається EUC-JP, відрізняється від набору для IBM932/CP932, які використовуються в OS/2® та Microsoft® Windows®. Для забезпечення взаємодії між цими платформами використовуйте кодування EUCJP-WIN. |
Shift_JIS (переважне MIME-ім'я) / MS_Kanji / csShift_JIS | Об'єднання JIS X0201:1997 / JIS X0208:1997 | Shift_JIS був розроблений на початку 80-х, коли Японські текстові процесори для рядових користувачів лише виходили на ринок, щоб зберегти сумісність із схемою кодування JIS X 0201:1976. Відповідно до визначення IANA, кодова таблиця Shift_JIS дещо відрізняється від IBM932/CP932. Тим не менш, назви "SJIS" / "Shift_JIS" помилково використовуються для звернення до цих кодових таблиць. | Для кодової таблиці CP932 використовуйте кодування SJIS-WIN. |
(none) | Об'єднання JIS X0201:1997 / JIS X0208:1997 / IBM розширення / NEC розширення | Незважаючи на те, що це "кодування" використовує ту ж схему кодування, що і EUC-JP, набори символів, що лежать у їх основі, різні. Таким чином, деякі коди посилаються на символи, відмінні від EUC-JP. | ні |
Windows-31J / csWindows31J | Об'єднання JIS X0201:1997 / JIS X0208:1997 / IBM розширення / NEC розширення | Незважаючи на те, що це "кодування" використовує ту ж схему кодування, що і Shift_JIS, набори символів, що лежить в їхній основі, різні. Таким чином, деякі коди посилаються на відмінні від Shift_JIS символи. | (ні) |
ISO-2022-JP (переважне MIME-ім'я) / csISO2022JP | US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983 | » RFC1468 | (ні) |
JIS | |||
ISO-8859-1 | |||
ISO-8859-2 | |||
ISO-8859-3 | |||
ISO-8859-4 | |||
ISO-8859-5 | |||
ISO-8859-6 | |||
ISO-8859-7 | |||
ISO-8859-8 | |||
ISO-8859-9 | |||
ISO-8859-10 | |||
ISO-8859-13 | |||
ISO-8859-14 | |||
ISO-8859-15 | |||
ISO-8859-16 | |||
byte2be | |||
byte2le | |||
byte4be | |||
byte4le | |||
BASE64 | |||
HTML-ENTITIES | |||
7bit | |||
8bit | |||
EUC-CN | |||
CP936 | |||
HZ | |||
EUC-TW | |||
CP950 | |||
BIG-5 | |||
EUC-KR | |||
UHC (CP949) | |||
ISO-2022-KR | |||
Windows-1251 (CP1251) | |||
Windows-1252 (CP1252) | |||
CP866 (IBM866) | |||
KOI8-R | |||
KOI8-U |