Основи японських багатобайтних кодувань
Японські символи можуть бути представлені тільки в багатобайтних кодування, і багато стандартів кодування залежать від платформи та призначення тексту. Ускладнює ситуацію те, що ці стандарти дещо один від одного відрізняються. Щоб створити веб-додаток, що правильно працює в японському оточенні, розробнику необхідно тримати всі ці розбіжності в розумі, щоб бути впевненим, що в кожний момент використовується правильне кодування.
- Кодовий простір для символу може тривати до шести байт
- Більшість японських багатобайтних символів вимагають для зберігання вдвічі більше простору ніж однобайтні символи. Такі символи називають "zen-kaku" японською, що означає "повна ширина". Інші, вужчі символи називають "han-kaku", що означає "напівширина". Проте графічні властивості символів залежать від шрифту, яким вони відображаються.
- У деяких кодуваннях для зміни кодової розмітки певної області кодів (
00h
на7fh
) використовуються клавіші shift(escape), визначені в стандарті ISO-2022. - ISO-2022-JP повинен використовуватися в SMTP/NNTP, а заголовки та сутності повинні перекодуватися відповідно до вимог RFC. Навіть якщо перекодування не потрібне, все ж таки воно буде не зайвим, оскільки деякі популярні поштові клієнти не вміють працювати з іншими кодуваннями.
- Веб-сторінки, що створюються для мобільних телефонів, таких як» i-mode або » EZwebповинні використовувати кодування Shift_JIS.
- Емодзі, що використовуються у сервісах мобільних телефонів, таких як» i-mode або » EZweb