Основи японських багатобайтних кодувань

Японські символи можуть бути представлені тільки в багатобайтних кодування, і багато стандартів кодування залежать від платформи та призначення тексту. Ускладнює ситуацію те, що ці стандарти дещо один від одного відрізняються. Щоб створити веб-додаток, що правильно працює в японському оточенні, розробнику необхідно тримати всі ці розбіжності в розумі, щоб бути впевненим, що в кожний момент використовується правильне кодування.

  • Кодовий простір для символу може тривати до шести байт
  • Більшість японських багатобайтних символів вимагають для зберігання вдвічі більше простору ніж однобайтні символи. Такі символи називають "zen-kaku" японською, що означає "повна ширина". Інші, вужчі символи називають "han-kaku", що означає "напівширина". Проте графічні властивості символів залежать від шрифту, яким вони відображаються.
  • У деяких кодуваннях для зміни кодової розмітки певної області кодів (00hна7fh) використовуються клавіші shift(escape), визначені в стандарті ISO-2022.
  • ISO-2022-JP повинен використовуватися в SMTP/NNTP, а заголовки та сутності повинні перекодуватися відповідно до вимог RFC. Навіть якщо перекодування не потрібне, все ж таки воно буде не зайвим, оскільки деякі популярні поштові клієнти не вміють працювати з іншими кодуваннями.
  • Веб-сторінки, що створюються для мобільних телефонів, таких як» i-mode або » EZwebповинні використовувати кодування Shift_JIS.
  • Емодзі, що використовуються у сервісах мобільних телефонів, таких як» i-mode або » EZweb