Punycode | это... Что такое Punycode? (original) (raw)

Punycode (произносится как «пуникод» или «пьюникод») — стандартизированный метод преобразования последовательностей Unicode-символов в так называемые ACE-последовательности, которые состоят только из алфавитно-цифровых символов, как это разрешено в доменных именах. Punycode был разработан для однозначного преобразования доменных имен в последовательность ASCII-символов.

Содержание

Мотивация

Важнейшей причиной введения Punycode был тот факт, что в утверждённой стандартом системе доменных имен разрешены только 26 символов латинского алфавита, цифры от 0 до 9 и дефис. Для английского и некоторых других языков с латинским алфавитом этого достаточно, однако другие языки, в том числе и с латинским алфавитом, содержат дополнительные символы, например, [ä](712966), [ö](612276) или [ü](752571).

Правила преобразования

В качестве базисных символов выступают символы латинского алфавита от a до z (без различия между прописными и строчными буквами), цифры от 0 до 9 и дефис «-»; всего 37 символов.

Примеры

Последовательность символов Кодировка
abcdef abcdef
abæcdöef abcdef-qua4k
schön schn-7qa
ยจฆฟคฏข 22cdfh1b8fsa
74h
правда 80aafi6cg
почемужеонинеговорятпорусски (пример из RFC 3492) b1abfaaepdrnnbgefbaDotcwatmq2g4l

Браузеры с поддержкой Punycode

Поддержка кириллических доменов

Punycode-конвертеры

Существуют также специальные программы или сервисы, называемые Punycode-конвертерами, позволяющие осуществлять кодирование/декодирование последовательности Unicode-символов в ACE и наоборот. Например, Punycode-конвертер

Примечания

  1. bugzilla.mozilla.org
  2. Браузер Safari обновился до 5й версии (рус.). Хабрахабр (8 июня 2010 года). Проверено 8 июня 2010.
  3. 1 2 3 4 5 Результаты проведённого компанией REG.RU тестирования работы браузеров с доменом .РФ (рус.). REG.RU (30 июня 2010 года). Проверено 30 сентября 2010.

Ссылки