Альтернативная кодировка | это... Что такое Альтернативная кодировка? (original) (raw)

Проблемы с содержанием статьи Проверить информацию. Необходимо проверить точность фактов и достоверность сведений, изложенных в этой статье.На странице обсуждения должны быть пояснения.

«Альтернати́вная кодиро́вка» — основанная на CP437 кодовая страница, где все специфические европейские символы во второй половине заменены на кириллицу, оставляя псевдографические символы нетронутыми. Следовательно, это не портит вид программ, использующих для работы текстовые окна, а также обеспечивает использование в них символов кириллицы.

Исторически существовало много вариантов альтернативной кодировки, но все различия касаются только области 0xF0 — 0xFF (240—255). Использовались всевозможные русификаторы-самоделки, писавшиеся независимо частными программистами, распространяясь по знакомству и через редкие компьютерные центры.

Окончательным стандартом стала кодировка IBM CP866, поддержка которой была добавлена в MS-DOS версии 6.22. В этой кодировке записываются имена файлов в системе FAT (и короткие имена в VFAT). Поныне является популярной стандартной кодировкой Microsoft в среде DOS и OS/2, используется в консоли русифицированных систем семейства Windows NT. Вне среды MS-DOS в Microsoft Windows заменена стандартной кодировкой CP1251, а в операционных системах Windows NT и следующих за ней (Windows 2000, Windows XP, Windows Server 2003, Windows Vista, Windows Server 2008, Windows 7) — кодировкой Юникод.

CP866

Нижняя часть таблиц кодировки (латиница) полностью соответствует кодировке ASCII. В приведённых таблицах числа под буквами обозначают шестнадцатеричный код буквы в Юникоде.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. А 410 Б 411 В 412 Г 413 Д 414 Е 415 Ж 416 З 417 И 418 Й 419 К 41A Л 41B М 41C Н 41D О 41E П 41F
9. Р 420 С 421 Т 422 У 423 Ф 424 Х 425 Ц 426 Ч 427 Ш 428 Щ 429 Ъ 42A Ы 42B Ь 42C Э 42D Ю 42E Я 42F
A. а 430 б 431 в 432 г 433 д 434 е 435 ж 436 з 437 и 438 й 439 к 43A л 43B м 43C н 43D о 43E п 43F
B. ░ 2591 ▒ 2592 ▓ 2593 │ 2502 ┤ 2524 ╡ 2561 ╢ 2562 ╖ 2556 ╕ 2555 ╣ 2563 ║ 2551 ╗ 2557 ╝ 255D ╜ 255C ╛ 255B ┐ 2510
C. └ 2514 ┴ 2534 ┬ 252C ├ 251C ─ 2500 ┼ 253C ╞ 255E ╟ 255F ╚ 255A ╔ 2554 ╩ 2569 ╦ 2566 ╠ 2560 ═ 2550 ╬ 256C ╧ 2567
D. ╨ 2568 ╤ 2564 ╥ 2565 ╙ 2559 ╘ 2558 ╒ 2552 ╓ 2553 ╫ 256B ╪ 256A ┘ 2518 ┌ 250C █ 2588 ▄ 2584 ▌ 258C ▐ 2590 ▀ 2580
E. р 440 с 441 т 442 у 443 ф 444 х 445 ц 446 ч 447 ш 448 щ 449 ъ 44A ы 44B ь 44C э 44D ю 44E я 44F
F. Ё 401 ё 451 Є 404 є 454 Ї 407 ї 457 Ў 40E ў 45E ° B0 ∙ 2219 · B7 √ 221A № 2116 ¤ A4 ■ 25A0 A0

CP866 может использоваться также для украинского и белорусского языков, поскольку включает символы Єє Її Ўў, однако в ней нет кириллической Іі, так что приходится вместо неё использовать латинскую Ii; также отсутствует Ґґ.

Другие варианты

(Показаны только последние строки таблиц, поскольку всё остальное совпадает.)

Наиболее распространённый вариант до появления CP866, называемый также «модифицированной альтернативной кодировкой» (в KOI8-R используется тот же набор символов, но в другом порядке):

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
F. Ё 401 ё 451 ≥ 2265 ≤ 2264 ⌠ 2320 ⌡ 2321 ÷ F7 ≈ 2248 ° B0 ∙ 2219 · B7 √ 221A ⁿ 207F ² B2 ■ 25A0 A0

То же самое, но без буквы Ё (все символы 0xF0—0xFF совпадают с соответствующими символами CP437):

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
F. ≡ 2261 ± B1 ≥ 2265 ≤ 2264 ⌠ 2320 ⌡ 2321 ÷ F7 ≈ 2248 ° B0 ∙ 2219 · B7 √ 221A ⁿ 207F ² B2 ■ 25A0 A0

RUSCII, она же CP1125:

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
F. Ё 401 ё 451 Ґ 490 ґ 491 Є 404 є 454 І 406 і 456 Ї 407 ї 457 · B7 √ 221A № 2116 ¤ A4 ■ 25A0 A0

Альтернативная кодировка согласно ГОСТ 19768-87 (по набору символов совпадает с основной кодировкой; в позициях 0xF2—0xF5 должны быть прямые диагональные линии):

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
F. Ё 401 ё 451 ╭ 256D ╮ 256E ╯ 256F ╰ 2570 → 2192 ← 2190 ↓ 2193 ↑ 2191 ÷ F7 ± B1 № 2116 ¤ A4 ■ 25A0 A0

CP866.chuv — кодировка, использовавшаяся для отображения знаков чувашского алфавита:

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
F. Ё 401 ё 451 Ӑ 4D0 ӑ 4D1 Ӗ 4D6 ӗ 4D7 Ҫ 4AA ҫ 4AB Ӳ 4F2 ӳ 4F3 · B7 √ 221A № 2116 ¤ A4 ■ 25A0 A0

CP866LV — кодировка используемая в Латвии(Латвийской ССР), часть стандартных символов заменена на буквы латышского алфавита:

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
B. ░ 2591 ▒ 2592 ▓ 2593 │ 2502 ┤ 2524 Ā 100 ╢ 2562 ņ 146 ╕ 2555 ╣ 2563 ║ 2551 ╗ 2557 ╝ 255D ╜ 255C ╛ 255B ┐ 2510
C. └ 2514 ┴ 2534 ┬ 252C ├ 251C ─ 2500 ┼ 253C ā 101 ╟ 255F ╚ 255A ╔ 2554 ╩ 2569 ╦ 2566 ╠ 2560 ═ 2550 ╬ 256C ╧ 2567
D. Š 160 ╤ 2564 č 10D Č 10C ╘ 2558 ╒ 2552 ģ 123 Ī 12A ī 12B ┘ 2518 ┌ 250C █ 2588 ▄ 2584 ū 16B Ū 16A ▀ 2580
E. р 440 с 441 т 442 у 443 ф 444 х 445 ц 446 ч 447 ш 448 щ 449 ъ 44A ы 44B ь 44C э 44D ю 44E я 44F
F. Ē 112 ē 113 Ģ 122 ķ 137 Ķ 136 ļ 13C Ļ 13B ž 17E Ž 17D ∙ 2219 · B7 √ 221A Ņ 145 š 161 ■ 25A0 A0

Источники

Кодировки символов
Основы → алфавиттекст ( файлданные ) • набор символов • конверсия
Исторические кодировки → Докомп.: семафорная (Макарова)МорзеБодоМТК-2 Комп.: 6 битУППRADIX-50EBCDIC ( ДКОИ-8 ) • КОИ-7ISO 646
совре-менное 8-битноепредстав-ление символы ASCII ( управляющиепечатные ) не-ASCII ( псевдографика )
8бит. код.стр. Разные → Кириллица: КОИ-8ГОСТ 19768-87MacCyrillic
ISO 8859 1(лат.) 2 3 4 5**(кир.)** 6 7 8 9 10 11 12 13 14 15(€) 16
Windows → 1250 1251**(кир.)** 1252 1253 1254 1255 1256 1257 1258 | WGL4
IBM&DOS → 437850852855866 «альт.» • ( МИК ) • ( НИИ ЭВМ )
Много-байтные Традиционные → DBCS ( GB2312 ) • HTML
Unicode UTF-16UTF-8список символов ( кириллица )
Связанныетемы → интерфейс пользователяраскладка клавиатурылокальперевод строкишрифткракозябрытранслитнестандартные шрифты • текст как изображение Утилиты: iconvrecode