КОИ-8 | это... Что такое КОИ-8? (original) (raw)
У этого термина существуют и другие значения, см. КОИ.
КОИ-8 (код обмена информацией, 8 битов), KOI8 — восьмибитовая ASCII-совместимая кодовая страница, разработанная для кодирования букв кириллических алфавитов.
Существует также семибитовая версия кодировки, не полностью совместимая с ASCII — КОИ-7. КОИ-7 и КОИ-8 описаны в ныне не действующем ГОСТ 19768-74.
Разработчики КОИ-8 поместили символы русского алфавита в верхней части кодовой таблицы таким образом, что позиции кириллических символов соответствуют их фонетическим аналогам в английском алфавите в нижней части таблицы. Это означает, что если в тексте, написанном в КОИ-8, убирать восьмой бит каждого символа, то получается «читаемый» текст, подобный транслиту. Например, слова «Русский Текст» превратились бы в «rUSSKIJ tEKST». Как побочное следствие, символы кириллицы оказались расположены не в алфавитном порядке.
Существует несколько вариантов кодировки КОИ-8 для различных кириллических алфавитов, расширяющие определённые коды (общий диапазон 192—255 с 32 русскими буквами в двух регистрах остаётся неизменным во всех вариантах). Русский алфавит описывается в кодировке KOI8-R, украинский — в KOI8-U.
KOI8-R стал фактически стандартом для русской кириллицы в 1990-х годах в юникс-подобных операционных системах и электронной почте. Автор данной кодировки (RFC1489), которая стала первой русской стандартизированной кодировкой в интернете — Андрей Чернов, в начале 1990-х годов работал в компании Демос (сеть Релком) и непосредственно участвовал в запуске и наладке первого интернет-канала между Россией и западными странами.
IETF утвердил несколько RFC по вариантам кодировки KOI-8:
- RFC1489 — KOI8-R;
- RFC2319 — KOI8-U;
- RFC1345 — ISO-IR-111 (с ошибкой в определении основного диапазона).
IANA зарегистрировала их в своём списке.
Стандарт RFC 1489 предписывает наличие графических символов «рамок» (псевдографики), однако это требование выполняется довольно редко.
В Microsoft Windows KOI8-R присвоен код страницы 20866, KOI8-U — 21866.
Начало таблицы кодировки (латиница) полностью соответствует кодировке ASCII.
В приведённых таблицах числа под буквами обозначают шестнадцатеричный код буквы в Юникоде.
Содержание
- 1 Кодировка KOI8-R (русская)
- 2 Другие варианты
- 3 Некириллические варианты КОИ-8
- 4 Примечания
- 5 Ссылки
Кодировка KOI8-R (русская)
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | ─ 2500 | │ 2502 | ┌ 250C | ┐ 2510 | └ 2514 | ┘ 2518 | ├ 251C | ┤ 2524 | ┬ 252C | ┴ 2534 | ┼ 253C | ▀ 2580 | ▄ 2584 | █ 2588 | ▌ 258C | ▐ 2590 |
9. | ░ 2591 | ▒ 2592 | ▓ 2593 | ⌠ 2320 | ■ 25A0 | ∙ 2219 | √ 221A | ≈ 2248 | ≤ 2264 | ≥ 2265 | A0 | ⌡ 2321 | ° B0 | ² B2 | · B7 | ÷ F7 |
A. | ═ 2550 | ║ 2551 | ╒ 2552 | ё 451 | ╓ 2553 | ╔ 2554 | ╕ 2555 | ╖ 2556 | ╗ 2557 | ╘ 2558 | ╙ 2559 | ╚ 255A | ╛ 255B | ╜ 255C | ╝ 255D | ╞ 255E |
B. | ╟ 255F | ╠ 2560 | ╡ 2561 | Ё 401 | ╢ 2562 | ╣ 2563 | ╤ 2564 | ╥ 2565 | ╦ 2566 | ╧ 2567 | ╨ 2568 | ╩ 2569 | ╪ 256A | ╫ 256B | ╬ 256C | © A9 |
C. | ю 44E | а 430 | б 431 | ц 446 | д 434 | е 435 | ф 444 | г 433 | х 445 | и 438 | й 439 | к 43A | л 43B | м 43C | н 43D | о 43E |
D. | п 43F | я 44F | р 440 | с 441 | т 442 | у 443 | ж 436 | в 432 | ь 44C | ы 44B | з 437 | ш 448 | э 44D | щ 449 | ч 447 | ъ 44A |
E. | Ю 42E | А 410 | Б 411 | Ц 426 | Д 414 | Е 415 | Ф 424 | Г 413 | Х 425 | И 418 | Й 419 | К 41A | Л 41B | М 41C | Н 41D | О 41E |
F. | П 41F | Я 42F | Р 420 | С 421 | Т 422 | У 423 | Ж 416 | В 412 | Ь 42C | Ы 42B | З 417 | Ш 428 | Э 42D | Щ 429 | Ч 427 | Ъ 42A |
Другие варианты
Показаны только не совпадающие строки таблиц, поскольку всё остальное совпадает.
Кодировка KOI8-U (русско-украинская)
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A. | ═ 2550 | ║ 2551 | ╒ 2552 | ё 451 | є 454 | ╔ 2554 | і 456 | ї 457 | ╗ 2557 | ╘ 2558 | ╙ 2559 | ╚ 255A | ╛ 255B | ґ 491 | ╝ 255D | ╞ 255E |
B. | ╟ 255F | ╠ 2560 | ╡ 2561 | Ё 401 | Є 404 | ╣ 2563 | І 406 | Ї 407 | ╦ 2566 | ╧ 2567 | ╨ 2568 | ╩ 2569 | ╪ 256A | Ґ 490 | ╬ 256C | © A9 |
Кодировка KOI8-RU (русско-белорусско-украинская)
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A. | ═ 2550 | ║ 2551 | ╒ 2552 | ё 451 | є 454 | ╔ 2554 | і 456 | ї 457 | ╗ 2557 | ╘ 2558 | ╙ 2559 | ╚ 255A | ╛ 255B | ґ 491 | ў 45E | ╞ 255E |
B. | ╟ 255F | ╠ 2560 | ╡ 2561 | Ё 401 | Є 404 | ╣ 2563 | І 406 | Ї 407 | ╦ 2566 | ╧ 2567 | ╨ 2568 | ╩ 2569 | ╪ 256A | Ґ 490 | Ў 40E | © A9 |
Кодировка KOI8-C (кавказская)
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | ғ493 | җ497 | қ49B | ҝ49D | ң4A3 | ү4AF | ұ4B1 | ҳ4B3 | ҷ4B7 | ҹ4B9 | һ4BB | ▀2580 | ҝ49D | ӣ4E3 | ө4E9 | ӯ4EF |
9. | Ғ492 | Җ496 | Қ49A | Ҝ49C | Ң4A2 | Ү4AE | Ұ4B0 | Ҳ4B2 | Ҷ4B6 | Ҹ4B8 | Һ4BA | ⌡2321 | Ә4D8 | Ӣ4E2 | Ө4E8 | Ӯ4EE |
A. | A0 | ђ452 | ѓ453 | ё451 | є454 | ѕ455 | і456 | ї457 | ј458 | љ459 | њ45A | ћ45B | ќ45C | ґ491 | ў45E | џ45F |
B. | №2116 | Ђ402 | Ѓ403 | Ё401 | Є404 | Ѕ405 | І406 | Ї407 | Ј408 | Љ409 | Њ40A | Ћ40B | Ќ40C | Ґ490 | Ў40E | Џ40F |
Кодировка KOI8-T (таджикская)
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | қ49B | ғ493 | ‚201A | Ғ492 | „201E | …2026 | †2020 | ‡2021 | ‰2030 | ҳ4B3 | ‹2039 | Ҳ4B2 | ҷ4B7 | Ҷ4B6 | ||
9. | Қ49A | ‘2018 | ’2019 | “201C | ”201D | •2022 | –2013 | —2014 | ™2122 | ›203A | ||||||
A. | ӯ4EF | Ӯ4EE | ё451 | ¤A4 | ӣ4E3 | ¦A6 | §A7 | «AB | ¬AC | AD | ®AE | |||||
B. | °B0 | ±B1 | ²B2 | Ё401 | Ӣ4E2 | ¶B6 | ·B7 | №2116 | »BB | ©A9 |
Кодировка KOI8-O, KOI8-C (славянская, старая орфография)
0407
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | Ђ 0402 | Ѓ 0403 | ¸ 00B8 | ѓ 0453 | „ 201E | … 2026 | † 2020 | § 00A7 | € 20AC | ¨ 00A8 | Љ 0409 | ‹ 2039 | Њ 040A | Ќ 040C | Ћ 040B | Џ 040F |
9. | ђ 0452 | ‘ 2018 | ’ 2019 | “ 201C | ” 201D | • 2022 | – 2013 | — 2014 | £ 00A3 | · 00B7 | љ 0459 | › 203A | њ 045A | ќ 045C | ћ 045B | џ 045F |
A. | 00A0 | ѵ 0475 | ѣ 0463 | ё 0451 | є 0454 | ѕ 0455 | і 0456 | ї 0457 | ј 0458 | ® 00AE | ™ 2122 | « 00AB | ѳ 0473 | ґ 0491 | ў 045E | ´ 00B4 |
B. | ° 00B0 | Ѵ 0474 | Ѣ 0462 | Ё 0401 | Є 0404 | Ѕ 0405 | І 0406 | Ї 0407 | Ј 0408 | № 2116 | ¢ 00A2 | » 00BB | Ѳ 0472 | Ґ 0490 | Ў 040E | © 00A9 |
Кодировка ISO-IR-111, KOI8-E
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A. | 00A0 | ђ 0452 | ѓ 0453 | ё 0451 | є 0454 | ѕ 0455 | і 0456 | ї 0457 | ј 0458 | љ 0459 | њ 045A | ћ 045B | ќ 045C | 00AD | ў 045E | џ 045F |
B. | № 2116 | Ђ 0402 | Ѓ 0403 | Ё 0401 | Є 0404 | Ѕ 0405 | І 0406 | Ї 0407 | Ј 0408 | Љ 0409 | Њ 040A | Ћ 040B | Ќ 040C | ¤ 00A4 | Ў 040E | Џ 040F |
Кодировка KOI8-Unified, KOI8-F
Является предложением компании Fingertip Software[1]
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | ─ 2500 | │ 2502 | ┌ 250C | ┐ 2510 | └ 2514 | ┘ 2518 | ├ 251C | ┤ 2524 | ┬ 252C | ┴ 2534 | ┼ 253C | ▀ 2580 | ▄ 2584 | █ 2588 | ▌ 258C | ▐ 2590 |
9. | ░ 2591 | ‘ 2018 | ’ 2019 | “ 201C | ” 201D | • 2022 | – 2013 | — 2014 | © 00A9 | ™ 2122 | 00A0 | » 00BB | ® 00AE | « 00AB | · 00B7 | ¤ 00A4 |
A. | 00A0 | ђ 0452 | ѓ 0453 | ё 0451 | є 0454 | ѕ 0455 | і 0456 | ї 0457 | ј 0458 | љ 0459 | њ 045A | ћ 045B | ќ 045C | ґ 0491 | ў 045E | џ 045F |
B. | № 2116 | Ђ 0402 | Ѓ 0403 | Ё 0401 | Є 0404 | Ѕ 0405 | І 0406 | Ї 0407 | Ј 0408 | Љ 0409 | Њ 040A | Ћ 040B | Ќ 040C | Ґ 0490 | Ў 040E | Џ 040F |
Некириллические варианты КОИ-8
В некоторых странах СЭВ были созданы модификации КОИ-8 для национальных вариантов латиницы. Базовая идея была та же самая — при «срезании» восьмого бита текст должен оставаться более или менее понятным. Например, в чешском варианте КОИ-8 (ČSN 369103) буквы Čč должны превращаться в cC, Žž — в zZ и т. д. В настоящее время эти кодировки используются в 1C.[источник не указан 727 дней]
Примечания
- ↑ KOI8 Unified // Fingertip Software site
Ссылки
Кодировки символов | |||
---|---|---|---|
Основы → | алфавит • текст ( файл • данные ) • набор символов • конверсия | ||
Исторические кодировки → | Докомп.: семафорная (Макарова) • Морзе • Бодо • МТК-2 | Комп.: 6 бит • УПП • RADIX-50 • EBCDIC ( ДКОИ-8 ) • КОИ-7 • ISO 646 | |
совре-менное 8-битноепредстав-ление | символы → | ASCII ( управляющие • печатные ) | не-ASCII ( псевдографика ) |
8бит. код.стр. | Разные → Кириллица: КОИ-8 • ГОСТ 19768-87 • MacCyrillic | ||
ISO 8859 → | 1(лат.) 2 3 4 5**(кир.)** 6 7 8 9 10 11 12 13 14 15(€) 16 | ||
Windows → | 1250 1251**(кир.)** 1252 1253 1254 1255 1256 1257 1258 | WGL4 | ||
IBM&DOS → | 437 • 850 • 852 • 855 • 866 «альт.» • ( МИК ) • ( НИИ ЭВМ ) | ||
Много-байтные | Традиционные → | DBCS ( GB2312 ) • HTML | |
Unicode → | UTF-16 • UTF-8 • список символов ( кириллица ) | ||
Связанныетемы → | интерфейс пользователя • раскладка клавиатуры • локаль • перевод строки • шрифт • кракозябры • транслит • нестандартные шрифты • текст как изображение | Утилиты: iconv • recode |