КОИ-8 | это... Что такое КОИ-8? (original) (raw)

У этого термина существуют и другие значения, см. КОИ.

КОИ-8 (код обмена информацией, 8 битов), KOI8 — восьмибитовая ASCII-совместимая кодовая страница, разработанная для кодирования букв кириллических алфавитов.

Существует также семибитовая версия кодировки, не полностью совместимая с ASCII — КОИ-7. КОИ-7 и КОИ-8 описаны в ныне не действующем ГОСТ 19768-74.

Разработчики КОИ-8 поместили символы русского алфавита в верхней части кодовой таблицы таким образом, что позиции кириллических символов соответствуют их фонетическим аналогам в английском алфавите в нижней части таблицы. Это означает, что если в тексте, написанном в КОИ-8, убирать восьмой бит каждого символа, то получается «читаемый» текст, подобный транслиту. Например, слова «Русский Текст» превратились бы в «rUSSKIJ tEKST». Как побочное следствие, символы кириллицы оказались расположены не в алфавитном порядке.

Существует несколько вариантов кодировки КОИ-8 для различных кириллических алфавитов, расширяющие определённые коды (общий диапазон 192—255 с 32 русскими буквами в двух регистрах остаётся неизменным во всех вариантах). Русский алфавит описывается в кодировке KOI8-R, украинский — в KOI8-U.

KOI8-R стал фактически стандартом для русской кириллицы в 1990-х годах в юникс-подобных операционных системах и электронной почте. Автор данной кодировки (RFC1489), которая стала первой русской стандартизированной кодировкой в интернете — Андрей Чернов, в начале 1990-х годов работал в компании Демос (сеть Релком) и непосредственно участвовал в запуске и наладке первого интернет-канала между Россией и западными странами.

IETF утвердил несколько RFC по вариантам кодировки KOI-8:

IANA зарегистрировала их в своём списке.

Стандарт RFC 1489 предписывает наличие графических символов «рамок» (псевдографики), однако это требование выполняется довольно редко.

В Microsoft Windows KOI8-R присвоен код страницы 20866, KOI8-U — 21866.

Начало таблицы кодировки (латиница) полностью соответствует кодировке ASCII.

В приведённых таблицах числа под буквами обозначают шестнадцатеричный код буквы в Юникоде.

Содержание

Кодировка KOI8-R (русская)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. ─ 2500 │ 2502 ┌ 250C ┐ 2510 └ 2514 ┘ 2518 ├ 251C ┤ 2524 ┬ 252C ┴ 2534 ┼ 253C ▀ 2580 ▄ 2584 █ 2588 ▌ 258C ▐ 2590
9. ░ 2591 ▒ 2592 ▓ 2593 ⌠ 2320 ■ 25A0 ∙ 2219 √ 221A ≈ 2248 ≤ 2264 ≥ 2265 A0 ⌡ 2321 ° B0 ² B2 · B7 ÷ F7
A. ═ 2550 ║ 2551 ╒ 2552 ё 451 ╓ 2553 ╔ 2554 ╕ 2555 ╖ 2556 ╗ 2557 ╘ 2558 ╙ 2559 ╚ 255A ╛ 255B ╜ 255C ╝ 255D ╞ 255E
B. ╟ 255F ╠ 2560 ╡ 2561 Ё 401 ╢ 2562 ╣ 2563 ╤ 2564 ╥ 2565 ╦ 2566 ╧ 2567 ╨ 2568 ╩ 2569 ╪ 256A ╫ 256B ╬ 256C © A9
C. ю 44E а 430 б 431 ц 446 д 434 е 435 ф 444 г 433 х 445 и 438 й 439 к 43A л 43B м 43C н 43D о 43E
D. п 43F я 44F р 440 с 441 т 442 у 443 ж 436 в 432 ь 44C ы 44B з 437 ш 448 э 44D щ 449 ч 447 ъ 44A
E. Ю 42E А 410 Б 411 Ц 426 Д 414 Е 415 Ф 424 Г 413 Х 425 И 418 Й 419 К 41A Л 41B М 41C Н 41D О 41E
F. П 41F Я 42F Р 420 С 421 Т 422 У 423 Ж 416 В 412 Ь 42C Ы 42B З 417 Ш 428 Э 42D Щ 429 Ч 427 Ъ 42A

Другие варианты

Показаны только не совпадающие строки таблиц, поскольку всё остальное совпадает.

Кодировка KOI8-U (русско-украинская)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
A. ═ 2550 ║ 2551 ╒ 2552 ё 451 є 454 ╔ 2554 і 456 ї 457 ╗ 2557 ╘ 2558 ╙ 2559 ╚ 255A ╛ 255B ґ 491 ╝ 255D ╞ 255E
B. ╟ 255F ╠ 2560 ╡ 2561 Ё 401 Є 404 ╣ 2563 І 406 Ї 407 ╦ 2566 ╧ 2567 ╨ 2568 ╩ 2569 ╪ 256A Ґ 490 ╬ 256C © A9

Кодировка KOI8-RU (русско-белорусско-украинская)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
A. ═ 2550 ║ 2551 ╒ 2552 ё 451 є 454 ╔ 2554 і 456 ї 457 ╗ 2557 ╘ 2558 ╙ 2559 ╚ 255A ╛ 255B ґ 491 ў 45E ╞ 255E
B. ╟ 255F ╠ 2560 ╡ 2561 Ё 401 Є 404 ╣ 2563 І 406 Ї 407 ╦ 2566 ╧ 2567 ╨ 2568 ╩ 2569 ╪ 256A Ґ 490 Ў 40E © A9

Кодировка KOI8-C (кавказская)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. ғ493 җ497 қ49B ҝ49D ң4A3 ү4AF ұ4B1 ҳ4B3 ҷ4B7 ҹ4B9 һ4BB ▀2580 ҝ49D ӣ4E3 ө4E9 ӯ4EF
9. Ғ492 Җ496 Қ49A Ҝ49C Ң4A2 Ү4AE Ұ4B0 Ҳ4B2 Ҷ4B6 Ҹ4B8 Һ4BA ⌡2321 Ә4D8 Ӣ4E2 Ө4E8 Ӯ4EE
A. A0 ђ452 ѓ453 ё451 є454 ѕ455 і456 ї457 ј458 љ459 њ45A ћ45B ќ45C ґ491 ў45E џ45F
B. №2116 Ђ402 Ѓ403 Ё401 Є404 Ѕ405 І406 Ї407 Ј408 Љ409 Њ40A Ћ40B Ќ40C Ґ490 Ў40E Џ40F

Кодировка KOI8-T (таджикская)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. қ49B ғ493 ‚201A Ғ492 „201E …2026 †2020 ‡2021 ‰2030 ҳ4B3 ‹2039 Ҳ4B2 ҷ4B7 Ҷ4B6
9. Қ49A ‘2018 ’2019 “201C ”201D •2022 –2013 —2014 ™2122 ›203A
A. ӯ4EF Ӯ4EE ё451 ¤A4 ӣ4E3 ¦A6 §A7 «AB ¬AC ­AD ®AE
B. °B0 ±B1 ²B2 Ё401 Ӣ4E2 ¶B6 ·B7 №2116 »BB ©A9

Кодировка KOI8-O, KOI8-C (славянская, старая орфография)

0407

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. Ђ 0402 Ѓ 0403 ¸ 00B8 ѓ 0453 „ 201E … 2026 † 2020 § 00A7 € 20AC ¨ 00A8 Љ 0409 ‹ 2039 Њ 040A Ќ 040C Ћ 040B Џ 040F
9. ђ 0452 ‘ 2018 ’ 2019 “ 201C ” 201D • 2022 – 2013 — 2014 £ 00A3 · 00B7 љ 0459 › 203A њ 045A ќ 045C ћ 045B џ 045F
A. 00A0 ѵ 0475 ѣ 0463 ё 0451 є 0454 ѕ 0455 і 0456 ї 0457 ј 0458 ® 00AE ™ 2122 « 00AB ѳ 0473 ґ 0491 ў 045E ´ 00B4
B. ° 00B0 Ѵ 0474 Ѣ 0462 Ё 0401 Є 0404 Ѕ 0405 І 0406 Ї 0407 Ј 0408 № 2116 ¢ 00A2 » 00BB Ѳ 0472 Ґ 0490 Ў 040E © 00A9

Кодировка ISO-IR-111, KOI8-E

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
A. 00A0 ђ 0452 ѓ 0453 ё 0451 є 0454 ѕ 0455 і 0456 ї 0457 ј 0458 љ 0459 њ 045A ћ 045B ќ 045C ­ 00AD ў 045E џ 045F
B. № 2116 Ђ 0402 Ѓ 0403 Ё 0401 Є 0404 Ѕ 0405 І 0406 Ї 0407 Ј 0408 Љ 0409 Њ 040A Ћ 040B Ќ 040C ¤ 00A4 Ў 040E Џ 040F

Кодировка KOI8-Unified, KOI8-F

Является предложением компании Fingertip Software[1]

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. ─ 2500 │ 2502 ┌ 250C ┐ 2510 └ 2514 ┘ 2518 ├ 251C ┤ 2524 ┬ 252C ┴ 2534 ┼ 253C ▀ 2580 ▄ 2584 █ 2588 ▌ 258C ▐ 2590
9. ░ 2591 ‘ 2018 ’ 2019 “ 201C ” 201D • 2022 – 2013 — 2014 © 00A9 ™ 2122 00A0 » 00BB ® 00AE « 00AB · 00B7 ¤ 00A4
A. 00A0 ђ 0452 ѓ 0453 ё 0451 є 0454 ѕ 0455 і 0456 ї 0457 ј 0458 љ 0459 њ 045A ћ 045B ќ 045C ґ 0491 ў 045E џ 045F
B. № 2116 Ђ 0402 Ѓ 0403 Ё 0401 Є 0404 Ѕ 0405 І 0406 Ї 0407 Ј 0408 Љ 0409 Њ 040A Ћ 040B Ќ 040C Ґ 0490 Ў 040E Џ 040F

Некириллические варианты КОИ-8

В некоторых странах СЭВ были созданы модификации КОИ-8 для национальных вариантов латиницы. Базовая идея была та же самая — при «срезании» восьмого бита текст должен оставаться более или менее понятным. Например, в чешском варианте КОИ-8 (ČSN 369103) буквы Čč должны превращаться в cC, Žž — в zZ и т. д. В настоящее время эти кодировки используются в 1C.[источник не указан 727 дней]

Примечания

  1. KOI8 Unified // Fingertip Software site

Ссылки

Кодировки символов
Основы → алфавиттекст ( файлданные ) • набор символов • конверсия
Исторические кодировки → Докомп.: семафорная (Макарова)МорзеБодоМТК-2 Комп.: 6 битУППRADIX-50EBCDIC ( ДКОИ-8 ) • КОИ-7ISO 646
совре-менное 8-битноепредстав-ление символы ASCII ( управляющиепечатные ) не-ASCII ( псевдографика )
8бит. код.стр. Разные → Кириллица: КОИ-8ГОСТ 19768-87MacCyrillic
ISO 8859 1(лат.) 2 3 4 5**(кир.)** 6 7 8 9 10 11 12 13 14 15(€) 16
Windows → 1250 1251**(кир.)** 1252 1253 1254 1255 1256 1257 1258 | WGL4
IBM&DOS → 437850852855866 «альт.» • ( МИК ) • ( НИИ ЭВМ )
Много-байтные Традиционные → DBCS ( GB2312 ) • HTML
Unicode UTF-16UTF-8список символов ( кириллица )
Связанныетемы → интерфейс пользователяраскладка клавиатурылокальперевод строкишрифткракозябрытранслитнестандартные шрифты • текст как изображение Утилиты: iconvrecode