KOI8-Rとは - わかりやすく解説 Weblio辞書 (original) (raw)
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/07/09 07:23 UTC 版)
KOI8-Rはロシア語のキリル文字を扱うよう設計された、8ビットの文字コードである。ブルガリア語も扱える。ここから派生したKOI8-Uには、ウクライナ語の文字が追加されている。最初のKOI-8符号はソビエト当局により1974年に設計された。
KOI8はISO 8859-5よりもはるかに広く使われ続けている。ISO 8859-5が人気だったことはない。他のよく知られたキリル語文字コードはWindows-1251である。キリル語を他の非ラテン言語と一緒に表現する方法としてUnicodeがある。
KOI8はロシア語で_Kod Obmena Informatsiey, 8 bit_ (Код Обмена Информацией, 8 бит) の略であり、「情報交換用符号、8ビット」という意味である。
KOIシリーズの文字集合におけるロシア語のキリル文字は、ISO 8859-5のような自然なキリル文字のアルファベット順ではなく、主に発音の対応するASCIIのラテン文字の符号位置の順で並べられているという特性を持つ。さらに、大文字と小文字の符号位置は逆になっている。これは一見して不自然に見えるが、8ビット目が欠落する文字化けに対処できるという利点がある。たとえば、KOI8-Rで表現した"Русский Текст" (ラテン文字転写例: Russkij Tjekst)は8ビット目を落とすと"rUSSKIJ tEKST"になる。大文字と小文字が逆になることで文字化けが発生したことが分かり、文字の発音も近いため、そのまま読めるか、少なくとも復元することはできる。また、これは正しいKOI-7として解釈できる。ASCII文字列"rUSSKIJ tEKST"をKOI-7(КОИ-7 Н1)として解釈すれば"Русский Текст"である。一方で、文字コードでソートしても正しいキリル文字の順序にならないという欠点もある。
KOI8-R
x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0x | 制御文字 | |||||||||||||||
1x | ||||||||||||||||
2x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | |
8x | ─ | │ | ┌ | ┐ | └ | ┘ | ├ | ┤ | ┬ | ┴ | ┼ | ▀ | ▄ | █ | ▌ | ▐ |
9x | ░ | ▒ | ▓ | ⌠ | ■ | ∙ | √ | ≈ | ≤ | ≥ | NBSP | ⌡ | ° | ² | · | ÷ |
Ax | ═ | ║ | ╒ | ё | ╓ | ╔ | ╕ | ╖ | ╗ | ╘ | ╙ | ╚ | ╛ | ╜ | ╝ | ╞ |
Bx | ╟ | ╠ | ╡ | Ё | ╢ | ╣ | ╤ | ╥ | ╦ | ╧ | ╨ | ╩ | ╪ | ╫ | ╬ | © |
Cx | ю | а | б | ц | д | е | ф | г | х | и | й | к | л | м | н | о |
Dx | п | я | р | с | т | у | ж | в | ь | ы | з | ш | э | щ | ч | ъ |
Ex | Ю | А | Б | Ц | Д | Е | Ф | Г | Х | И | Й | К | Л | М | Н | О |
Fx | П | Я | Р | С | Т | У | Ж | В | Ь | Ы | З | Ш | Э | Щ | Ч | Ъ |
外部リンク
- RFC 1489
- All about KOI8-R (英語)
- Universal Cyrillic decoder (英語) 壊れたKOI8-Rや他の文字コードで書かれたキリル文字の文章の修復を手助けするオンラインのプログラム。
- キリル文字符号化の小史 (英語)
表話編歴文字コード | |
---|---|
カテゴリ | |
日本語用の文字コード | JIS規格符号化文字集合 JIS X 0201 JIS X 0208 JIS X 0212 JIS X 0213 JIS X 0221(日本文字部分レパートリ) 文字符号化方式 ISO-2022-JP EUC-JP Shift_JIS Shift_JISX0213 Shift_JIS-2004 EUC-JISX0213 EUC-JIS-2004 ISO-2022-JP-3 ISO-2022-JP-2004 漢字シフトコード 文字一覧 JIS X 0213非漢字一覧 JIS X 0213漢字一覧の1面 JIS X 0213漢字一覧の2面 JIS以外の公規格 MJ文字 入管正字 ARIB外字 ARIB外字の追加記号一覧 メーカーの規格符号化文字集合 IBM拡張文字 マイクロソフト標準キャラクタセット Adobe-Japan1 iモード絵文字 EZweb絵文字 SoftBank絵文字 今昔文字鏡 JIPS EBCDIC GT書体 KEIS IBM漢字システム レコード用文字符号 ビブロス外字 文字符号化方式 Microsoftコードページ932 MacJapanese JEF漢字コード U-PRESS |
日本語を含む多言語文字集合 | UnicodeISO/IEC 10646JIS X 0221面 基本多言語面 追加面 追加多言語面 追加漢字面 第三漢字面 追加特殊用途面 私用面 文字符号化方式 UTF-8 UTF-16/UCS-2 UTF-32/UCS-4 UTF-7 UTF-EBCDIC GB 18030 SCSU BOCU-1 文字一覧 Unicode一覧 Unicode一覧表 Unicode6.0の携帯電話の絵文字の一覧 UnicodeのEmojiの一覧 TRONコード TRONコード |
日本語以外用の文字集合 | 初期の文字コード ASCII Baudot Code ISO/IEC 646 ISO/IEC 6937 T.61 ISO/IEC 8859 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -13 -14 -15 -16 書誌用 ISO 5426 ISO 5426-2 ISO 5427 ISO 5428 ISO 6438 ISO 6861 ISO 6862 ISO 9036 ISO 10585 ISO 10586 ISO 10754 ISO 11822 ANSEL MARC-8 国家標準 ArmSCII CNS 11643 GOST 10859 GB 2312 HKSCS ISCII KPS 9566 KS X 1001 PASCII TIS-620 TSCII VISCII YUSCII KOI8-R KOI8-RU KOI8-U KOI8-T KOI8-CS EUC EUC-CN EUC-KR EUC-TW ISO/IEC 2022 ISO/IEC 2022 CN ISO/IEC 2022 KR CCCII MacOSコードページ Macintosh Standard Roman Character Set アラビア語 CentralEurRoman EUC-CN Big5 クロアチア語 キリル デーヴァナーガリー Dingbats ペルシャ語 ギリシア語 グジャラート語 グルムキー ヘブライ語 アイスランド語 EUC-KR ルーマニア語 MacSymbol TIS-620 トルコ語 ウクライナ語 DOSコードページ 437 720 737 775 850 852 855 857 858 860 861 862 863 864 865 866 869 KOI8 Kamenicky Mazovia MIK Iran System Windowsコードページ 874 (TIS-620) 936 (GBK) 949 (EUC-KR) 950 (Big5) 1250 1251 1252 1253 1254 1255 1256 1257 1258 1361 54936 (GB18030) EBCDIC コードページ 1(英語版) 2(英語版) 3(英語版) 4(英語版) 5(英語版) 6(英語版) 7(英語版) 8(英語版) 9(英語版) 10(英語版) 11(英語版) 12(英語版) 13(英語版) 15(英語版) 16(英語版) 17(英語版) 18(英語版) 19(英語版) 20(英語版) 21(英語版) 22(英語版) 23(英語版) 24(英語版) 25(英語版) 26(英語版) 27(英語版) 29(英語版) 30(英語版) 31(英語版) 32(英語版) 33(英語版) 34(英語版) 35(英語版) 36(英語版) 37(英語版)/1140(英語版) 37-2(英語版) 38(英語版) 39(英語版) 40(英語版) 251(英語版) 252(英語版) 254(英語版) 256(英語版) 257(英語版) 258(英語版) 259(英語版) 260(英語版) 264(英語版) 273(英語版)/1141(英語版) 274(英語版) 275(英語版) 276(英語版) 277(英語版)/1142(英語版) 278(英語版)/1143(英語版) 279(英語版) 280(英語版)/1144(英語版) 281(英語版) 282(英語版) 283(英語版) 284(英語版)/1145(英語版) 285(英語版)/1146(英語版) 286(英語版) 287(英語版) 288(英語版) 289(英語版) 290(英語版) 293(英語版) 297(英語版)/1147(英語版) 298(英語版) 300(英語版) 310(英語版) 320(英語版) 321(英語版) 322(英語版) 330(英語版) 351(英語版) 352(英語版) 353(英語版) 355(英語版) 357(英語版) 358(英語版) 359(英語版) 360(英語版) 361(英語版) 421(英語版) 423(英語版) 424(英語版)/8616(英語版)/12712(英語版) 500(英語版)/1148(英語版) 870(英語版)/1110(英語版)/1153(英語版) 871(英語版)/1149(英語版) 875(英語版)/4971(英語版)/9067(英語版) 880(英語版) 905(英語版) 924(英語版) 930(英語版)/1390(英語版) 1025(英語版)/1154(英語版) 1026(英語版)/1155(英語版) 1047(英語版) 1069(英語版) 1113(英語版) 1166(英語版) その他標準 モザイク集合 記号用 Symbol Wingdings Webdings プラットフォーム固有 ATASCII CDC display code DEC Radix-50 Fieldata GSM 03.38 HP roman8 PETSCII TI calculator character sets ZX Spectrum character set |
ソフトウェア | 文字コード表 (Windows) 文字パレット KCharSelect IMEパッド |
区分け | 外字 図形文字 制御文字 特殊文字 C0 and C1 control codes CJK統合漢字 ワイド文字 マルチバイト文字 機種依存文字 |
概念 | コードページ 群 面 区 点 文字コード表 |
関連トピック | CCSID charset detection ISO 6429/IEC 6429/ANSI X3.64 legacy encoding 文字化け モールス符号 6ビット文字コード 携帯電話の絵文字 機械彫刻用標準書体 サロゲートペア 異体字セレクタ フォント |