KOI8-U (original) (raw)
KOI8-U aus der KOI8-Familie ist ein Zeichensatz, der für die Zeichenkodierung des kyrillischen Alphabetes für die ukrainische Sprache in Computersystemen benutzt wird und verwendet nur ein einzelnes Byte zur Kodierung. KOI8-U ist eine Übermenge von ASCII und enthält somit auch die 26 Buchstaben des Lateinischen Alphabets. KOI8-U teilt viele Eigenschaften mit KOI8-R für Russisch. Der internationale Zeichensatz-Standard Unicode ersetzt KOI8-U vollständig. KOI-U ist beschrieben in RFC 2319 und ist IANA-registriert und für MIME zugelassen.
Property | Value |
---|---|
dbo:abstract | KOI8-U aus der KOI8-Familie ist ein Zeichensatz, der für die Zeichenkodierung des kyrillischen Alphabetes für die ukrainische Sprache in Computersystemen benutzt wird und verwendet nur ein einzelnes Byte zur Kodierung. KOI8-U ist eine Übermenge von ASCII und enthält somit auch die 26 Buchstaben des Lateinischen Alphabets. KOI8-U teilt viele Eigenschaften mit KOI8-R für Russisch. Der internationale Zeichensatz-Standard Unicode ersetzt KOI8-U vollständig. KOI-U ist beschrieben in RFC 2319 und ist IANA-registriert und für MIME zugelassen. (de) KOI8-U (Код Обмена Информацией, 8 бит - KOI8) est un encodage 8-bits créé pour l'ukrainien, qui utilise l'alphabet cyrillique. KOI8-U est basé sur KOI8-R, qui couvre le russe et le bulgare, ajoutant ou remplaçant 8 caractères : Ґ, Є, І et Ї, en majuscules comme en minuscules. KOI8-U y est plus utilisé que ISO/CEI 8859-5. Un autre encodage courant est le . Depuis peu, Unicode semble s'imposer. Les caractères qui diffèrent de KOI8-R sont 0xA4; 0xA6; 0xA7; 0xAD; et 0xB4; 0xB6; 0xB7; 0xBD;. (fr) KOI8-U (RFC 2319) is an 8-bit character encoding, designed to cover Ukrainian, which uses a Cyrillic alphabet. It is based on KOI8-R, which covers Russian and Bulgarian, but replaces eight box drawing characters with four Ukrainian letters Ґ, Є, І, and Ї in both upper case and lower case. KOI8-RU is closely related, but adds Ў for Belarusian. In both, the letter allocations match those in KOI8-E, except for Ґ which is added to KOI8-F. In Microsoft Windows, KOI8-U is assigned the code page number 21866. In IBM, KOI8-U is assigned code page/CCSID 1168. KOI8 remains much more commonly used than ISO 8859-5, which never really caught on. Another common Cyrillic character encoding is Windows-1251. In the future, both may eventually give way to Unicode. KOI8 stands for Kod Obmena Informatsiey, 8 bit (Russian: Код Обмена Информацией, 8 бит) which means "Code for Information Exchange, 8 bit". The KOI8 character sets have the property that the Russian Cyrillic letters are in pseudo-Roman order rather than the natural Cyrillic alphabetical order as in ISO 8859-5. Although this may seem unnatural, it has the useful property that if the eighth bit is stripped, the text can still be read (or at least deciphered) in case-reversed transliteration on an ordinary ASCII terminal. For instance, "Русский Текст" in KOI8-U becomes rUSSKIJ tEKST ("Russian Text") if the 8th bit is stripped. (en) KOI8-Uは、キリル文字を使う言語であるウクライナ語をカバーするように設計された、8ビットの文字コードである。ロシア語とブルガリア語をカバーするKOI8-Rに基づくが、8つの図形文字を4つのウクライナ文字Ґ、Є、І、Їの大文字と小文字双方に置き換えている。 有名にならなかったISO 8859-5より、KOI8ははるかに広く使われ続けている。もう1つの広く使われているキリル文字コードはである。将来は、最終的にどちらもUnicodeに取って代わられるかもしれない。 ロシア語で、KOI8は Kod Obmena Informatsiey, 8 bit (Код Обмена Информацией, 8 бит) の略で、"情報交換用符号、8ビット" という意味である。 KOIシリーズの文字集合におけるロシア語のキリル文字は、ISO 8859-5のような自然なキリル文字のアルファベット順ではなく、ASCIIのラテン文字と対応する符号位置に疑似ローマ字順で並べられているという特性を持つ。さらに、大文字と小文字の符号位置は逆になっている。これは不自然に見えるかもしれないが、8ビット目が落ちて文字化けしても、大文字小文字を入れ替えた翻字をすることで通常のASCII端末上で文章をまだ読める (もしくは少なくとも解読できる) という役に立つ特性である。たとえば、KOI8-Uの "Русский Текст"(ルスキー・テクスト、ロシア語のテキストの意) は8ビット目を落とすと rUSSKIJ tEKSTになる。その一方で、文字コードでソートしても正しいキリル文字の順序にならないという欠点もある。 上記の表において、20は通常の空白 (SPACE) 文字であり、9Aはノーブレークスペース (NO-BREAK SPACE) である。 KOI8-Rとの違いは位置 0xA4; 0xA6; 0xA7; 0xAD; および 0xB4; 0xB6; 0xB7; 0xBD; にある。これらはロシア語に存在しない追加の文字からなる。 RFC 2319では文字95がU+2219 (∙) であるべきだと言っているが、のビュレット文字に合わせるためU+2022 (•) が使われる場合もある。 いくつかの参考文献には誤植があり、文字B4はU+0403であると誤って述べている (正しくはU+0404)。この誤植はRFC 2319のAppendix Aにも存在する (ただしRFC本文の表には正しいマッピングが示されている)。 (ja) KOI8-U è un sistema di codifica di caratteri a 8-bit progettato per essere adoperato con l'ucraino, lingua che utilizza l'alfabeto cirillico. Il KOI8-U, il cui nome sta per Kod Obmena Informaciej, 8 bit (in russo Код Обмена Информацией, 8 бит, Codice per lo scambio di informazioni, 8 bit), è basato sul KOI8-R, sistema di codifica basato sull'originale KOI8 e progettato per l'utilizzo con il russo e con il bulgaro, di cui sostituisce otto caratteri grafici con quattro lettere ucraine nelle loro versioni maiuscola e minuscola: Ґ, Є, І e Ї. Il KOI8 ed il CP-1251, un altro sistema di codifica di caratteri per le lingue che utilizzano l'alfabeto cirillico, sono ancora molto più utilizzati dell'ISO 8859-5, che in effetti non ha mai trovato grande utilizzo, anche se oggi, ormai, nella stragrande maggioranza degli utilizzi moderni, viene loro preferito l'Unicode. Il KOI8 ed i sistemi da lui derivati hanno la particolarità di avere le lettere cirilliche disposte in ordine pseudo-latino piuttosto che nel comune ordine dell'alfabeto cirillico come hanno per esempio l'ISO 8859-5 e l'Unicode. Sebbene questo possa sembrare anti intuitivo, questa caratteristica risulta utile per il fatto che se l'ottavo bit viene eliminato, il testo è parzialmente leggibile utilizzando il sistema ASCII e può essere convertito in un testo in KOI7 sintatticamente corretto. Per esempio se dalla scritta in KOI8-U "Русский Текст" viene eliminato l'ottavo bit, essa diventa rUSSKIJ tEKST ("Testo russo") ed un tentativo di interpretare tale stringa con il KOI7 porta a "РУССКИЙ ТЕКСТ". Il KOI8 fu creato basandosi sul codice Morse russo (che a sua volta fu creato dal codice Morse internazionale basandosi sulle assonanze) e la connessione riguardante l'ordine delle lettere tra il codice Morse russo e quello internazionale è la stessa che esiste tra il KOI8 e l'ASCII. Nel sistema operativo Microsoft Windows, il numero di code page assegnato al sistema KOI8-U è 21866, nei sistemi di IBM è invece il numero 1186. (it) KOI8-U是KOI-8系列的斯拉夫文字8位元编码,供乌克兰语使用。在Unicode未流行之前,KOI-8 系列编码是最为广泛使用的西里尔字母编码,使用率比起ISO/IEC 8859-5为高。 乌克兰有一个KOI8-U Working Group,负责维护 KOI8-U 编码。KOI8-U 编码是互联网协会(ISOC)的 RFC 2319 文件 ("Ukrainian Character Set KOI8-U")。 在上表中,0x20是空格、0x9A是不换行空格。 0xA4、0xA6、0xA7、0xAD、0xB4、0xB6、0xB7、0xBD是KOI8-U与KOI8-R版本的不同之处。 0x95 在 RFC 2319 之中是 U+2219 (∙),但有时会使用 U+2022 (·) 以配合 Windows-1251 编码。 (zh) |
dbo:wikiPageExternalLink | http://czyborra.com/charsets/cyrillic.html http://www.columbia.edu/kermit/ftp/charsets/cyrillic-summary.txt http://segfault.kiev.ua/cyrillic-encodings/ http://www.iis.ru/cyrillic/resource/tables.en.html http://search.cpan.org/~guido/libintl-perl/lib/Locale/RecodeData/KOI8_U.pm https://www.math.nmsu.edu/~mleisher/Software/csets/KOI8U.TXT http://www.columbia.edu/kermit/ftp/charsets/koi8u.txt https://web.archive.org/web/20050206230944/http:/www.net.ua/KOI8-U/ https://web.archive.org/web/20161203230933/http:/czyborra.com/charsets/cyrillic.html https://web.archive.org/web/20161205134629/http:/segfault.kiev.ua/cyrillic-encodings/ https://web.archive.org/web/20161205140054/http:/www.iis.ru/cyrillic/resource/tables.en.html https://web.archive.org/web/20170115040944/http:/search.cpan.org/~guido/libintl-perl/lib/Locale/RecodeData/KOI8_U.pm https://web.archive.org/web/20170218142454/http:/www.verycomputer.com/42_17e2e72303d2c08b_1.htm https://web.archive.org/web/20170219005245/https:/www.math.nmsu.edu/~mleisher/Software/csets/KOI8U.TXT |
dbo:wikiPageID | 612375 (xsd:integer) |
dbo:wikiPageLength | 23949 (xsd:nonNegativeInteger) |
dbo:wikiPageRevisionID | 1082853887 (xsd:integer) |
dbo:wikiPageWikiLink | dbr:Caret dbr:Q dbr:Question_mark dbr:Hard_sign dbr:Be_(Cyrillic) dbr:Belarusian_language dbr:De_(Cyrillic) dbr:Degree_symbol dbr:Hyphen-minus dbr:Pe_(Cyrillic) dbr:Percent_sign dbr:Character_encoding dbr:U_(Cyrillic) dbr:Ukrainian_Ye dbr:Ukrainian_alphabet dbr:Ukrainian_language dbr:Underscore dbr:Unicode dbr:V dbr:Ve_(Cyrillic) dbr:Vertical_bar dbr:0 dbr:Colon_(punctuation) dbr:Columbia_University dbr:Comma_(punctuation) dbr:Copyright_symbol dbr:Russian_language dbr:S dbr:Ef_(Cyrillic) dbr:El_(Cyrillic) dbr:Em_(Cyrillic) dbr:En_(Cyrillic) dbr:Equals_sign dbr:Full_stop dbr:G dbr:Ge_(Cyrillic) dbr:Ghe_with_upturn dbr:Grave_accent dbr:Greater-than_sign dbr:N dbr:Apostrophe dbr:Less-than_sign dbr:M dbr:Short_I dbr:Slash_(punctuation) dbr:Yu_(Cyrillic) dbr:Z dbr:Ze_(Cyrillic) dbr:Zhe_(Cyrillic) dbr:1 dbr:B dbr:Backslash dbr:Bulgarian_language dbr:C dbr:Tilde dbr:Tse_(Cyrillic) dbr:U dbr:W dbr:Windows-1251 dbr:Curly_brackets dbr:2 dbr:3 dbr:4 dbr:5 dbr:6 dbr:7 dbr:8 dbr:9 dbr:@ dbr:A dbr:A_(Cyrillic) dbr:Ampersand dbr:Cyrillic dbr:D dbr:E dbr:E_(Cyrillic) dbr:Er_(Cyrillic) dbr:Es_(Cyrillic) dbr:Exclamation_mark dbr:F dbr:Non-breaking_space dbr:Number_sign dbr:P dbr:Parenthesis dbr:KOI_character_encodings dbr:H dbr:Interpunct dbr:J dbr:Te_(Cyrillic) dbr:Asterisk dbc:Character_sets dbr:Che_(Cyrillic) dbr:K dbr:KOI8-B dbr:KOI8-F dbr:KOI8-R dbr:KOI8-RU dbr:Ka_(Cyrillic) dbr:Kermit_(protocol) dbr:L dbr:T dbr:Dollar_sign dbr:CCSID dbr:CPAN dbr:Plus_sign dbr:Soft_sign dbr:Square_(algebra) dbr:Square_brackets dbr:Ha_(Cyrillic) dbr:I dbr:IBM dbr:I_(Cyrillic) dbr:Microsoft_Windows dbr:O dbr:O_(Cyrillic) dbr:Obelus dbr:Quotation_mark dbr:R dbr:Semicolon dbr:Sha_(Cyrillic) dbr:Shcha dbr:X dbr:Y dbr:Ya_(Cyrillic) dbr:Ya_(letter) dbr:Ye_(Cyrillic) dbr:Yery dbr:Yi_(Cyrillic) dbr:Yo_(Cyrillic) dbr:Extended_ASCII dbr:ISO_8859-5 dbr:KOI8-E dbr:Soft-dotted_i_(Cyrillic) dbr:Space_character dbr:Ukrainian_I |
dbp:basedon | dbr:KOI8-R |
dbp:classification | 8 (xsd:integer) |
dbp:extends | dbr:KOI8-B |
dbp:lang | dbr:Ukrainian_language dbr:Russian_language dbr:Bulgarian_language |
dbp:name | KOI8-U (en) |
dbp:otherrelated | dbr:KOI8-F dbr:KOI8-RU |
dbp:wikiPageUsesTemplate | dbt:= dbt:Cite_web dbt:IETF_RFC dbt:Legend dbt:Reflist dbt:Pipe dbt:Chset-cell1 dbt:Character_encoding dbt:Chset-ctrl1 dbt:Chset-left1 dbt:Infobox_character_encoding dbt:Cyrillic_encodings |
dct:subject | dbc:Character_sets |
gold:hypernym | dbr:Character |
rdf:type | yago:WikicatCharacterSets yago:Abstraction100002137 yago:CharacterSet106488880 yago:Communication100033020 yago:Database106637824 yago:Information106634376 yago:List106481320 yago:Message106598915 dbo:FictionalCharacter |
rdfs:comment | KOI8-U aus der KOI8-Familie ist ein Zeichensatz, der für die Zeichenkodierung des kyrillischen Alphabetes für die ukrainische Sprache in Computersystemen benutzt wird und verwendet nur ein einzelnes Byte zur Kodierung. KOI8-U ist eine Übermenge von ASCII und enthält somit auch die 26 Buchstaben des Lateinischen Alphabets. KOI8-U teilt viele Eigenschaften mit KOI8-R für Russisch. Der internationale Zeichensatz-Standard Unicode ersetzt KOI8-U vollständig. KOI-U ist beschrieben in RFC 2319 und ist IANA-registriert und für MIME zugelassen. (de) KOI8-U (Код Обмена Информацией, 8 бит - KOI8) est un encodage 8-bits créé pour l'ukrainien, qui utilise l'alphabet cyrillique. KOI8-U est basé sur KOI8-R, qui couvre le russe et le bulgare, ajoutant ou remplaçant 8 caractères : Ґ, Є, І et Ї, en majuscules comme en minuscules. KOI8-U y est plus utilisé que ISO/CEI 8859-5. Un autre encodage courant est le . Depuis peu, Unicode semble s'imposer. Les caractères qui diffèrent de KOI8-R sont 0xA4; 0xA6; 0xA7; 0xAD; et 0xB4; 0xB6; 0xB7; 0xBD;. (fr) KOI8-U是KOI-8系列的斯拉夫文字8位元编码,供乌克兰语使用。在Unicode未流行之前,KOI-8 系列编码是最为广泛使用的西里尔字母编码,使用率比起ISO/IEC 8859-5为高。 乌克兰有一个KOI8-U Working Group,负责维护 KOI8-U 编码。KOI8-U 编码是互联网协会(ISOC)的 RFC 2319 文件 ("Ukrainian Character Set KOI8-U")。 在上表中,0x20是空格、0x9A是不换行空格。 0xA4、0xA6、0xA7、0xAD、0xB4、0xB6、0xB7、0xBD是KOI8-U与KOI8-R版本的不同之处。 0x95 在 RFC 2319 之中是 U+2219 (∙),但有时会使用 U+2022 (·) 以配合 Windows-1251 编码。 (zh) KOI8-U (RFC 2319) is an 8-bit character encoding, designed to cover Ukrainian, which uses a Cyrillic alphabet. It is based on KOI8-R, which covers Russian and Bulgarian, but replaces eight box drawing characters with four Ukrainian letters Ґ, Є, І, and Ї in both upper case and lower case. KOI8-RU is closely related, but adds Ў for Belarusian. In both, the letter allocations match those in KOI8-E, except for Ґ which is added to KOI8-F. In Microsoft Windows, KOI8-U is assigned the code page number 21866. In IBM, KOI8-U is assigned code page/CCSID 1168. (en) KOI8-U è un sistema di codifica di caratteri a 8-bit progettato per essere adoperato con l'ucraino, lingua che utilizza l'alfabeto cirillico. Il KOI8-U, il cui nome sta per Kod Obmena Informaciej, 8 bit (in russo Код Обмена Информацией, 8 бит, Codice per lo scambio di informazioni, 8 bit), è basato sul KOI8-R, sistema di codifica basato sull'originale KOI8 e progettato per l'utilizzo con il russo e con il bulgaro, di cui sostituisce otto caratteri grafici con quattro lettere ucraine nelle loro versioni maiuscola e minuscola: Ґ, Є, І e Ї. (it) KOI8-Uは、キリル文字を使う言語であるウクライナ語をカバーするように設計された、8ビットの文字コードである。ロシア語とブルガリア語をカバーするKOI8-Rに基づくが、8つの図形文字を4つのウクライナ文字Ґ、Є、І、Їの大文字と小文字双方に置き換えている。 有名にならなかったISO 8859-5より、KOI8ははるかに広く使われ続けている。もう1つの広く使われているキリル文字コードはである。将来は、最終的にどちらもUnicodeに取って代わられるかもしれない。 ロシア語で、KOI8は Kod Obmena Informatsiey, 8 bit (Код Обмена Информацией, 8 бит) の略で、"情報交換用符号、8ビット" という意味である。 上記の表において、20は通常の空白 (SPACE) 文字であり、9Aはノーブレークスペース (NO-BREAK SPACE) である。 KOI8-Rとの違いは位置 0xA4; 0xA6; 0xA7; 0xAD; および 0xB4; 0xB6; 0xB7; 0xBD; にある。これらはロシア語に存在しない追加の文字からなる。 RFC 2319では文字95がU+2219 (∙) であるべきだと言っているが、のビュレット文字に合わせるためU+2022 (•) が使われる場合もある。 (ja) |
rdfs:label | KOI8-U (de) KOI8-U (it) KOI8-U (en) KOI8-U (fr) KOI8-U (ja) KOI8-U (zh) |
owl:sameAs | freebase:KOI8-U yago-res:KOI8-U wikidata:KOI8-U dbpedia-bar:KOI8-U dbpedia-de:KOI8-U dbpedia-fi:KOI8-U dbpedia-fr:KOI8-U dbpedia-it:KOI8-U dbpedia-ja:KOI8-U dbpedia-zh:KOI8-U https://global.dbpedia.org/id/57fSW |
prov:wasDerivedFrom | wikipedia-en:KOI8-U?oldid=1082853887&ns=0 |
foaf:isPrimaryTopicOf | wikipedia-en:KOI8-U |
is dbo:wikiPageRedirects of | dbr:KOI8-UKRAINE dbr:KOI8-Ukraine dbr:KOI8U dbr:MS-21866 dbr:MS21866 dbr:MS_21866 dbr:Code_Page_1168 dbr:Code_Page_21866 dbr:Codepage_1168 dbr:Codepage_21866 dbr:Cp1168 dbr:Cp21866 dbr:CsKOI8U dbr:Code_page_1168 dbr:Code_page_21866 dbr:IBM-1168 dbr:IBM1168 dbr:IBM_1168 dbr:Koi8-u dbr:CL8KOI8U dbr:CP-1168 dbr:CP-21866 dbr:CP1168 dbr:CP21866 dbr:CP_1168 dbr:CP_21866 dbr:Koi8u dbr:Oracle_CL8KOI8U |
is dbo:wikiPageWikiLink of | dbr:Romanization_of_Ukrainian dbr:Hard_sign dbr:Be_(Cyrillic) dbr:De_(Cyrillic) dbr:Pe_(Cyrillic) dbr:Character_encoding dbr:U_(Cyrillic) dbr:Ukrainian_Ye dbr:Ukrainian_alphabet dbr:Ve_(Cyrillic) dbr:KOI8-UKRAINE dbr:KOI8-Ukraine dbr:KOI8U dbr:MS-21866 dbr:MS21866 dbr:MS_21866 dbr:Ef_(Cyrillic) dbr:El_(Cyrillic) dbr:Em_(Cyrillic) dbr:En_(Cyrillic) dbr:Ge_(Cyrillic) dbr:Ghe_with_upturn dbr:Minix_3 dbr:Short_I dbr:Yu_(Cyrillic) dbr:Ze_(Cyrillic) dbr:Zhe_(Cyrillic) dbr:Tse_(Cyrillic) dbr:Windows-1251 dbr:Code_Page_1168 dbr:Code_Page_21866 dbr:Codepage_1168 dbr:Codepage_21866 dbr:Cp1168 dbr:Cp21866 dbr:CsKOI8U dbr:A_(Cyrillic) dbr:Cyrillic_script dbr:E_(Cyrillic) dbr:Er_(Cyrillic) dbr:Es_(Cyrillic) dbr:Non-breaking_space dbr:KOI_character_encodings dbr:Te_(Cyrillic) dbr:Character_encodings_in_HTML dbr:Che_(Cyrillic) dbr:KOI-7 dbr:KOI-8 dbr:KOI8-B dbr:KOI8-F dbr:KOI8-R dbr:KOI8-RU dbr:Ka_(Cyrillic) dbr:Kha_(Cyrillic) dbr:Code_page dbr:Code_page_1168 dbr:Code_page_21866 dbr:Dotted_I_(Cyrillic) dbr:Soft_sign dbr:IBM-1168 dbr:IBM1168 dbr:IBM_1168 dbr:ISO-IR-111 dbr:ISO/IEC_8859-5 dbr:I_(Cyrillic) dbr:Koi8-u dbr:O_(Cyrillic) dbr:Sha_(Cyrillic) dbr:Shcha dbr:CL8KOI8U dbr:CP-1168 dbr:CP-21866 dbr:CP1168 dbr:CP21866 dbr:CP_1168 dbr:CP_21866 dbr:Ya_(Cyrillic) dbr:Ye_(Cyrillic) dbr:Yery dbr:Yi_(Cyrillic) dbr:Yo_(Cyrillic) dbr:Koi8u dbr:Oracle_CL8KOI8U |
is dbp:basedon of | dbr:KOI8-RU |
is dbp:extensions of | dbr:KOI8-B |
is dbp:map of | dbr:Ukrainian_Ye dbr:Ghe_with_upturn dbr:Non-breaking_space dbr:Dotted_I_(Cyrillic) dbr:Yi_(Cyrillic) |
is dbp:otherrelated of | dbr:KOI8-F dbr:KOI8-R |
is foaf:primaryTopic of | wikipedia-en:KOI8-U |