Extended Unix Code (original) (raw)

Extended UNIX Coding (Abkürzung EUC) ist eine 8-Bit-Zeichencodierung, die vor allem für Chinesisch, Japanisch und Koreanisch gebraucht wird. EUC ist eine Sammelbezeichnung für verschiedene Kodierungen, die je nach Land bis zu vier unterschiedliche Zeichensätze kodieren können. Ursprünglich entwickelt von der Open Software Foundation (OSF), (UI) und den als Standardkodierung für UNIX-Systeme, findet diese Kodierung heute immer weniger Verwendung, da sie oft von weiter verbreiteten lokalen Kodierungen (Shift-JIS, Big5 etc.) und/oder Unicode (UTF-8) abgelöst wurde.

Property	Value
dbo:abstract	Extended UNIX Coding (Abkürzung EUC) ist eine 8-Bit-Zeichencodierung, die vor allem für Chinesisch, Japanisch und Koreanisch gebraucht wird. EUC ist eine Sammelbezeichnung für verschiedene Kodierungen, die je nach Land bis zu vier unterschiedliche Zeichensätze kodieren können. Ursprünglich entwickelt von der Open Software Foundation (OSF), (UI) und den als Standardkodierung für UNIX-Systeme, findet diese Kodierung heute immer weniger Verwendung, da sie oft von weiter verbreiteten lokalen Kodierungen (Shift-JIS, Big5 etc.) und/oder Unicode (UTF-8) abgelöst wurde. (de) Extended Unix Code (EUC) is a multibyte character encoding system used primarily for Japanese, Korean, and simplified Chinese. The most commonly used EUC codes are variable-length encodings with a character belonging to an ISO/IEC 646 compliant coded character set (such as ASCII) taking one byte, and a character belonging to a 94x94 coded character set (such as GB 2312) represented in two bytes. The EUC-CN form of GB 2312 and EUC-KR are examples of such two-byte EUC codes. EUC-JP includes characters represented by up to three bytes, including an initial shift code, whereas a single character in EUC-TW can take up to four bytes. Modern applications are more likely to use UTF-8, which supports all of the glyphs of the EUC codes, and more, and is generally more portable with fewer vendor deviations and errors. EUC is however still very popular, especially EUC-KR for South Korea. (en) Extended Unix Coding (EUC) est un codage des caractères sur 8 bits utilisé premièrement par le japonais et le coréen. Au Japon, ce codage est intensivement utilisé par les systèmes d'exploitation de type Unix, mais est rarement utilisé ailleurs. EUC est cependant le moins utilisé des 3 principaux codage du japonais, derrière l'ISO-2022-JP (JIS) et le codage Shift-JIS. (fr) L'Extended Unix Code è un sistema multibyte di codifica di caratteri usato soprattutto per il giapponese, il cinese ed il coreano. La struttura dell'Extended Unix Code è basata sullo standard . Questo tipo di codifica si suddivide in: * EUC-CN: una codifica basata sullo standard per i caratteri cinesi semplificati; * EUC-JP: una variabile della codifica JIS basati su tre elementi, nominati JIS X 0208, JIS X 0212, e JIS X 0201 per la lingua giapponese; * EUC-KR: una variabile delle codifiche KS X 1001 (detto anche KS C 5601) e KS X 1003 (detto anche KS C 5636)/ISO 646:KR/US-ASCII e KS X 2901 (detto anche KS C 5861) utilizzata per la lingua coreana; * EUC-TW: una variabile della codifica US-ASCII e CNS 11643, raramente usata per i caratteri cinesi tradizionali poiché più diffusa la codifica Big5. (it) Extended Unix Code(EUC)は、UNIX上で使われてきた文字コードの符号化方式である。 * 日本語EUC * JIS X 0208ベース (EUC-JP) * JIS X 0213ベース (EUC-JIS-2004) * 韓国語EUC (EUC-KR) * 簡体字中国語EUC (EUC-CN) * 繁体字中国語EUC (EUC-TW) などがある。 (ja) 확장 유닉스 코드(Extended Unix Code, EUC)란 한국어, 중국어, 일본어 문자 전산화에 주로 사용되는 8비트 문자 인코딩 방식이다. EUC의 구조는 ISO 2022 표준에 기반하고 있다. 대한민국의 인터넷 환경에서 광범위하게 쓰이고 있어 친숙한 EUC-KR은 이 인코딩 방식을 사용하여 한글 등 한국어에서 사용되는 문자를 표현한 것이다. 사용빈도는 다르지만 중화인민공화국에서는 EUC-CN, 중화민국(대만)에서는 EUC-TW, 일본에서는 EUC-JP 등의 인코딩 방식이 존재한다. (ko) Розши́рена систе́ма кодува́ння операці́йної систе́ми Unix (EUC, англ. Extended Unix Code) — , яка використовується в основному для японської, корейської і спрощеної китайської мови. Структура EUC заснована на стандарті ISO-2022, який визначає спосіб представлення набору символів, що містить максимум 94 символів або 8836 (942) символів або 830 584 (943) символів, як послідовності 7-бітових кодів. (uk) EUC全名为Extended Unix Code，是一个使用8位编码来表示字符的方法。 EUC最初是针对Unix系统，由一些Unix公司所开发，于1991年标准化。EUC基于ISO/IEC 2022的7位编码标准，因此单字节的编码空间为94，双字节的编码空间（区位码）为94x94。把每个区位加上0xA0来表示，以便符合ISO 2022。它主要用于表示及储存汉语文字、日语文字及朝鲜文字。 EUC定义了4个单独的码集（code set）。码集0总是对应于7位的ASCII（或其它的各国定义的ISO 646），包括了ISO 2022定义的C0与G0空间的值。码集1, 2, 3表示G1空间的值。其中，码集1表示一些未经修饰（unadorned）的字符。码集2的字符编码以0x8E（属于C1控制字符，或称SS2）为第一字节。码集3的字符编码以0x8F（另一个属于C1的控制字符，或称SS3）为第一字节。码集0总是编码为单字节；码集2、3总是编码为至少2个字节；码集1编码为1-3个字节。 (zh)
dbo:thumbnail	wiki-commons:Special:FilePath/Ecma43_versus_EUC.svg?width=300
dbo:wikiPageExternalLink	https://web.archive.org/web/20120825155118/http:/developers.sun.com/dev/gadc/technicalpublications/articles/gb18030.html http://www.rikai.com/library/kanjitables/kanji_codes.euc.shtml https://search.cpan.org/~dankogai/Encode-JIS2K-0.02/JIS2K.pm https://www.itscj.ipsj.or.jp/itscj_english/iso-ir/ISO-IR.pdf http://users.monash.edu/~jwb/cjk.inf https://docs.microsoft.com/en-us/windows/desktop/intl/code-page-identifiers https://web.archive.org/web/20050611013847/http:/www.cns11643.gov.tw/web/word.jsp%23euc https://web.archive.org/web/20060329202847/http:/www.jagat.or.jp/asia/report/China3.htm
dbo:wikiPageID	546341 (xsd:integer)
dbo:wikiPageLength	45337 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID	1123212030 (xsd:integer)
dbo:wikiPageWikiLink	dbr:Private_Use_Area dbr:Python_(programming_language) dbr:MacJapanese dbr:Big5 dbr:Hitachi dbr:Republic_of_Korea dbr:Required_space dbr:Character_encoding dbr:DBCS dbr:UTF-8 dbr:Underscore dbr:Unicode dbr:Unified_Hangul_Code dbr:Unix dbr:JIS_X_0212 dbr:JIS_X_0213 dbr:JIS_encoding dbr:Ainu_language dbr:Hanzi dbr:Copyright_sign dbr:Russian_language dbr:Open_Software_Foundation dbr:Classic_Mac_OS dbr:Code_page_1115 dbr:Code_page_895 dbr:Code_page_932_(Microsoft_Windows) dbr:Code_page_936_(Microsoft_Windows) dbr:Code_page_949_(IBM) dbr:Ellipsis dbr:En_dash dbr:English_language dbr:Fujitsu dbr:GBK_(character_encoding) dbr:GB_18030 dbr:GB_2312 dbr:GB_6345.1 dbr:NEC dbr:Trademark_sign dbr:MacKorean dbr:MacOS dbr:Chinese_character_encoding dbr:Simplified_Chinese_characters dbr:Combining_character dbr:Ü dbr:Half-width_kana dbr:Private_Use_Areas dbr:State_(computer_science) dbr:Backslash dbr:C0_and_C1_control_codes dbr:CJK dbr:CNS_11643 dbr:Traditional_Chinese_characters dbr:US-ASCII dbr:USENET dbr:Data_General dbr:W3C dbr:WHATWG dbr:Japanese_language_and_computers dbr:ASCII dbr:EBCDIC dbr:EUC-JP dbr:EUC-KR dbr:Non-breaking_space dbr:Dingbat dbr:HP-UX dbr:HTML5 dbr:HZ_(character_encoding) dbr:Hewlett-Packard dbr:Hexadecimal dbr:JIS_X_0201 dbr:JIS_X_0208 dbr:Japanese_language dbr:EUC-CN dbr:EUC-TW dbc:Character_sets dbc:Encodings_of_Japanese dbr:Johab dbr:KPS_9566 dbr:KS_X_1001 dbc:Chinese-language_computing dbc:Encodings_of_Asian_languages dbr:Taiwan dbr:Digital_Equipment_Corporation dbr:CCSID dbr:CJK_characters dbc:Korean-language_computing dbr:IBM dbr:ISO-2022-JP dbr:ISO/IEC_2022 dbr:ISO/IEC_646 dbr:Korean_language dbr:Korean_language_and_computers dbr:Kuten dbr:Microsoft_Windows dbr:Operating_system dbr:Oracle_Solaris dbr:Shift_JIS dbr:Won_sign dbr:Yen_sign dbr:Simplified_Chinese dbr:Variable-width_encoding dbr:Extended_ASCII dbr:ISO/IEC_8859 dbr:Windows_code_page dbr:Traditional_Chinese dbr:ISO_646 dbr:Shift_JIS-2004 dbr:ISO_2022 dbr:JISCII dbr:Character_string dbr:ISO-2022-CN dbr:Unicode_transformation_format dbr:Space_character dbr:TIS-620 dbr:File:CsEucFixWidJapanese.svg dbr:File:Ecma43_versus_EUC.svg dbr:KS_X_2901
dbp:Nomimecode	1 (xsd:integer)
dbp:alias	EUC-JISx0213 (en) Unixized JIS , csEUCPkdFmtJapanese (en) Wansung, IBM-970 (en) csGB2312 (en)
dbp:caption	EUC-KR code structure (en)
dbp:classification	Extended ISO 646, variable-length encoding, CJK encoding, EUC (en) Extended ASCII, variable-length encoding, CJK encoding, EUC (en)
dbp:encodes	dbr:JIS_X_0212 dbr:JIS_X_0213 dbr:GB_2312 dbr:JIS_X_0201 dbr:JIS_X_0208 dbr:KS_X_1001
dbp:extends	dbr:US-ASCII US-ASCII or ISO 646:JP (en) US-ASCII or ISO 646:KR (en)
dbp:extensions	748 (xsd:integer) dbr:Unified_Hangul_Code dbr:Code_page_949_(IBM) dbr:GB_18030 dbr:MacKorean , x-mac-chinesesimp (en)
dbp:lang	dbr:Ainu_language dbr:Russian_language dbr:English_language dbr:Japanese_language dbr:Korean_language dbr:Simplified_Chinese
dbp:mime	EUC-JP (en) EUC-KR (en) GB2312 (en)
dbp:name	EUC-CN (en) EUC-JIS-2004 (en) EUC-JP (en) EUC-KR (en)
dbp:next	dbr:Unified_Hangul_Code dbr:GBK_(character_encoding) dbr:GB_18030 (en) EUC-JISx0213 (en)
dbp:prev	EUC-JP (en)
dbp:standard	JIS X 0213 (en) GB 2312 (en) KS X 2901 (en)
dbp:wikiPageUsesTemplate	dbt:Ctrl dbt:Anchor dbt:As_of dbt:Clear dbt:Code dbt:Efn dbt:IETF_RFC dbt:Main dbt:Main_article dbt:Notelist dbt:Redirect dbt:Refn dbt:Short_description dbt:Snd dbt:Character_encoding dbt:Infobox_character_encoding
dcterms:subject	dbc:Character_sets dbc:Encodings_of_Japanese dbc:Chinese-language_computing dbc:Encodings_of_Asian_languages dbc:Korean-language_computing
gold:hypernym	dbr:Character
rdf:type	yago:WikicatCharacterSets yago:Abstraction100002137 yago:Act100030358 yago:Activity100407535 yago:CharacterSet106488880 yago:Communication100033020 yago:Cryptography100614489 yago:Database106637824 yago:Encoding100615887 yago:Event100029378 yago:Information106634376 yago:List106481320 yago:Message106598915 yago:PsychologicalFeature100023100 yago:Writing100614224 yago:YagoPermanentlyLocatedEntity dbo:FictionalCharacter yago:WikicatEncodingsOfAsianLanguages yago:WikicatEncodingsOfJapanese
rdfs:comment	Extended UNIX Coding (Abkürzung EUC) ist eine 8-Bit-Zeichencodierung, die vor allem für Chinesisch, Japanisch und Koreanisch gebraucht wird. EUC ist eine Sammelbezeichnung für verschiedene Kodierungen, die je nach Land bis zu vier unterschiedliche Zeichensätze kodieren können. Ursprünglich entwickelt von der Open Software Foundation (OSF), (UI) und den als Standardkodierung für UNIX-Systeme, findet diese Kodierung heute immer weniger Verwendung, da sie oft von weiter verbreiteten lokalen Kodierungen (Shift-JIS, Big5 etc.) und/oder Unicode (UTF-8) abgelöst wurde. (de) Extended Unix Coding (EUC) est un codage des caractères sur 8 bits utilisé premièrement par le japonais et le coréen. Au Japon, ce codage est intensivement utilisé par les systèmes d'exploitation de type Unix, mais est rarement utilisé ailleurs. EUC est cependant le moins utilisé des 3 principaux codage du japonais, derrière l'ISO-2022-JP (JIS) et le codage Shift-JIS. (fr) Extended Unix Code(EUC)は、UNIX上で使われてきた文字コードの符号化方式である。 * 日本語EUC * JIS X 0208ベース (EUC-JP) * JIS X 0213ベース (EUC-JIS-2004) * 韓国語EUC (EUC-KR) * 簡体字中国語EUC (EUC-CN) * 繁体字中国語EUC (EUC-TW) などがある。 (ja) 확장 유닉스 코드(Extended Unix Code, EUC)란 한국어, 중국어, 일본어 문자 전산화에 주로 사용되는 8비트 문자 인코딩 방식이다. EUC의 구조는 ISO 2022 표준에 기반하고 있다. 대한민국의 인터넷 환경에서 광범위하게 쓰이고 있어 친숙한 EUC-KR은 이 인코딩 방식을 사용하여 한글 등 한국어에서 사용되는 문자를 표현한 것이다. 사용빈도는 다르지만 중화인민공화국에서는 EUC-CN, 중화민국(대만)에서는 EUC-TW, 일본에서는 EUC-JP 등의 인코딩 방식이 존재한다. (ko) Розши́рена систе́ма кодува́ння операці́йної систе́ми Unix (EUC, англ. Extended Unix Code) — , яка використовується в основному для японської, корейської і спрощеної китайської мови. Структура EUC заснована на стандарті ISO-2022, який визначає спосіб представлення набору символів, що містить максимум 94 символів або 8836 (942) символів або 830 584 (943) символів, як послідовності 7-бітових кодів. (uk) EUC全名为Extended Unix Code，是一个使用8位编码来表示字符的方法。 EUC最初是针对Unix系统，由一些Unix公司所开发，于1991年标准化。EUC基于ISO/IEC 2022的7位编码标准，因此单字节的编码空间为94，双字节的编码空间（区位码）为94x94。把每个区位加上0xA0来表示，以便符合ISO 2022。它主要用于表示及储存汉语文字、日语文字及朝鲜文字。 EUC定义了4个单独的码集（code set）。码集0总是对应于7位的ASCII（或其它的各国定义的ISO 646），包括了ISO 2022定义的C0与G0空间的值。码集1, 2, 3表示G1空间的值。其中，码集1表示一些未经修饰（unadorned）的字符。码集2的字符编码以0x8E（属于C1控制字符，或称SS2）为第一字节。码集3的字符编码以0x8F（另一个属于C1的控制字符，或称SS3）为第一字节。码集0总是编码为单字节；码集2、3总是编码为至少2个字节；码集1编码为1-3个字节。 (zh) Extended Unix Code (EUC) is a multibyte character encoding system used primarily for Japanese, Korean, and simplified Chinese. The most commonly used EUC codes are variable-length encodings with a character belonging to an ISO/IEC 646 compliant coded character set (such as ASCII) taking one byte, and a character belonging to a 94x94 coded character set (such as GB 2312) represented in two bytes. The EUC-CN form of GB 2312 and EUC-KR are examples of such two-byte EUC codes. EUC-JP includes characters represented by up to three bytes, including an initial shift code, whereas a single character in EUC-TW can take up to four bytes. (en) L'Extended Unix Code è un sistema multibyte di codifica di caratteri usato soprattutto per il giapponese, il cinese ed il coreano. La struttura dell'Extended Unix Code è basata sullo standard . Questo tipo di codifica si suddivide in: (it)
rdfs:label	Extended UNIX Coding (de) Extended Unix Code (en) Extended Unix Coding (fr) Extended Unix Code (it) 확장 유닉스 코드 (ko) Extended Unix Code (ja) EUC (zh) EUC (uk)
owl:sameAs	freebase:Extended Unix Code yago-res:Extended Unix Code wikidata:Extended Unix Code dbpedia-de:Extended Unix Code dbpedia-fr:Extended Unix Code dbpedia-it:Extended Unix Code dbpedia-ja:Extended Unix Code dbpedia-ko:Extended Unix Code dbpedia-uk:Extended Unix Code dbpedia-zh:Extended Unix Code https://global.dbpedia.org/id/CXHm
prov:wasDerivedFrom	wikipedia-en:Extended_Unix_Code?oldid=1123212030&ns=0
foaf:depiction	wiki-commons:Special:FilePath/Ecma43_versus_EUC.svg wiki-commons:Special:FilePath/CsEucFixWidJapanese.svg wiki-commons:Special:FilePath/EUC-JISx0213.svg wiki-commons:Special:FilePath/EUC-JP.svg wiki-commons:Special:FilePath/EUC-KR_without_extensions.svg wiki-commons:Special:FilePath/EUCCN_encoding.svg
foaf:isPrimaryTopicOf	wikipedia-en:Extended_Unix_Code
is dbo:wikiPageDisambiguates of	dbr:EUC
is dbo:wikiPageRedirects of	dbr:Extended_UNIX_Code_Packed_Format_for_Japanese dbr:EUC-JIS-2004 dbr:Code_page_1380 dbr:Code_page_1381 dbr:Code_page_1382 dbr:Code_page_1383 dbr:Code_page_20932 dbr:Code_page_954 dbr:Code_page_970 dbr:Code_page_971 dbr:MacKorean dbr:Mac_OS_Chinese_Simplified dbr:CsEUCKR dbr:CsEUCPkdFmtJapanese dbr:EUC-JISX0213 dbr:EUC-JP dbr:EUC-KP dbr:EUC-KR dbr:EUC-CN dbr:EUC-TW dbr:X-mac-chinesesimp dbr:X-mac-korean dbr:UJIS dbr:X-euc-jp dbr:Extended_Unix_Coding
is dbo:wikiPageWikiLink of	dbr:Extended_UNIX_Code_Packed_Format_for_Japanese dbr:List_of_computing_and_IT_abbreviations dbr:Character_encoding dbr:DBCS dbr:Index_of_Japan-related_articles_(E) dbr:List_of_modern_Hangul_characters_in_IS...iant_national_character_set_standards dbr:EUC-JIS-2004 dbr:Code_page_1380 dbr:Code_page_1381 dbr:Code_page_1382 dbr:Code_page_1383 dbr:Code_page_20932 dbr:Code_page_895 dbr:Code_page_949_(IBM) dbr:Code_page_954 dbr:Code_page_970 dbr:Code_page_971 dbr:GB_18030 dbr:MacKorean dbr:Mac_OS_Chinese_Simplified dbr:String_(computer_science) dbr:94_(number) dbr:C0_and_C1_control_codes dbr:CsEUCKR dbr:CsEUCPkdFmtJapanese dbr:Japanese_language_and_computers dbr:EUC-JISX0213 dbr:EUC-JP dbr:EUC-KP dbr:EUC-KR dbr:HZ_(character_encoding) dbr:Internet_Relay_Chat dbr:EUC dbr:EUC-CN dbr:EUC-TW dbr:KPS_9566 dbr:KS_X_1001 dbr:Katakana dbr:Sony_NEWS dbr:ISO-IR-165 dbr:ISO/IEC_2022 dbr:Shift_JIS dbr:X-mac-chinesesimp dbr:X-mac-korean dbr:UJIS dbr:X-euc-jp dbr:Extended_Unix_Coding
is foaf:primaryTopic of	wikipedia-en:Extended_Unix_Code