Unified Hangul Code (original) (raw)

About DBpedia

Windows-949 ou CP949 est un jeu de caractères, aussi appelé Unified Hangul Code ou Extended Wansung, utilisé sur le système d'exploitation Microsoft Windows en coréen, développé pour Windows 95, compatible avec la norme KS C 5601 (appelée KS X 1001 après 1998) et avec le codage . C'est un codage sur 16 bits variable, similaire à l’EUC-KR, dans lequel les caractères peuvent être définis un octet ou sur deux octets. Les caractères 0x00-0x7F sont identiques à la norme KS C 5636 (appelée KS X 1003 après 1998) et utilisent un octet. Le reste des caractères commençant par 0x81-0xC6 occupent deux octets. Il compte 11172 caractères, dont 2350 caractères hangeul du (KS X 1001) et 8822 caractères précomposés du Johab.

thumbnail

Property Value
dbo:abstract Die Codepage 949 (koreanisch 코드페이지 949, Alternativbezeichnung Vereinigter Hangeul-Code (koreanisch 통합형 한글 코드, englisch Unified Hangul Code (UHC)), teilw. auch Erweitertes Wansung (englisch Extended Wansung)) ist eine Zeichenkodierung des Windows-Betriebssystems, die mit Windows 95 eingeführt wurde. Sie ist abwärtskompatibel mit EUC-KR und vereinigt die beiden koreanischen Zeichensätze Wansung (KS X 1001) und Johab. Für Korea gab es zwei verschiedene Zeichensätze: der Wansung-Zeichensatz (koreanisch 완성), der nur die Hangul-Silbenblöcke kodiert, die in der koreanischen Sprache verwendet werden (2.350), und der Johab-Zeichensatz, der alle möglichen Hangul-Silbenblöcke kodiert, auch die, die nicht in der koreanischen Sprache vorkommen (insgesamt 11.172). Die Codepage 949 belegt 8822 freie Codepunkte des Wansung-Zeichensatzes mit den zusätzlichen Hangul-Silbenblöcken des Johab-Zeichensatzes. Die Codepage 949 ist genau wie EUC-KR eine variable 16-Bit-Kodierung, d. h. ein Zeichen kann entweder ein oder zwei Byte groß sein. Die Zeichen im Bereich 0x00-0x7F sind identisch mit KS X 1003 und bestehen aus nur einem Byte. Die Zeichen im Bereich 0x81-0xFE hingegen bestehen aus zwei Bytes, im Gegensatz zu EUC-KR kann sich das nachfolgende Byte jedoch auch im Bereich von 0x41-0x7A befinden. Seit Windows XP wird auch die ursprüngliche Kodierung EUC-KR als Codepage 51949 angeboten. (de) Windows-949 ou CP949 est un jeu de caractères, aussi appelé Unified Hangul Code ou Extended Wansung, utilisé sur le système d'exploitation Microsoft Windows en coréen, développé pour Windows 95, compatible avec la norme KS C 5601 (appelée KS X 1001 après 1998) et avec le codage . C'est un codage sur 16 bits variable, similaire à l’EUC-KR, dans lequel les caractères peuvent être définis un octet ou sur deux octets. Les caractères 0x00-0x7F sont identiques à la norme KS C 5636 (appelée KS X 1003 après 1998) et utilisent un octet. Le reste des caractères commençant par 0x81-0xC6 occupent deux octets. Il compte 11172 caractères, dont 2350 caractères hangeul du (KS X 1001) et 8822 caractères précomposés du Johab. (fr) Unified Hangul Code (UHC), or Extended Wansung, also known under Microsoft Windows as Code Page 949 (Windows-949, MS949 or ambiguously CP949), is the Microsoft Windows code page for the Korean language. It is an extension of Wansung Code (KS C 5601:1987, encoded as EUC-KR) to include all 11172 non-partial Hangul syllables present in Johab (KS C 5601:1992 annex 3). This corresponds to the pre-composed syllables available in Unicode 2.0 and later. Wansung Code has the drawback that it only assigns codes for the 2350 precomposed Hangul syllables which have their own KS X 1001 (KS C 5601) codepoints (out of 11172 in total, not counting those using obsolete jamo), and requires others to use eight-byte composition sequences, which are not supported by some partial implementations of the standard. UHC resolves this by assigning single codes for all possible syllables constructed using modern jamo, by making assignments outside of the encoding space used for KS X 1001. The lead byte range is extended to 0x81–FE, and the trail byte range is extended to 0x41–5A, 0x61–7A and 0x81–FE (in EUC-KR, both ranges are 0xA1–FE). The codes outside the EUC-KR ranges are used for the additional hangul. If considered separately, both the EUC-KR Hangul block and the UHC extended Hangul section are in Unicode order. (en) 코드 페이지 949(CP949)는 마이크로소프트사가 도입한 코드 페이지이다. 본래는 KS C 5601의 완성형 한글을 표현한 코드 페이지였으나, 윈도 95부터는 확장 완성형 혹은 통합형 한글 코드(Unified Hangul Code)이라는 명칭으로 확장되어 현대의 모든 한글을 수용하게 되었다. 마이크로소프트에서는 이 인코딩을 기반 문자 집합 이름인 "ks_c_5601-1987"로 사용하고 있다. 이 코드 페이지는 IANA에 등록되어 있지 않지만[1], W3C와 WHATWG의 인코딩 스펙에 EUC-KR이라는 이름으로 표준으로 지정되어 있다. CP949 인코딩은 EUC-KR의 확장이며, 하위 호환성이 있다. * 128보다 작은 바이트에 KS X 1003을 배당한다. * 128보다 크거나 같은 두 바이트에 KS X 1001을 배당한다. 각 글자는 행과 열에 128을 더한 코드값을 사용하여 2바이트로 표현된다. 행과 열 번호가 32부터 시작하기 때문에 실제로 이 문자 집합은 첫째/둘째 바이트가 161부터 254 범위에 있다. * 나머지 공간에 KS X 1001에 없는 8822자의 현대 한글을 가나다 순서대로 배당한다. 이 경우 첫째 바이트가 129부터 198까지이며, 둘째 바이트는 65부터 90까지(로마자 대문자), 97부터 122까지(로마자 소문자), 129부터 254까지의 범위이다. 단 첫째 바이트가 161 이상일 경우 KS X 1001과의 충돌을 막기 위해 둘째 바이트는 161 이상이 될 수 없다. * 한글 채움 문자의 부호값은 A4D4이다. 따라서 KS X 1001의 40-27에 배당된 "위"라는 글자는 CP949에서도 C0 A7라는 바이트 열로 표현된다. 한편 KS X 1001에 없는 "갘"이라는 글자는 KS X 1001에 없는 현대 한글 중 10번째이고 따라서 CP949에서 81 4A가 된다. (ko)
dbo:thumbnail wiki-commons:Special:FilePath/Unified_Hangul_Code.svg?width=300
dbo:wikiPageExternalLink https://www.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP949.TXT https://msdn.microsoft.com/en-us/library/cc194941.aspx http://www-01.ibm.com/software/globalization/ccsid/ccsid1363.html https://github.com/unicode-org/icu/blob/master/icu4c/source/data/mappings/ibm-1363_P110-1997.ucm https://github.com/unicode-org/icu/blob/master/icu4c/source/data/mappings/ibm-1363_P11B-1998.ucm https://github.com/unicode-org/icu/blob/master/icu4c/source/data/mappings/windows-949-2000.ucm http://demo.icu-project.org/icu-bin/convexp%3Fconv=ibm-1363 http://demo.icu-project.org/icu-bin/convexp%3Fconv=windows-949
dbo:wikiPageID 2997032 (xsd:integer)
dbo:wikiPageLength 21826 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID 1090298583 (xsd:integer)
dbo:wikiPageWikiLink dbr:5_(number) dbr:6_(number) dbr:8_(number) dbr:Python_(programming_language) dbr:Q dbr:Braces_(punctuation) dbr:DBCS dbr:UTF-8 dbr:Underscore dbr:Unicode dbr:Unicode_Consortium dbr:V dbr:Vertical_bar dbr:• dbr:∟ dbr:─ dbr:○ dbr:☼ dbr:♪ dbr:♫ dbr:! dbr:$ dbr:" dbr:% dbr:? dbr:^ dbr:` dbr:& dbr:' dbr:( dbr:) dbr:+ dbr:, dbr:- dbr:0_(number) dbr:Colon_(punctuation) dbr:S dbr:Code_page_437 dbr:Code_page_949_(IBM) dbr:Full_stop dbr:G dbr:Gender_symbol dbr:Greater-than_sign dbr:Miscellaneous_Technical_(Unicode_block) dbr:N dbr:Less-than_sign dbr:M dbr:Slash_(punctuation) dbr:Z dbr:~ dbr:¶ dbr:1_(number) dbr:B dbr:Backslash dbr:C dbr:C0_and_C1_control_codes dbr:CJK dbr:Tilde dbr:U dbr:W dbr:W3C dbr:WHATWG dbr:4_(number) dbr:7_(number) dbr:; dbr:= dbr:@ dbr:A dbr:D dbr:E dbr:EUC-KR dbr:Exclamation_mark dbr:F dbr:Null_character dbr:Number_sign dbr:P dbc:Hangul dbr:9_(number) dbr:H dbr:HTML5 dbr:Hangul dbr:Hangul_Syllables dbr:Hexadecimal dbr:International_Components_for_Unicode dbr:Internet_Assigned_Numbers_Authority dbr:J dbr:Asterisk dbr:Johab_-_Korean_Standard_Symbol dbr:K dbr:KPS_9566 dbr:KS_X_1001 dbr:L dbc:Encodings_of_Asian_languages dbr:T dbr:Code_page dbr:2_(number) dbr:3_(number) dbr:Arrow_(symbol) dbc:Korean-language_computing dbc:Windows_code_pages dbr:Square_brackets dbr:I dbr:Korean_language dbr:Microsoft_Windows dbr:O dbr:R dbr:Won_sign dbr:X dbr:Y dbr:SBCS dbr:Variable-width_encoding dbr:Extended_ASCII dbr:ISO_646 dbr:│ dbr:┌ dbr:┐ dbr:└ dbr:┘ dbr:├ dbr:┤ dbr:┬ dbr:┴ dbr:┼ dbr:▲ dbr:▼ dbr:◄ dbr:◘ dbr:◙ dbr:KS_C_5601 dbr:Space_character
dbp:alias Windows Code Page 949, IBM Code Page 1363 (en)
dbp:caption Layout of the Unified Hangul Code (en)
dbp:classification Extended ISO 646, variable-width encoding, CJK encoding (en)
dbp:extends dbr:EUC-KR
dbp:lang dbr:Korean_language
dbp:name Unified Hangul Code (en)
dbp:otherrelated (en) , (en) KPS 9566-2011 (en) KPS 9566-2003 (en)
dbp:standard WHATWG Encoding Standard (en)
dbp:wikiPageUsesTemplate dbt:Anchor dbt:Efn dbt:Legend dbt:Notelist dbt:Redirect dbt:Reflist dbt:Short_description dbt:Pipe dbt:Chset-cell1 dbt:Hangul_Jamo dbt:Character_encoding dbt:Chset-ctrl1 dbt:Chset-left1 dbt:Infobox_character_encoding
dcterms:subject dbc:Hangul dbc:Encodings_of_Asian_languages dbc:Korean-language_computing dbc:Windows_code_pages
rdfs:comment Windows-949 ou CP949 est un jeu de caractères, aussi appelé Unified Hangul Code ou Extended Wansung, utilisé sur le système d'exploitation Microsoft Windows en coréen, développé pour Windows 95, compatible avec la norme KS C 5601 (appelée KS X 1001 après 1998) et avec le codage . C'est un codage sur 16 bits variable, similaire à l’EUC-KR, dans lequel les caractères peuvent être définis un octet ou sur deux octets. Les caractères 0x00-0x7F sont identiques à la norme KS C 5636 (appelée KS X 1003 après 1998) et utilisent un octet. Le reste des caractères commençant par 0x81-0xC6 occupent deux octets. Il compte 11172 caractères, dont 2350 caractères hangeul du (KS X 1001) et 8822 caractères précomposés du Johab. (fr) Die Codepage 949 (koreanisch 코드페이지 949, Alternativbezeichnung Vereinigter Hangeul-Code (koreanisch 통합형 한글 코드, englisch Unified Hangul Code (UHC)), teilw. auch Erweitertes Wansung (englisch Extended Wansung)) ist eine Zeichenkodierung des Windows-Betriebssystems, die mit Windows 95 eingeführt wurde. Sie ist abwärtskompatibel mit EUC-KR und vereinigt die beiden koreanischen Zeichensätze Wansung (KS X 1001) und Johab. Seit Windows XP wird auch die ursprüngliche Kodierung EUC-KR als Codepage 51949 angeboten. (de) Unified Hangul Code (UHC), or Extended Wansung, also known under Microsoft Windows as Code Page 949 (Windows-949, MS949 or ambiguously CP949), is the Microsoft Windows code page for the Korean language. It is an extension of Wansung Code (KS C 5601:1987, encoded as EUC-KR) to include all 11172 non-partial Hangul syllables present in Johab (KS C 5601:1992 annex 3). This corresponds to the pre-composed syllables available in Unicode 2.0 and later. (en) 코드 페이지 949(CP949)는 마이크로소프트사가 도입한 코드 페이지이다. 본래는 KS C 5601의 완성형 한글을 표현한 코드 페이지였으나, 윈도 95부터는 확장 완성형 혹은 통합형 한글 코드(Unified Hangul Code)이라는 명칭으로 확장되어 현대의 모든 한글을 수용하게 되었다. 마이크로소프트에서는 이 인코딩을 기반 문자 집합 이름인 "ks_c_5601-1987"로 사용하고 있다. 이 코드 페이지는 IANA에 등록되어 있지 않지만[1], W3C와 WHATWG의 인코딩 스펙에 EUC-KR이라는 이름으로 표준으로 지정되어 있다. CP949 인코딩은 EUC-KR의 확장이며, 하위 호환성이 있다. 따라서 KS X 1001의 40-27에 배당된 "위"라는 글자는 CP949에서도 C0 A7라는 바이트 열로 표현된다. 한편 KS X 1001에 없는 "갘"이라는 글자는 KS X 1001에 없는 현대 한글 중 10번째이고 따라서 CP949에서 81 4A가 된다. (ko)
rdfs:label Codepage 949 (de) Windows-949 (fr) 코드 페이지 949 (ko) Unified Hangul Code (en)
owl:sameAs wikidata:Unified Hangul Code dbpedia-de:Unified Hangul Code dbpedia-fr:Unified Hangul Code dbpedia-ko:Unified Hangul Code https://global.dbpedia.org/id/AdKh
prov:wasDerivedFrom wikipedia-en:Unified_Hangul_Code?oldid=1090298583&ns=0
foaf:depiction wiki-commons:Special:FilePath/Unified_Hangul_Code.svg
foaf:isPrimaryTopicOf wikipedia-en:Unified_Hangul_Code
is dbo:wikiPageDisambiguates of dbr:UHC
is dbo:wikiPageRedirects of dbr:Code_page_949 dbr:Code_page_1126 dbr:Code_page_1362 dbr:Code_page_1363 dbr:Extended_Wansung dbr:CP_949 dbr:Codepage_949 dbr:CP949 dbr:Windows-949
is dbo:wikiPageWikiLink of dbr:Mo_(kana) dbr:N_(kana) dbr:Na_(kana) dbr:Ne_(kana) dbr:E_(kana) dbr:Chi_(kana) dbr:Ni_(kana) dbr:Nu_(kana) dbr:O_(kana) dbr:Code_page_949 dbr:Radical_213 dbr:Code_page_949_(IBM) dbr:Lotus_Multi-Byte_Character_Set dbr:ß dbr:Fu_(kana) dbr:Ku_(kana) dbr:Ta_(kana) dbr:Te_(kana) dbr:To_(kana) dbr:Tilde dbr:Code_page_1126 dbr:Code_page_1362 dbr:Code_page_1363 dbr:Ha_(kana) dbr:He_(kana) dbr:Extended_Unix_Code dbr:Extended_Wansung dbr:No_(kana) dbr:Number_sign dbr:Ho_(kana) dbr:Ka_(kana) dbr:Ke_(kana) dbr:Ki_(kana) dbr:Ko_(kana) dbr:Ra_(kana) dbr:Radical_symbol dbr:Re_(kana) dbr:Ri_(kana) dbr:Ro_(kana) dbr:At_sign dbr:A_(kana) dbr:Character_encodings_in_HTML dbr:KPS_9566 dbr:KS_X_1001 dbr:Code_page dbr:Hi_(kana) dbr:Tsu_(kana) dbr:Ya_(kana) dbr:Yo_(kana) dbr:Yu_(kana) dbr:PostScript_fonts dbr:Sokuon dbr:Infinity_symbol dbr:CP_949 dbr:Won_sign dbr:Ma_(kana) dbr:Me_(kana) dbr:Mi_(kana) dbr:Mu_(kana) dbr:Ru_(kana) dbr:Sa_(kana) dbr:So_(kana) dbr:Su_(kana) dbr:Se_(kana) dbr:Shi_(kana) dbr:UHC dbr:U_(kana) dbr:Wa_(kana) dbr:We_(kana) dbr:Wo_(kana) dbr:Wi_(kana) dbr:I_(kana) dbr:Windows_code_page dbr:Outline_of_Korean_language dbr:Codepage_949 dbr:CP949 dbr:Windows-949
is dbp:encodings of dbr:KS_X_1001
is dbp:extensions of dbr:Extended_Unix_Code
is dbp:map of dbr:Mo_(kana) dbr:N_(kana) dbr:Na_(kana) dbr:Ne_(kana) dbr:E_(kana) dbr:Chi_(kana) dbr:Ni_(kana) dbr:Nu_(kana) dbr:O_(kana) dbr:Radical_213 dbr:ß dbr:Fu_(kana) dbr:Ku_(kana) dbr:Ta_(kana) dbr:Te_(kana) dbr:To_(kana) dbr:Ha_(kana) dbr:He_(kana) dbr:No_(kana) dbr:Number_sign dbr:Ho_(kana) dbr:Ka_(kana) dbr:Ke_(kana) dbr:Ki_(kana) dbr:Ko_(kana) dbr:Ra_(kana) dbr:Re_(kana) dbr:Ri_(kana) dbr:Ro_(kana) dbr:At_sign dbr:A_(kana) dbr:Hi_(kana) dbr:Tsu_(kana) dbr:Ya_(kana) dbr:Yo_(kana) dbr:Yu_(kana) dbr:Sokuon dbr:Ma_(kana) dbr:Me_(kana) dbr:Mi_(kana) dbr:Mu_(kana) dbr:Ru_(kana) dbr:Sa_(kana) dbr:So_(kana) dbr:Su_(kana) dbr:Se_(kana) dbr:Shi_(kana) dbr:U_(kana) dbr:Wa_(kana) dbr:We_(kana) dbr:Wo_(kana) dbr:Wi_(kana) dbr:I_(kana)
is dbp:next of dbr:Extended_Unix_Code
is foaf:primaryTopic of wikipedia-en:Unified_Hangul_Code