Windows-1258 (original) (raw)

About DBpedia

Windows-1258 ist eine 8-Bit-Zeichenkodierung des Windows-Betriebssystems. Sie deckt die Orthographie der vietnamesischen Sprache ab. Da diese Orthographie insgesamt 134 Zeichen außer den ASCII-Zeichen verwendet, ist eine einfache Erweiterung des ASCII-Zeichensatzes auf 8-Bit nicht möglich. Windows-1258 löst dieses Problem durch die Verwendung kombinierender Zeichen, die sich mit den Basiskonsonanten verbinden und so die nötigen Kombinationen erzeugen. Der Zeichensatz selber basiert größtenteils auf Windows-1252, enthält jedoch außer den Diakritiken einige weitere vietnamesische Buchstaben und Zeichen.

Property Value
dbo:abstract Windows-1258 ist eine 8-Bit-Zeichenkodierung des Windows-Betriebssystems. Sie deckt die Orthographie der vietnamesischen Sprache ab. Da diese Orthographie insgesamt 134 Zeichen außer den ASCII-Zeichen verwendet, ist eine einfache Erweiterung des ASCII-Zeichensatzes auf 8-Bit nicht möglich. Windows-1258 löst dieses Problem durch die Verwendung kombinierender Zeichen, die sich mit den Basiskonsonanten verbinden und so die nötigen Kombinationen erzeugen. Der Zeichensatz selber basiert größtenteils auf Windows-1252, enthält jedoch außer den Diakritiken einige weitere vietnamesische Buchstaben und Zeichen. Die folgende Tabelle zeigt das Repertoire von Windows-1258. Diakritische Zeichen sind rot markiert, weitere Unterschiede zu Windows-1252 gelb. Unbelegte Positionen sind grün markiert. (de) La page de code Windows-1258 (dans le registre IANA des jeux de caractères codés pour l’informatique et les normes Internet, aussi connue comme CP1258) est utilisée dans Microsoft Windows pour représenter les textes en quôc ngu, l’actuelle adaptation de l’écriture latine utilisée pour la langue vietnamienne moderne. C‘est une variante de la page de code Windows-1252 (ou CP1252, utilisée pour les langues d’Europe occidentale à écriture latine), avec quelques positions modifiées : * comme la page de code Windows-1252 ou les pages de code de la norme ISO/CEI 8859, elle est compatible avec les pages de code sur 7 bits de la norme ISO 646 (ici dans sa version américaine pour les positions variables, version communément appelée ASCII) dans toutes les positions hexadécimales 00 à 7F (les 8 premières rangées de la table ci-dessous) ; * comme la page de code Windows-1252, c’est également une variante du jeu de caractères codés ISO/CEI 8859-1 sur 8 bits de la norme ISO/CEI 8859 et utilisée pour les langues occidentales à écriture latine ; * comme toutes les pages de code sur 8 bits pour Windows basées sur la norme ISO/IEC 8859, elle s’écarte de cette norme pour placer (dans les positions hexadécimales 80 à 9F) des caractères typographiques, des symboles monétaires ou des lettres supplémentaires, à la place du jeu de caractères de contrôle C1 (inutilisés dans Windows) ; * les 18 positions qui sont modifiées par rapport à la page de code CP1252 sont indiquées dans la table ci-dessous par la bordure en tirets épais des cases : * ce sont les 5 signes diacritiques combinants (marques de ton), les 6 lettres latines diacritées (1 consonne et 2 voyelles phonémiques, chacune dans les deux casses) et 1 symbole monétaire nécessaires au vietnamien, présents dans les 4 dernières rangées de la table ci-dessous (ils remplacent des lettres latines diacritées utilisées dans les langues d’Europe centrale ou orientale et précomposées avec le caron ou hacek en chef, ainsi que la lettre latine edh encore utilisée en islandais, mais remplacée ici par la lettre latine d avec barre inscrite), * ainsi que 4 caractères supprimés et non remplacées (dans les rangées numéro 8 et 9, correspondant aux extensions de CP1252, par rapport à l’ISO/IEC 8859-1, et dans le cas présent pour 2 autres lettres latines avec caron). Bizarrement, Microsoft a modifié cette page de code pour y placer le symbole « € » (U+20AC) de l’euro en position 0x80 (comme dans la plupart des pages de codes pour Windows) lors de son introduction en 1999 (alors que l’euro n’est pas officiellement utilisé au Viêt Nam), mais a tout de même placé le symbole monétaire « ₫ » (U+20AB) du dong (localement đồng en vietnamien) en position 0xFE et qui, dans cette page de code, est différent de la lettre latine minuscule d barrée normale « đ » codée en position 0xF0 (l’initiale du nom de la devise en vietnamien, mais non transcrite en exposant souligné comme le symbole monétaire). Dans la table ci-dessus, les cases à fond rouge indiquent des positions réservées aux caractères de contrôle, les cases grisées indiquent des positions totalement inutilisés. Les cases à fond bleu clair indiquent des signes diacritiques combinants (qui doivent être utilisés après une lettre de base) utilisés comme marques de ton en vietnamien (affichées ici en combinaison avec un cercle pointillé et non une lettre) : * soit après une des 6 voyelles de l’alphabet latin de base (12 en comptant aussi les variantes majuscules), * soit après une des 6 autres voyelles diacrités de l’alphabet latin qui correspondent à une modification vocalique en vietnamien (12 en comptant aussi les variantes majuscules), * soit après l‘espace insécable (noté « NBSP » dans le tableau) qui permet d’afficher le diacritique seul sans le lier à une lettre et de traiter l’ensemble comme s’il s’agissait d’une lettre normale. Les voyelles de base et espaces avec lesquelles ces diacritiques doivent pouvoir être utilisés pour l’écriture du vietnamien sont indiquées dans les cases à fond jaune : elles peuvent aussi être utilisées seules (sans signe diacritique de ton) pour marquer le ton « moyen trainant » (ngang) par défaut du vietnamien, ou pour les textes transcrits sous forme simplifiée sans leur tonalité. Quelques-unes des combinaisons d’une voyelle phonémique et d’une marque de ton sont aussi disponibles sous forme de caractères précomposés dans cette table, ce sont celles qui correspondent aux principales langues européennes a écriture latine, avec lesquelles le vietnamien est utilisé. Les cases à fond blanc indiquent les autres caractères utilisables directement en vietnamien, y compris l’espace normale sécable, notée « SP », la ponctuation générale, les signes mathématiques, les dix chiffres latino-arabes, ainsi que les 8 voyelles précomposées (notant à la fois une voyelle phonémique de l’alphabet de base et une marque de ton) parmi les 60 (12 × 5) voyelles possibles (comprenant une marque de ton), chacune de ces voyelles dans les deux casses possibles, ainsi que les 4 symboles précombinés parmi les 5 symboles possibles par les mêmes marques de ton en isolation (car déjà précombinés avec une espace insécable). Les cases à fond rose clair indiquent des lettres simples ou precomposées, ou des symboles ou signes, non destinés à la transcription classique du vietnamien ou pour lesquels d’autres transcriptions leur sont préférées en vietnamien. Ils sont toutefois parfaitement utilisables dans cette page de code (notamment pour les textes internationaux et les mots importés de langues occidentales tels que les noms propres ou les marques commerciales). (fr) Windows-1258 is a code page used in Microsoft Windows to represent Vietnamese texts. It makes use of combining diacritical marks. Windows-1258 is compatible with neither the Vietnamese standard (TCVN 5712 / VSCII), nor the various other encodings in use in practice (VISCII, VNI, VPS). Rather, it is very similar to Windows-1252, with the differences being that s-caron and z-caron (which were added to Windows-1252 later) are missing, five of the letters with diacritics have been replaced by combining diacritics for Vietnamese tone marks, one has been replaced with the đông sign, and eight others (four per case) have been changed to four otherwise-unsupported Vietnamese letters. Use of combining diacritics means that Windows-1258 can cover the large number of combinations of letters and tone marks in Vietnamese without compromising coverage of control codes or symbols. However it also means that software must be careful to handle conversions between precomposed characters and combining sequences correctly when converting to/from other encodings and makes determining user-visible length of a string more difficult. IBM uses code page 1258 (CCSID 1258 and euro sign extended CCSID 5354) for Windows-1258. UTF-8 is the preferred encoding for Vietnamese in modern applications. Windows-1258 may not always round-trip Unicode encoded Vietnamese due to changes caused by Unicode normalization. Combining diacritics are encoded after the letter in both Windows-1258 and Unicode (like VNI, unlike ANSEL). (en) Windows-1258, znane także jako CP-1258, bądź WinVietnamese, jest 8–bitowym kodowaniem znaków zaprojektowanym do pokrycia języka wietnamskiego, jest używane w systemie Microsoft Windows. Korzysta z . Nie jest kompatybilne z kodowaniem , jest natomiast podobne do Windows-1252, różniąc się brakującymi znakami „Š” i „Ž” (które do CP1252 zostały dodane później), czterema literami z diakrytykami zastąpionymi samymi łączonymi znakami diakrytycznymi, oraz kilkoma innymi zmienionymi kombinacjami litera/znak diakrytyczny. Użycie łączonych diakrytyków spowodowało, że Windows-1258 może pokryć dużą liczbę kombinacji litera/znak diakrytyczny z języka wietnamskiego bez konieczności uszczuplenia pokrycia symboli, bądź znaków kontrolnych. (pl)
dbo:wikiPageExternalLink http://www.siao2.com/2005/08/27/457224.aspx https://www.iana.org/assignments/charset-reg/windows-1258
dbo:wikiPageID 503149 (xsd:integer)
dbo:wikiPageLength 31259 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID 1091091090 (xsd:integer)
dbo:wikiPageWikiLink dbr:Caret dbr:Bell_character dbr:Pound_sign dbr:Q dbr:Question_mark dbr:Enquiry_character dbr:Î dbr:Angle_quotes dbr:Degree_(symbol) dbr:Percent_sign dbr:UTF-8 dbr:Underscore dbr:Unicode dbr:Unicode_normalization dbr:V dbr:VISCII dbr:VNI_Character_Set dbr:VPS_character_encoding dbr:VSCII dbr:Vertical_bar dbr:Vietnamese_alphabet dbr:Vietnamese_language dbr:Vietnamese_đồng dbr:̀ dbr:̣ dbr:₫ dbr:Devanagari_transliteration dbr:Round-trip_format_conversion dbr: dbr:` dbr:0 dbr:Colon_(punctuation) dbr:Comma_(punctuation) dbr:Copyright_symbol dbr:Masculine_ordinal_indicator dbr:S dbr:Escape_character dbr:Circumflex dbr:Ellipsis dbr:English_language dbr:Equals_sign dbr:French_language dbr:Full_stop dbr:G dbr:German_language dbr:Greater-than_sign dbr:Minus_sign dbr:Multiplication_sign dbr:N dbr:Apostrophe dbr:Less-than_sign dbr:Line_feed dbr:Luxembourgish_language dbr:M dbr:Slash_(punctuation) dbr:Delete_character dbr:Z dbr:ª dbr:® dbr:Ä dbr:Å dbr:Æ dbr:Ç dbr:É dbr:Ê dbr:Ë dbr:Í dbr:Ï dbr:Ñ dbr:Ô dbr:Ö dbr:Ø dbr:Ù dbr:Ü dbr:ß dbr:Œ dbr:Ÿ dbr:Device_Control_1 dbr:Device_Control_2 dbr:Device_Control_3 dbr:Device_Control_4 dbr:Substitute_character dbr:Tab_character dbr:1 dbr:B dbr:Backslash dbr:Bullet_(typography) dbr:C dbr:Cedilla dbr:Cent_(currency) dbr:Tilde dbr:Trademark_symbol dbr:Trema_(diacritic) dbr:Tswana_language dbr:U dbr:W dbr:WHATWG dbr:Curly_brackets dbr:Currency_(typography) dbr:2 dbr:3 dbr:4 dbr:5 dbr:6 dbr:7 dbr:8 dbr:9 dbr:@ dbr:A dbr:Acute_accent dbr:Albanian_language dbr:Ampersand dbr:D dbr:Dagger_(typography) dbr:Danish_language dbr:E dbr:Estonian_language dbr:Euro_sign dbr:Exclamation_mark dbr:F dbr:Finnish_language dbr:Florin_sign dbr:Form_feed dbr:Fraction_(mathematics) dbr:Non-breaking_space dbr:Norwegian_language dbr:Null_character dbr:Number_sign dbr:P dbr:Parenthesis dbr:End_of_medium dbr:One_half dbr:Guarani_language dbr:Guillemet dbr:H dbr:Interpunct dbr:Irish_language dbr:Italian_language dbr:J dbr:Backspace dbr:À dbr:Û dbr:Start_of_heading dbr:Start_of_text dbr:Asterisk dbr:ANSEL dbr:K dbr:L dbr:Superscript dbr:Swedish_language dbr:T dbr:Code_page dbr:Dollar_sign dbr:CCSID dbc:Windows_code_pages dbr:Pilcrow dbr:Plus-minus_sign dbr:Plus_sign dbr:Portuguese_language dbr:Spanish_language dbr:Square_brackets dbr:End_of_text dbr:Data_link_escape dbr:En_Dash dbr:End_of_transmission_block dbr:End_of_transmission_character dbr:I dbr:IBM dbr:Igbo_language dbr:Microsoft dbr:Microsoft_Windows dbr:O dbr:Obelus dbr:Cancel_character dbr:Carriage_return dbr:Quotation_mark dbr:R dbr:Section_sign dbr:Semicolon dbr:X dbr:Y dbr:Yen dbr:Yoruba_language dbr:Macron_(diacritic) dbr:Synchronous_idle dbr:Vertical_tab dbr:È dbr:Extended_ASCII dbr:Ơ dbr:Windows_code_page dbr:Soft_hyphen dbr:Ư dbr:Windows-1252 dbr:Acknowledge_character dbr:Inverted_exclamation_mark dbr:Inverted_question_mark dbr:Á dbr:Ú dbr:Ă dbr:Ó dbr:́ dbr:̃ dbr:̉ dbr:Đ dbr:Broken_bar dbr:Micro_sign dbr:Em_Dash dbr:Windows-125x dbr:File_separator dbr:Group_separator dbr:Permille dbr:Record_separator dbr:Combining_diacritical_mark dbr:Unit_separator dbr:Curved_quotes dbr:Space_character dbr:Logical_not dbr:Negative_acknowledge_character dbr:Shift_in dbr:Shift_out dbr:TCVN_5712
dbp:alias cp1258 (en)
dbp:basedon dbr:Windows-1252
dbp:by dbr:Microsoft
dbp:classification dbr:Extended_ASCII dbr:Windows-125x
dbp:lang dbr:Vietnamese_language dbr:Devanagari_transliteration dbr:English_language dbr:French_language dbr:German_language dbr:Luxembourgish_language dbr:Tswana_language dbr:Albanian_language dbr:Danish_language dbr:Estonian_language dbr:Finnish_language dbr:Norwegian_language dbr:Guarani_language dbr:Irish_language dbr:Italian_language dbr:Swedish_language dbr:Portuguese_language dbr:Spanish_language dbr:Igbo_language dbr:Yoruba_language With combining diacritics: (en)
dbp:mime windows-1258 (en)
dbp:name Windows-1258 (en)
dbp:standard WHATWG Encoding Standard (en)
dbp:wikiPageUsesTemplate dbt:Legend dbt:Reflist dbt:Short_description dbt:Chset-cell1 dbt:Character_encodings dbt:Chset-ctrl1 dbt:Chset-left1 dbt:Chset-table-footer1 dbt:Infobox_character_encoding
dcterms:subject dbc:Windows_code_pages
gold:hypernym dbr:Page
rdf:type dbo:Work yago:WikicatCharacterSets yago:Abstraction100002137 yago:CharacterSet106488880 yago:Communication100033020 yago:Database106637824 yago:Information106634376 yago:List106481320 yago:Message106598915
rdfs:comment Windows-1258 ist eine 8-Bit-Zeichenkodierung des Windows-Betriebssystems. Sie deckt die Orthographie der vietnamesischen Sprache ab. Da diese Orthographie insgesamt 134 Zeichen außer den ASCII-Zeichen verwendet, ist eine einfache Erweiterung des ASCII-Zeichensatzes auf 8-Bit nicht möglich. Windows-1258 löst dieses Problem durch die Verwendung kombinierender Zeichen, die sich mit den Basiskonsonanten verbinden und so die nötigen Kombinationen erzeugen. Der Zeichensatz selber basiert größtenteils auf Windows-1252, enthält jedoch außer den Diakritiken einige weitere vietnamesische Buchstaben und Zeichen. (de) La page de code Windows-1258 (dans le registre IANA des jeux de caractères codés pour l’informatique et les normes Internet, aussi connue comme CP1258) est utilisée dans Microsoft Windows pour représenter les textes en quôc ngu, l’actuelle adaptation de l’écriture latine utilisée pour la langue vietnamienne moderne. C‘est une variante de la page de code Windows-1252 (ou CP1252, utilisée pour les langues d’Europe occidentale à écriture latine), avec quelques positions modifiées : (fr) Windows-1258 is a code page used in Microsoft Windows to represent Vietnamese texts. It makes use of combining diacritical marks. Windows-1258 is compatible with neither the Vietnamese standard (TCVN 5712 / VSCII), nor the various other encodings in use in practice (VISCII, VNI, VPS). Rather, it is very similar to Windows-1252, with the differences being that s-caron and z-caron (which were added to Windows-1252 later) are missing, five of the letters with diacritics have been replaced by combining diacritics for Vietnamese tone marks, one has been replaced with the đông sign, and eight others (four per case) have been changed to four otherwise-unsupported Vietnamese letters. (en) Windows-1258, znane także jako CP-1258, bądź WinVietnamese, jest 8–bitowym kodowaniem znaków zaprojektowanym do pokrycia języka wietnamskiego, jest używane w systemie Microsoft Windows. Korzysta z . Nie jest kompatybilne z kodowaniem , jest natomiast podobne do Windows-1252, różniąc się brakującymi znakami „Š” i „Ž” (które do CP1252 zostały dodane później), czterema literami z diakrytykami zastąpionymi samymi łączonymi znakami diakrytycznymi, oraz kilkoma innymi zmienionymi kombinacjami litera/znak diakrytyczny. (pl)
rdfs:label Windows-1258 (de) Windows-1258 (fr) Windows-1258 (pl) Windows-1258 (en)
owl:sameAs freebase:Windows-1258 yago-res:Windows-1258 wikidata:Windows-1258 dbpedia-de:Windows-1258 dbpedia-fr:Windows-1258 dbpedia-pl:Windows-1258 https://global.dbpedia.org/id/4zKeu
prov:wasDerivedFrom wikipedia-en:Windows-1258?oldid=1091091090&ns=0
foaf:isPrimaryTopicOf wikipedia-en:Windows-1258
is dbo:wikiPageRedirects of dbr:Code_page_1129 dbr:Code_page_1163 dbr:Code_Page_1258 dbr:Codepage_1258 dbr:Cp-1258 dbr:Cp1258 dbr:Cp_1258 dbr:Win-1258 dbr:Win1258 dbr:WinVietnamese dbr:Win_1258 dbr:Windows_Vietnam dbr:Windows_Vietnamese dbr:CP-1258 dbr:CP_1258 dbr:WIN1258 dbr:WINDOWS-1258 dbr:WIN_1258 dbr:Code_page_1258 dbr:CP1258 dbr:Cswindows1258 dbr:X-cp1258
is dbo:wikiPageWikiLink of dbr:Mojibake dbr:Rich_Text_Format dbr:Character_encoding dbr:VISCII dbr:VNI dbr:VSCII dbr:Vietnamese_alphabet dbr:Vietnamese_language dbr:Code_page_1129 dbr:Code_page_1163 dbr:ß dbr:Code_Page_1258 dbr:Codepage_1258 dbr:Cp-1258 dbr:Cp1258 dbr:Cp_1258 dbr:Non-breaking_space dbr:HTMLDOC dbr:Character_encodings_in_HTML dbr:Win-1258 dbr:Win1258 dbr:WinVietnamese dbr:Win_1258 dbr:Windows_Vietnam dbr:Windows_Vietnamese dbr:RE/flex dbr:CP-1258 dbr:CP_1258 dbr:ISO/IEC_8859 dbr:Vietnamese_language_and_computers dbr:Windows_code_page dbr:Vietnamese_Quoted-Readable dbr:WIN1258 dbr:WINDOWS-1258 dbr:WIN_1258 dbr:Code_page_1258 dbr:CP1258 dbr:Cswindows1258 dbr:X-cp1258
is foaf:primaryTopic of wikipedia-en:Windows-1258