T.51/ISO/IEC 6937 (original) (raw)
ISO/IEC 6937:2001, 즉 Information technology — Coded graphic character set for text communication — Latin alphabet은 ASCII의 멀티바이트 확장 또는 ISO/IEC 646-IRV이다. T.51이라는 이름으로 컴퓨터 통신 서비스를 위해 ITU-T(당시 CCITT)를 통해 개발되었으며 1983년 처음으로 ISO 표준이 되었다. IANA는 ISO_6937-2-25과 ISO_6937-2-add라는 이 표준의 두 개의 (더 오래된) 버전을 등록하였다. 그러나 현실적으로 이 문자 인코딩은 인터넷에서 사용되지 않는다. ISO/IEC 6937 문자 집합의 오른손잡이 사이드를 지정하기 위한 ISO/IEC 2022 이스케이프 시퀀스는 ESC - R (16진 1B 2D 52)이다.
Property | Value |
---|---|
dbo:abstract | ISO/IEC 6937 je standard pro kódování znaků latinky používaný pro přenos českých znaků v digitálním pozemním vysílání (DVB). ISO/IEC 6937 je zkonstruováno jako vícebajtové rozšíření ASCII (přesněji řečeno ISO/IEC 646); některé kódy byly použity jako úvodní bajty pro znaky s diakritikou (akcenty). Hodnota úvodního bajtu většinou indikuje, který akcent bude použit a je následován kódem ASCII pro znak bez akcentu. Jsou povoleny pouze určité kombinace akcentu a základního znaku – takové, které mají vyjádření i v jiných znakových sadách. Standard definuje kódování pro 333 možných znaků. Podobně jako ISO/IEC 646-IRV byla tato norma vyvinuta ve spolupráci s ITU-T (následně CCITT) pro telematické služby pod názvem T.51. ISO normou se stala roku 1983, tedy několik let před vývojem a zavedení Unicode. V Česku byla převzata jako ČSN ISO/IEC 6937 (36 9110), Informační technologie – Kódovaný soubor grafických znaků pro přenos textu – Latinská abeceda. (cs) ISO 6937 ist eine Zeichenkodierung mit variabler Länge sowie eine ISO-Norm, die erstmals 1983 veröffentlicht wurde. Sie deckt die meisten europäischen Sprachen mit lateinischer Schrift ab. Die Norm wurde zuletzt 2009 aktualisiert. ISO 6937 wurde von Teletex verwendet. Um das €-Zeichen (an Position A4hex) erweitert, ist ISO 6937 eine der möglichen Text-Kodierungen bei DVB. ISO 6937 kodiert die Vielzahl an akzentuierten Zeichen mit zwei Bytes, wobei das erste Byte das diakritische Zeichen darstellt und das zweite Byte das Zeichen, an dem das Diakritikum positioniert werden soll. Die möglichen Kombinationen sind dabei genau festgelegt, also nicht beliebig. Die folgende Tabelle stellt das Repertoire von ISO 6937 dar. Blaue Felder stellen diakritische Zeichen dar, grüne Felder nicht belegte Codepunkte. Die ersten 128 Zeichen sind mit ASCII identisch. Erlaubte Zeichenkombinationen: (de) ISO/CEI 6937, intitulée Technologies de l’information — Jeu de caractères graphiques codés pour la transmission de texte — Alphabet latin, est une norme internationale de l’ISO publiée pour la première fois en 1983 et définissant un codage de caractères étendant le codage ISO/CEI 646 (dont la variante la plus connue est ASCII). Elle a été conçue en collaboration avec l’UIT-T (le Secteur de la normalisation des télécommunications de l’Union internationale des télécommunications — Comité Consultatif International Téléphonique et Télégraphique à l’époque). Sa dernière actualisation date de 2009. Ses principaux architectes furent Hugh McGregor Ross, Peter Fenwick, Bernard Marti et . Ce jeu de caractères se distingue des précédents en ce que les lettres diacritées sont encodées sur deux octets, le premier indiquant le diacritique et le second, la lettre. L’encodage est ainsi à longueur variable, complication qui jointe à différents défauts peut expliquer la réticence de certains industriels à implémenter cette norme. Cet échec a porté préjudice à la langue française dans le sens où ISO/CEI 6937 est le premier jeu de caractères à supporter l’e dans l’o, et que ce défaut d’implémentation engendra indirectement l’exclusion de l’œ/Œ du jeu de caractères suivant, le Latin-1. (fr) T.51 / ISO/IEC 6937:2001, Information technology — Coded graphic character set for text communication — Latin alphabet, is a multibyte extension of ASCII, or rather of ISO/IEC 646-IRV. It was developed in common with ITU-T (then CCITT) for telematic services under the name of T.51, and first became an ISO standard in 1983. Certain byte codes are used as lead bytes for letters with diacritics (accents). The value of the lead byte often indicates which diacritic that the letter has, and the follow byte then has the ASCII-value for the letter that the diacritic is on. ISO/IEC 6937's architects were Hugh McGregor Ross, Peter Fenwick, Bernard Marti and . ISO6937/2 defines 327 characters found in modern European languages using the Latin alphabet. Non-Latin European characters, such as Cyrillic and Greek, are not included in the standard. Also, some diacritics used with the Latin alphabet like the Romanian comma are not included, using cedilla instead as no distinction between cedilla and comma below was made at the time. IANA has registered the charset names ISO_6937-2-25 and ISO_6937-2-add for two (older) versions of this standard (plus control codes). But in practice this character encoding is unused on the Internet. (en) ISO/IEC 6937:2001, Information technology — Coded graphic character set for text communication — Latin alphabet(情報技術 — 文字コミュニケーションのためのコード化された図形文字集合 — ラテンアルファベット)は、ISO基本ラテンアルファベットにないラテン文字を表現するためにASCII(ISO/IEC 646)をマルチバイト拡張したものである。ITU-T(当時はCCITT)によってテレマティクスのために開発され、T.51として勧告された。1983年にISO標準となった。 特定のバイトコードが、ダイアクリティカルマークつきの文字のためのバイトとして使われる。第1バイトの値がダイアクリティカルマークの種別を表し、ASCIIの値を持つ第2バイトが、ダイアクリティカルマークがつく文字を表す。第1バイトと第2バイトは特定の組み合わせのみが許容され、第1バイトの解釈は第2バイトによって例外がある。ISO/IEC 6937ではダイアクリティカルマークつきの組み合わせ後の文字は1つもコード化されていない。ダイアクリティカルマークその物を表したい場合は、第2バイトにASCIIのスペースを入れる。 ISO/IEC 6937は、ピーター・フェンウィック、、レーク・ゼッケンドルフによって設計された。 ISO 6937/2ではラテン文字を使用する現代のヨーロッパの言語で使われている327の文字が定義されている。キリル文字・ギリシャ文字などのラテン文字ではない文字は含まれていない。ダイアクリティカルマークつきのラテン文字でも、ルーマニア語のȘ(Sコンマ)など一部は含んでいない。Sコンマについては、規格制定時にコンマビローとセディーユの区別をしていなかったので、コンマビローの代わりにセディーユを使用する。 IANAでは、ISO 6937/2のバージョンの違いに応じてISO_6937-2-25とISO_6937-2-addの2つの名称を与えている。ただし、この文字コードがインターネット上では使用されたことはない。 ISO/IEC 6937の右半分を指すISO/IEC 2022のエスケープシーケンスは ESC - R (十六進数 1B 2D 52)である。 (ja) ISO/IEC 6937:2001, 즉 Information technology — Coded graphic character set for text communication — Latin alphabet은 ASCII의 멀티바이트 확장 또는 ISO/IEC 646-IRV이다. T.51이라는 이름으로 컴퓨터 통신 서비스를 위해 ITU-T(당시 CCITT)를 통해 개발되었으며 1983년 처음으로 ISO 표준이 되었다. IANA는 ISO_6937-2-25과 ISO_6937-2-add라는 이 표준의 두 개의 (더 오래된) 버전을 등록하였다. 그러나 현실적으로 이 문자 인코딩은 인터넷에서 사용되지 않는다. ISO/IEC 6937 문자 집합의 오른손잡이 사이드를 지정하기 위한 ISO/IEC 2022 이스케이프 시퀀스는 ESC - R (16진 1B 2D 52)이다. (ko) ISO/IEC 6937 är en teckenkodning för datorer, en multibyte-utvidgning av ASCII, eller rättare av ISO/IEC 646-IRV. Tanken med ISO/IEC 6937 är att stödja diakritiska tecken i europeiska språk som skrivs med latinska tecken. Det finns i dessa språk totalt sett betydligt fler kombinationer än de 128 som är vad som finns utrymme för i en utökad ASCII förutom grundbokstäver mm. I princip stöder ISO/IEC 6937 alla europeiska språk som skrivs med latinska tecken. Standarden är inte mycket använd numera. Vissa kodvärden används som startbyte för bokstäver med diakriter ("accenter"). Startbytens värde indikerar mestadels vilket diakrit som bokstaven har, och följebyten är ASCII-värdet för bokstaven som diakriten applicerats på. Bara vissa kombinationer av startbyte och följebyte är tillåtna, och att det finns undantag från tolkningsregeln av startbyten för vissa följebyte. Observera dock att inga kombinerande tecken kodas i ISO/IEC 6937. Men man kan representera vissa fristående diakriter, i de flesta fall genom att följebyten är koden för ett blanktecken. Denna standard stöds av Unicode, alltså kan textfiler i ISO/IEC 6937 omvandlas till Unicode och tillbaka till samma ISO/IEC 6937-fil. Men man avråds från att använda denna metod i Unicode. Istället ska man använda de färdiga teckenkombinationer som stöds. Till exempel representeras i ISO/IEC 6937 grav accent med 0xC1, och tilde med 0xC4. Då tolkas följden 0xC1 (´), 0x61 (a), 0xC4 (~), 0x4E (n) som áñ. (sv) |
dbo:wikiPageExternalLink | https://www.itscj-ipsj.jp/ir/156.pdf https://www.itu.int/rec/T-REC-T.51 https://www.itu.int/rec/dologin_pub.asp%3Flang=e&id=T-REC-T.51-198811-S!!PDF-E&type=items http://std.dkuug.dk/JTC1/sc2/wg3/docs/n454.pdf https://www.iso.org/standard/13465.html https://www.iso.org/standard/13466.html https://www.iso.org/standard/13467.html https://www.iso.org/standard/13468.html https://www.iso.org/standard/31393.html |
dbo:wikiPageID | 2756880 (xsd:integer) |
dbo:wikiPageLength | 34908 (xsd:nonNegativeInteger) |
dbo:wikiPageRevisionID | 1093102187 (xsd:integer) |
dbo:wikiPageWikiLink | dbr:Caron dbr:5_(number) dbr:6_(number) dbr:8_(number) dbr:Pound_sign dbr:Q dbr:Question_mark dbr:Romanian_language dbr:Bracket dbr:Hugh_McGregor_Ross dbr:Per_mille dbr:Percent_sign dbr:Ring_(diacritic) dbr:Character_encoding dbr:Umlaut_(diacritic) dbr:Underscore dbr:V dbr:Vertical_bar dbr:Viewdata dbr:Α dbr:Μ dbr:― dbr:‘ dbr:’ dbr:“ dbr:” dbr:™ dbr:♪ dbr:Semigraphics dbr:0_(number) dbc:ITU-T_recommendations dbr:Colon_(punctuation) dbr:Comma_(punctuation) dbr:S dbr:Escape_sequence dbr:Ohm dbr:Circumflex dbr:Equal_sign dbr:Full_stop dbr:Grave_accent dbr:Greek_alphabet dbr:N dbr:Angle_bracket dbr:Apostrophe dbr:Slash_(punctuation) dbr:Combining_character dbr:Z dbr:¤ dbr:¦ dbr:© dbr:ª dbr:« dbr:¬ dbr:® dbr:° dbr:± dbr:² dbr:³ dbr:¶ dbr:· dbr:¹ dbr:º dbr:» dbr:¿ dbr:Æ dbr:Ð dbr:× dbr:Ø dbr:Þ dbr:ß dbr:÷ dbr:Ħ dbr:ĸ dbr:Ŀ dbr:Ł dbr:Ŋ dbr:Œ dbr:Ŧ dbr:Whitespace_character dbr:1_(number) dbr:B dbr:Backslash dbc:Character_encoding dbr:CCITT dbr:Cedilla dbr:Cent_(currency) dbr:Tilde dbr:U dbr:US-ASCII dbr:W dbr:4_(number) dbr:7_(number) dbr:@ dbr:A dbr:ASCII dbr:Acute_accent dbr:Ampersand dbr:Cyrillic_script dbr:D dbr:D_with_stroke dbr:E dbr:Eth dbr:European_Currency_Unit dbr:Exclamation_mark dbr:Fraction_(mathematics) dbr:Breve dbr:Non-breaking_space dbr:Number_sign dbr:P dbr:One_half dbr:9_(number) dbr:H dbr:Hexadecimal dbr:Internet_Assigned_Numbers_Authority dbr:J dbr:Underline dbr:Asterisk dbr:ANSEL dbc:Character_sets dbc:Computer-related_introductions_in_1983 dbr:K dbr:L dbr:Latin_alphabet dbr:T dbr:Teletex dbr:ISO/IEC_646:1991 dbr:ISO_646-IRV dbr:ITU_T.50 dbr:Diacritic dbr:Dollar_sign dbr:Dot_(diacritic) dbr:Double_acute_accent dbr:2_(number) dbr:3_(number) dbr:Plus_and_minus_signs dbr:Square_brackets dbr:I dbr:ISO-IR dbr:ISO/IEC_2022 dbr:ISO/IEC_646 dbr:ITU_T.61 dbr:O dbr:Ogonek dbr:Quotation_mark dbr:R dbr:Section_sign dbr:Semicolon dbr:X dbr:Y dbr:Yen dbr:Macron_(diacritic) dbr:World_System_Teletext dbc:ITU-T_T_Series_Recommendations dbr:ISO/IEC_10367 dbr:ISO/IEC_10646 dbr:ISO_5426 dbr:ITU-T dbr:Soft_hyphen dbr:Videotex dbr:ʼN dbr:΅ dbr:S-comma dbr:International_currency_sign dbr:Đ dbr:IJ dbr:ANSI_escape_sequences dbr:Latin-1 dbr:Latin-2 dbr:Latin-5 dbr:Underlined dbr:Space_character dbr:Loek_Zeckendorf |
dbp:committee | Study Group VIII (en) |
dbp:domain | dbr:Character_encoding |
dbp:license | Freely available (en) |
dbp:longName | Latin based coded character sets for telematic services (en) |
dbp:organization | dbr:ITU-T |
dbp:relatedStandards | dbr:ISO/IEC_2022 dbr:ITU_T.61 dbr:World_System_Teletext dbr:ISO/IEC_10367 dbr:ISO_5426 |
dbp:status | In force (en) |
dbp:title | T.51 (en) |
dbp:version | (en) |
dbp:versionDate | September 1992 (en) |
dbp:website | https://www.itu.int/rec/T-REC-T.51 |
dbp:wikiPageUsesTemplate | dbt:Citation dbt:Efn dbt:ISO_standards dbt:Infobox_technology_standard dbt:Legend dbt:Main dbt:Notelist dbt:Reflist dbt:Refn dbt:Short_description dbt:Pipe dbt:Chset-cell1 dbt:Character_encoding dbt:Chset-ctrl1 dbt:Chset-left1 |
dbp:yearStarted | 1984 (xsd:integer) |
dcterms:subject | dbc:ITU-T_recommendations dbc:Character_encoding dbc:Character_sets dbc:Computer-related_introductions_in_1983 dbc:ITU-T_T_Series_Recommendations |
rdfs:comment | ISO/IEC 6937:2001, 즉 Information technology — Coded graphic character set for text communication — Latin alphabet은 ASCII의 멀티바이트 확장 또는 ISO/IEC 646-IRV이다. T.51이라는 이름으로 컴퓨터 통신 서비스를 위해 ITU-T(당시 CCITT)를 통해 개발되었으며 1983년 처음으로 ISO 표준이 되었다. IANA는 ISO_6937-2-25과 ISO_6937-2-add라는 이 표준의 두 개의 (더 오래된) 버전을 등록하였다. 그러나 현실적으로 이 문자 인코딩은 인터넷에서 사용되지 않는다. ISO/IEC 6937 문자 집합의 오른손잡이 사이드를 지정하기 위한 ISO/IEC 2022 이스케이프 시퀀스는 ESC - R (16진 1B 2D 52)이다. (ko) ISO/IEC 6937 je standard pro kódování znaků latinky používaný pro přenos českých znaků v digitálním pozemním vysílání (DVB). ISO/IEC 6937 je zkonstruováno jako vícebajtové rozšíření ASCII (přesněji řečeno ISO/IEC 646); některé kódy byly použity jako úvodní bajty pro znaky s diakritikou (akcenty). Hodnota úvodního bajtu většinou indikuje, který akcent bude použit a je následován kódem ASCII pro znak bez akcentu. Jsou povoleny pouze určité kombinace akcentu a základního znaku – takové, které mají vyjádření i v jiných znakových sadách. Standard definuje kódování pro 333 možných znaků. (cs) ISO 6937 ist eine Zeichenkodierung mit variabler Länge sowie eine ISO-Norm, die erstmals 1983 veröffentlicht wurde. Sie deckt die meisten europäischen Sprachen mit lateinischer Schrift ab. Die Norm wurde zuletzt 2009 aktualisiert. ISO 6937 wurde von Teletex verwendet. Um das €-Zeichen (an Position A4hex) erweitert, ist ISO 6937 eine der möglichen Text-Kodierungen bei DVB. Die folgende Tabelle stellt das Repertoire von ISO 6937 dar. Blaue Felder stellen diakritische Zeichen dar, grüne Felder nicht belegte Codepunkte. Die ersten 128 Zeichen sind mit ASCII identisch. Erlaubte Zeichenkombinationen: (de) ISO/CEI 6937, intitulée Technologies de l’information — Jeu de caractères graphiques codés pour la transmission de texte — Alphabet latin, est une norme internationale de l’ISO publiée pour la première fois en 1983 et définissant un codage de caractères étendant le codage ISO/CEI 646 (dont la variante la plus connue est ASCII). Elle a été conçue en collaboration avec l’UIT-T (le Secteur de la normalisation des télécommunications de l’Union internationale des télécommunications — Comité Consultatif International Téléphonique et Télégraphique à l’époque). Sa dernière actualisation date de 2009. (fr) T.51 / ISO/IEC 6937:2001, Information technology — Coded graphic character set for text communication — Latin alphabet, is a multibyte extension of ASCII, or rather of ISO/IEC 646-IRV. It was developed in common with ITU-T (then CCITT) for telematic services under the name of T.51, and first became an ISO standard in 1983. Certain byte codes are used as lead bytes for letters with diacritics (accents). The value of the lead byte often indicates which diacritic that the letter has, and the follow byte then has the ASCII-value for the letter that the diacritic is on. (en) ISO/IEC 6937:2001, Information technology — Coded graphic character set for text communication — Latin alphabet(情報技術 — 文字コミュニケーションのためのコード化された図形文字集合 — ラテンアルファベット)は、ISO基本ラテンアルファベットにないラテン文字を表現するためにASCII(ISO/IEC 646)をマルチバイト拡張したものである。ITU-T(当時はCCITT)によってテレマティクスのために開発され、T.51として勧告された。1983年にISO標準となった。 特定のバイトコードが、ダイアクリティカルマークつきの文字のためのバイトとして使われる。第1バイトの値がダイアクリティカルマークの種別を表し、ASCIIの値を持つ第2バイトが、ダイアクリティカルマークがつく文字を表す。第1バイトと第2バイトは特定の組み合わせのみが許容され、第1バイトの解釈は第2バイトによって例外がある。ISO/IEC 6937ではダイアクリティカルマークつきの組み合わせ後の文字は1つもコード化されていない。ダイアクリティカルマークその物を表したい場合は、第2バイトにASCIIのスペースを入れる。 (ja) ISO/IEC 6937 är en teckenkodning för datorer, en multibyte-utvidgning av ASCII, eller rättare av ISO/IEC 646-IRV. Tanken med ISO/IEC 6937 är att stödja diakritiska tecken i europeiska språk som skrivs med latinska tecken. Det finns i dessa språk totalt sett betydligt fler kombinationer än de 128 som är vad som finns utrymme för i en utökad ASCII förutom grundbokstäver mm. I princip stöder ISO/IEC 6937 alla europeiska språk som skrivs med latinska tecken. Standarden är inte mycket använd numera. (sv) |
rdfs:label | ISO/IEC 6937 (cs) ISO 6937 (de) ISO/CEI 6937 (fr) ISO/IEC 6937 (ko) ISO/IEC 6937 (ja) T.51/ISO/IEC 6937 (en) ISO/IEC 6937 (sv) |
owl:sameAs | wikidata:T.51/ISO/IEC 6937 dbpedia-cs:T.51/ISO/IEC 6937 dbpedia-de:T.51/ISO/IEC 6937 dbpedia-fr:T.51/ISO/IEC 6937 dbpedia-ja:T.51/ISO/IEC 6937 dbpedia-ko:T.51/ISO/IEC 6937 dbpedia-sv:T.51/ISO/IEC 6937 https://global.dbpedia.org/id/55W45 |
prov:wasDerivedFrom | wikipedia-en:T.51/ISO/IEC_6937?oldid=1093102187&ns=0 |
foaf:homepage | https://www.itu.int/rec/T-REC-T.51 |
foaf:isPrimaryTopicOf | wikipedia-en:T.51/ISO/IEC_6937 |
is dbo:wikiPageRedirects of | dbr:T.51_(ITU-T_recommendation) dbr:Code_page_20269 dbr:ISO/IEC_6937 dbr:ITU-T_T.51 dbr:ISO/CEI_6937 dbr:ISO/CEI_6937:2001 dbr:ISO/IEC_6937:2001 dbr:ITU_T.51 dbr:ISO-IR-156 dbr:ISO_6937 dbr:ISO_6937-2-25 dbr:ISO_6937-2-add dbr:CsISOTextComm dbr:Iso-ir-142 dbr:Iso-ir-156 |
is dbo:wikiPageWikiLink of | dbr:Videotex_character_set dbr:T.51_(ITU-T_recommendation) dbr:T51 dbr:Code_page_20269 dbr:ISO/IEC_6937 dbr:ITU-T_T.51 dbr:ISO/CEI_6937 dbr:ISO/CEI_6937:2001 dbr:ISO/IEC_6937:2001 dbr:World_System_Teletext dbr:ITU_T.51 dbr:ISO-IR-156 dbr:ISO_6937 dbr:ISO_6937-2-25 dbr:ISO_6937-2-add dbr:CsISOTextComm dbr:Iso-ir-142 dbr:Iso-ir-156 |
is dbp:otherrelated of | dbr:World_System_Teletext |
is foaf:primaryTopic of | wikipedia-en:T.51/ISO/IEC_6937 |