Standard Compression Scheme for Unicode (original) (raw)

About DBpedia

Das Standard Compression Scheme for Unicode (SCSU, englisch für Standard-Kompressions-Schema für Unicode) ist eine Zeichenkodierung für Texte aus Unicode-Zeichen, das im Gegensatz zu den meisten anderen Kodierungen darauf ausgerichtet ist, möglichst wenig Speicherplatz zu benötigten.

Property Value
dbo:abstract Das Standard Compression Scheme for Unicode (SCSU, englisch für Standard-Kompressions-Schema für Unicode) ist eine Zeichenkodierung für Texte aus Unicode-Zeichen, das im Gegensatz zu den meisten anderen Kodierungen darauf ausgerichtet ist, möglichst wenig Speicherplatz zu benötigten. (de) Standard Compression Scheme for Unicode (SCSU) fait partie des normes concernant le codage des caractères Unicode et leurs compressions. SCSU permet différentes stratégies de compression. (fr) The Standard Compression Scheme for Unicode (SCSU) is a Unicode Technical Standard for reducing the number of bytes needed to represent Unicode text, especially if that text uses mostly characters from one or a small number of per-language character blocks. It does so by dynamically mapping values in the range 128–255 to offsets within particular blocks of 128 characters. The initial conditions of the encoder mean that existing strings in ASCII and ISO-8859-1 that do not contain C0 control codes other than NULL TAB CR and LF can be treated as SCSU strings. Since most alphabets do reside in blocks of contiguous Unicode codepoints, texts that use small alphabets and either ASCII punctuation or punctuation that fits within the window for the main alphabet can be encoded at one byte per character (plus setup overhead, which for common languages is often only 1 byte), most other punctuation can be encoded at 2 bytes per symbol through non-locking shifts. SCSU can also switch to UTF-16 internally to handle non-alphabetic languages. (en) SCSU(英語: Standard Compression Scheme for Unicode)はUnicodeのテキストを表すために必要なバイト数を削減するためのUnicode技術標準である。特にテキストが1つまたは少数の言語ごとの文字ブロックの文字をほとんど使用している場合に用いられる。128以上255以下の範囲の値を128文字の特定のブロック内のオフセットに動的にマッピングすることにより行なわれる。符号化器の初期状態は、NULLやTAB、CR、LF以外のC0制御文字を含まないASCII、およびISO-8859-1の既存の文字列をSCSU文字列として処理する。ほとんどのアルファベットは隣接するUnicode符号点のブロックに存在するため、アルファベットの小文字とASCII句読点、またはアルファベットの大文字の枠内に収まる句読点が用いられたテキストは1文字につき1バイトで符号化できる。他のほとんどの句読点は、非ロックシフトを介して1文字あたり2バイトで符号化できる。SCSUは、アルファベット以外の言語を処理するために内部でUTF-16に切り替えることもできる。 携帯電話やその他のモバイルデバイス用のオペレーティングシステムであるSymbian OSは、SCSUを使用して文字列をシリアル化する。 CSUの最初の提案を公開した組織はロイターであり、内部でSCSUを使用していると考えられている。 SQL Server 2008 R2はSCSUを使用して、nchar(n)列とnvarchar(n)列に格納されているUnicodeの値を圧縮し、データの言語に応じて15%から50%の領域を節約している。 (ja) Standard Compression Scheme for Unicode (SCSU) é uma norma técnica do Unicode para reduzir a quantidade de bytes necessárias para representar texto nessa codificação de caracteres, especialmente se o texto usa em sua maioria caracteres de um ou poucos blocos de línguas suportadas. O processo é feito através do mapeamento dinâmico de valores entre 128 e 255 para as distâncias do início de blocos particulares de códigos Unicode de 128 bytes. Já que a maioria dos alfabetos reside em um bloco contíguo de códigos Unicode, textos que usam pequenos alfabetos e até mesmo pontuação pode ser codificado em um byte por caractere (mais o(s) caractere(s) inicial(ais) de configuração do padrão, o que geralmente é somente um). (pt) 統一碼標準壓縮方案(英語:Standard Compression Scheme for Unicode,縮寫:SCSU),是一種統一碼技術標準。用於減少統一碼文本所需使用的字節數,尤其是該文本中所使用的字符,主要集中在一種或幾種語言區段。它的作法主要是將 128– 255 范围内的值,动态映射到 以 128 個字符為單位的特定區段的偏移量来实现。编码器的初始条件則是ASCII和ISO-8859-1中不包含除 NULL TAB CR 和 LF 之外的 C0 控制代码的现有字符串可以被视为 SCSU 字符串。 由于大多数字母在統一碼所使用的碼位,通常會是區塊中的連續位置,所以如果文本使用小寫字母、 ASCII 標點符號或窗口內的其它標點符號,可以按每个字符一个字节进行编码(需另外加上前置成本,对常见语言通常只有 1 个字节),大多数其他标点符号可以通过非锁定移位的方式,以每個字符使用 2 個位元組进行编码。統一碼標準壓縮方案还可以在內部切換到UTF-16模式,以处理非字母语言。 SCSU 是IANA注册的字符集。 (zh)
dbo:wikiPageID 653715 (xsd:integer)
dbo:wikiPageLength 8019 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID 1107530967 (xsd:integer)
dbo:wikiPageWikiLink dbr:Reuters dbr:UTF-16 dbr:UTF-8 dbr:Unicode dbr:GNU_Unifont dbr:Cross-site_scripting dbr:Byte dbr:UCS-2 dbr:W3C dbr:WHATWG dbr:ASCII dbr:HTML dbr:International_Components_for_Unicode dbc:Unicode_Transformation_Formats dbr:Binary_Ordered_Compression_for_Unicode dbr:Symbian_OS dbr:Microsoft_SQL_Server dbr:ISO-8859-1
dbp:wikiPageUsesTemplate dbt:Expand_German dbt:Short_description dbt:Unicode_navigation dbt:Character_encoding
dcterms:subject dbc:Unicode_Transformation_Formats
gold:hypernym dbr:Standard
rdf:type dbo:Work yago:WikicatUnicodeTransformationFormats yago:Abstraction100002137 yago:Communication100033020 yago:Format106636806 yago:Information106634376 yago:Message106598915
rdfs:comment Das Standard Compression Scheme for Unicode (SCSU, englisch für Standard-Kompressions-Schema für Unicode) ist eine Zeichenkodierung für Texte aus Unicode-Zeichen, das im Gegensatz zu den meisten anderen Kodierungen darauf ausgerichtet ist, möglichst wenig Speicherplatz zu benötigten. (de) Standard Compression Scheme for Unicode (SCSU) fait partie des normes concernant le codage des caractères Unicode et leurs compressions. SCSU permet différentes stratégies de compression. (fr) Standard Compression Scheme for Unicode (SCSU) é uma norma técnica do Unicode para reduzir a quantidade de bytes necessárias para representar texto nessa codificação de caracteres, especialmente se o texto usa em sua maioria caracteres de um ou poucos blocos de línguas suportadas. O processo é feito através do mapeamento dinâmico de valores entre 128 e 255 para as distâncias do início de blocos particulares de códigos Unicode de 128 bytes. Já que a maioria dos alfabetos reside em um bloco contíguo de códigos Unicode, textos que usam pequenos alfabetos e até mesmo pontuação pode ser codificado em um byte por caractere (mais o(s) caractere(s) inicial(ais) de configuração do padrão, o que geralmente é somente um). (pt) 統一碼標準壓縮方案(英語:Standard Compression Scheme for Unicode,縮寫:SCSU),是一種統一碼技術標準。用於減少統一碼文本所需使用的字節數,尤其是該文本中所使用的字符,主要集中在一種或幾種語言區段。它的作法主要是將 128– 255 范围内的值,动态映射到 以 128 個字符為單位的特定區段的偏移量来实现。编码器的初始条件則是ASCII和ISO-8859-1中不包含除 NULL TAB CR 和 LF 之外的 C0 控制代码的现有字符串可以被视为 SCSU 字符串。 由于大多数字母在統一碼所使用的碼位,通常會是區塊中的連續位置,所以如果文本使用小寫字母、 ASCII 標點符號或窗口內的其它標點符號,可以按每个字符一个字节进行编码(需另外加上前置成本,对常见语言通常只有 1 个字节),大多数其他标点符号可以通过非锁定移位的方式,以每個字符使用 2 個位元組进行编码。統一碼標準壓縮方案还可以在內部切換到UTF-16模式,以处理非字母语言。 SCSU 是IANA注册的字符集。 (zh) The Standard Compression Scheme for Unicode (SCSU) is a Unicode Technical Standard for reducing the number of bytes needed to represent Unicode text, especially if that text uses mostly characters from one or a small number of per-language character blocks. It does so by dynamically mapping values in the range 128–255 to offsets within particular blocks of 128 characters. The initial conditions of the encoder mean that existing strings in ASCII and ISO-8859-1 that do not contain C0 control codes other than NULL TAB CR and LF can be treated as SCSU strings. Since most alphabets do reside in blocks of contiguous Unicode codepoints, texts that use small alphabets and either ASCII punctuation or punctuation that fits within the window for the main alphabet can be encoded at one byte per charac (en) SCSU(英語: Standard Compression Scheme for Unicode)はUnicodeのテキストを表すために必要なバイト数を削減するためのUnicode技術標準である。特にテキストが1つまたは少数の言語ごとの文字ブロックの文字をほとんど使用している場合に用いられる。128以上255以下の範囲の値を128文字の特定のブロック内のオフセットに動的にマッピングすることにより行なわれる。符号化器の初期状態は、NULLやTAB、CR、LF以外のC0制御文字を含まないASCII、およびISO-8859-1の既存の文字列をSCSU文字列として処理する。ほとんどのアルファベットは隣接するUnicode符号点のブロックに存在するため、アルファベットの小文字とASCII句読点、またはアルファベットの大文字の枠内に収まる句読点が用いられたテキストは1文字につき1バイトで符号化できる。他のほとんどの句読点は、非ロックシフトを介して1文字あたり2バイトで符号化できる。SCSUは、アルファベット以外の言語を処理するために内部でUTF-16に切り替えることもできる。 携帯電話やその他のモバイルデバイス用のオペレーティングシステムであるSymbian OSは、SCSUを使用して文字列をシリアル化する。 (ja)
rdfs:label Standard Compression Scheme for Unicode (de) Standard Compression Scheme for Unicode (fr) SCSU (ja) Standard Compression Scheme for Unicode (en) Standard Compression Scheme for Unicode (pt) 統一碼標準壓縮方案 (zh)
owl:sameAs freebase:Standard Compression Scheme for Unicode yago-res:Standard Compression Scheme for Unicode wikidata:Standard Compression Scheme for Unicode dbpedia-de:Standard Compression Scheme for Unicode dbpedia-fr:Standard Compression Scheme for Unicode dbpedia-ja:Standard Compression Scheme for Unicode dbpedia-pt:Standard Compression Scheme for Unicode dbpedia-zh:Standard Compression Scheme for Unicode https://global.dbpedia.org/id/4vtBF
prov:wasDerivedFrom wikipedia-en:Standard_Compression_Scheme_for_Unicode?oldid=1107530967&ns=0
foaf:isPrimaryTopicOf wikipedia-en:Standard_Compression_Scheme_for_Unicode
is dbo:wikiPageDisambiguates of dbr:SCSU
is dbo:wikiPageRedirects of dbr:Standard_compression_scheme_for_Unicode dbr:CsSCSU dbr:SCSU_(Unicode)
is dbo:wikiPageWikiLink of dbr:List_of_file_signatures dbr:Character_encoding dbr:Unicode dbr:Lotus_Multi-Byte_Character_Set dbr:Standard_compression_scheme_for_Unicode dbr:Comparison_of_Unicode_encodings dbr:C0_and_C1_control_codes dbr:CsSCSU dbr:Character_encodings_in_HTML dbr:Binary_Ordered_Compression_for_Unicode dbr:Byte_order_mark dbr:SCSU dbr:Universal_Coded_Character_Set dbr:SCSU_(Unicode)
is foaf:primaryTopic of wikipedia-en:Standard_Compression_Scheme_for_Unicode