Universal Coded Character Set (original) (raw)
ISO/IEC 10646 je mezinárodní norma definující univerzální kódovanou znakovou sadu (anglicky Universal Coded Character Set, UCS), která by měla zahrnovat znaky nutné k reprezentaci prakticky všech známých jazyků. UCS obsahuje znaky z různých standardů znakových sad, včetně množství grafických, typografických, matematických a vědeckých symbolů. Norma ISO/IEC 10646 je vyvíjena v součinnosti s Unicode – přestože oba standardy nemají zcela totožné zaměření, definují stejnou univerzální znakovou sadu se stejnými kódy znaků.
Property | Value |
---|---|
dbo:abstract | ISO/IEC 10646 je mezinárodní norma definující univerzální kódovanou znakovou sadu (anglicky Universal Coded Character Set, UCS), která by měla zahrnovat znaky nutné k reprezentaci prakticky všech známých jazyků. UCS obsahuje znaky z různých standardů znakových sad, včetně množství grafických, typografických, matematických a vědeckých symbolů. Norma ISO/IEC 10646 je vyvíjena v součinnosti s Unicode – přestože oba standardy nemají zcela totožné zaměření, definují stejnou univerzální znakovou sadu se stejnými kódy znaků. (cs) Der Universal Coded Character Set (UCS) ist ein Zeichensatz, der in der internationalen Norm ISO/IEC 10646 definiert ist. Seit der Revision 2011 (ISO/IEC 10646:2011) sind die definierten Zeichenkodierungen einschließlich ihrer Benennungen identisch mit denen des Unicode-Standards: * UTF-8 * UTF-16 * UTF-32 Ältere Ausgaben der Norm definierten andere Kodierungen, die jetzt deprecated sind: * UCS-2, Untermenge von UTF-16 * UCS-4, als Codierung identisch mit UTF-32 Der Unterschied zwischen UCS-2 und UTF-16 ist folgender: * UCS-2 ist eine Fixed-Byte-Kodierung: jedes Zeichen ist genau 2 Byte lang. UCS-2 kann damit die 65.536 Zeichen der Basic Multilingual Plane (BMP) darstellen. * UTF-16 ist eine Flexible-Byte-Kodierung: ein einzelnes Zeichen ist 2 Byte oder 4 Byte lang – 2 Byte bei Zeichen in der oben genannten BMP, 4 Byte bei Zeichen außerhalb der BMP. Dadurch hat jedes UCS2-Zeichen den gleichen Codepoint wie das entsprechende UTF-16-Zeichen, aber nicht jedes UTF-16-Zeichen kann in UCS-2 dargestellt werden (wenn es nämlich in UTF-16 vier Byte umfasst). Der UCS wird entwickelt von ISO/IEC/JTC1/SC2/WG2. Die Gruppe arbeitet sehr eng mit dem Unicode-Konsortium zusammen, das die Standards ständig in neuen Versionen synchronisiert. Aufgrund dessen sind alle Kodierungen aus Gründen der Interoperabilität beschränkt auf die bei Unicode erlaubten 1.112.064 Zeichen (= 220+216, abzüglich 211 = 2048 Surrogate von UTF-16), nämlich von U+00000 bis U+0D7FF sowie von U+0E000 bis U+10FFFF. Ursprünglich wurden diese beiden Formate definiert: * UCS-2: obsolete Kodierung in 2 Byte; dabei lässt sich nur die Basic Multilingual Plane kodieren. Dies ermöglicht die Codierung der meisten lebenden Sprachen und der gebräuchlicheren Sonderzeichen. UCS-2 ist nicht mehr Bestandteil des Standards. UCS-2 war auch der Zeichensatz von Microsoft Windows NT, wohingegen seit Windows 2000 UTF-16 eingesetzt wird. * UCS-4: Kodierung in 4 Byte (entspricht UTF-32). In der Version ISO/IEC 10646-3:2003 wurden die gleichen Formate UTF-8, UTF-16 und UTF-32 beschrieben wie in Unicode 4.0. (de) El estándar internacional ISO/IEC 10646 define el Conjunto de Caracteres Universal (en inglés Universal Character Set o UCS) como un sistema de codificación de caracteres en varios octetos. La última versión contiene cerca de 136000 caracteres abstractos, cada uno de ellos identificado de forma precisa por un número entero denominado punto de código. El estándar ISO/IEC 10646 se mantiene junto con el estándar Unicode ("Unicode"), los cuales, son idénticos en el código. Se creó en el año 1993, por ello, a veces también se lo llama ISO/IEC 10646-1:1993. En este conjunto se encuentran los diversos caracteres (letras, números, símbolos, ideogramas, logogramas, etc.) procedentes de muchos lenguajes, alfabetos, etc..., así como, de las diversas tradiciones de puntuación existentes en todos los idiomas del mundo, representadas en UCS con los únicos puntos de código. La inclusión de nuevos caracteres es constante, haciendo que el conjunto esté permanentemente en estado de actualización. Desde el año 1991, el Unicode Consortium ha venido trabajando con el organismo ISO con el objeto de desarrollar el estándar Unicode y el ISO/IEC 10646 conjuntamente. El repertorio, el nombre de los caracteres y los puntos de código de la versión 2.0 de Unicode hacen un ajuste perfecto con las siete primeras publicaciones de la ISO/IEC 10646-1:1993. Tras la publicación de Unicode 3.0 en febrero de 2000, se fueron introduciendo nuevos caracteres en el UCS vía el ISO/IEC 10646-1:2000. El conjunto UCS tiene cerca de 1,1 millones de puntos de código, pero solo los primeros 65.536 (la , o BMP) han entrado en uso antes del año 2000. Esta situación comenzó a cambiar cuando República Popular China (RPC) solicitó en el año 2000 que los sistemas computarizados vendidos en su territorio tuvieran que soportar el GB18030, esta situación hizo que los sistemas que se tenían que vender en el RPC tuvieran que ir más allá del BMP. El conjunto tal y como está definido hoy en día ha dejado de forma deliberada algunos huecos con el objeto de poder incorporar en un futuro otros caracteres que no entren en conflicto con los actuales. (es) La norme ISO/CEI 10646, intitulée Technologies de l'information — Jeu universel de caractères codés (JUC), tente de définir un système de codage universel pour tous les systèmes d’écriture. Cette norme est le fondement du standard Unicode. (fr) The Universal Coded Character Set (UCS, Unicode) is a standard set of characters defined by the international standard ISO/IEC 10646, Information technology — Universal Coded Character Set (UCS) (plus amendments to that standard), which is the basis of many character encodings, improving as characters from previously unrepresented typing systems are added. The UCS has over 1.1 million possible code points available for use/allocation, but only the first 65,536, which is the Basic Multilingual Plane (BMP), had entered into common use before 2000. This situation began changing when the People's Republic of China (PRC) ruled in 2006 that all software sold in its jurisdiction would have to support GB 18030. This required software intended for sale in the PRC to move beyond the BMP. The system deliberately leaves many code points not assigned to characters, even in the BMP. It does this to allow for future expansion or to minimise conflicts with other encoding forms. The original edition of the UCS defined UTF-16, an extension of UCS-2, to represent code points outside the BMP. A range of code points in the S (Special) Zone of the BMP remains unassigned to characters. UCS-2 disallows use of code values for these code points, but UTF-16 allows their use in pairs. Unicode also adopted UTF-16, but in Unicode terminology, the high-half zone elements become "high surrogates" and the low-half zone elements become "low surrogates". Another encoding, UTF-32 (previously named UCS-4), uses four bytes (total 32 bits) to encode a single character of the codespace. UTF-32 thereby permits a binary representation of every code point in the APIs, and software applications. (en) 국제 문자 세트(UCS, Universal Character Set, 범용 문자 집합)는 ISO 10646으로 정의된 문자 인코딩의 국제 표준이다. 1991년부터, 유니코드 컨소시엄에서는 유니코드 표준과 ISO/IEC 10646을 발전시키기 위해 ISO와 공동 작업을 해 왔다. 분류와, 문자명과 유니코드 표준 2.0 버전의 코드들은 ISO/IEC 10646-1:1993과 첫 수정판과 동일하다. 2000년 3월 유니코드 3.0이 발표된 이후, 새롭게 추가된 문자들이 ISO/IEC 10646-1:2000을 통해 UCS에 포함되었다. UCS는 110만 개 이상의 코드가 있지만, 일반적으로 첫 65536개 (BMP, Basic Multilingual Plane, 기본 다국어 평면) 만이 사용된다. 나머지는 고대 이집트 상형문자나 쓰임이 적은 한자같은 문자를 표현하기 위해 남겨져 있다. 많은 코드영역, 심지어 BMP 영역에서도 서로 다른 인코딩 형태와 미래의 확장성을 고려하여, 일부러 문자를 할당하지 않았다. (ko) Universal Character Set (UCS) è una codifica di caratteri definita nell'ISO/IEC 10646. (it) International Standaard ISO/IEC 10646 is een standaard karakterset voor Universal Coded Character Set (UCS, Unicode). (nl) ISO/IEC 10646 (UCS; 英: Universal Coded Character Set) は、符号化文字集合や文字符号化方式などを定めた、文字コードの国際標準のひとつで、業界規格のUnicodeと概ね互換である。日本の対応規格はJIS X 0221(国際符号化文字集合)。 文字空間(0 - 10FFFF16)、収録されている文字、それらの符号位置、英語でつけられた文字の名前、文字符号化方式(UTF-8, UTF-16, UTF-32)はUnicode規格と全く同じである。ただし、文字空間は古い規格では21ビットのUnicodeをベースにして文字空間を31ビットに拡張したものとされ、Unicodeの最大値であるU+10FFFFより大きなコードも使用できるという点でUnicodeと異なっていた。しかし、2006年の改訂によりUnicodeで使用できない領域には文字が「永久に定義されない」こととされ、2011年の改訂では明確に0 - 10FFFFと定義され同一となった。 面 (plane)、区 (row)、点 (cell) として分けられ、Unicodeと同じ第0面の基本多言語面 (BMP; 英: Basic Multilingual Plane) と追加面の第1 - 16面までの範囲で文字が定義されている。古い規格では群 (group) という分類もあったが2011年の改訂で廃止された。 (ja) Norma ISO/IEC 10646 opisuje uniwersalny zestaw znaków (UCS – Universal Character Set) służący do opisu znaków (liter, cyfr, symboli, ideogramów itd.) z wielu języków, pism i tradycji na świecie. Zestaw zawiera około 100 000 abstrakcyjnych znaków, z których każdy posiada unikalną nazwę i . Teoretycznie standard pozwala na zapisanie ponad 2 miliardów znaków (w 31 bitach, zobacz UCS-4), jednak w powszechnym użyciu jest jedynie pierwsze 65 536 znaków (UCS-2) ze zbioru Podstawowej Płaszczyzny Wielojęzycznej (BMP - Basic Multilingual Plane). UCS jest ciągle rozwijany, aktualnie trwają prace nad poprawką numer 3 i 4 do standardu ISO/IEC 10646:2003 Amendment 1 and Amendment 2. (pl) A norma internacional ISO/IEC 10646 define o Conjunto Universal de Caracteres (do inglês Universal Character Set, ou somente UCS) como uma codificação de caracteres. Ela contém em torno de 100 000 códigos identificados por um nome não ambíguo, que representam símbolos como letras, números e ideogramas. Desde 1991, a Unicode Consortium vêm trabalhando com a ISO para desenvolver o padrão Unicode e a ISO/IEC 10646 em conjunto. O repertório, a nomeclatura de caracteres e os códigos da versão 2.0 do Unicode são idênticos aos da ISO/IEC 10646-1:1993. Após a publicação do Unicode 3.0 em fevereiro de 2000, novos e atualizados caracteres correspondentes foram inseridos no UCS através da ISO/IEC 10646-1:2000. (pt) ISO/IEC 10646, eller Universal Coded Character Set eller Universal Multiple-Octet Coded Character Set är en internationell standard för teckenkodning.Arbetet med ISO/IEC 10646 började synkroniseras 1991 med Unicode-standarden som gjorts av ett antal datorleverantörer sammanslutna i Unicode-konsortiet. Den första publicerade versionen var färdig 1993 och ett antal nya utgåvor av standarden har publicerats sedan dess. Arbetet med både Unicode och ISO/IEC 10646 är synkroniserat och ISO-standarden har samma teckenuppsättning, teckenkoder och teckennamn som Unicode. ISO/IEC 10646 definierar en grundläggande teckenuppsättning, Universal Coded Character Set, UCS, och ett antal kodningar av denna. Kodningen UCS-4 omfattar hela UCS och där varje tecken representeras av ett 32-bitars tal (i praktiken samma som Unicodes UTF-32). UCS-2 omfattar endast de första 65536 tecknen i UCS och som representeras av ett 16-bitars tal. UCS-2 är föråldrad, då tecken allokerats som har fått kodpunkter större än 65535. UTF-16 är en utvidgning av UCS-2, och täcker i praktiken in hela UCS. UTF-8 är en multibyte-utvidgning av ASCII. Förkortningen av Universal Coded Character Set är ”UCS” med ett C, inte ”UCCS”, trots att ordet ”Coded” nu ingår i det officiella namnet. (sv) UCS (англ. Universal Coded Character Set) представляет собой стандартный набор символов, определённый международным стандартом ISO/IEC 10646, который является основой многих символьных кодировок. UCS содержит чуть более 128 000 абстрактных символов, как и в Unicode 9.0, каждый из которых определяется однозначно сочетанием имени и целого числа (так называемый «кодовый пункт»). Символы (буквы, цифры, идеограммы, логограммы и т. д.) из многих языков, манускриптов, традиций мира представлены в UCS с уникальными кодовыми пунктами. Символы из ранее не представленных письменностей добавляются в UCS, постоянно совершенствуя её. С 1991 года Unicode Inc. и ISO в сотрудничестве разработали Стандарт Unicode и ISO / IEC 10646. Уникальные имена символов и их кодовые пункты в Unicode 2.0 в точности совпадают с ISO/IEC 10646-1: 1993. После того, как Unicode 3.0 был опубликован в феврале 2000 года, соответствующие новые и обновленные символы вошли UCS по стандарту ISO/IEC 10646-1: 2000. В 2003 году 2 части ISO / IEC 10646 были объединены, и теперь добавление символов проходит с приблизительной синхронностью со стандартом Unicode. UCS содержит более 1,1 миллиона возможных кодовых пунктов, доступных для использования/распределения, но только первые 65 536 (Базовая многоязыковая плоскость (Basic Multilingual Plane, BMP)) вошли в общее употребление до 2000 года. Ситуация начала меняться, когда Китайская Народная Республика (КНР) вынесла решение в 2006 году о том, что все программное обеспечение, продаваемое под их юрисдикцией, должно поддерживать стандарт GB 18030. Это решение привело к тому, что программное обеспечение, предназначенное для продажи в КНР, должно было выходить за пределы BMP. Система сознательно оставляет много кодовых пунктов не заполненными, даже в BMP, для будущего расширения набора и для того, чтобы свести к минимуму конфликты с другими формами кодирования. (ru) 通用字符集(英語:Universal Character Set, UCS)是由ISO制定的ISO 10646(或称ISO/IEC 10646)标准所定义的标准字符集。 通用字符集又称Universal Multiple-Octet Coded Character Set,中国大陆译为通用多八位编码字符集,台湾译为廣用多八位元組編碼字元集。 (zh) Універсальний кодований набір символів (UCS) - це стандартний набір символів, визначений Міжнародним стандартом ISO / IEC 10646, який є основою багатьох кодувань символів . Остання версія містить понад 136 000 абстрактних символів, кожен з яких ідентифікується однозначним ім’ям і цілим числом, що називається . Цей стандарт ISO / IEC 10646 підтримується спільно зі стандартом Unicode ("Юнікод"), і вони ідентичні коду для коду. Символи (букви, цифри, символи, ідеограми, логограми тощо) з багатьох мов, манускриптів та традицій світу представлені в UCS з унікальними кодовими точками. Інклюзивність UCS постійно покращується, оскільки додаються символи раніше непредставлених систем письма. UCS має понад 1,1 мільйона можливих кодових точок, доступних для використання / розподілу, але лише перші 65 536 ( увійшли до загального користування до 2000 року. Ситуація почала змінюватися, коли Китайська Народна Республіка (КНР) прийняла рішення у 2006 р., що все програмне забезпечення, що продається під їхньою юрисдикцією, повинне підтримувати GB 18030. Для цього потрібно було перенести програмне забезпечення, призначене для продажу в КНР, за межі BMP. Система свідомо залишає багато кодових точок не заповненими навіть у BMP для майбутнього розширення набору і для того, щоб звести до мінімуму конфлікти з іншими формами кодування. (uk) |
dbo:wikiPageExternalLink | http://standards.iso.org/ittf/PubliclyAvailableStandards/index.html http://archive.adaic.com/pol-hist/history/9x-history/reports/charset-Oct89.txt http://www.columbia.edu/kermit/utf8.html http://std.dkuug.dk/JTC1/SC2/WG2/ http://scripts.sil.org/cms/scripts/page.php%3Fsite_id=nrsi&id= http://www.cl.cam.ac.uk/~mgk25/unicode.html |
dbo:wikiPageID | 23431060 (xsd:integer) |
dbo:wikiPageLength | 13495 (xsd:nonNegativeInteger) |
dbo:wikiPageRevisionID | 1119278112 (xsd:integer) |
dbo:wikiPageWikiLink | dbr:List_of_XML_and_HTML_character_entity_references dbr:Ken_Thompson_(computer_programmer) dbr:Basic_Multilingual_Plane dbr:Devanagari dbc:Unicode dbr:Hugh_McGregor_Ross dbr:People's_Republic_of_China dbr:Right-to-left dbr:Rob_Pike dbr:Character_(computing) dbr:Character_encoding dbr:UTF-1 dbr:UTF-16 dbr:UTF-7 dbr:UTF-8 dbr:Unicode dbr:Unicode_1.1 dbr:Unicode_10.0 dbr:Unicode_11.0 dbr:Unicode_12.0 dbr:Unicode_13.0 dbr:Unicode_14.0 dbr:Unicode_2.0 dbr:Unicode_2.1 dbr:Unicode_3.0 dbr:Unicode_3.1 dbr:Unicode_3.2 dbr:Unicode_4.0 dbr:Unicode_4.1 dbr:Unicode_5.0 dbr:Unicode_5.1 dbr:Unicode_5.2 dbr:Unicode_6.0 dbr:Unicode_6.1 dbr:Unicode_6.2 dbr:Unicode_6.3 dbr:Unicode_7.0 dbr:Unicode_8.0 dbr:Unicode_9.0 dbr:Unicode_Consortium dbr:Unicode_character_property dbr:Universal_Character_Set_characters dbr:International_standard dbr:Russian_ruble dbr:Text_normalization dbr:GB_18030 dbr:Georgian_lari dbr:Graphical_User_Interface dbr:Comparison_of_Unicode_encodings dbr:Specials_(Unicode_block) dbr:C0_and_C1_control_codes dbr:Euro_sign dbr:Hentaigana dbr:Hexadecimal dbr:International_Electrotechnical_Commission dbr:International_Organization_for_Standardization dbc:Character_sets dbr:Character_repertoire dbr:Collation dbr:Turkish_lira_sign dbr:Plan_9_from_Bell_Labs dbr:ISO/IEC_2022 dbr:ISO/IEC_646 dbr:ISO_15924 dbr:Indian_rupee_sign dbr:Working_group dbr:Xterm dbr:Standard_Compression_Scheme_for_Unicode dbr:UTF-32 dbr:ISO/IEC_14651 dbr:ISO/IEC_6429 dbr:ISO/IEC_8859 dbr:ISO/IEC_JTC_1/SC_2 dbr:List_of_typefaces dbr:BOCU dbr:Bidirectional_algorithm dbr:Unicode_plane |
dbp:alias | UCS, Unicode (en) |
dbp:encodings | dbr:UTF-16 dbr:UTF-8 dbr:GB_18030 Less common: UTF-32, BOCU, SCSU, UTF-7 (en) |
dbp:lang | International (en) |
dbp:name | Universal Coded Character Set (en) |
dbp:prev | ISO/IEC 8859, ISO/IEC 2022, various others. (en) |
dbp:standard | ISO/IEC 10646 (en) |
dbp:wikiPageUsesTemplate | dbt:Citation_needed dbt:Clarification_needed dbt:Clarify dbt:ISO_standards dbt:Refimprove dbt:Reflist dbt:Short_description dbt:Unicode_navigation dbt:Character_encoding dbt:Infobox_character_encoding dbt:List_of_International_Electrotechnical_Commission_standards dbt:Use_British_(Oxford)_English |
dcterms:subject | dbc:Unicode dbc:Character_sets |
gold:hypernym | dbr:Set |
rdf:type | yago:WikicatCharacterSets yago:Abstraction100002137 yago:CharacterSet106488880 yago:Communication100033020 yago:Database106637824 yago:Information106634376 yago:List106481320 yago:Measure100033615 yago:Message106598915 yago:WikicatIECStandards yago:WikicatISO/IECStandards yago:WikicatISOStandards yago:Standard107260623 yago:SystemOfMeasurement113577171 |
rdfs:comment | ISO/IEC 10646 je mezinárodní norma definující univerzální kódovanou znakovou sadu (anglicky Universal Coded Character Set, UCS), která by měla zahrnovat znaky nutné k reprezentaci prakticky všech známých jazyků. UCS obsahuje znaky z různých standardů znakových sad, včetně množství grafických, typografických, matematických a vědeckých symbolů. Norma ISO/IEC 10646 je vyvíjena v součinnosti s Unicode – přestože oba standardy nemají zcela totožné zaměření, definují stejnou univerzální znakovou sadu se stejnými kódy znaků. (cs) La norme ISO/CEI 10646, intitulée Technologies de l'information — Jeu universel de caractères codés (JUC), tente de définir un système de codage universel pour tous les systèmes d’écriture. Cette norme est le fondement du standard Unicode. (fr) 국제 문자 세트(UCS, Universal Character Set, 범용 문자 집합)는 ISO 10646으로 정의된 문자 인코딩의 국제 표준이다. 1991년부터, 유니코드 컨소시엄에서는 유니코드 표준과 ISO/IEC 10646을 발전시키기 위해 ISO와 공동 작업을 해 왔다. 분류와, 문자명과 유니코드 표준 2.0 버전의 코드들은 ISO/IEC 10646-1:1993과 첫 수정판과 동일하다. 2000년 3월 유니코드 3.0이 발표된 이후, 새롭게 추가된 문자들이 ISO/IEC 10646-1:2000을 통해 UCS에 포함되었다. UCS는 110만 개 이상의 코드가 있지만, 일반적으로 첫 65536개 (BMP, Basic Multilingual Plane, 기본 다국어 평면) 만이 사용된다. 나머지는 고대 이집트 상형문자나 쓰임이 적은 한자같은 문자를 표현하기 위해 남겨져 있다. 많은 코드영역, 심지어 BMP 영역에서도 서로 다른 인코딩 형태와 미래의 확장성을 고려하여, 일부러 문자를 할당하지 않았다. (ko) Universal Character Set (UCS) è una codifica di caratteri definita nell'ISO/IEC 10646. (it) International Standaard ISO/IEC 10646 is een standaard karakterset voor Universal Coded Character Set (UCS, Unicode). (nl) 通用字符集(英語:Universal Character Set, UCS)是由ISO制定的ISO 10646(或称ISO/IEC 10646)标准所定义的标准字符集。 通用字符集又称Universal Multiple-Octet Coded Character Set,中国大陆译为通用多八位编码字符集,台湾译为廣用多八位元組編碼字元集。 (zh) Der Universal Coded Character Set (UCS) ist ein Zeichensatz, der in der internationalen Norm ISO/IEC 10646 definiert ist. Seit der Revision 2011 (ISO/IEC 10646:2011) sind die definierten Zeichenkodierungen einschließlich ihrer Benennungen identisch mit denen des Unicode-Standards: * UTF-8 * UTF-16 * UTF-32 Ältere Ausgaben der Norm definierten andere Kodierungen, die jetzt deprecated sind: * UCS-2, Untermenge von UTF-16 * UCS-4, als Codierung identisch mit UTF-32 Der Unterschied zwischen UCS-2 und UTF-16 ist folgender: Ursprünglich wurden diese beiden Formate definiert: (de) El estándar internacional ISO/IEC 10646 define el Conjunto de Caracteres Universal (en inglés Universal Character Set o UCS) como un sistema de codificación de caracteres en varios octetos. La última versión contiene cerca de 136000 caracteres abstractos, cada uno de ellos identificado de forma precisa por un número entero denominado punto de código. El estándar ISO/IEC 10646 se mantiene junto con el estándar Unicode ("Unicode"), los cuales, son idénticos en el código. Se creó en el año 1993, por ello, a veces también se lo llama ISO/IEC 10646-1:1993. (es) The Universal Coded Character Set (UCS, Unicode) is a standard set of characters defined by the international standard ISO/IEC 10646, Information technology — Universal Coded Character Set (UCS) (plus amendments to that standard), which is the basis of many character encodings, improving as characters from previously unrepresented typing systems are added. The system deliberately leaves many code points not assigned to characters, even in the BMP. It does this to allow for future expansion or to minimise conflicts with other encoding forms. (en) ISO/IEC 10646 (UCS; 英: Universal Coded Character Set) は、符号化文字集合や文字符号化方式などを定めた、文字コードの国際標準のひとつで、業界規格のUnicodeと概ね互換である。日本の対応規格はJIS X 0221(国際符号化文字集合)。 文字空間(0 - 10FFFF16)、収録されている文字、それらの符号位置、英語でつけられた文字の名前、文字符号化方式(UTF-8, UTF-16, UTF-32)はUnicode規格と全く同じである。ただし、文字空間は古い規格では21ビットのUnicodeをベースにして文字空間を31ビットに拡張したものとされ、Unicodeの最大値であるU+10FFFFより大きなコードも使用できるという点でUnicodeと異なっていた。しかし、2006年の改訂によりUnicodeで使用できない領域には文字が「永久に定義されない」こととされ、2011年の改訂では明確に0 - 10FFFFと定義され同一となった。 (ja) Norma ISO/IEC 10646 opisuje uniwersalny zestaw znaków (UCS – Universal Character Set) służący do opisu znaków (liter, cyfr, symboli, ideogramów itd.) z wielu języków, pism i tradycji na świecie. Zestaw zawiera około 100 000 abstrakcyjnych znaków, z których każdy posiada unikalną nazwę i . Teoretycznie standard pozwala na zapisanie ponad 2 miliardów znaków (w 31 bitach, zobacz UCS-4), jednak w powszechnym użyciu jest jedynie pierwsze 65 536 znaków (UCS-2) ze zbioru Podstawowej Płaszczyzny Wielojęzycznej (BMP - Basic Multilingual Plane). (pl) A norma internacional ISO/IEC 10646 define o Conjunto Universal de Caracteres (do inglês Universal Character Set, ou somente UCS) como uma codificação de caracteres. Ela contém em torno de 100 000 códigos identificados por um nome não ambíguo, que representam símbolos como letras, números e ideogramas. (pt) UCS (англ. Universal Coded Character Set) представляет собой стандартный набор символов, определённый международным стандартом ISO/IEC 10646, который является основой многих символьных кодировок. UCS содержит чуть более 128 000 абстрактных символов, как и в Unicode 9.0, каждый из которых определяется однозначно сочетанием имени и целого числа (так называемый «кодовый пункт»). (ru) ISO/IEC 10646, eller Universal Coded Character Set eller Universal Multiple-Octet Coded Character Set är en internationell standard för teckenkodning.Arbetet med ISO/IEC 10646 började synkroniseras 1991 med Unicode-standarden som gjorts av ett antal datorleverantörer sammanslutna i Unicode-konsortiet. Den första publicerade versionen var färdig 1993 och ett antal nya utgåvor av standarden har publicerats sedan dess. Arbetet med både Unicode och ISO/IEC 10646 är synkroniserat och ISO-standarden har samma teckenuppsättning, teckenkoder och teckennamn som Unicode. (sv) Універсальний кодований набір символів (UCS) - це стандартний набір символів, визначений Міжнародним стандартом ISO / IEC 10646, який є основою багатьох кодувань символів . Остання версія містить понад 136 000 абстрактних символів, кожен з яких ідентифікується однозначним ім’ям і цілим числом, що називається . Цей стандарт ISO / IEC 10646 підтримується спільно зі стандартом Unicode ("Юнікод"), і вони ідентичні коду для коду. (uk) |
rdfs:label | ISO/IEC 10646 (cs) Universal Coded Character Set (de) ISO/IEC 10646 (es) ISO/CEI 10646 (fr) Universal Character Set (it) ISO/IEC 10646 (ja) 국제 문자 세트 (ko) ISO-10646 (nl) ISO 10646 (pl) Универсальный набор символов (ru) ISO/IEC 10646 (pt) Universal Coded Character Set (en) ISO/IEC 10646 (sv) Універсальний кодований набір символів (uk) 通用字符集 (zh) |
owl:sameAs | freebase:Universal Coded Character Set yago-res:Universal Coded Character Set wikidata:Universal Coded Character Set dbpedia-cs:Universal Coded Character Set dbpedia-de:Universal Coded Character Set dbpedia-es:Universal Coded Character Set dbpedia-fa:Universal Coded Character Set dbpedia-fr:Universal Coded Character Set dbpedia-he:Universal Coded Character Set dbpedia-hu:Universal Coded Character Set dbpedia-it:Universal Coded Character Set dbpedia-ja:Universal Coded Character Set dbpedia-ko:Universal Coded Character Set http://ky.dbpedia.org/resource/Юникод_тамгалар_системи dbpedia-nl:Universal Coded Character Set dbpedia-nn:Universal Coded Character Set dbpedia-no:Universal Coded Character Set dbpedia-pl:Universal Coded Character Set dbpedia-pt:Universal Coded Character Set dbpedia-ru:Universal Coded Character Set dbpedia-sr:Universal Coded Character Set dbpedia-sv:Universal Coded Character Set dbpedia-uk:Universal Coded Character Set dbpedia-yo:Universal Coded Character Set dbpedia-zh:Universal Coded Character Set https://global.dbpedia.org/id/4wfAQ |
prov:wasDerivedFrom | wikipedia-en:Universal_Coded_Character_Set?oldid=1119278112&ns=0 |
foaf:isPrimaryTopicOf | wikipedia-en:Universal_Coded_Character_Set |
is dbo:wikiPageRedirects of | dbr:10646-1:1993 dbr:UCS-16 dbr:UCS-2 dbr:ISO/IEC_10646:1993 dbr:ISO/IEC_10646:2000 dbr:ISO/IEC_10646:2001 dbr:ISO/IEC_10646:2003 dbr:ISO/IEC_10646:2011 dbr:ISO/IEC_10646:2012 dbr:ISO/IEC_10646:2014 dbr:ISO/CEI_10646 dbr:ISO/CEI_10646-1 dbr:ISO/CEI_10646-1:1993 dbr:ISO/CEI_10646-1:2000 dbr:ISO/CEI_10646-2 dbr:ISO/CEI_10646-2:2001 dbr:ISO/CEI_10646:1993 dbr:ISO/CEI_10646:2000 dbr:ISO/CEI_10646:2001 dbr:ISO/CEI_10646:2003 dbr:ISO/CEI_10646:2011 dbr:ISO/CEI_10646:2012 dbr:ISO/CEI_10646:2014 dbr:Universal_Character_Set dbr:Universal_code_(typography) dbr:ISO/IEC_10646 dbr:ISO_10646 dbr:Universal_Code_(Typography) dbr:Universal_character_set dbr:IEC_10646 dbr:List_of_Unicode_entities dbr:ISO-10646 dbr:ISO/IEC_10646-1 dbr:ISO/IEC_10646-1:1993 dbr:ISO/IEC_10646-1:2000 dbr:ISO/IEC_10646-1:2000(E) dbr:ISO/IEC_10646-2 dbr:ISO/IEC_10646-2:2001 dbr:ISO/IEC_JTC1/SC2/WG2 dbr:ISO10646 dbr:Iso_10646-1 |
is dbo:wikiPageWikiLink of | dbr:Enclosed_CJK_Letters_and_Months dbr:Cyrillic_(Unicode_block) dbr:UTF-16 dbr:Unicode dbr:Unicode_Consortium dbr:JIS_encoding dbr:10646-1:1993 dbr:Emoji dbr:GB_18030 dbr:Combining_Diacritical_Marks dbr:Private_Use_Areas dbr:Balti_language dbr:CJK_Symbols_and_Punctuation dbr:Cell_Broadcast dbr:Tibetan_script dbr:UCS-16 dbr:UCS-2 dbr:Hebrew_(Unicode_block) dbr:Lao_(Unicode_block) dbr:Miscellaneous_Technical dbr:Allegro_Common_Lisp dbr:Alphabetic_Presentation_Forms dbr:Null_character dbr:Hangul_(obsolete_Unicode_block) dbr:List_of_International_Organization_for_Standardization_standards,_10000-11999 dbr:JIS_X_0208 dbr:Text_over_IP dbr:Plain_text dbr:Thai_(Unicode_block) dbr:Theban_alphabet dbr:Tibetan_(Unicode_block) dbr:ISO/IEC_10646:1993 dbr:ISO/IEC_10646:2000 dbr:ISO/IEC_10646:2001 dbr:ISO/IEC_10646:2003 dbr:ISO/IEC_10646:2011 dbr:ISO/IEC_10646:2012 dbr:ISO/IEC_10646:2014 dbr:Greek_and_Coptic dbr:ISO/CEI_10646 dbr:ISO/CEI_10646-1 dbr:ISO/CEI_10646-1:1993 dbr:ISO/CEI_10646-1:2000 dbr:ISO/CEI_10646-2 dbr:ISO/CEI_10646-2:2001 dbr:ISO/CEI_10646:1993 dbr:ISO/CEI_10646:2000 dbr:ISO/CEI_10646:2001 dbr:ISO/CEI_10646:2003 dbr:ISO/CEI_10646:2011 dbr:ISO/CEI_10646:2012 dbr:ISO/CEI_10646:2014 dbr:ISO/IEC_2022 dbr:ISO/IEC_646 dbr:ISO/IEC_8859-1 dbr:Implementation_of_emojis dbr:Short_Message_Peer-to-Peer dbr:Universal_Character_Set dbr:Universal_code_(typography) dbr:ISO/IEC_10646 dbr:ISO/IEC_8859 dbr:ISO/IEC_JTC_1/SC_2 dbr:ISO_10646 dbr:Windows-1252 dbr:Wide_character dbr:Universal_Code_(Typography) dbr:Universal_character_set dbr:IEC_10646 dbr:List_of_Unicode_entities dbr:ISO-10646 dbr:ISO/IEC_10646-1 dbr:ISO/IEC_10646-1:1993 dbr:ISO/IEC_10646-1:2000 dbr:ISO/IEC_10646-1:2000(E) dbr:ISO/IEC_10646-2 dbr:ISO/IEC_10646-2:2001 dbr:ISO/IEC_JTC1/SC2/WG2 dbr:ISO10646 dbr:Iso_10646-1 |
is dbp:alias of | dbr:Unicode |
is rdfs:seeAlso of | dbr:UTF-8 |
is foaf:primaryTopic of | wikipedia-en:Universal_Coded_Character_Set |