Unicode (original) (raw)

About DBpedia

Unicode(ユニコード)は、符号化文字集合や文字符号化方式などを定めた、文字コードの業界規格。文字集合(文字セット)が単一の大規模文字セットであること(「Uni」という名はそれに由来する)などが特徴である。 従来、国あるいは各メーカーで独自に開発されていた文字コードには互換性がなかった。複数の文字コードを共存させる方法には文字が重複する短所があるため、微細な差異はあっても本質的に同じ文字であれば一つの番号を当てる方針で各国・各社の文字コードの統合を図ったものである。1980年代に、Starワークステーションの日本語化(J-Star)などを行ったゼロックスが提唱し、マイクロソフト、Apple、IBM、サン・マイクロシステムズ、ヒューレット・パッカード、ジャストシステムなどが参加するユニコードコンソーシアムにより作られた。国際規格のISO/IEC 10646とUnicode規格は同じ文字コード表になるように協調して策定されている。

thumbnail

Property Value
dbo:abstract في علم الحاسوب، الترميز الموحد (يونيكودأو يُونِكُود) (بالإنجليزية: Unicode)‏ هو معيار يمكن الحواسيب من تمثيل النصوص المكتوبة بأغلب نظم الكتابة ومعالجتها، بصورة متناسقة. يتكون يونيكود من 100,000 محرف، وطقم من مخططات الرموز كمرجع مرئي، ونهج في الترميز، وطقم من ترميزات المحارف المعيارية، وسرد لخصائص المحارف، وطقم من البيانات المرجعية، وعدد من الأمور المتعلقة مثل خصائص المحارف، وقواعد تطبيع النص، وفك الحروف لوحداتها الأولية، والترتيب، والتصيير، وثنائية الاتجاه (لعرض النصوص الذي يحتوي على كتابات من اليمين لليسار، مثل العربية، مع كتابات من اليسار لليمين، مثل اللاتينية). يطور يونيكود بالتوازي مع معيار ، وينشر على شكل كتاب يحمل الاسم معيار يونيكود (Unicode Standard). يطمح مجمع يونيكود -المنظمة غير الربحية التي تنسق تطوير يونيكود- في النهاية إلى استبدال الموجودة حاليا، ليحل محلها يونيكود وتنسيق يونيكود المعياري للتحويل (Unicode Transformation Format ،UTF)، حيث أن الكثير من الترميزات الحالية محدودة السعة والمدى، ولا تتوافق مع البيئات متعددة اللغات. أدى نجاح يونيكود في توحيد أطقم المحارف إلى انتشار وغلبة استخدامه في توطين وعولمة برمجيات الحاسوب. وجرى تطبيق البرنامج في العديد من التقنيات الحديثة، مثل لغة الترميز القابلة للامتداد، ولغة البرمجة جافا وأنظمة التشغيل الحديثة. (ar) Unicode és un estàndard internacional de codificació de caràcters, per a suports informàtics. Permet emmagatzemar qualsevol mena d'escriptura que es faci servir actualment, moltes formes d'escriptura conegudes només pels estudiosos, i símbols com ara els símbols matemàtics, lingüístics, i APL. Està mantingut pel (UTC), integrat al , on hi ha empreses com: Microsoft, Apple, Adobe, IBM, Oracle, SAP, Google o Yahoo!, institucions com la Universitat de Berkeley, i professionals i acadèmics a títol individual.Des del 1991, l'Unicode Consortium i la ISO/IEC estan d'acord a mantenir els mateixos codis per als mateixos caràcters. Unicode vol reemplaçar tots els codis de caràcters existents. És el conjunt de caràcters més complet, i ha esdevingut l'opció a triar als entorns multilingües. Molts estàndards recents ja l'han adoptat, per exemple XML, Java, i sistemes operatius moderns. (ca) Unicode (anglicky Unicode) je technická norma pro oblast výpočetní techniky definující jednotnou znakovou sadu a konzistentní kódování znaků pro reprezentaci a zpracovávání textů použitelné pro většinu písem používaných v současnosti na Zemi. Unicode je vyvíjen v součinnosti s ISO/IEC 10646 a je publikován elektronicky jako The Unicode Standard. Nejnovější verze obsahuje repertoár více než 140 000 znaků pokrývajících 159 moderních a historických písem a mnoho sad symbolů. Standard sestává ze sady tabulek pro vizuální referenci, popisu metod kódování, sady referenčních datových souborů a dalších položek, jako například vlastností znaků, pravidel pro textů, dekompozici, řazení, vykreslování a zobrazování (pro správné zobrazení textu obsahující písma psaná zprava doleva i zleva doprava, jako například arabské a hebrejské písmo). Poslední verze je Unicode 14.0 ze září roku 2021. Normu udržuje . Úspěch Unicode v unifikaci znakových sad vedl k jeho rozšíření a převládajícímu používání pro internacionalizaci a lokalizaci počítačového softwaru. Unicode je implementován mnoha technologiemi, včetně moderních operačních systémů, XML, programovacím jazykem Java a .NET Frameworkem firmy Microsoft. Unicode definuje několik způsobů reprezentace textů různými znakovými kódy. K nejpoužívanějším kódováním patří UTF-8, UTF-16 a zastaralé UCS-2. UTF-8 používá jeden bajt pro libovolný ASCII znak, přičemž všechny ASCII znaky mají v UTF-8 stejné kódové hodnoty jako ASCII a dva až čtyři bajty pro jiné znaky. UCS-2 používá 16bitové kódové jednotky (dva 8bitové bajty) pro každý znak, ale neumožňuje kódovat všechny znaky v aktuálním standardu Unicode. UTF-16 je rozšíření UCS-2, které pomocí dvou 16bitových jednotek (4 × 8 bit) umožňuje kódovat všechny znaky z Unicode. V Číně se používá kódování GB18030, které přebírá celý znakový repertoár Unicode, proto je také jedním ze způsobů kódování Unicode. Mapování GB18030 na UTF-32 je však netriviální (potřebuje převodní tabulku). Umožňuje současně používat různá písma při vícejazyčném zpracování textu v počítači a kóduje široké portfolio znaků pro profesionální zpracování textů v prakticky jakémkoli moderním i historickém jazyce. Nevýhodou unicode může být složitější zpracování, stejný text zabírá více prostoru na disku nebo v operační paměti počítače. Ovšem výhody univerzální znakové sady drtivě převažují, což je vidět mj. na tom, že starší osmibitové znakové sady jsou dnes definované jako podmnožiny Unicode. (cs) Στους υπολογιστές, το διεθνές πρότυπο Unicode στοχεύει στην κωδικοποίηση όλων των συστημάτων γραφής που χρησιμοποιούνται στον πλανήτη, ώστε να γίνει δυνατή η αποθήκευση -στη μνήμη ενός υπολογιστή- γραπτού κειμένου όλων των γλωσσών συμπεριλαμβανομένων και συμβόλων επιστημών, όπως μαθηματικά, φυσική κτλ. Η καθιέρωση του Unicode είναι ένα φιλόδοξο σχέδιο αφού σκοπεύει να αντικαταστήσει όλες τις υπάρχουσες κωδικοποιήσεις συνόλων χαρακτήρων, οι οποίες έχουν περιορισμούς που τις καθιστούν προβληματικές για χρήση σε πολυγλωσσικά υπολογιστικά συστήματα. Παρά τα τεχνικά προβλήματα που έχουν παρουσιαστεί το Unicode έχει καθιερωθεί ως το πιο πλήρες σύνολο χαρακτήρων και ως η προτιμότερη κωδικοποίηση σε πολυγλωσσικό λογισμικό. Πολλά πρόσφατα πρότυπα όπως το XML, καθώς και λογισμικό συστήματος όπως λειτουργικά συστήματα, έχουν υιοθετήσει το Unicode για να αναπαριστούν εσωτερικά κείμενο. (el) Unikodo (angle Unicode [junikoŭd]) estas normo de la komputila industrio por la konsekvenca enkodigo de signojn, alfabetojn, nombrojn kaj eĉ emoĝiojn en skribojn, por la reprezentado kaj manipulado de ajna teksto esprimita en iu el la plejmulto de la mondaj skribsistemoj: latine, arabe, cirile, greke, ĉine, japane, kartvele, hieroglife ktp. La latina, ekzemple, estas skripto, kiu funkcias por dekoj aŭ eĉ centoj da lingvoj - sed iuj skriboj estas uzataj por nur unu lingvo. Kelkaj arkaikaj skriboj, kaj ankaŭ kelkaj skriboj ankoraŭ uzataj, tamen ankoraŭ ne estas subtenataj en Unikodo, kvankam en 2020 Unikodo subtenas jam 154 alfabetojn. La Unicode Consortium (Unikoda Konsorcio) komencis prilabori Unikodon en 1991 kaj ankoraŭ bontenas ĝin kaj plivastigas ĝin. La internacia normo ISO-10646 sekvas ĉiupaŝe la normon Unikodan. En septembro 2013, la plej freŝa versio estis Unikodo 6.3. Tiu versio enhavas repertuaron de pli ol 110,000 signoj, kovrante 100 specojn de skripto. La normo konsistas el aro de kodtabeloj por vida referenco, enkodiga metodo kaj aro de normaj signaj enkodigoj, aro de referencdatumaj dosieroj, kaj kelkaj rilataj eroj, ekzemple signaj atributoj, reguloj por normaligo, malkombinigo, ordigo, vidigo, kaj dudirekta vidigo (por la ĝusta montrado de teksto enhavanta kaj dekstra-al-maldekstrajn skriptojn, ekzemple la araba kaj la hebrea, kaj maldekstra-al-dekstraj skriptoj). La sukceso de Unikodo unuecigi signarojn kaŭzis la ĝeneraligitan kaj ĉiean uzadon de Unikodo en la internaciigo kaj asimilado de programaroj. La normo estis efektivigita en multaj lastatempaj teknologioj, inkluzive de modernaj operaciumoj, markolingvoj, programlingvoj, ktp. En decembro 2007, UTF-8 (UTF signifas "unikoda transforma aranĝo") iĝis la plej uzata kodsistemo en la TTT. Antaŭe, la plej uzata sistemo estis askio, kiu estis desegnita ĉefe por tekstoj en la angla. (eo) Der Unicode-Standard (Aussprachen: amerikanisches Englisch [ˈjuːnikoʊd], britisches Englisch [ˈjuːnikəʊd]; dt. [ˈjuːnikoːt]) legt fest, wie Schrift elektronisch gespeichert wird, z. B. auf einem Computer oder Telefon. Der durch den Standard festgelegte Zeichensatz enthält 145.000 Zeichen. Das Unicode-Konsortium hat dazu 159 moderne und alte Schriften berücksichtigt, wie auch Symbole, Emojis und nicht druckbare Steuerzeichen. Die ISO bezeichnet den Standard als ISO 10646 und den Zeichensatz als Universal Coded Character Set (UCS). Unicode muss auch tatsächlich in Nullen und Einsen übersetzt werden. Eine solche Umwandlung wird als Unicode Transformation Format (UTF) bezeichnet. Durchgesetzt hat sich dabei UTF-8. In einigen Fällen ist auch noch UTF-16 anzutreffen, speziell in Betriebssystemen und Programmiersprachen, da eine Umstellung nicht einfach ist. (de) Unicode es un estándar de codificación de caracteres diseñado para facilitar el tratamiento informático, transmisión, y visualización de textos de numerosos idiomas y disciplinas técnicas, además de textos clásicos de lenguas muertas. El término Unicode proviene de los tres objetivos perseguidos: universalidad, uniformidad, y unicidad.​ Unicode define cada carácter o símbolo mediante un nombre e identificador numérico, el punto de código (code point). Además incluye otras informaciones para el uso correcto de cada carácter, como sistema de escritura, categoría, direccionalidad, mayúsculas y otros atributos. Unicode trata los caracteres alfabéticos, ideográficos y símbolos de forma equivalente, lo que significa que se pueden mezclar en un mismo texto sin utilizar marcas o caracteres de control.​ Este estándar es mantenido por el (UTC), integrado en el Consorcio Unicode, del que forman parte con distinto grado de implicación empresas como: Microsoft, Apple, Adobe, IBM, Oracle, SAP, Google o Facebook, instituciones como la Universidad de Berkeley, o el Gobierno de la India y profesionales y académicos a título individual.​El Unicode Consortium mantiene estrecha relación con ISO/IEC, con la que mantiene desde 1991 el acuerdo de sincronizar sus estándares que contienen los mismos caracteres y puntos de código.​ La creación de Unicode ha sido un ambicioso proyecto para reemplazar los esquemas de codificación de caracteres ya existentes, muchos de los cuales estaban muy limitados en tamaño y son incompatibles con entornos plurilingües. Unicode se ha convertido en el más extenso y completo esquema de codificación de caracteres, siendo el dominante en la internacionalización y adaptación local del software informático. El estándar ha sido aceptado en un número considerable de tecnologías recientes, como XML, Java y sistemas operativos modernos. La descripción completa del estándar y las tablas de caracteres están disponibles en la página web oficial de Unicode. La referencia completa se publica, además, en forma de libro cada vez que se completa una nueva versión principal. La versión digital de este libro está disponible de forma gratuita. Las revisiones y adiciones se publican de forma independiente. (es) Unicode, testu-karaktereak edozein hizkuntzatan informatikoki adierazteko balio duen standar erabiliena da. UNICODEko UTF-8 kodetze-modua erabiliena da gaur egunean. Munduan zehar erabiltzen diren alfabeto guztiak erabiltzeko aukera ematen du (Latindar alfabetoa, grekoak, ziriliko‎, arabiarra, ... Sistema berri honen zabalpena orokorra da, existitzen diren beste ordezkatzen ari da, besteek ezin baitituzte adierazi hainbat hizkuntzatako karaktere asko. Gaur egun nazioarteko proiektu gehienetan erabiltzen den estandarra UTF-8 da; teknologia berri gehienek erabiltzen dute. (UTC) erakundeak kudeatzen du, non enpresa hauek parte hartzen duten: Microsoft, Apple, , IBM, Oracle, , Google edo Yahoo!. Berkeley-ko Unibertsitateak ere parte hartzen du, eta zenbait akademikok eta profesionalek. 1991z Unicode Consortium eta ISO/IEC erakundeak ados jartzen dira karakteren kode berdinak erabiltzeko. Lehenago karaktere latinoentzat erabiltzen zen ASCII karaktere multzoan oinarrituta dago, hizkuntza guztien karaktereak kodetzea ahalbidetzearren 16 biteko eredu bat hartu zuen hasieran, kontrol-kodeak edo ihes-sekuentziak sartu beharrik gabe. * Txinerako Yue karakterea (U+6708) * A letra latindarra (U+0041) * "Aum" (ॐ) (U+0950) (eu) Unicode est un standard informatique qui permet des échanges de textes dans différentes langues, à un niveau mondial. Il est développé par le Consortium Unicode, qui vise au codage de texte écrit en donnant à tout caractère de n'importe quel système d'écriture un nom et un identifiant numérique, et ce de manière unifiée, quels que soient la plateforme informatique ou le logiciel utilisé. Ce standard est lié à la norme ISO/CEI 10646 qui décrit une table de caractères équivalente. La dernière version, Unicode 15.0, a été publiée en septembre 2022. Totalement compatible avec le jeu universel de caractères (JUC) de l'ISO/CEI 10646, le standard Unicode l'étend en lui ajoutant un modèle complet de représentation et de traitement de textes, en conférant à chaque caractère un jeu de propriétés (qui peuvent être soit pour certaines standardisées et stabilisées dans toutes les versions d'Unicode où le caractère a été encodé, soit informatives avec seulement une recommandation sur leur usage qui peut évoluer en fonction des nouveaux besoins trouvés). Ces propriétés décrivent avec précision les relations sémantiques qui peuvent exister entre plusieurs caractères successifs d'un texte, et permettent de standardiser ou recommander des algorithmes de traitement qui préservent au maximum la sémantique des textes transformés. Unicode a pour objet de rendre un même texte utilisable à l'identique sur des systèmes informatiques totalement différents. Le standard Unicode est constitué d'un répertoire de 149 186 caractères, couvrant plus de 150 écritures, d'un ensemble de tableaux de codes pour référence visuelle, d'une méthode de codage et de plusieurs codages de caractères standard, d'une énumération des propriétés de caractère (lettres majuscules, minuscules, APL, symboles, ponctuation, etc.) d'un ensemble de fichiers de référence des données informatiques, et d'un certain nombre d'éléments liés, tels que des règles de normalisation, de décomposition, de tri, de rendu et d'ordre d'affichage bidirectionnel (pour l'affichage correct de texte contenant à la fois des caractères d'écritures de droite à gauche, comme l'arabe et l'hébreu, et de gauche à droite). En pratique, Unicode reprend intégralement la norme ISO/CEI 10646, puisque cette dernière ne standardise que les caractères individuels en leur assignant un nom et un numéro normatif (appelé point de code) et une description informative très limitée, mais aucun traitement ni aucune spécification ou recommandation pour leur emploi dans l'écriture de langues réelles, ce que seul le standard Unicode définit précisément. L'ISO/CEI 10646 fait normativement référence à certaines parties du standard Unicode (notamment (en)) ; Unicode est également une norme de facto pour le traitement du texte et sert de base à de nombreuses autres normes. Tables Unicode (plan 0) (fr) Is córas stórála sonraí agus caighdeán i dtionscal na ríomhaireachta é Unicode. Úsáidtear dhá bheart le haghaidh carachtair a stóráil. Tá an córas seo ag teacht i gcomharbacht, nach mór, ar ASCII. Is féidir 65,536 luach éagsúil a stóráil in dhá bheart. Ciallaíonn sé seo gur féidir na carachtair ar fad in aibítrí an domhain a stóráil tríd an gcóras Unicode. Cuireadh an caighdeán i bhfeidhm i dteicneolaíochtaí nua ar nós XML, Java agus córais oibriúcháin nua-aimseartha. Tugann Unicode sainmhíniú ar dhá mhodh mapála: * Na hionchódaithe UTF (Unicode Transformation Format) * Na hionchódaithe UCS (Universal Character Set) (ga) Unicode adalah suatu standar teknis yang dirancang untuk mengizinkan teks dan simbol dari semua sistem tulisan di dunia untuk ditampilkan dan dimanipulasi secara konsisten oleh komputer. Dikembangkan secara tandem dengan standar dan dipublikasikan dalam bentuk buku The Unicode Standard. Unicode mengandung suatu kumpulan , suatu metodologi dan kumpulan standar penyandian karakter, suatu kumpulan bagan kode untuk referensi visual, deskripsi sifat karakter seperti huruf besar dan huruf kecil, suatu kumpulan data referensi berkas komputer, serta aturan normalisasi, dekomposisi, pembandingan (collation), serta penggambaran (rendering). Unicode Consortium, suatu organisasi nirlaba yang mengkoordinasikan pengembangan Unicode memiliki tujuan ambisius untuk dapat, pada akhirnya, menggantikan skema pengkodean karakter yang ada dengan Unicode dan skema (UTF) nya, karena banyak skema yang ada sekarang memiliki keterbatasan ukuran dan lingkup dan takserasi dengan lingkungan multibahasa. Kesuksesan Unicode menyatukan set karakter telah membawa pada penggunaannya yang luas dan pradominan dalam internasionalisasi dan lokalisasi perangkat lunak komputer. Standar ini telah diterapkan pada teknologi-teknologi terkini, termasuk XML, bahasa pemrograman Java, dan sistem operasi modern. (in) Unicode(ユニコード)は、符号化文字集合や文字符号化方式などを定めた、文字コードの業界規格。文字集合(文字セット)が単一の大規模文字セットであること(「Uni」という名はそれに由来する)などが特徴である。 従来、国あるいは各メーカーで独自に開発されていた文字コードには互換性がなかった。複数の文字コードを共存させる方法には文字が重複する短所があるため、微細な差異はあっても本質的に同じ文字であれば一つの番号を当てる方針で各国・各社の文字コードの統合を図ったものである。1980年代に、Starワークステーションの日本語化(J-Star)などを行ったゼロックスが提唱し、マイクロソフト、Apple、IBM、サン・マイクロシステムズ、ヒューレット・パッカード、ジャストシステムなどが参加するユニコードコンソーシアムにより作られた。国際規格のISO/IEC 10646とUnicode規格は同じ文字コード表になるように協調して策定されている。 (ja) Unicode è un sistema di codifica che assegna un numero univoco ad ogni carattere usato per la scrittura di testi, in maniera indipendente dalla lingua, dalla piattaforma informatica e dal programma utilizzato. È stato compilato e viene aggiornato e pubblicizzato dallo Unicode Consortium, un consorzio internazionale di aziende interessate alla interoperabilità nel trattamento informatico dei testi in lingue diverse. (it) Unicode, formally The Unicode Standard, is an information technology standard for the consistent encoding, representation, and handling of text expressed in most of the world's writing systems. The standard, which is maintained by the Unicode Consortium, defines as of the current version (15.0) 149,186 characters covering 161 modern and historic scripts, as well as symbols, emoji (including in colors), and non-visual control and formatting codes. Unicode's success at unifying character sets has led to its widespread and predominant use in the internationalization and localization of computer software. The standard has been implemented in many recent technologies, including modern operating systems, XML, and most modern programming languages. The Unicode character repertoire is synchronized with ISO/IEC 10646, each being code-for-code identical with the other. The Unicode Standard, however, includes more than just the base code. Alongside the character encodings, the Consortium's official publication includes a wide variety of details about the scripts and how to display them: normalization rules, decomposition, collation, rendering, and bidirectional text display order for multilingual texts, and so on. The Standard also includes reference data files and visual charts to help developers and designers correctly implement the repertoire. Unicode can be stored using several different encodings, which translate the character codes into sequences of bytes. The Unicode standard defines three and several other encodings exist, all in practice variable-length encodings. The most common encodings are the ASCII-compatible UTF-8, the ASCII-incompatible UTF-16 (compatible with the obsolete UCS-2), and the Chinese Unicode encoding standard GB18030 which is not an official Unicode standard but is used in China and implements Unicode fully. (en) ( 유니의 음반에 대해서는 U;Nee Code 문서를 참고하십시오.) 유니코드(영어: Unicode)는 전 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업 표준이다. 유니코드는 유니코드 협회(Unicode Consortium)가 제정한다. 또한 이 표준에는 ISO 10646 문자 집합, 문자 인코딩, 문자 정보 데이터베이스, 문자들을 다루기 위한 알고리즘 등을 포함하고 있다. 또한 유니코드의 목적은 현존하는 문자 인코딩 방법들을 모두 유니코드로 교체하려는 것이다. 기존의 인코딩들은 그 규모나 범위 면에서 한정되어 있고, 다국어 환경에서는 서로 호환되지 않는 문제점이 있었다. 유니코드가 다양한 문자 집합들을 통합하는 데 성공하면서 유니코드는 컴퓨터 소프트웨어의 국제화와 지역화에 널리 사용되게 되었으며, 비교적 최근의 기술인 XML, 자바, 그리고 최신 운영 체제 등에서도 지원하고 있다. 유니코드에서 한국어 발음을 나타날 때는 예일 로마자 표기법의 변형인 ISO/TR 11941을 사용하고 있다. (ko) Unicode is een internationale standaard (nauw samenhangend met ISO-10646) voor de codering van grafische tekens en symbolen in binaire codes, vergelijkbaar met de ASCII-standaard. De standaard voorziet alle tekens van alle geschreven talen van een naam (in de standaard in hoofdletters geschreven) en een nummer (vaak hexadecimaal geschreven, voorafgegaan door U+). Er is bijvoorbeeld het teken LATIN CAPITAL LETTER A met nummer U+0041 (65), los van de lettertypes waarin het weergegeven kan worden. De grafische weergave per lettertype behoort niet tot de standaard. De standaard wordt onderhouden door het Unicode Consortium. In tegenstelling tot ASCII (alleen Engels) of Latin-1 (alleen West-Europese talen) heeft Unicode als doel alle gebruikte schriften (zoals het Griekse schrift en Chinese karakters) te ondersteunen. De standaard bevat ruim 100.000 gestandaardiseerde tekens en ongeveer 900.000 voor toekomstig gebruik gereserveerde codes. De Unicode standaard schrijft niets voor over de visuele representatie van een karakter. Unicode stelt geen beperkingen aan het aantal talen dat in één enkel document gebruikt kan worden. Naast letters en cijfers bevat Unicode ook veel symbolen, zoals: kruisen, wiskundige tekens, muntsymbolen enzovoort. Unicode bevat geen symbolen die niet in een schrift worden gebruikt, zoals verkeersborden. Enkele "tekens" in Unicode zijn zelf geen grafische tekens, maar hebben betekenis voor de wijze waarop de zichtbare tekens geplaatst worden, zoals carriage return, line feed, spatie en de niet-afbrekende spatie (harde spatie, NBSP). Een neveneffect bij omzetting van gegevens die anders gecodeerd waren, is dat bij sorteren op numerieke volgorde een ander resultaat (space, numeric, uppercase, lowercase (SNUL)) dan bijvoorbeeld bij EBCDIC (space, lowercase, uppercase, numeric (=SLUN)) verkregen wordt, omdat de tekens anders gerangschikt zijn. (nl) Unicode (formalnie Unicode Standard, pol. Unikod) – komputerowy standard kodowania zestawu znaków obejmującego litery większości używanych na świecie pism, a także symboli, emoji i kodów formatowania. Standard Unicode rozwijany jest przez konsorcjum Unicode, składające się z firm wytwarzających sprzęt komputerowy, producentów oprogramowania oraz instytutów naukowych, agencji międzynarodowych i grup użytkowników. Konsorcjum współpracuje z organizacją ISO. W odróżnieniu od standardów takich jak ISO 10646, oprócz kodowania znaków publikacje konsorcjum Unicode dostarczają również wiele szczegółów o systemach pisma i sposobie ich wyświetlania: reguły normalizacji, dekompozycji, kolacjonowania, renderowania i dwukierunkowej kolejności wyświetlania dla tekstów wielojęzycznych. Zawierają również referencyjne pliki danych i wykresy wizualne, które pomagają deweloperom poprawnie zaimplementować standard Unicode. (pl) Unicode é um padrão que permite aos computadores representar e manipular, de forma consistente, texto de qualquer sistema de escrita existente. Publicado no livro The Unicode Standard, o padrão consiste de quase 138 mil caracteres, um conjunto de diagramas de códigos para referência visual, uma metodologia para codificação e um conjunto de codificações padrões de caracteres, uma enumeração de propriedades de caracteres como caixa alta e caixa baixa, um conjunto de arquivos de computador com dados de referência, além de regras para normalização, decomposição, ordenação alfabética e renderização. Atualmente, é promovido e desenvolvido pela Unicode Consortium, uma organização sem fins lucrativos que coordena o padrão, e que possui o objetivo de um dia substituir esquemas de codificação de caractere existentes pelo Unicode e pelos esquemas padronizados de transformação Unicode (chamado Unicode Transformation Format, ou UTF). Seu desenvolvimento é feito em conjunto com a Organização Internacional para Padronização (ISO) e compartilha o repertório de caracteres com o ISO/IEC 10646: o Conjunto Universal de Caracteres (UCS). Ambos funcionam equivalentemente como codificadores de caracteres, mas o padrão Unicode fornece muito mais informação para implementadores, cobrindo em detalhes tópicos como ordenação alfabética e visualização. Seu sucesso em unificar conjuntos de caracteres levou a um uso amplo e predominante na internacionalização e localização de programas de computador. O padrão foi implementado em várias tecnologias recentes, incluindo XML, Java e sistemas operacionais modernos. (pt) Юніко́д (англ. Unicode), УНІфіковане КОДування — промисловий стандарт, розроблений, щоб забезпечити цифрове представлення символів усіх писемностей світу та спеціальних символів. Удосконалений сумісно зі стандартом Універсальний Набір Символів (Universal Character Set — UCS) і опублікований у формі книги Стандарт Юнікод, Юнікод складається з асортименту символів, методології кодування та комплекту (набору) стандартів кодування символів, комплекту кодових таблиць для посилань на зображення символів, списку властивостей символів таких, наприклад, як верхній і нижній , комплект довідкових даних комп'ютерних файлів, правил нормалізації, декомпозиції, зіставлення і зображення (рендерингу). (uk) Unicode är en branschstandard för hur datorer ska hantera text skriven i olika skriftsystem. Unicode är utvecklad tillsammans med den internationella standarden Universal Coded Character Set och publicerad på internet och i bokform. Unicode består av en repertoar med fler än 100 000 skrivtecken. Ett av de viktigaste målen är att alla tecken i världens alla skriftsystem ska finnas med: bokstäver, kinesiska tecken, siffror, skiljetecken, matematiska symboler, och så vidare. Unicode består även av ett antal metoder för att lagra tecknen i datorer, bland annat UTF-8 och UTF-16. Även en serie teckenegenskaper definieras, som exempelvis: huruvida ett tecken är en bokstav, siffra, skiljetecken, om en bokstav är en versal eller gemen, med mera. Unicode ger även en beskrivning hur normalisering ska gå till och i vilken ordning tecken ska visas när tecken ur höger-till-vänster-skriftsystem (till exempel arabiska) används. En separat Unicode-standard ger en grundläggande sorteringsordning, som sedan kan anpassas till olika språk. Unicode-konsortiet är en ideell organisation grundad för att styra utvecklingen av Unicodestandarden och består av representanter från bland annat mobil- och datortillverkare, till exempel Apple, Microsoft, Facebook och Google men även lingvister och typografer. (sv) Юнико́д (англ. Unicode) — стандарт кодирования символов, включающий в себя знаки почти всех письменных языков мира. В настоящее время стандарт является преобладающим в Интернете. Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (англ. Unicode Consortium, Unicode Inc.). Применение этого стандарта позволяет закодировать очень большое число символов из разных систем письменности: в документах, закодированных по стандарту Юникод, могут соседствовать китайские иероглифы, математические символы, буквы греческого алфавита, латиницы и кириллицы, символы музыкальной нотной нотации, при этом становится ненужным переключение кодовых страниц. Стандарт состоит из двух основных частей: универсального набора символов (англ. Universal character set, UCS) и семейства кодировок (англ. Unicode transformation format, UTF). Универсальный набор символов перечисляет допустимые по стандарту Юникод символы и присваивает каждому символу код в виде неотрицательного целого числа, записываемого обычно в шестнадцатеричной форме с префиксом U+, например, U+040F. Семейство кодировок определяет способы преобразования кодов символов для передачи в потоке или в файле. Коды в стандарте Юникод разделены на несколько областей. Область с кодами от U+0000 до U+007F содержит символы набора ASCII, и коды этих символов совпадают с их кодами в ASCII. Далее расположены области символов других систем письменности, знаки пунктуации и технические символы. Часть кодов зарезервирована для использования в будущем. Под символы кириллицы выделены области знаков с кодами от U+0400 до U+052F, от U+2DE0 до U+2DFF, от U+A640 до U+A69F (см. Кириллица в Юникоде). (ru) Unicode,全稱為Unicode標準(The Unicode Standard),其官方機構Unicode聯盟所用的中文名称为統一碼,又译作萬國碼、統一字元碼、统一字符编码,是信息技术領域的業界標準,其整理、編碼了世界上大部分的文字系統,使得電腦能以通用劃一的字元集來處理和顯示文字,不但減輕在不同編碼系統間切換和轉換的困擾,更提供了一種跨平臺的亂碼問題解決方案。Unicode由非營利機構Unicode聯盟(Unicode Consortium)負責維護,該機構致力讓Unicode標準取代既有的字符編碼方案。尤其既有方案的編碼空間有限,亦不適用於多語環境。 Unicode伴隨著通用字符集ISO/IEC 10646的標準而發展,同時也以書本的形式對外發表。Unicode至今仍在不斷增修,每個新版本都加入更多新的字符。目前最新的版本為2022年9月公布的15.0.0,已經收錄超過14萬個字符(第十萬個字符在2005年獲採納)。Unicode標準不僅僅只是為文字指定代碼。除了涵蓋視覺上的字形、編碼方法、標準的字符編碼资料外,聯盟官方出版品還包含了關於各書寫系統的細節及呈現方式,如規格化的準則、拆分、定序、繪製、雙向文本顯示、书写方向、字符特性(如大小寫字母)等等。此外還提供參考資料和視覺圖像,以幫助開發者和設計師正確應用標準。 Unicode備受認可,為ISO納入国际标准,成為通用字符集,即 ISO/IEC 10646。Unicode兼容ISO/IEC 10646,能完整对应各个版本标准。Unicode廣泛應用於電腦软件的國際化與本地化過程。很多新科技,如可扩展置标语言(Extensible Markup Language,簡稱:XML)、Java程式語言以及現代作業系統,都採用Unicode來編碼。Unicode最普遍的編碼格式是和ASCII兼容的UTF-8,以及和UCS-2兼容的UTF-16。 (zh)
dbo:thumbnail wiki-commons:Special:FilePath/New_Unicode_logo.svg?width=300
dbo:wikiPageExternalLink https://www.unicode.org/versions/Unicode6.0.0/ https://scripts.sil.org/cms/scripts/page.php%3Fsite_id=nrsi&id=UnicodeBMPFallbackFont https://www.worldswritingsystems.org https://doi.org/10.36824/2018-graf-hara1 http://www.unicode.org/reports/tr44/ http://www.alanwood.net/unicode/ https://home.unicode.org/%7Cname=Official https://www.unicode.org/Public/UCD/latest/ucd/UnicodeData.txt https://www.unicode.org/main.html%7Cname=Official, https://www.unicode.org/versions/latest/ https://unicode.org/main.html%7Cname=Official
dbo:wikiPageID 31742 (xsd:integer)
dbo:wikiPageLength 77883 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID 1124795833 (xsd:integer)
dbo:wikiPageWikiLink dbr:Private_Use_Area_(Unicode_block) dbr:Python_(programming_language) dbr:Rongorongo dbr:List_of_XML_and_HTML_character_entity_references dbr:List_of_binary_codes dbr:Mojibake dbr:Religious_and_political_symbols_in_Unicode dbr:Open-source_Unicode_typefaces dbr:Parody dbr:Base64 dbr:Basic_Latin_(Unicode_block) dbr:Devanagari dbr:Apple_Advanced_Typography dbr:April_Fools'_Day_RFC dbc:Unicode dbr:List_of_Unicode_characters dbr:Lithuanian_language dbr:People's_Republic_of_China dbr:Character_(computing) dbr:Character_encoding dbr:Charis_SIL dbr:Currency_Symbols_(Unicode_block) dbr:Cyrillic_(Unicode_block) dbr:DIN_91379 dbr:UTF-1 dbr:UTF-16 dbr:UTF-5 dbr:UTF-6 dbr:UTF-7 dbr:UTF-8 dbr:UTF-EBCDIC dbr:Unicode_Consortium dbr:Unicode_alias_names_and_abbreviations dbr:Uniform_Resource_Identifier dbr:University_of_California,_Berkeley dbr:University_of_Cambridge dbr:University_of_Edinburgh dbr:Unix-like dbr:Variation_Selectors dbr:ʼPhags-pa_script dbr:Duplicate_characters_in_Unicode dbr:Input_method dbr:Internationalization_and_localization dbr:Number dbr:Letterlike_Symbols dbr:Latin-1_Supplement_(Unicode_block) dbr:Number_Forms dbr:Round-trip_format_conversion dbr:Percent_encoding dbr:.NET_Framework dbr:16-bit_computing dbr:Mathematical_Operators dbr:Maya_script dbr:SAP_SE dbr:SIL_International dbr:General_Punctuation dbr:Punycode dbr:Egyptian_hieroglyphs dbr:Emoji dbr:Endianness dbr:FreeBSD dbr:GB_18030 dbr:GNOME dbr:GNU_Compiler_Collection dbr:GTK+ dbr:Geometric_Shapes dbr:Glyph dbr:Gmail dbr:Google dbr:Graphite_(SIL) dbr:Box_Drawing dbr:Ministry_of_Endowments_and_Religious_Affairs_(Oman) dbr:Musical_notation dbr:ConScript_Unicode_Registry dbr:Core_Text dbr:Apple_Inc. dbr:Arabic_script_in_Unicode dbr:Ligature_(typography) dbr:Lotus_Multi-Byte_Character_Set dbr:MacOS dbr:Bidirectional_Text dbr:Standardization_Administration_of_China dbr:Combining_character dbr:Comparison_of_Unicode_encodings dbr:Email dbr:Halfwidth_and_Fullwidth_Forms_(Unicode_block) dbr:Ideographic_Research_Group dbr:Private_Use_Areas dbr:Proof_of_concept dbr:Specials_(Unicode_block) dbr:Microsoft_Layer_for_Unicode dbr:Windows_9x dbc:Character_encoding dbr:Byte dbr:C0_and_C1_control_codes dbr:COVID-19_pandemic dbc:Digital_typography dbr:Tibetan_script dbr:Typeface dbr:URL dbr:Dave_Opstad dbr:W3C dbr:Web_Open_Font_Format dbr:Web_browser dbr:Windows_10 dbr:Windows_11 dbr:Windows_2000 dbr:Windows_7 dbr:Windows_8 dbr:Windows_NT dbr:Windows_NT_4.0 dbr:Windows_Vista dbr:Windows_XP dbr:Domain_Name_System dbr:Jurchen_script dbr:Latin_Extended-A dbr:Latin_Extended-B dbr:Latin_Extended_Additional dbr:Leading_zero dbr:Miscellaneous_Symbols dbr:Miscellaneous_Technical dbr:ASCII dbr:ATSUI dbr:Abugida dbr:Acute_accent dbr:Adobe_Inc. dbr:Allograph dbr:Alphabet dbr:32-bit_computing dbr:E dbr:EBCDIC dbr:EUC-JP dbr:Alphabetic_Presentation_Forms dbr:European_Union dbr:FTP dbr:Facebook,_Inc. dbr:Outlook.com dbr:Pango dbr:Diminishing_returns dbr:DirectWrite dbr:Font dbr:Font_substitution dbr:Grapheme dbr:Han_unification dbr:Ken_Lunde dbr:Word_processor dbr:Michael_Everson dbr:Quoted-printable dbr:Replacement_character dbr:Research_Libraries_Group dbr:HTML dbr:HTTP dbr:Hangul dbr:Hexadecimal dbr:International_Components_for_Unicode dbr:International_Organization_for_Standardization dbr:Internet_Explorer dbr:Tamil_script dbr:Tatsuo_Kobayashi dbr:Technical_standard dbr:Chinese_characters dbr:Joe_Becker_(Unicode) dbr:KDE dbr:Kanji dbr:Khitan_small_script dbr:Latin_character dbr:Bidirectional_text dbr:Binary_Ordered_Compression_for_Unicode dbr:Block_Elements dbr:Sun_Microsystems dbr:Cocoa_text_system dbr:Code dbr:Code_page dbr:Code_point dbr:High-level_programming_language dbr:Egyptian_hieroglyph dbr:Java_virtual_machine dbr:TRON_(encoding) dbr:Wireless dbr:ISCII dbr:Ideographic_Description_Sequences dbr:Writing_system dbr:Dot_(diacritic) dbr:Arrows_(Unicode_block) dbr:Mark_Davis_(Unicode) dbr:Byte_order_mark dbr:CJK_Unified_Ideographs dbr:CJK_characters dbr:Plan_9_from_Bell_Labs dbr:Greek_Extended dbr:Greek_and_Coptic dbr:IBM dbr:IETF dbr:ISO/IEC_8859-1 dbr:Indo-Aryan_languages dbr:Information_technology dbr:Klingon_scripts dbr:Microsoft dbr:Microsoft_Windows dbr:NeXT dbr:Netflix dbr:Newline dbr:Ogonek dbr:OpenType dbr:Operating_system dbr:Radical_(Chinese_characters) dbr:Seed7 dbr:Wubi_method dbr:XHTML dbr:XML dbr:Xerox dbr:Xerox_Character_Code_Standard dbr:Yahoo!_Mail dbr:Romanization dbr:MIME dbr:Macron_(diacritic) dbr:Medieval_Unicode_Font_Initiative dbr:Roozbeh_Pournader dbr:Sic dbr:Standard_Compression_Scheme_for_Unicode dbr:Script_(Unicode) dbr:Software dbr:UTF-32 dbr:Unicode_collation_algorithm dbr:Variable-width_encoding dbr:World_Wide_Web dbr:Extended_ASCII dbr:IPA_Extensions dbr:ISO/IEC_14755 dbr:ISO/IEC_6429 dbr:ISO/IEC_8859 dbr:ISO/IEC_JTC_1/SC_2 dbr:List_of_typefaces dbr:Programming_language dbr:Precomposed_character dbr:Thai_alphabet dbr:Superscripts_and_Subscripts dbr:Universal_Coded_Character_Set dbr:Linux_distributions dbr:Character_set dbr:Spacing_Modifier_Letters dbr:Syllabary dbr:Multilingualism dbr:Windows-1252 dbr:Injective dbr:Tengwar dbr:Unicode_symbols dbr:List_of_Unicode_fonts dbr:Wide_character dbr:Standards_related_to_Unicode dbr:Shape_context dbr:Unicode_equivalence dbr:Uniscribe dbr:Lee_Collins_(software_engineer) dbr:Cangjie_method dbr:Canonical_equivalence dbr:Internationalized_Domain_Names dbr:TrueType dbr:IDNA dbr:Hangul_Jamo dbr:Character_property_(Unicode) dbr:Radical_(Chinese_character) dbr:ISO_8859-1 dbr:Dot_above dbr:Indic_script dbr:Block_(Unicode) dbr:East_Asian_language dbr:ISO-2022 dbr:Last_Resort_font dbr:WOFF2 dbr:Combining_diacritical_mark dbr:Unicode_fallback_font dbr:WGL-4 dbr:Homoglyphs dbr:Shift-JIS dbr:UTF-18 dbr:UTF-9 dbr:NLP_(computer_science) dbr:TIS-620 dbr:File:Hiero_O4.png dbr:File:Unicode_sample.png dbr:File:Cyrillic_cursive.svg
dbp:alias dbr:Universal_Coded_Character_Set
dbp:caption Logo of the Unicode Consortium (en) The Arabic (en) The Devanāgarī -ligature of JanaSanskritSans (en) ligature (en)
dbp:cs1Dates y (en)
dbp:date May 2019 (en) April 2010 (en)
dbp:image 23 (xsd:integer) JanaSanskritSans ddhrya.svg (en)
dbp:lang International (en)
dbp:m Unicode (en)
dbp:mw no (en)
dbp:n no (en)
dbp:name Unicode (en)
dbp:prev ISO/IEC 8859, various others (en)
dbp:q no (en)
dbp:reason "and, contains" and meaning of statement (en)
dbp:s no (en)
dbp:species no (en)
dbp:standard Unicode Standard (en)
dbp:totalWidth 300 (xsd:integer)
dbp:v no (en)
dbp:voy no (en)
dbp:wikiPageUsesTemplate dbt:DMOZ dbt:Anchor dbt:As_of dbt:Authority_control dbt:Better_source_needed dbt:Char dbt:Citation_needed dbt:Cite_book dbt:Clarify dbt:Cn dbt:Contains_special_characters dbt:Em dbt:IETF_RFC dbt:IPA-th dbt:ISBN dbt:Main dbt:Mono dbt:Multiple_image dbt:Notelist dbt:Official_website dbt:Quote dbt:Refbegin dbt:Refend dbt:Reflist dbt:Refn dbt:Sc2 dbt:See_also dbt:Short_description dbt:Sister_project_links dbt:Snd dbt:Tt dbt:Ubl dbt:Unichar dbt:Use_dmy_dates dbt:Use_Oxford_spelling dbt:Unicode_version_history dbt:Wiktth dbt:Abbr. dbt:Unicode_navigation dbt:Typo dbt:IAST dbt:Middot dbt:General_Category_(Unicode) dbt:Character_encoding dbt:Infobox_character_encoding
dcterms:subject dbc:Unicode dbc:Character_encoding dbc:Digital_typography
gold:hypernym dbr:Industry
rdf:type owl:Thing dbo:Company yago:WikicatComputerData yago:WikicatComputerFileFormats yago:WikicatComputerStandards yago:Abstraction100002137 yago:Act100030358 yago:Activity100407535 yago:Cognition100023271 yago:Communication100033020 yago:Cryptography100614489 yago:Datum105816622 yago:Direction106786629 yago:Encoding100615887 yago:Event100029378 yago:Format106636806 yago:Information105816287 yago:Information106634376 yago:Measure100033615 yago:Message106598915 yago:Protocol106665108 yago:PsychologicalFeature100023100 yago:WikicatISOStandards yago:Writing100614224 yago:YagoPermanentlyLocatedEntity yago:Rule106652242 yago:Standard107260623 yago:SystemOfMeasurement113577171 yago:WikicatEncodings yago:WikicatPresentationLayerProtocols
rdfs:comment Unicode(ユニコード)は、符号化文字集合や文字符号化方式などを定めた、文字コードの業界規格。文字集合(文字セット)が単一の大規模文字セットであること(「Uni」という名はそれに由来する)などが特徴である。 従来、国あるいは各メーカーで独自に開発されていた文字コードには互換性がなかった。複数の文字コードを共存させる方法には文字が重複する短所があるため、微細な差異はあっても本質的に同じ文字であれば一つの番号を当てる方針で各国・各社の文字コードの統合を図ったものである。1980年代に、Starワークステーションの日本語化(J-Star)などを行ったゼロックスが提唱し、マイクロソフト、Apple、IBM、サン・マイクロシステムズ、ヒューレット・パッカード、ジャストシステムなどが参加するユニコードコンソーシアムにより作られた。国際規格のISO/IEC 10646とUnicode規格は同じ文字コード表になるように協調して策定されている。 (ja) Unicode è un sistema di codifica che assegna un numero univoco ad ogni carattere usato per la scrittura di testi, in maniera indipendente dalla lingua, dalla piattaforma informatica e dal programma utilizzato. È stato compilato e viene aggiornato e pubblicizzato dallo Unicode Consortium, un consorzio internazionale di aziende interessate alla interoperabilità nel trattamento informatico dei testi in lingue diverse. (it) ( 유니의 음반에 대해서는 U;Nee Code 문서를 참고하십시오.) 유니코드(영어: Unicode)는 전 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업 표준이다. 유니코드는 유니코드 협회(Unicode Consortium)가 제정한다. 또한 이 표준에는 ISO 10646 문자 집합, 문자 인코딩, 문자 정보 데이터베이스, 문자들을 다루기 위한 알고리즘 등을 포함하고 있다. 또한 유니코드의 목적은 현존하는 문자 인코딩 방법들을 모두 유니코드로 교체하려는 것이다. 기존의 인코딩들은 그 규모나 범위 면에서 한정되어 있고, 다국어 환경에서는 서로 호환되지 않는 문제점이 있었다. 유니코드가 다양한 문자 집합들을 통합하는 데 성공하면서 유니코드는 컴퓨터 소프트웨어의 국제화와 지역화에 널리 사용되게 되었으며, 비교적 최근의 기술인 XML, 자바, 그리고 최신 운영 체제 등에서도 지원하고 있다. 유니코드에서 한국어 발음을 나타날 때는 예일 로마자 표기법의 변형인 ISO/TR 11941을 사용하고 있다. (ko) Юніко́д (англ. Unicode), УНІфіковане КОДування — промисловий стандарт, розроблений, щоб забезпечити цифрове представлення символів усіх писемностей світу та спеціальних символів. Удосконалений сумісно зі стандартом Універсальний Набір Символів (Universal Character Set — UCS) і опублікований у формі книги Стандарт Юнікод, Юнікод складається з асортименту символів, методології кодування та комплекту (набору) стандартів кодування символів, комплекту кодових таблиць для посилань на зображення символів, списку властивостей символів таких, наприклад, як верхній і нижній , комплект довідкових даних комп'ютерних файлів, правил нормалізації, декомпозиції, зіставлення і зображення (рендерингу). (uk) في علم الحاسوب، الترميز الموحد (يونيكودأو يُونِكُود) (بالإنجليزية: Unicode)‏ هو معيار يمكن الحواسيب من تمثيل النصوص المكتوبة بأغلب نظم الكتابة ومعالجتها، بصورة متناسقة. يتكون يونيكود من 100,000 محرف، وطقم من مخططات الرموز كمرجع مرئي، ونهج في الترميز، وطقم من ترميزات المحارف المعيارية، وسرد لخصائص المحارف، وطقم من البيانات المرجعية، وعدد من الأمور المتعلقة مثل خصائص المحارف، وقواعد تطبيع النص، وفك الحروف لوحداتها الأولية، والترتيب، والتصيير، وثنائية الاتجاه (لعرض النصوص الذي يحتوي على كتابات من اليمين لليسار، مثل العربية، مع كتابات من اليسار لليمين، مثل اللاتينية). يطور يونيكود بالتوازي مع معيار ، وينشر على شكل كتاب يحمل الاسم معيار يونيكود (Unicode Standard). (ar) Unicode és un estàndard internacional de codificació de caràcters, per a suports informàtics. Permet emmagatzemar qualsevol mena d'escriptura que es faci servir actualment, moltes formes d'escriptura conegudes només pels estudiosos, i símbols com ara els símbols matemàtics, lingüístics, i APL. Unicode vol reemplaçar tots els codis de caràcters existents. És el conjunt de caràcters més complet, i ha esdevingut l'opció a triar als entorns multilingües. Molts estàndards recents ja l'han adoptat, per exemple XML, Java, i sistemes operatius moderns. (ca) Unicode (anglicky Unicode) je technická norma pro oblast výpočetní techniky definující jednotnou znakovou sadu a konzistentní kódování znaků pro reprezentaci a zpracovávání textů použitelné pro většinu písem používaných v současnosti na Zemi. Unicode je vyvíjen v součinnosti s ISO/IEC 10646 a je publikován elektronicky jako The Unicode Standard. Nejnovější verze obsahuje repertoár více než 140 000 znaků pokrývajících 159 moderních a historických písem a mnoho sad symbolů. Standard sestává ze sady tabulek pro vizuální referenci, popisu metod kódování, sady referenčních datových souborů a dalších položek, jako například vlastností znaků, pravidel pro textů, dekompozici, řazení, vykreslování a zobrazování (pro správné zobrazení textu obsahující písma psaná zprava doleva i zleva doprava, jak (cs) Στους υπολογιστές, το διεθνές πρότυπο Unicode στοχεύει στην κωδικοποίηση όλων των συστημάτων γραφής που χρησιμοποιούνται στον πλανήτη, ώστε να γίνει δυνατή η αποθήκευση -στη μνήμη ενός υπολογιστή- γραπτού κειμένου όλων των γλωσσών συμπεριλαμβανομένων και συμβόλων επιστημών, όπως μαθηματικά, φυσική κτλ. Η καθιέρωση του Unicode είναι ένα φιλόδοξο σχέδιο αφού σκοπεύει να αντικαταστήσει όλες τις υπάρχουσες κωδικοποιήσεις συνόλων χαρακτήρων, οι οποίες έχουν περιορισμούς που τις καθιστούν προβληματικές για χρήση σε πολυγλωσσικά υπολογιστικά συστήματα. (el) Der Unicode-Standard (Aussprachen: amerikanisches Englisch [ˈjuːnikoʊd], britisches Englisch [ˈjuːnikəʊd]; dt. [ˈjuːnikoːt]) legt fest, wie Schrift elektronisch gespeichert wird, z. B. auf einem Computer oder Telefon. Der durch den Standard festgelegte Zeichensatz enthält 145.000 Zeichen. Das Unicode-Konsortium hat dazu 159 moderne und alte Schriften berücksichtigt, wie auch Symbole, Emojis und nicht druckbare Steuerzeichen. Die ISO bezeichnet den Standard als ISO 10646 und den Zeichensatz als Universal Coded Character Set (UCS). (de) Unikodo (angle Unicode [junikoŭd]) estas normo de la komputila industrio por la konsekvenca enkodigo de signojn, alfabetojn, nombrojn kaj eĉ emoĝiojn en skribojn, por la reprezentado kaj manipulado de ajna teksto esprimita en iu el la plejmulto de la mondaj skribsistemoj: latine, arabe, cirile, greke, ĉine, japane, kartvele, hieroglife ktp. La latina, ekzemple, estas skripto, kiu funkcias por dekoj aŭ eĉ centoj da lingvoj - sed iuj skriboj estas uzataj por nur unu lingvo. Kelkaj arkaikaj skriboj, kaj ankaŭ kelkaj skriboj ankoraŭ uzataj, tamen ankoraŭ ne estas subtenataj en Unikodo, kvankam en 2020 Unikodo subtenas jam 154 alfabetojn. (eo) Unicode, testu-karaktereak edozein hizkuntzatan informatikoki adierazteko balio duen standar erabiliena da. UNICODEko UTF-8 kodetze-modua erabiliena da gaur egunean. Munduan zehar erabiltzen diren alfabeto guztiak erabiltzeko aukera ematen du (Latindar alfabetoa, grekoak, ziriliko‎, arabiarra, ... Lehenago karaktere latinoentzat erabiltzen zen ASCII karaktere multzoan oinarrituta dago, hizkuntza guztien karaktereak kodetzea ahalbidetzearren 16 biteko eredu bat hartu zuen hasieran, kontrol-kodeak edo ihes-sekuentziak sartu beharrik gabe. * Txinerako Yue karakterea (U+6708) * * "Aum" (ॐ) (U+0950) (eu) Unicode es un estándar de codificación de caracteres diseñado para facilitar el tratamiento informático, transmisión, y visualización de textos de numerosos idiomas y disciplinas técnicas, además de textos clásicos de lenguas muertas. El término Unicode proviene de los tres objetivos perseguidos: universalidad, uniformidad, y unicidad.​ (es) Is córas stórála sonraí agus caighdeán i dtionscal na ríomhaireachta é Unicode. Úsáidtear dhá bheart le haghaidh carachtair a stóráil. Tá an córas seo ag teacht i gcomharbacht, nach mór, ar ASCII. Is féidir 65,536 luach éagsúil a stóráil in dhá bheart. Ciallaíonn sé seo gur féidir na carachtair ar fad in aibítrí an domhain a stóráil tríd an gcóras Unicode. Cuireadh an caighdeán i bhfeidhm i dteicneolaíochtaí nua ar nós XML, Java agus córais oibriúcháin nua-aimseartha. Tugann Unicode sainmhíniú ar dhá mhodh mapála: (ga) Unicode adalah suatu standar teknis yang dirancang untuk mengizinkan teks dan simbol dari semua sistem tulisan di dunia untuk ditampilkan dan dimanipulasi secara konsisten oleh komputer. Dikembangkan secara tandem dengan standar dan dipublikasikan dalam bentuk buku The Unicode Standard. Unicode mengandung suatu kumpulan , suatu metodologi dan kumpulan standar penyandian karakter, suatu kumpulan bagan kode untuk referensi visual, deskripsi sifat karakter seperti huruf besar dan huruf kecil, suatu kumpulan data referensi berkas komputer, serta aturan normalisasi, dekomposisi, pembandingan (collation), serta penggambaran (rendering). (in) Unicode est un standard informatique qui permet des échanges de textes dans différentes langues, à un niveau mondial. Il est développé par le Consortium Unicode, qui vise au codage de texte écrit en donnant à tout caractère de n'importe quel système d'écriture un nom et un identifiant numérique, et ce de manière unifiée, quels que soient la plateforme informatique ou le logiciel utilisé. Ce standard est lié à la norme ISO/CEI 10646 qui décrit une table de caractères équivalente. La dernière version, Unicode 15.0, a été publiée en septembre 2022. Tables Unicode (plan 0) (fr) Unicode, formally The Unicode Standard, is an information technology standard for the consistent encoding, representation, and handling of text expressed in most of the world's writing systems. The standard, which is maintained by the Unicode Consortium, defines as of the current version (15.0) 149,186 characters covering 161 modern and historic scripts, as well as symbols, emoji (including in colors), and non-visual control and formatting codes. (en) Unicode is een internationale standaard (nauw samenhangend met ISO-10646) voor de codering van grafische tekens en symbolen in binaire codes, vergelijkbaar met de ASCII-standaard. De standaard voorziet alle tekens van alle geschreven talen van een naam (in de standaard in hoofdletters geschreven) en een nummer (vaak hexadecimaal geschreven, voorafgegaan door U+). Er is bijvoorbeeld het teken LATIN CAPITAL LETTER A met nummer U+0041 (65), los van de lettertypes waarin het weergegeven kan worden. De grafische weergave per lettertype behoort niet tot de standaard. (nl) Unicode (formalnie Unicode Standard, pol. Unikod) – komputerowy standard kodowania zestawu znaków obejmującego litery większości używanych na świecie pism, a także symboli, emoji i kodów formatowania. Standard Unicode rozwijany jest przez konsorcjum Unicode, składające się z firm wytwarzających sprzęt komputerowy, producentów oprogramowania oraz instytutów naukowych, agencji międzynarodowych i grup użytkowników. Konsorcjum współpracuje z organizacją ISO. (pl) Unicode é um padrão que permite aos computadores representar e manipular, de forma consistente, texto de qualquer sistema de escrita existente. Publicado no livro The Unicode Standard, o padrão consiste de quase 138 mil caracteres, um conjunto de diagramas de códigos para referência visual, uma metodologia para codificação e um conjunto de codificações padrões de caracteres, uma enumeração de propriedades de caracteres como caixa alta e caixa baixa, um conjunto de arquivos de computador com dados de referência, além de regras para normalização, decomposição, ordenação alfabética e renderização. (pt) Unicode är en branschstandard för hur datorer ska hantera text skriven i olika skriftsystem. Unicode är utvecklad tillsammans med den internationella standarden Universal Coded Character Set och publicerad på internet och i bokform. Unicode består av en repertoar med fler än 100 000 skrivtecken. Ett av de viktigaste målen är att alla tecken i världens alla skriftsystem ska finnas med: bokstäver, kinesiska tecken, siffror, skiljetecken, matematiska symboler, och så vidare. Unicode består även av ett antal metoder för att lagra tecknen i datorer, bland annat UTF-8 och UTF-16. Även en serie teckenegenskaper definieras, som exempelvis: huruvida ett tecken är en bokstav, siffra, skiljetecken, om en bokstav är en versal eller gemen, med mera. Unicode ger även en beskrivning hur normalisering ska (sv) Юнико́д (англ. Unicode) — стандарт кодирования символов, включающий в себя знаки почти всех письменных языков мира. В настоящее время стандарт является преобладающим в Интернете. Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (англ. Unicode Consortium, Unicode Inc.). Применение этого стандарта позволяет закодировать очень большое число символов из разных систем письменности: в документах, закодированных по стандарту Юникод, могут соседствовать китайские иероглифы, математические символы, буквы греческого алфавита, латиницы и кириллицы, символы музыкальной нотной нотации, при этом становится ненужным переключение кодовых страниц. (ru) Unicode,全稱為Unicode標準(The Unicode Standard),其官方機構Unicode聯盟所用的中文名称为統一碼,又译作萬國碼、統一字元碼、统一字符编码,是信息技术領域的業界標準,其整理、編碼了世界上大部分的文字系統,使得電腦能以通用劃一的字元集來處理和顯示文字,不但減輕在不同編碼系統間切換和轉換的困擾,更提供了一種跨平臺的亂碼問題解決方案。Unicode由非營利機構Unicode聯盟(Unicode Consortium)負責維護,該機構致力讓Unicode標準取代既有的字符編碼方案。尤其既有方案的編碼空間有限,亦不適用於多語環境。 Unicode伴隨著通用字符集ISO/IEC 10646的標準而發展,同時也以書本的形式對外發表。Unicode至今仍在不斷增修,每個新版本都加入更多新的字符。目前最新的版本為2022年9月公布的15.0.0,已經收錄超過14萬個字符(第十萬個字符在2005年獲採納)。Unicode標準不僅僅只是為文字指定代碼。除了涵蓋視覺上的字形、編碼方法、標準的字符編碼资料外,聯盟官方出版品還包含了關於各書寫系統的細節及呈現方式,如規格化的準則、拆分、定序、繪製、雙向文本顯示、书写方向、字符特性(如大小寫字母)等等。此外還提供參考資料和視覺圖像,以幫助開發者和設計師正確應用標準。 (zh)
rdfs:label Unicode (en) الترميز الموحد (ar) Unicode (ca) Unicode (cs) Unicode (de) Unicode (el) Unikodo (eo) Unicode (es) Unicode (eu) Unicode (ga) Unicode (in) Unicode (fr) Unicode (it) Unicode (ja) 유니코드 (ko) Unicode (nl) Unicode (pl) Юникод (ru) Unicode (pt) Unicode (sv) Unicode (zh) Юнікод (uk)
rdfs:seeAlso dbr:UTF-8 dbr:Unicode_normalization dbr:Universal_Character_Set_characters
owl:sameAs freebase:Unicode freebase:Unicode http://sw.cyc.com/concept/Mx4rv6pxRpwpEbGdrcN5Y29ycA yago-res:Unicode http://d-nb.info/gnd/4343497-6 dbpedia-commons:Unicode wikidata:Unicode dbpedia-af:Unicode dbpedia-als:Unicode http://am.dbpedia.org/resource/ዩኒኮድ dbpedia-ar:Unicode http://ast.dbpedia.org/resource/Unicode dbpedia-az:Unicode dbpedia-bar:Unicode dbpedia-be:Unicode dbpedia-bg:Unicode http://bn.dbpedia.org/resource/ইউনিকোড dbpedia-br:Unicode http://bs.dbpedia.org/resource/Unicode dbpedia-ca:Unicode http://ckb.dbpedia.org/resource/یوونیکۆد dbpedia-cs:Unicode http://cv.dbpedia.org/resource/Юникод dbpedia-cy:Unicode dbpedia-da:Unicode dbpedia-de:Unicode dbpedia-el:Unicode dbpedia-eo:Unicode dbpedia-es:Unicode dbpedia-et:Unicode dbpedia-eu:Unicode dbpedia-fa:Unicode dbpedia-fi:Unicode dbpedia-fr:Unicode dbpedia-ga:Unicode dbpedia-gl:Unicode http://gu.dbpedia.org/resource/યુનિકોડ dbpedia-he:Unicode http://hi.dbpedia.org/resource/यूनिकोड dbpedia-hr:Unicode dbpedia-hu:Unicode http://hy.dbpedia.org/resource/Յունիկոդ http://ia.dbpedia.org/resource/Unicode dbpedia-id:Unicode dbpedia-is:Unicode dbpedia-it:Unicode dbpedia-ja:Unicode http://jv.dbpedia.org/resource/Unicode dbpedia-ka:Unicode dbpedia-kk:Unicode http://kn.dbpedia.org/resource/ಯುನಿಕೋಡ್ dbpedia-ko:Unicode dbpedia-ku:Unicode http://ky.dbpedia.org/resource/Юникод dbpedia-la:Unicode http://lt.dbpedia.org/resource/Unikodas http://lv.dbpedia.org/resource/Unikods dbpedia-mk:Unicode http://ml.dbpedia.org/resource/യൂണികോഡ് http://mn.dbpedia.org/resource/Юникод dbpedia-mr:Unicode dbpedia-ms:Unicode http://my.dbpedia.org/resource/ယူနီကုဒ် dbpedia-nds:Unicode http://ne.dbpedia.org/resource/युनिकोड http://new.dbpedia.org/resource/युनिकोड dbpedia-nl:Unicode dbpedia-nn:Unicode dbpedia-no:Unicode dbpedia-oc:Unicode http://pa.dbpedia.org/resource/ਯੂਨੀਕੋਡ dbpedia-pl:Unicode dbpedia-pt:Unicode dbpedia-ro:Unicode dbpedia-ru:Unicode http://sa.dbpedia.org/resource/युनिकोड http://sah.dbpedia.org/resource/Юникод http://sco.dbpedia.org/resource/Unicode dbpedia-sh:Unicode http://si.dbpedia.org/resource/යුනිකෝඩ් dbpedia-simple:Unicode dbpedia-sk:Unicode dbpedia-sl:Unicode dbpedia-sq:Unicode dbpedia-sr:Unicode http://su.dbpedia.org/resource/Unicode dbpedia-sv:Unicode dbpedia-sw:Unicode http://ta.dbpedia.org/resource/ஒருங்குறி http://te.dbpedia.org/resource/యూనికోడ్ http://tg.dbpedia.org/resource/Юникод dbpedia-th:Unicode http://tl.dbpedia.org/resource/Unicode dbpedia-tr:Unicode dbpedia-uk:Unicode http://ur.dbpedia.org/resource/یونیکوڈ http://uz.dbpedia.org/resource/Unicode dbpedia-vi:Unicode http://wa.dbpedia.org/resource/Unicôde http://yi.dbpedia.org/resource/יוניקאד dbpedia-yo:Unicode dbpedia-zh:Unicode https://global.dbpedia.org/id/52xEf
prov:wasDerivedFrom wikipedia-en:Unicode?oldid=1124795833&ns=0
foaf:depiction wiki-commons:Special:FilePath/Cyrillic_cursive.svg wiki-commons:Special:FilePath/23a-Lam-Alif.svg wiki-commons:Special:FilePath/Hiero_O4.png wiki-commons:Special:FilePath/JanaSanskritSans_ddhrya.svg wiki-commons:Special:FilePath/New_Unicode_logo.svg wiki-commons:Special:FilePath/Unicode_sample.png
foaf:isPrimaryTopicOf wikipedia-en:Unicode
is dbo:knownFor of dbr:Mark_Davis_(Unicode) dbr:Komeil_Bahmanpour
is dbo:wikiPageRedirects of dbr:Brakcet dbr:UniCode dbr:Unicode.org dbr:Unicode_1 dbr:Unicode_1.0 dbr:Unicode_1.0.0 dbr:Unicode_1.0.1 dbr:Unicode_1.1 dbr:Unicode_1.1.0 dbr:Unicode_10 dbr:Unicode_10.0 dbr:Unicode_10.0.0 dbr:Unicode_11 dbr:Unicode_11.0 dbr:Unicode_11.0.0 dbr:Unicode_12 dbr:Unicode_12.0 dbr:Unicode_12.0.0 dbr:Unicode_12.1 dbr:Unicode_12.1.0 dbr:Unicode_13 dbr:Unicode_13.0 dbr:Unicode_13.0.0 dbr:Unicode_14 dbr:Unicode_14.0 dbr:Unicode_14.0.0 dbr:Unicode_15 dbr:Unicode_15.0 dbr:Unicode_15.0.0 dbr:Unicode_2 dbr:Unicode_2.0 dbr:Unicode_2.0.0 dbr:Unicode_2.1 dbr:Unicode_2.1.0 dbr:Unicode_3 dbr:Unicode_3.0 dbr:Unicode_3.0.0 dbr:Unicode_3.1 dbr:Unicode_3.1.0 dbr:Unicode_3.2 dbr:Unicode_3.2.0 dbr:Unicode_4 dbr:Unicode_4.0 dbr:Unicode_4.0.0 dbr:Unicode_4.1 dbr:Unicode_4.1.0 dbr:Unicode_5 dbr:Unicode_5.0 dbr:Unicode_5.0.0 dbr:Unicode_5.1 dbr:Unicode_5.1.0 dbr:Unicode_5.2 dbr:Unicode_5.2.0 dbr:Unicode_6 dbr:Unicode_6.0 dbr:Unicode_6.0.0 dbr:Unicode_6.1 dbr:Unicode_6.1.0 dbr:Unicode_6.2 dbr:Unicode_6.2.0 dbr:Unicode_6.3 dbr:Unicode_6.3.0 dbr:Unicode_7 dbr:Unicode_7.0 dbr:Unicode_7.0.0 dbr:Unicode_8 dbr:Unicode_8.0 dbr:Unicode_8.0.0 dbr:Unicode_88 dbr:Unicode_9 dbr:Unicode_9.0 dbr:Unicode_9.0.0 dbr:Unicode_Standard dbr:Unicode_Transformation_Format dbr:Unicode_pipeline dbr:The_Unicode_Standard dbr:The_Unicode_Bulldog_Award dbr:Multilingual_European_subsets dbr:Script_Encoding_Initiative dbr:Unicode_anomaly dbr:Uni-code dbr:Unicode_1.1.5 dbr:Unicode_2.1.2 dbr:Unicode_2.1.5 dbr:Unicode_2.1.8 dbr:Unicode_2.1.9 dbr:Unicode_3.0.1 dbr:Unicode_3.1.1 dbr:Unicode_4.0.1 dbr:Unicode_Transformation_Formats dbr:Unicode_alias dbr:Unicode_code_points dbr:Unicode_roadmap dbr:Unicode_versions dbr:U+ dbr:Yunicode dbr:UNICODE dbr:Unicode_Bulldog_Award dbr:Unicode_Character_Set dbr:Unicode_Pipeline dbr:Unicode_Version_History dbr:Unicode_code_point dbr:Unicode_codepoint dbr:Unicode_notation dbr:Unicode_transformation_format dbr:Bulldog_Award dbr:Multilingual_European_subset dbr:MES-1 dbr:MES-2
is dbo:wikiPageWikiLink of dbr:C_string_handling dbr:Caduceus dbr:Cambrian dbr:Canto_(news_aggregator) dbr:Capella_(notation_program) dbr:Cardfile dbr:Caret dbr:Carian_alphabets dbr:Caron dbr:Belarusian_alphabet dbr:Bell_character dbr:Bengali_input_methods dbr:Bengali–Assamese_script dbr:Potawatomi_language dbr:Pound_sign dbr:PowerShell dbr:Pracalit_script dbr:Prehistoric_counting dbr:Presentation_(software) dbr:Project_Madurai dbr:Puddletag dbr:Punctuation dbr:PyQt dbr:PyScripter dbr:Python_(programming_language) dbr:Q.E.D. dbr:QBittorrent dbr:QWERTY dbr:Qmodem dbr:QuarkXPress dbr:Queen_of_Sheba dbr:Question_mark dbr:Quiet_Internet_Pager dbr:Rod_of_Asclepius dbr:Roman_numerals dbr:Romanian_language dbr:Romanization_of_Ukrainian dbr:Rook_(chess) dbr:Rostest dbr:Rotated_letter dbr:Rough_breathing dbr:Ruble_sign dbr:Ruby_(programming_language) dbr:Samaritan_script dbr:Sanskrit dbr:Saurashtra_script dbr:Scale_(map) dbr:Scheme_(programming_language) dbr:Schwa dbr:SciTE dbr:Scientific_transliteration_of_Cyrillic dbr:Scintilla_(software) dbr:Brakcet dbr:Elbasan_(Unicode_block) dbr:Elbasan_script dbr:Elder_Futhark dbr:Elfdalian_alphabet dbr:Enclosed_Alphanumeric_Supplement dbr:Enclosed_CJK_Letters_and_Months dbr:Enclosed_Ideographic_Supplement dbr:End-of-Transmission_character dbr:Engineering_drawing_abbreviations_and_symbols dbr:List_of_XML_and_HTML_character_entity_references dbr:List_of_binary_codes dbr:List_of_computer_standards dbr:List_of_computing_and_IT_abbreviations dbr:List_of_cuneiform_signs dbr:List_of_file_formats dbr:MULE dbr:Miao_(Unicode_block) dbr:Micro- dbr:Misha_(Mandaeism) dbr:Mitre dbr:Modi_(Unicode_block) dbr:Mojibake dbr:Monocular_O dbr:Mork_(file_format) dbr:Multani_(Unicode_block) dbr:Musical_Symbols_(Unicode_block) dbr:N'Ko_script dbr:N_(kana) dbr:Nabla_symbol dbr:National_Language_Promotion_Department dbr:Nga_(Javanese) dbr:Numeric_character_reference dbr:Lê_Duy_Cận dbr:Lām_with_bar dbr:M3U dbr:MARC-8 dbr:MUD_client dbr:Mac_OS_Armenian dbr:Mac_OS_Central_European_encoding dbr:Mac_OS_Georgian dbr:Mac_OS_Gujarati dbr:Mac_OS_Gurmukhi dbr:Mac_OS_Inuit dbr:Meetei_Mayek_(Unicode_block) dbr:Meetei_Mayek_Extensions dbr:Meiryo dbr:Mende_Kikakui_(Unicode_block) dbr:Mende_Kikakui_script dbr:Menksoft dbr:Menksoft_Mongolian_IME dbr:Mensural_notation dbr:Meroitic_Cursive_(Unicode_block) dbr:Meroitic_Hieroglyphs_(Unicode_block) dbr:Mesoamerican_writing_systems dbr:Meteg dbr:Monus dbr:Religious_and_political_symbols_in_Unicode dbr:Sixteenth_note dbr:Supplemental_Arrows-A dbr:Ye_with_grave dbr:Š dbr:On_Beyond_Zebra! dbr:Open-source_Unicode_typefaces dbr:Patriarchal_cross dbr:Table_of_General_Standard_Chinese_Characters dbr:Universal_quantification dbr:Programming_Perl dbr:ThaiURL dbr:Variation_Selectors_Supplement dbr:Basic_Latin_(Unicode_block) dbr:Basmala dbr:Bassa_Vah_script dbr:Batak_(Unicode_block) dbr:Batak_script dbr:Batch_file dbr:Baudot_code dbr:Baybayin dbr:BeOS dbr:Bengali_(Unicode_block) dbr:Bengali_alphabet dbr:Benzene dbr:Bhaiksuki_script dbr:Biangbiang_noodles dbr:BibTeX dbr:Biber_(LaTeX) dbr:Bicycle dbr:Big5 dbr:Binary-coded_decimal dbr:Binary_code dbr:Bishop_(chess) dbr:Bitcoin dbr:Blackletter dbr:Blitz_BASIC dbr:Boo_(programming_language) dbr:Bopomofo dbr:Bopomofo_(Unicode_block) dbr:Bopomofo_Extended dbr:Box-drawing_character dbr:Bracket dbr:Brahmi_script dbr:Brahmic_scripts dbr:Braille dbr:Brazilian_cruzeiro_(1942–1967) dbr:Decimal_separator dbr:Degree_symbol dbr:DejaVu_fonts dbr:Deseret_alphabet dbr:Devanagari dbr:Allah dbr:Allography dbr:Anusvara dbr:AppLocale dbr:Apple_Color_Emoji dbr:Apple_File_System dbr:Apple_Filing_Protocol dbr:Apple_Symbols dbr:Apple_Type_Services_for_Unicode_Imaging dbr:Apple_keyboards dbr:Arabic_(Unicode_block) dbr:Arabic_Extended-A dbr:Arabic_Extended-B dbr:Arabic_Extended-C dbr:Arabic_Mathematical_Alphabetic_Symbols dbr:Arabic_Presentation_Forms-A dbr:Arabic_Supplement dbr:Arabic_letter_frequency dbr:Arabic_letter_mark dbr:Arabic_numeral_variations dbr:Arabic_numerals dbr:Aramaic_alphabet dbr:Arbortext_Advanced_Print_Publisher dbr:History_of_the_Cherokee_language dbr:Hmong_Americans dbr:Hmong_language dbr:Hokkien dbr:Hollywood_(programming_language) dbr:Homoglyph dbr:Hong_Kong_Supplementary_Character_Set dbr:Horn_(diacritic) dbr:Horn_of_Africa dbr:Hungarian_language dbr:Hunspell dbr:Hyphen-minus dbr:Julia_(programming_language) dbr:Beta_Code dbr:Bhaiksuki_(Unicode_block) dbr:Bible_translations_into_Burmese dbr:Bible_translations_into_Hindi_and_Urdu dbr:Bible_translations_into_the_languages_of_China dbr:List_of_Cyrillic_letters dbr:List_of_Japanese_typographic_symbols dbr:List_of_QWERTY_keyboard_language_variants dbr:List_of_Unicode_characters dbr:List_of_archive_formats dbr:List_of_emoticons dbr:List_of_gravitationally_rounded_objects_of_the_Solar_System dbr:List_of_mathematical_symbols_by_subject dbr:List_of_writing_systems dbr:Litecoin dbr:Litre dbr:Paul_Halmos dbr:Pe_(Semitic_letter) dbr:Peace_symbols dbr:Peach_emoji dbr:Pentagram dbr:Per_mille dbr:Per_sign dbr:Percent_sign dbr:Perl dbr:Perl_5_version_history dbr:Perl_Compatible_Regular_Expressions dbr:Persian_alphabet dbr:Perso-Arabic_Script_Code_for_Information_Interchange dbr:Personal_Ancestral_File dbr:Pe̍h-ōe-jī dbr:Registered_trademark_symbol dbr:Regular_expression dbr:Reiwa dbr:Relational_algebra dbr:Resh dbr:Resource_Description_Framework dbr:Reversed_half_H dbr:Rhythmbox dbr:Rich_Text_Format dbr:Ring_(diacritic) dbr:Character_(computing) dbr:Character_Map_(Windows) dbr:Character_encoding dbr:Charis_SIL dbr:Cubic_metre dbr:Cultural_depictions_of_dinosaurs dbr:Cultural_influence_of_Star_Trek dbr:Cuneiform_(Unicode_block) dbr:Cuneiform_Numbers_and_Punctuation dbr:Currency_Symbols_(Unicode_block) dbr:Cypriot_Syllabary_(Unicode_block) dbr:Cypriot_syllabary dbr:Cypro-Minoan_(Unicode_block) dbr:Cypro-Minoan_syllabary dbr:Cyrillic_(Unicode_block) dbr:Cyrillic_Extended-A dbr:Cyrillic_Extended-B dbr:Cyrillic_Extended-C dbr:Cyrillic_Extended-D dbr:Cyrillic_Supplement dbr:Cyrillic_script_in_Unicode dbr:D'Alembert_operator dbr:D-comma dbr:DBCS dbr:DGCA_(computing) dbr:DICT dbr:DIN_91379 dbr:Da_(Javanese) dbr:Dagesh dbr:UTF-1 dbr:UTF-16 dbr:UTF-7 dbr:UTF-8 dbr:UTF-EBCDIC dbr:Uilta_language dbr:Uk_(Cyrillic) dbr:Ukrainian_alphabet dbr:Ukrainian_hryvnia dbr:UltraEdit dbr:Underscore dbr:UniCode dbr:Unicode.org dbr:Unicode_1 dbr:Unicode_1.0 dbr:Unicode_1.0.0 dbr:Unicode_1.0.1 dbr:Unicode_1.1 dbr:Unicode_1.1.0 dbr:Unicode_10 dbr:Unicode_10.0 dbr:Unicode_10.0.0 dbr:Unicode_11 dbr:Unicode_11.0 dbr:Unicode_11.0.0 dbr:Unicode_12 dbr:Unicode_12.0 dbr:Unicode_12.0.0 dbr:Unicode_12.1 dbr:Unicode_12.1.0 dbr:Unicode_13 dbr:Unicode_13.0 dbr:Unicode_13.0.0
is dbp:affectedSoftware of dbr:Trojan_Source
is dbp:fileFormat of dbr:AssemblyScript
is dbp:knownFor of dbr:Mark_Davis_(Unicode)
is dbp:next of dbr:Windows_code_page
is dbp:special of dbr:Table_of_mathematical_symbols_by_introduction_date
is dbp:standard of dbr:Sketch_Engine
is dbp:style of dbr:GNU_Unifont
is gold:hypernym of dbr:Latin-1_Supplement_(Unicode_block) dbr:Specials_(Unicode_block) dbr:Tamil_All_Character_Encoding
is rdfs:seeAlso of dbr:Islamic_honorifics dbr:Radical_(Chinese_characters) dbr:Yiddish_orthography
is foaf:primaryTopic of wikipedia-en:Unicode