Byte order mark (original) (raw)
علامة ترتيب البايتات (BOM) هي علامة يونيكود لتحديد ترتيب تخزين أو إرسال المعلومات التي تتطلب أكثر من بايت لتخزنها. ولها الرمز U+FEFF.
Property | Value |
---|---|
dbo:abstract | BOM (Byte order mark, česky přibližně „označení pořadí bajtů“) je znak hexadecimálně zapsaný jako FEFF (v desítkové soustavě 65279). V kódování UTF-8 je tento znak reprezentován trojicí bajtů 0xEF 0xBB 0xBF („UTF-8 signatura“), v kódování UTF-16 big-endian dvojicí bajtů 0xFE 0xFF a v UTF-16 little-endian 0xFF 0xFE. Grafický význam znaku je „nedělitelná mezera nulové šířky“ (zero-width no-break space), je tak podobný znaku U+2060 (word joiner). Hlavním důvodem užití tohoto znaku je rozlišení pořadí ukládání bajtů big-endian nebo little-endian v UTF-16 a odlišení samotného UTF-16 od UTF-8. V případě záměny pořadí bajtů není znak U+FFFE platný Unicode znak, navíc v kódování UTF-8 se bajty 0xFE a 0xFF nesmí vyskytovat. Užití BOM v UTF-8 je pro účel rozpoznání pořadí ukládání bajtů nadbytečné, nicméně mnohé aplikace operačního systému Microsoft Windows používají tento znak na začátku souboru pro rozlišení souborů uložených ve formátu UTF-8. V některých systémech ( např. POSIX) není tato signatura používána. Používání nebo nepoužívání BOM může být zdrojem problémů. Například Internet Explorer verze 6 u souborů HTML s BOM na začátku zobrazoval netisknutelné znaky před samotným obsahem HTML. (cs) علامة ترتيب البايتات (BOM) هي علامة يونيكود لتحديد ترتيب تخزين أو إرسال المعلومات التي تتطلب أكثر من بايت لتخزنها. ولها الرمز U+FEFF. (ar) The byte order mark (BOM) is a particular usage of the special Unicode character, U+FEFF BYTE ORDER MARK, whose appearance as a magic number at the start of a text stream can signal several things to a program reading the text: * The byte order, or endianness, of the text stream in the cases of 16-bit and 32-bit encodings; * The fact that the text stream's encoding is Unicode, to a high level of confidence; * Which Unicode character encoding is used. BOM use is optional. Its presence interferes with the use of UTF-8 by software that does not expect non-ASCII bytes at the start of a file but that could otherwise handle the text stream. Unicode can be encoded in units of 8-bit, 16-bit, or 32-bit integers. For the 16- and 32-bit representations, a computer receiving text from arbitrary sources needs to know which byte order the integers are encoded in. The BOM is encoded in the same scheme as the rest of the document and becomes a noncharacter Unicode code point if its bytes are swapped. Hence, the process accessing the text can examine these first few bytes to determine the endianness, without requiring some contract or metadata outside of the text stream itself. Generally the receiving computer will swap the bytes to its own endianness, if necessary, and would no longer need the BOM for processing. The byte sequence of the BOM differs per Unicode encoding (including ones outside the Unicode standard such as UTF-7, see ), and none of the sequences is likely to appear at the start of text streams stored in other encodings. Therefore, placing an encoded BOM at the start of a text stream can indicate that the text is Unicode and identify the encoding scheme used. This use of the BOM character is called a "Unicode signature". (en) Als Byte Order Mark (BOM; deutsch Byte-Reihenfolge-Markierung) wird eine charakteristische Bytefolge am Anfang eines Datenstroms bezeichnet, die das Unicode-Zeichen U+FEFF (englisch zero width no-break space) kodiert. Diese Bytefolge dient als Kennung zur Definition der Byte-Reihenfolge und Kodierungsform in UCS/Unicode-Zeichenketten, insbesondere Textdateien. (de) En Unicode, la marca de orden de bytes (del idioma inglés "byte order mark" o BOM) es un dato que indica el uso de una codificación Unicode, así como el orden de los bytes, que generalmente se encuentra al principio de algunos archivos de texto. Técnicamente, es un carácter Unicode cuyo (code point o code position, en idioma inglés) es U+FEFF (espacio sin salto de línea de ancho cero o zero-width no-break space en idioma inglés), el cual se utiliza para marcar cuál es la posición de mayor o menor valor (endianness) de una cadena del Conjunto de Caracteres Universal ISO/IEC 10646 (en inglés Universal Character Set o UCS) o Unicode ya sea en UTF-16 o y/o como un marcador para indicar que el texto está codificado en UTF-8, UTF-16 o UTF-32. El término oficial para este carácter en la versión francesa de ISO/IEC 10646 (que es la contraparte de Unicode ISO) es marca de orden de bytes (BOM). Cuando se interpreta correctamente, el usuario final del texto codificado no ve el BOM. Sin embargo, hay dos casos donde este carácter puede ser mal interpretado: * En el caso de que se considere una versión antigua de Unicode, este carácter es invisible y que no se muestra al usuario. * En el caso de un texto Unicode UTF-8 mostrado con una codificación incorrecta (es decir, la codificación utilizada no es la que debe usarse), el usuario hallará al comienzo de la página o texto una breve secuencia de caracteres incomprensibles sin significado (en particular con la codificación ISO/IEC 8859-1). En este caso los siguientes tres caracteres aparecen al principio del texto:Debido a que la codificación utilizada no es la especificada, algunos caracteres regionales o acentuados no se muestran correctamente en el resto del texto. La marca de orden de bytes de la mayoría de las codificaciones Unicode es una secuencia de pocos bytes que puede aparecer como una secuencia inusual de caracteres si el software que se usa para leer el texto está mal configurado o como un espacio si el software que se usa para leer el texto no reconoce este indicador. Si una marca de orden de bytes se interpreta erróneamente como un carácter dentro del texto, será invisible porque es un espacio sin interrupción de ancho cero (es decir, un zero-width no-break space). El uso del carácter U+FEFF como un espacio sin interrupción de ancho cero, (es decir, como un espacio duro) se ha vuelto obsoleto en la versión Unicode 3.2, la cual proporciona el carácter U+2060 como alternativa para este uso específico. Por lo tanto, este carácter debe usarse solo como un marca de orden de bytes. (es) En Unicode, l'indicateur d'ordre des octets ou BOM (pour l'anglais byte order mark) est une donnée qui indique l'utilisation d'un encodage unicode ainsi que l'ordre des octets, généralement situé au début de certains fichiers texte. Techniquement, il s'agit d'un caractère Unicode de point de code U+FEFF (espace insécable sans chasse ou en anglais zero-width no-break space), quand ce caractère est utilisé pour marquer l'endianness (boutisme) d'une chaîne de caractères UCS/Unicode codée en UTF-16 ou UTF-32 et/ou comme marqueur pour indiquer que le texte est codé en UTF-8, UTF-16 ou UTF-32. Le terme officiel dans la version française de l'ISO/CEI 10646, qui est le pendant ISO d'Unicode, de ce caractère est indicateur d'ordre des octets (IOO). Lorsqu'il est correctement interprété, l'IOO n'est pas vu par l'utilisateur final du texte codé.Il existe cependant deux cas où ce caractère peut être mal interprété : * Dans le cas où une version Unicode plus ancienne est considérée, ce caractère est un caractère invisible qui n'est pas affiché à l'utilisateur. * Dans le cas d'un texte Unicode UTF-8 affiché avec un mauvais encodage (c'est-à-dire que l'encodage utilisé n'est pas celui qui devrait être utilisé), l'utilisateur est confronté en début de page/texte à une courte séquence incompréhensible de caractères sans signification : en particulier avec l'encodage ISO/CEI 8859-1, les trois caractères  apparaissent au début de texte. Du fait que l'encodage utilisé n'est pas le bon, certains caractères régionaux ou accentués ne sont alors pas non plus affichés correctement dans la suite du texte. L'indicateur d'ordre des octets de la plupart des codages Unicode est une séquence de quelques octets qui peut apparaître comme une obscure séquence de caractères si le logiciel utilisé pour lire le texte est mal configuré ou comme une espace si le logiciel utilisé pour lire le texte ne sait pas reconnaître cet indicateur. Si un indicateur d'ordre des octets est interprété à tort comme un caractère à l'intérieur du texte, alors il sera invisible en raison du fait que c'est une espace insécable sans chasse (c'est-à-dire de largeur nulle). L'utilisation du caractère U+FEFF comme une espace insécable sans chasse, autrement dit en tant que gluon de mot, a été rendue obsolète dans la version Unicode 3.2, qui fournit une alternative U+2060 pour cette utilisation. Ce caractère doit donc être utilisé seulement en tant qu'indicateur d'ordre des octets. (fr) 바이트 순서 표시(Byte Order Mark, BOM)는 유니코드 문자 U+FEFF byte order mark로, 매직 넘버로서 문서의 가장 앞에 추가하여 텍스트를 읽는 프로그램에 여러 정보를 전달할 수 있다. * 16비트 혹은 32비트 인코딩의 경우, 문서의 바이트 순서 또는 엔디언 * 문서의 인코딩이 거의 확실히 유니코드임 * 문서에 사용한 유니코드 문자 인코딩 방식 BOM을 반드시 사용할 필요는 없으며, 사용할 경우 문서의 가장 앞에 등장해야 한다. 유니코드는 8비트, 16비트 혹은 32비트 정수 단위로 인코딩할 수 있다. 16비트 및 32비트 표현의 경우, 알 수 없는 출처로부터 텍스트를 읽는 컴퓨터는 데이터를 어떤 바이트 순서로 인코딩했는지 알아야 한다. BOM은 문서의 나머지 부분과 같은 방식으로 인코딩되며 바이트 순서가 바뀔 경우 비문자인 유니코드 코드 포인트가 되므로, 이 텍스트를 읽는 프로세스는 문서 외적인 정보 없이도 처음 몇 바이트를 검사함으로써 엔디언을 확인할 수 있다. 이후 수신자는 필요할 경우 바이트 순서를 자신의 엔디안에 맞게 바꾸며, 이 이후의 처리에는 더 이상 BOM이 필요하지 않다. BOM의 바이트열은 유니코드 인코딩마다 다르며, 이들이 다른 인코딩으로 저장된 문서의 가장 앞에 등장할 가능성은 적다. 그러므로, 문서의 가장 앞에 인코딩된 BOM을 추가함으로써 텍스트가 유니코드임을 나타내고 그 인코딩 방식을 명시할 수 있다. BOM 문자를 이 방식으로 사용하는 것을 "유니코드 시그니처"라 한다. (ko) バイト順マーク (バイトじゅんマーク、英: byte order mark) あるいはバイトオーダーマークとは、通称BOM(ボム)といわれるUnicodeの符号化形式で符号化したテキストの先頭につける数バイトのデータのことである。このデータを元にUnicodeで符号化されていることおよび符号化の種類の判別に使用する。 (ja) Il Byte Order Mark (BOM) è una piccola sequenza di byte che viene posizionata all'inizio di un flusso di dati di puro testo, tipicamente un file, per indicarne il tipo di codifica Unicode. I byte da usare nelle intestazioni delle varie codifiche sono i seguenti: (it) A marca de ordem de byte (BOM) é um caractere Unicode usado para denotar a extremidade (ordem de bytes) de um arquivo de texto ou fluxo de dados, cujo código é U+FEFF. Seu uso é opcional e, se usado, deve aparecer no começo do fluxo de texto. Além do seu uso tradicional, esse caractere também pode indicar em qual das diferentes representações Unicode o texto está codificado. Tendo em vista que o Unicode pode ser codificado tanto em 16 quanto 32 bits, o leitor de texto Unicode deve saber em que formato o texto que está sendo lido está codificado. (pt) BOM (ang. Byte Order Mark), znacznik kolejności bajtów – znak niedrukowalny używany w wielobajtowym kodowaniu znaków, który jest zapisywany na początku strumienia bajtów (pliku) i informuje, w jakiej kolejności należy ustawić bajty, aby odczytać kod znaku. BOM rozwiązuje problem interpretacji kolejności bajtów w znaku i umożliwia automatyczną detekcję kodowania UTF-8, UTF-16LE, UTF-16BE, UTF-32LE oraz UTF-32BE. (pl) Маркер последовательности байтов или метка порядка байтов (англ. Byte Order Mark, BOM) — специальный символ из стандарта Юникод, вставляемый в начало текстового файла или потока для обозначения того, что в файле (потоке) используется Юникод, а также для косвенного указания кодировки и порядка байтов, с помощью которых символы Юникода были закодированы. Номер этого символа в стандарте Юникод — U+FEFF. Использование этого символа, согласно спецификации Юникод, не является обязательным, однако оно широко распространено, так как позволяет легко избежать неверного декодирования текстовой информации. (ru) En BOM (Byte order mark) är ett specialtecken (kodpunkt) i Unicode (teckenkodning för datorer). Den används i första hand för att markera om en fil med Unicode-text i något av formaten UTF-16 eller UTF-32 är "big-endian" eller "little-endian". Kodpunktens värde är U+FEFF, och den ska ligga först i filen. En kodpunkt lagras vid "big endian" med den mest signifikanta byten först, så filen kommer att ha 0xFE 0xFF först i UTF-16BE. UTF-16 med "little-endian" (UTF-16LE) är standard internt i Windows för Unicode-text, så att Windows-filer kommer att ha 0xFF 0xFE först. I Windows används BOM även i UTF-8 (vilket blir de tre byten 0xEF 0xBB 0xBF), trots att UTF-8 inte har någon tvetydighet om hur lagring i bytes ska ske. BOM används här för att känna igen att en fil har UTF-8. Unix/Linux använder UTF-8 för Unicode men använder inte BOM eftersom det stör syntaxen för kommandofiler. BOM stör också kompilatorer för programspråk. Det går bra att med hjälp av UTF-8 införa Unicode i programspråk och kompilatorer som inte har Unicodestöd, bortsett från att en eventuell BOM då måste tas bort manuellt före varje kompilering. Kodpunkten U+FEFF används också som "zero-width no-break space", i princip ett osynligt tecken. Kodpunkten U+FFFE, alltså med bytena i omvänd ordning, är ett förbjudet tecken i Unicode, detta för att känna igen BOM och vilken byteordning det är när 0xFE 0xFF eller omvänt ligger i filen. (sv) Ма́ркер поря́дку ба́йтів (англ. Byte-order mark, BOM) — символ Юнікоду з кодом U+FEFF («нерозривний пробіл нульової ширини»), що використовується для позначення порядку байтів в рядку символів Юнікода, що закодовано в UTF-16 або UTF-32. Ця позначка використовується для позначення того, що текст має кодування UTF-8, UTF-16 або UTF-32. В більшості систем кодування, BOM рідко зустрічається в інших контекстах (зазвичай, вона виглядає як послідовність незрозумілих керуючих кодів). Якщо позначку BOM буде помилково інтерпретовано як дійсний символ Юнікода, її, взагалі кажучи, видно не буде, оскільки вона є нерозривним пробілом нульової ширини. Використання символу з кодом U+FEFF для інших цілей було скасовано в стандарті Юнікод 3.2 (в якому визначено символ U+2060 для застосування в інших цілях), що дозволило вивільнити U+FEFF для використання виключно як позначки порядку байтів BOM. В UTF-16, BOM (U+FEFF) стоїть на місці першого символу файла або потоку літер, для того, аби вказати порядок 16-бітних символів у цьому файлі або потоці. Якщо 16-бітні символи записано в прямому порядку (англ. big-endian), позначку BOM буде зчитано як байти 0xFE і 0xFF; якщо порядок байт зворотний, послідовність BOM буде зчитано як 0xFF і 0xFE. Гарантується, що символ Юнікода з кодом U+FFFE ніколи не буде використовуватись для позначення літери в кодуванні Юнікода; із цього випливає, що в контексті Юнікода пара байт 0xFF і 0xFE може означати лише U+FEFF у зворотному порядку. Не зважаючи на те, що UTF-8 не має проблем з порядком байтів, BOM, у цьому випадку, може використовуватись для позначення тексту в кодуванні UTF-8. Ця позначка лише позначає кодування файла, а не порядок байт в ньому. Достатньо велика кількість програмного забезпечення виробництва Microsoft, (наприклад блокнот) додає позначку BOM. Однак, на Юнікс-подібних системах, застосування позначки BOM може перешкоджати нормальній обробці файлів. (uk) 位元組順序記號(英語:byte-order mark,BOM)是位於碼點U+FEFF的統一碼字符的名称。當以UTF-16或UTF-32來將UCS/統一碼字符所組成的字串編碼時,這個字符被用來標示其位元組序。它常被用來當做標示文件是以UTF-8、UTF-16或UTF-32編碼的記號。 位元組順序記號通常有幾種涵義: 1. * 在16位元和32位元的情況下,文字流的位元組順序。 2. * 表示文字流非常有可能是Unicode編碼。 3. * 使用的是哪一種Unicode字元編碼。 位元組順序記號的使用是選擇性的。它的存在會干擾那些不希望檔案開頭出現非ASCII字元、但可以用其他方式處理文字流的軟體對於UTF-8的使用。 Unicode可以以8位元、16位元或32位元整數為單位進行編碼。對於16位元和32位元的表示方法,從任意來源接收文本的電腦需要知道整數是以何種位元組順序編碼的。位元組順序記號的編碼方式與文件檔案的其他部分相同,如果它的位元組被調換,就會變成一個非字元的Unicode碼位。因此,訪問文本的過程中,可以透過檢查這頭幾個位元組來確定位元組順序,而不需要文字流本身以外的一些約定或元資料。一般來說,如果有必要,接收資料的電腦會將位元組換成自己的位元組順序,不再需要位元組順序記號進行處理。 每個Unicode編碼(包括Unicode標準以外的編碼,如UTF-7,見)的BOM位元組序列都不一樣,而且這些序列都不可能出現在以其他編碼儲存的文字流的開頭。因此,在文字流的開頭放置一個編碼的BOM,可以表明文本是Unicode,並識別所使用的編碼方案。這種對BOM字元的使用被稱為「Unicode簽名」。 (zh) |
dbo:wikiPageExternalLink | https://www.unicode.org/faq/utf_bom.html https://web.archive.org/web/20210422192604/http:/www.unicode.org/versions/Unicode5.0.0/ch02.pdf%23G9354 https://web.archive.org/web/20210506134650/http:/www.unicode.org/versions/Unicode5.0.0/ch16.pdf%23G25817 |
dbo:wikiPageID | 105412 (xsd:integer) |
dbo:wikiPageLength | 15626 (xsd:nonNegativeInteger) |
dbo:wikiPageRevisionID | 1118035978 (xsd:integer) |
dbo:wikiPageWikiLink | dbr:Caret_notation dbr:Big-endian dbr:Big_Endian dbr:Decimal dbr:Little-endian dbr:Little_Endian dbr:Character_encoding dbr:UTF-1 dbr:UTF-16 dbr:UTF-7 dbr:UTF-8 dbr:UTF-EBCDIC dbr:Unicode dbr:Universal_Character_Set_characters dbr:Endianness dbr:GB_18030 dbr:Google_Docs dbr:Arabic_Presentation_Forms-B dbr:Computer_program dbr:Specials_(Unicode_block) dbr:String_literal dbr:C0_and_C1_control_codes dbr:W3C dbr:Windows_PowerShell dbr:ASCII dbr:Null_character dbr:Left-to-right_mark dbr:Hexadecimal dbr:Internet_Assigned_Numbers_Authority dbr:Binary_Ordered_Compression_for_Unicode dbr:Plain_text dbr:Zero-width_non-breaking_space dbc:Unicode_special_code_points dbr:Microsoft dbr:Microsoft_Windows dbr:Magic_number_(programming) dbr:Standard_Compression_Scheme_for_Unicode dbr:UTF-32 dbr:Shift_Out_and_Shift_In_characters dbr:Syslog dbr:Word_Joiner dbr:Notepad_(Windows) dbr:CP1252 dbr:Comparison_of_web_browser_engines_(HTML_support) |
dbp:wikiPageUsesTemplate | dbt:Proper_name dbt:Redirect dbt:Reflist dbt:Refn dbt:Short_description dbt:Tt dbt:Unichar dbt:Use_dmy_dates dbt:Unicode_navigation |
dct:subject | dbc:Unicode_special_code_points |
gold:hypernym | dbr:Character |
rdf:type | yago:WikicatComputerFileFormats yago:Abstraction100002137 yago:Communication100033020 yago:Format106636806 yago:Information106634376 yago:Message106598915 dbo:FictionalCharacter |
rdfs:comment | علامة ترتيب البايتات (BOM) هي علامة يونيكود لتحديد ترتيب تخزين أو إرسال المعلومات التي تتطلب أكثر من بايت لتخزنها. ولها الرمز U+FEFF. (ar) Als Byte Order Mark (BOM; deutsch Byte-Reihenfolge-Markierung) wird eine charakteristische Bytefolge am Anfang eines Datenstroms bezeichnet, die das Unicode-Zeichen U+FEFF (englisch zero width no-break space) kodiert. Diese Bytefolge dient als Kennung zur Definition der Byte-Reihenfolge und Kodierungsform in UCS/Unicode-Zeichenketten, insbesondere Textdateien. (de) バイト順マーク (バイトじゅんマーク、英: byte order mark) あるいはバイトオーダーマークとは、通称BOM(ボム)といわれるUnicodeの符号化形式で符号化したテキストの先頭につける数バイトのデータのことである。このデータを元にUnicodeで符号化されていることおよび符号化の種類の判別に使用する。 (ja) Il Byte Order Mark (BOM) è una piccola sequenza di byte che viene posizionata all'inizio di un flusso di dati di puro testo, tipicamente un file, per indicarne il tipo di codifica Unicode. I byte da usare nelle intestazioni delle varie codifiche sono i seguenti: (it) A marca de ordem de byte (BOM) é um caractere Unicode usado para denotar a extremidade (ordem de bytes) de um arquivo de texto ou fluxo de dados, cujo código é U+FEFF. Seu uso é opcional e, se usado, deve aparecer no começo do fluxo de texto. Além do seu uso tradicional, esse caractere também pode indicar em qual das diferentes representações Unicode o texto está codificado. Tendo em vista que o Unicode pode ser codificado tanto em 16 quanto 32 bits, o leitor de texto Unicode deve saber em que formato o texto que está sendo lido está codificado. (pt) BOM (ang. Byte Order Mark), znacznik kolejności bajtów – znak niedrukowalny używany w wielobajtowym kodowaniu znaków, który jest zapisywany na początku strumienia bajtów (pliku) i informuje, w jakiej kolejności należy ustawić bajty, aby odczytać kod znaku. BOM rozwiązuje problem interpretacji kolejności bajtów w znaku i umożliwia automatyczną detekcję kodowania UTF-8, UTF-16LE, UTF-16BE, UTF-32LE oraz UTF-32BE. (pl) Маркер последовательности байтов или метка порядка байтов (англ. Byte Order Mark, BOM) — специальный символ из стандарта Юникод, вставляемый в начало текстового файла или потока для обозначения того, что в файле (потоке) используется Юникод, а также для косвенного указания кодировки и порядка байтов, с помощью которых символы Юникода были закодированы. Номер этого символа в стандарте Юникод — U+FEFF. Использование этого символа, согласно спецификации Юникод, не является обязательным, однако оно широко распространено, так как позволяет легко избежать неверного декодирования текстовой информации. (ru) BOM (Byte order mark, česky přibližně „označení pořadí bajtů“) je znak hexadecimálně zapsaný jako FEFF (v desítkové soustavě 65279). V kódování UTF-8 je tento znak reprezentován trojicí bajtů 0xEF 0xBB 0xBF („UTF-8 signatura“), v kódování UTF-16 big-endian dvojicí bajtů 0xFE 0xFF a v UTF-16 little-endian 0xFF 0xFE. Grafický význam znaku je „nedělitelná mezera nulové šířky“ (zero-width no-break space), je tak podobný znaku U+2060 (word joiner). (cs) The byte order mark (BOM) is a particular usage of the special Unicode character, U+FEFF BYTE ORDER MARK, whose appearance as a magic number at the start of a text stream can signal several things to a program reading the text: * The byte order, or endianness, of the text stream in the cases of 16-bit and 32-bit encodings; * The fact that the text stream's encoding is Unicode, to a high level of confidence; * Which Unicode character encoding is used. (en) En Unicode, la marca de orden de bytes (del idioma inglés "byte order mark" o BOM) es un dato que indica el uso de una codificación Unicode, así como el orden de los bytes, que generalmente se encuentra al principio de algunos archivos de texto. Cuando se interpreta correctamente, el usuario final del texto codificado no ve el BOM. Sin embargo, hay dos casos donde este carácter puede ser mal interpretado: (es) En Unicode, l'indicateur d'ordre des octets ou BOM (pour l'anglais byte order mark) est une donnée qui indique l'utilisation d'un encodage unicode ainsi que l'ordre des octets, généralement situé au début de certains fichiers texte. Lorsqu'il est correctement interprété, l'IOO n'est pas vu par l'utilisateur final du texte codé.Il existe cependant deux cas où ce caractère peut être mal interprété : (fr) 바이트 순서 표시(Byte Order Mark, BOM)는 유니코드 문자 U+FEFF byte order mark로, 매직 넘버로서 문서의 가장 앞에 추가하여 텍스트를 읽는 프로그램에 여러 정보를 전달할 수 있다. * 16비트 혹은 32비트 인코딩의 경우, 문서의 바이트 순서 또는 엔디언 * 문서의 인코딩이 거의 확실히 유니코드임 * 문서에 사용한 유니코드 문자 인코딩 방식 BOM을 반드시 사용할 필요는 없으며, 사용할 경우 문서의 가장 앞에 등장해야 한다. 유니코드는 8비트, 16비트 혹은 32비트 정수 단위로 인코딩할 수 있다. 16비트 및 32비트 표현의 경우, 알 수 없는 출처로부터 텍스트를 읽는 컴퓨터는 데이터를 어떤 바이트 순서로 인코딩했는지 알아야 한다. BOM은 문서의 나머지 부분과 같은 방식으로 인코딩되며 바이트 순서가 바뀔 경우 비문자인 유니코드 코드 포인트가 되므로, 이 텍스트를 읽는 프로세스는 문서 외적인 정보 없이도 처음 몇 바이트를 검사함으로써 엔디언을 확인할 수 있다. 이후 수신자는 필요할 경우 바이트 순서를 자신의 엔디안에 맞게 바꾸며, 이 이후의 처리에는 더 이상 BOM이 필요하지 않다. (ko) En BOM (Byte order mark) är ett specialtecken (kodpunkt) i Unicode (teckenkodning för datorer). Den används i första hand för att markera om en fil med Unicode-text i något av formaten UTF-16 eller UTF-32 är "big-endian" eller "little-endian". Kodpunktens värde är U+FEFF, och den ska ligga först i filen. En kodpunkt lagras vid "big endian" med den mest signifikanta byten först, så filen kommer att ha 0xFE 0xFF först i UTF-16BE. UTF-16 med "little-endian" (UTF-16LE) är standard internt i Windows för Unicode-text, så att Windows-filer kommer att ha 0xFF 0xFE först. (sv) Ма́ркер поря́дку ба́йтів (англ. Byte-order mark, BOM) — символ Юнікоду з кодом U+FEFF («нерозривний пробіл нульової ширини»), що використовується для позначення порядку байтів в рядку символів Юнікода, що закодовано в UTF-16 або UTF-32. Ця позначка використовується для позначення того, що текст має кодування UTF-8, UTF-16 або UTF-32. (uk) 位元組順序記號(英語:byte-order mark,BOM)是位於碼點U+FEFF的統一碼字符的名称。當以UTF-16或UTF-32來將UCS/統一碼字符所組成的字串編碼時,這個字符被用來標示其位元組序。它常被用來當做標示文件是以UTF-8、UTF-16或UTF-32編碼的記號。 位元組順序記號通常有幾種涵義: 1. * 在16位元和32位元的情況下,文字流的位元組順序。 2. * 表示文字流非常有可能是Unicode編碼。 3. * 使用的是哪一種Unicode字元編碼。 位元組順序記號的使用是選擇性的。它的存在會干擾那些不希望檔案開頭出現非ASCII字元、但可以用其他方式處理文字流的軟體對於UTF-8的使用。 Unicode可以以8位元、16位元或32位元整數為單位進行編碼。對於16位元和32位元的表示方法,從任意來源接收文本的電腦需要知道整數是以何種位元組順序編碼的。位元組順序記號的編碼方式與文件檔案的其他部分相同,如果它的位元組被調換,就會變成一個非字元的Unicode碼位。因此,訪問文本的過程中,可以透過檢查這頭幾個位元組來確定位元組順序,而不需要文字流本身以外的一些約定或元資料。一般來說,如果有必要,接收資料的電腦會將位元組換成自己的位元組順序,不再需要位元組順序記號進行處理。 (zh) |
rdfs:label | علامة ترتيب البايتات (ar) Byte order mark (cs) Byte Order Mark (de) Byte order mark (en) Marca de orden de bytes (es) Byte Order Mark (it) Indicateur d'ordre des octets (fr) 바이트 순서 표식 (ko) バイト順マーク (ja) BOM (informatyka) (pl) Marca de ordem de byte (pt) Маркер последовательности байтов (ru) Byte order mark (sv) Маркер порядку байтів (uk) 位元組順序記號 (zh) |
owl:sameAs | freebase:Byte order mark yago-res:Byte order mark wikidata:Byte order mark dbpedia-ar:Byte order mark dbpedia-cs:Byte order mark dbpedia-de:Byte order mark dbpedia-es:Byte order mark dbpedia-fa:Byte order mark dbpedia-fr:Byte order mark dbpedia-he:Byte order mark dbpedia-it:Byte order mark dbpedia-ja:Byte order mark dbpedia-ko:Byte order mark http://lt.dbpedia.org/resource/BOM http://mg.dbpedia.org/resource/ dbpedia-no:Byte order mark dbpedia-pl:Byte order mark dbpedia-pt:Byte order mark dbpedia-ro:Byte order mark dbpedia-ru:Byte order mark dbpedia-simple:Byte order mark dbpedia-sv:Byte order mark dbpedia-uk:Byte order mark dbpedia-zh:Byte order mark https://global.dbpedia.org/id/6XFc |
prov:wasDerivedFrom | wikipedia-en:Byte_order_mark?oldid=1118035978&ns=0 |
foaf:isPrimaryTopicOf | wikipedia-en:Byte_order_mark |
is dbo:wikiPageDisambiguates of | dbr:BOM |
is dbo:wikiPageRedirects of | dbr:Byte-Order_Mark dbr:Byte_Order_Mark dbr: dbr:BOM_(Unicode) dbr:Byte-order_mark dbr:FEFF dbr:FFFE dbr:Ÿþ dbr:BYTE_ORDER_MARK dbr:U+FEFF dbr:Feff dbr:Ï»¿ dbr:Þÿ dbr:Fffe dbr:Unicode_Byte-Order_Mark dbr:Unicode_signature |
is dbo:wikiPageWikiLink of | dbr:BOM dbr:List_of_computing_and_IT_abbreviations dbr:List_of_file_signatures dbr:Mojibake dbr:Regular_expression dbr:Character_encoding dbr:UTF-16 dbr:UTF-7 dbr:UTF-8 dbr:Unicode dbr:Unicode_and_HTML dbr:Universal_Character_Set_characters dbr:Universal_Disk_Format dbr:Byte-Order_Mark dbr:Byte_Order_Mark dbr: dbr:Comma-separated_values dbr:Windows_10_version_1903 dbr:EmEditor dbr:Endianness dbr:Arabic_Presentation_Forms-B dbr:LibreOffice dbr:LibreOffice_Writer dbr:SubRip dbr:Ï dbr:Specials_(Unicode_block) dbr:BOM_(Unicode) dbr:Byte-order_mark dbr:WebVTT dbr:Windows_Notepad dbr:AkelPad dbr:Non-breaking_space dbr:Charset_detection dbr:JSON dbr:Character_encodings_in_HTML dbr:LDraw dbr:Bush_hid_the_facts dbr:FEFF dbr:FFFE dbr:ID3 dbr:ISO/IEC_8859-1 dbr:Shebang_(Unix) dbr:Word_joiner dbr:XML dbr:Popularity_of_text_encodings dbr:Ÿþ dbr:BYTE_ORDER_MARK dbr:U+FEFF dbr:Feff dbr:Ï»¿ dbr:Þÿ dbr:Fffe dbr:Unicode_Byte-Order_Mark dbr:Unicode_signature |
is foaf:primaryTopic of | wikipedia-en:Byte_order_mark |