Diferenças entre edições de "UTF-16"

2 bytes adicionados ,  19h37min de 5 de setembro de 2014
sem resumo de edição
abstratos, presentes no [[Unicode]] e no [[ISO/IEC 10646]], como uma série de palavras (neste caso, de 16-bits), para então poder ser armazenados ou transmitidos por uma [[rede]]. A codificação
UTF-16 é oficialmente definida no Anexo Q do padrão ISO/IEC 10646-1. É também descrita em ''"The Unicode Standard"'', versões 3.0 e superiores, bem como no RFC 2781.
 
== Descrição ==
O espaço de código Unicode é dividido em dezessete ''[[Plano (Unicode)|plano]]s'' de 2<sup>16</sup> (65.536) [[Ponto de código|pontos de código]] cada, apesar de alguns pontos de código ainda não terem sido designados com valores de caractere, alguns são reservados para uso privado e alguns são reservados permanentemente como não-caracteres. Os pontos de código em cada plano possuem valores [[Hexadecimal|hexadecimais]] xx0000 a xxFFFF, onde xx é um valor hexadecimal de 00 a 10, que significa o plano ao qual os valores pertencem.
 
=== Pontos de código U+D800 a U+DFFF ===
O padrão Unicode reserva permanentemente estes valores de ponto de código para codificação UTF-16 dos substitutos anteriores e posteriores, e eles nunca serão designados com um caractere, desta forma não há razão de codificá-los. O padrão Unicode oficial diz que nenhuma das formas UTF, incluindo o UTF-16, pode codificar estes pontos de código.
 
Entretanto UCS-2, UTF-8 e [[UTF-32]] pode codificar estes pontos de código de maneiras triviais e óbvias, e grandes quantidades de softwresoftware fazem isso mesmo que o padrão afirme que tais disposições devam ser tratadas como erros de codificação. É possível codifica-los de forma não ambígua em UTF-16 usando uma unidade de código igual ao ponto de código, enquanto nenhuma sequência de duas unidades de código possa ser interpretada como um par substituto legal (isto é, enquanto um substituto posterior nunca seja seguido por um substituto anterior). A maioria das implementações de codificadores e decodificadores UTF-16 traduzem entre codificações como se este fosse o caso.
 
==Exemplos em UTF-16==
 
Para os caracteres que tenham recebido um identificador entre 0 e 65535 nas listas Unicode ou ISO/IEC 10646, a codificação UTF-16 representa-os simplesmente como um número idêntico ao
Hoje em dia, UTF-16 é a representação nativa de texto no [[Microsoft Windows]] e na [[Linguagem de programação Java]].
 
== Descrição ==
O espaço de código Unicode é dividido em dezessete ''[[Plano (Unicode)|plano]]s'' de 2<sup>16</sup> (65.536) [[Ponto de código|pontos de código]] cada, apesar de alguns pontos de código ainda não terem sido designados com valores de caractere, alguns são reservados para uso privado e alguns são reservados permanentemente como não-caracteres. Os pontos de código em cada plano possuem valores [[Hexadecimal|hexadecimais]] xx0000 a xxFFFF, onde xx é um valor hexadecimal de 00 a 10, que significa o plano ao qual os valores pertencem.
 
=== Pontos de código U+D800 a U+DFFF ===
O padrão Unicode reserva permanentemente estes valores de ponto de código para codificação UTF-16 dos substitutos anteriores e posteriores, e eles nunca serão designados com um caractere, desta forma não há razão de codificá-los. O padrão Unicode oficial diz que nenhuma das formas UTF, incluindo o UTF-16, pode codificar estes pontos de código.
 
Entretanto UCS-2, UTF-8 e [[UTF-32]] pode codificar estes pontos de código de maneiras triviais e óbvias, e grandes quantidades de softwre fazem isso mesmo que o padrão afirme que tais disposições devam ser tratadas como erros de codificação. É possível codifica-los de forma não ambígua em UTF-16 usando uma unidade de código igual ao ponto de código, enquanto nenhuma sequência de duas unidades de código possa ser interpretada como um par substituto legal (isto é, enquanto um substituto posterior nunca seja seguido por um substituto anterior). A maioria das implementações de codificadores e decodificadores UTF-16 traduzem entre codificações como se este fosse o caso.
 
==Exemplos em UTF-16==
{| border="1"
|-----