Diferenças entre edições de "UTF-16"

1 641 bytes adicionados ,  20h23min de 5 de setembro de 2014
== Descrição ==
O espaço de código Unicode é dividido em dezessete ''[[Plano (Unicode)|plano]]s'' de 2<sup>16</sup> (65.536) [[Ponto de código|pontos de código]] cada, apesar de alguns pontos de código ainda não terem sido designados com valores de caractere, alguns são reservados para uso privado e alguns são reservados permanentemente como não-caracteres. Os pontos de código em cada plano possuem valores [[Hexadecimal|hexadecimais]] xx0000 a xxFFFF, onde xx é um valor hexadecimal de 00 a 10, que significa o plano ao qual os valores pertencem.
 
=== Pontos de código de U+0000 a U+D7FF e de U+E000 a U+FFFF ===
O primeiro plano (pontos de código de [[U+]]0000 a U+FFFF) contem os caracteres usados com maior frequência e é chamado de [[Plano Multilingue Básico]] (PMB), do inglês Basic Multilingual Plane - ''BMP''. Tanto o UF-16 quanto o UCS-2 codificam pontos de código neste intervalo como unidades de código de 16 bits simples que são numericamente iguais aos pontos de código correspondentes. Os pontos de código no PMB são os ''únicos'' pontos de código que podem ser representados em UCS-2. Dentro deste plano, os pontos de código de U+D800 a U+DFFF (ver abaixo) são reservados para substitutos posteriores e anteriores.
 
=== Pontos de código de U+010000 a U+10FFFF ===
Pontos de código de outros planos (chamados de Planos Suplementares) são codificados em UTF-16 por pares de unidades de código de 16 bits chamadas de ''pares substitutos'', pelo seguinte esquema:
* 0x010000 é subtraído do ponto de código, deixando um número de 20 bits no intervalo 0..0x0FFFFF.
* Os dez bits mais altos (um número no intervalo 0..0x03FF) são adicionados a 0xD800 para dar a primeira unidade de código ou ''substituto posterior'', o qual estará no intervalo 0xD800..0xDBFF. (As versões anteriores do Padrão Unicode referiam-se a esses substitutos como ''substitutos altos''.)
* Os dez bits mais baixos (também no intervalo 0..0x03FF) são adicionados a 0xDC00 para dar a segunda unidade de código ou ''substituto anterior'', que estará no intervalo 0xDC00..0xDFFF. (As versões anteriores do Padrão Unicode referiam-se a esses como ''substitutos baixos''.)
 
=== Pontos de código U+D800 a U+DFFF ===