UTF-16: diferenças entre revisões
Conteúdo apagado Conteúdo adicionado
Mais tradução |
|||
Linha 14:
código UTF-16 de um dado "caractere alto" é o seguinte:
<pre>
U' := U - 0x10000 (U' tem 20 bits)▼
</pre>
<pre>
vh := uh estendido para 16 bits (colocados zeros à esquerda)▼
utf16,1 := 0xD800 | vh▼
</pre>
Após a execução do algoritmo, o código UTF-16 é composto de utf16,1 e utf16,2.
Linha 41 ⟶ 45:
Hoje em dia, UTF-16 é a representação nativa de texto no [[Microsoft Windows]] e na [[Linguagem de programação Java]].
Ele é um formato de transformação de [[Unicode]] 16 bits, que permite a representação de séries de caracteres abstratos do Unicode e do ISO/IEC 10646, como uma série de palavras de 16 bits convenientes para armazenagem e transmissão via [[redes de computadores]]. UTF-16 é oficialmente definido no Annex Q of ISO/IEC 10646-1. Também é descrito no "The Unicode Standard version 3.0 and higher", assim como no RFC 2781 da IETF.
▲[[categoria:Informática]]
|