UTF-16: diferenças entre revisões

Conteúdo apagado Conteúdo adicionado
Mais tradução
LeonardoG (discussão | contribs)
Linha 14:
código UTF-16 de um dado "caractere alto" é o seguinte:
 
hipóteseHipótese: ultimo caractere ISO/IEC 10646 Z = 10FFFD
sejaSeja U: caractere ISO/IEC 10646 que queremos passar para UTF-16 (U tem 21 bits)
 
<pre>
U' := U - 0x10000 (U' tem 20 bits)
uhU' := dezU bits- altos de0x10000 (U' (uh tem 1020 bits)
uluh := dez bits baixosaltos de U' (uluh tem 10 bits)
U'ul := Udez -bits 0x10000baixos de (U' (ul tem 2010 bits)
</pre>
 
<pre>
vh := uh estendido para 16 bits (colocados zeros à esquerda)
vlvh := vhuh estendido para 16 bits (colocados zeros à esquerda)
vhvl := uhvh estendido para 16 bits (colocados zeros à esquerda)
utf16,1 := 0xD800 | vh
utf16,21 := 0xDC000xD800 | vlvh
utf16,12 := 0xD8000xDC00 | vhvl
</pre>
 
Após a execução do algoritmo, o código UTF-16 é composto de utf16,1 e utf16,2.
Linha 41 ⟶ 45:
 
Hoje em dia, UTF-16 é a representação nativa de texto no [[Microsoft Windows]] e na [[Linguagem de programação Java]].
 
 
 
 
 
Ele é um formato de transformação de [[Unicode]] 16 bits, que permite a representação de séries de caracteres abstratos do Unicode e do ISO/IEC 10646, como uma série de palavras de 16 bits convenientes para armazenagem e transmissão via [[redes de computadores]]. UTF-16 é oficialmente definido no Annex Q of ISO/IEC 10646-1. Também é descrito no "The Unicode Standard version 3.0 and higher", assim como no RFC 2781 da IETF.
 
[[categoria:InformáticaCodificação]]
{{esboço}}
 
[[categoria:Informática]]