Revisão das 23h30min de 14 de abril de 2020 editar 138.255.106.25 (discussão) →‎Descrição: Python Etiqueta: Editor Visual ← Ver a alteração anterior		Revisão das 18h52min de 17 de junho de 2020 editar desfazer 2804:d55:52a1:e100:7161:1e5e:c4c7:e279 (discussão) Etiquetas: Edição via dispositivo móvel Edição feita através do sítio móvel Ver a alteração posterior →
Linha 1: {{Sem-fontes\|data=janeiro de 2011\| angola=\| arte=\| Brasil=\| ciência=\| ~~geografia~~geografiamúsica=~~\| música=\|~~ Portugal=\| sociedade=\|1=\|2=\|3=\|4=\|5=\|6=}} ~~'''UTF~~Tabela UnicodeUTF-8~~'''~~ (8-~~[[bit]] [[Unicode~~biUnicode\|Unicode Transformation Format~~]]-~~ informática avançada) é um tipo de codificação binária (Unicode) de comprimento variável criado por [[Ken Thompson]] e [[Rob Pike]]. Pode representar qualquer caracter universal padrão do [[Unicode]], sendo também compatível com o [[ASCII]]. Por esta razão, está lentamente a ser adaptado como tipo de codificação padrão para email, páginas web, e outros locais onde os caracteres são armazenados.▼ ~~{{Tabela Unicode}}~~ ▲'''UTF-8''' (8-[[bit]] [[Unicode\|Unicode Transformation Format]]- informática avançada) é um tipo de codificação binária (Unicode) de comprimento variável criado por [[Ken Thompson]] e [[Rob Pike]]. Pode representar qualquer caracter universal padrão do [[Unicode]], sendo também compatível com o [[ASCII]]. Por esta razão, está lentamente a ser adaptado como tipo de codificação padrão para email, páginas web, e outros locais onde os caracteres são armazenados. UTF-8 usa de um a quatro ~~[[byte]]~~s (estritamente, octetos) por carácter, dependendo do símbolo Unicode que representa. É necessário apenas um byte para codificar os 128 caracteres ASCII (Unicode U+0000 a U+007F). São necessários dois bytes para caracteres Latinos com [[diacrítico]]s. São também usados dois bytes para representar caracteres dos alfabetos [[Alfabeto grego\|Grego]], [[Alfabeto cirílico\|Cirílico]], Armênio, [[Alfabeto hebraico\|Hebraico]], Sírio e Thaana (Unicode U+0080 a U+07FF). São necessários três bytes para o resto do [[Plano Multilingual Básico]] (que contém praticamente todos os caracteres comuns utilizados). Existem ainda outros caracteres que necessitam de quatro bytes. Quatro bytes pode parecer muito para um carácter ~~("code point"),~~ mas muito raramente são utilizados. Além disso, ~~[[UTF-16]]~~ (a principal alternativa ~~ao UTF-8)~~a necessita também de quatro bytes para estes "code points". A definição de qual dos dois é mais eficiente ~~(UTF-8 ou UTF-16)~~ depende da variedade de "code points" usados. Contudo, as diferenças entre os vários tipos de codificação tornam-se irrelevantes com o uso de sistemas de compressão como o [[DEFLATE~~]].~~ Para textos curtos nos quais os tradicionais algoritmos não funcionam bem e se faz necessário ter o tamanho em consideração, é geralmente usado o Esquema Padrão de Compressão para Unicode ~~([[~~Standard Compression Scheme for Unicode]]). ~~O "[[IETF\|Internet~~OIETFInternet Engineering Task Force]]" (IETF) requer que todos os protocolos utilizados na Internet suportem, pelo menos, o UTF-8. O "Internet Mail ~~Consortium" (IMC~~ConsortiuIMC) ~~[https~~http://web.archive.~~org/web/20071026103104/http~~orgweb20071026103104http://www.imc.~~org/mail-i18n~~orgmaili18n.html] recomenda que todos os clientes de email consigam ler e criar mails usando o UTF-8. == História ==

UTF-8: diferenças entre revisões