Parâmetro estatístico: diferenças entre revisões

Conteúdo apagado Conteúdo adicionado
Pórokhov (discussão | contribs)
m {{subst: não funciona dentro de referências, replaced: 1={{subst:DATA}} }} → data=janeiro de 2019}} (4)
m WP:BOT: Substituindo sintaxe matemática obsoleta de acordo com mw:Extension:Math/Roadmap
Linha 141:
{\displaystyle 1,5={\frac <nowiki>{{\cor {Rede}1}+{\cor {Rede}2}}</nowiki>{2}}}<math />
[[Ficheiro:Ejemplo_de_uso_de_una_tabla_de_percentiles.png|miniaturadaimagem|503x503px|Neste exemplo baseado numa tabela real de percentiles usada em [[Pediatria|pediatría]], pode comprovar-se que uma menina de 24 meses com um peso de 13 kg estaria no percentil 75º, isto é, seu peso é superior ao 75\% das meninas de sua idade. A média corresponderia, aproximadamente, a 12 kg (interseção da linha curva mais escura com a linha horizontal correspondente ao valor 12 no eixo vertical, para essa mesma idade).]]
Existem métodos de cálculo mais rápidos para dados mais numerosos (veja-se o [[Mediana (estatística)|artigo principal]] dedicado a este parâmetro). Do mesmo modo, para valores agrupados em intervalos, acha-se o "intervalo médio" e, dentro deste, se obtém um valor concreto por interpolação.
 
Linha 153:
 
=== Medidas de posição não central ===
Directamente relacionados com a anterior, encontram-se as '''medidas de posição não central''', também conhecidas como [[Quantil|cuantiles.]] Trata-se de valores da variável estatística que deixam por embaixo de sim determinada quantidade dos dados. São, em definitiva, uma generalização do conceito da média. Enquanto esta deixa por embaixo de sim ao 50\% da distribuição, os cuantiles podem o fazer com qualquer outra percentagem.<ref>{{Citar livro|url=http://books.google.es/books?id=kZ5NoA2BwjEC|título=Bioestadística para las ciencias de la Salud|página=28|isbn=8484510182}}</ref> Denominam-se medidas de posição porque informam, precisamente, da posição que ocupa um valor dentro da distribuição de dados.
 
Tradicionalmente distingue-se entre '''cuartiles''', se divide-se a quantidade de dados em quatro partes dantes de proceder ao cálculo dos valores que ocupam cada posição; '''deciles''', se divide-se os dados em dez partes; ou '''percentiles''', que dividem a população em cem partes.
 
Exemplos: se diz-se que uma pessoa, depois de um teste de inteligência, ocupa o percentil 75, isso supõe que o 75\% da população tem um [[Quociente de inteligência|cociente intelectual]] com um valor inferior ao dessa pessoa. Este critério usa-se pelas [[Sociedades de Alto QI|associações de superdotados]], que limitam seu conjunto de membros àquelas que atingem determinado percentil (igual ou superior a 98 na maioria dos casos).
 
O exemplo que se mostra na imagem da direita é o correspondente ao cálculo inverso, isto é, quando se deseja conhecer o percentil correspondente a um valor da variável, em lugar do valor que corresponde a um determinado percentil.
Linha 172:
 
=== Medidas de dispersão ===
[[Ficheiro:Diagrama_de_caja.svg|miniaturadaimagem|200x200px|[[Diagrama de caixa]] que mostra a [[Dispersão estatística|dispersão]] graficamente, usando os [[Quantil|cuartiles]] como referência. Entre Q1 e Q3 ([[Amplitude interquartil|faixa intercuartílico]]) encontram-se o 50\% das observações.]]
As medidas de posição resumem a distribuição de dados, mas resultam insuficientes e simplificam excessivamente a informação. Estas medidas adquirem verdadeiro significado quando vão acompanhadas de outras que informem sobre a heterogeneidade dos dados. Os '''parâmetros de dispersão''' medem isso precisamente, geralmente, calculando em que medida os dados se agrupam em torno de um valor central. Indicam, de um modo bem definido, o homogêneos que estes dados são. Há '''medidas de dispersão absolutas''', entre as quais se encontram a [[Variância|varianza]], o [[Desvio padrão|desvio típico]] ou o [[Desvio absoluto|desvio médio]], ainda que também existem outras menos utilizadas como os percursos ou a meda; e '''medidas de dispersão relativas''', como o [[coeficiente de variação]], o coeficiente de abertura ou os percursos relativos. Em muitas ocasiões as medidas de dispersão oferecem-se acompanhando a um parâmetro de posição central para indicar em que medida os dados se agrupam em torno dele.<ref name="rius_desv">{{Citar livro|título=Bioestadística. Métodos y aplicaciones}}</ref>
 
Linha 180:
O '''percurso''' ou '''faixa''' de uma variável estatística é a diferença entre o maior e o menor valor que toma a mesma. É a medida de dispersão mais singela de calcular, ainda que é algo burda porque só toma em consideração um par de observações. Basta apenas que um destes dois dados varie pára que o parâmetro também o faça, ainda que o resto da distribuição segua sendo, essencialmente, a mesma.
 
Existem outros parâmetros dentro desta categoria, como os percursos ou faixas intercuantílicos, que têm em conta mais dados e, por tanto, permitem afinar na dispersão. Entre os mais usados está a '''[[Amplitude interquartil|faixa intercuartílico]]''', que se define como a diferença entre o cuartil terceiro e o cuartil primeiro. Nessa faixa estão, pela própria definição dos cuartiles, o 50\% das observações. Este tipo de medidas também se usa para determinar [[Outlier|valores atípicos.]] No [[diagrama de caixa]] que aparece à direita se marcam como valores atípicos todos aqueles que caem fora do [[Intervalo (matemática)|intervalo]] [Li, Ls] = [Q1 - 1,5·Rs, Q3 + 1,5·Rs], onde Q1 e Q3 são os cuartiles 1º e 3º, respectivamente, e Rs representa a metade do '''percurso''' ou faixa intercuartílico, também conhecido como percorrido semiintercuartílico.<ref>{{Citar livro|url=http://books.google.es/books?id=31d5cGxXUnEC|título=Estadística Descriptiva|página=192|isbn=8473563069}}</ref>
 
===== Desvios médios =====
Linha 296:
<math /> 1 k
<math /> <nowiki>) \% {\displaystyle 100(1-{\frac {1}{k^{2}}})\%} das observações (</nowiki>''veja-se'' [[Desigualdade de Chebyshev|Desigualdade de Tchebyschev]]).<math /><math /><ref>{{Citar livro|título=Estadística matemática con aplicaciones|ultimo=Wackerly, Dennis D|página=139}}</ref>
 
Esta última propriedade mostra a potência do uso conjunto da média e o desvio típico como parâmetros estatísticos, já que para valores de ''k'' iguais a 2 e 3, respectivamente, se obtém que:
Linha 309:
<math />
<math />
<math /> <nowiki>) {\displaystyle ({\overline {x}}-2\sigma ,\,{\overline {x}}+2\sigma )} estão, ao menos, o 75\% dos dados.</nowiki><math />
* No intervalo ( x ¯
Linha 319:
<math />
<math />
<math /> <nowiki>) {\displaystyle ({\overline {x}}-3\sigma ,\,{\overline {x}}+3\sigma )} estão, ao menos, o 89\% dos dados.</nowiki><math />
 
Cumpre-se a seguinte relação entre os parâmetros de dispersão:
Linha 544:
A '''proporção''' de um dado estatístico é o número de vezes que se apresenta esse dado com respeito ao total de dados. Conhece-se também como '''frequência relativa''' e é um dos parâmetros de cálculo mais singelo. Tem a vantagem de que pode se calcular para [[Variável (estatística)|variáveis qualitativas]].
 
Por exemplo, se estuda-se a cor de olhos de um grupo de 20 pessoas, onde 7 delas os têm azuis, a proporção de indivíduos com olhos azuis é de 35\% (= 7/20).
 
O dado com maior proporção conhece-se como moda (se veja, mais acima).