Usuário:Gildemar Felix/Testes/IntervaloInterquartil
Definição formal
editarDefinir intervalo interquartil é necessário o entendimento sobre quartil e para a definição aqui apresentada é utilizado o conceito de mediana para determinar os quartis ( e ) e, no conjunto de dados existe o caso para um quantidade ímpar ou par para determinar a posição dos quartis. Somente é possível determinar a posição dos quartis se os dados de um conjunto finito de dados qualquer estiver ordenado.[1]
Quartil, quantidade par de elementos
A mediana de um conjunto de dados é a posição que divide igualmente o conjunto em dois grupos, cada um com 50% dos dados. Em , são as posições dos elementos. Então, é a posição que marca o segundo quartil. Pela definição de mediana para o caso de um conjunto de dados com quantidade par de elementos, a posição está entre as posições e obtida pelo cálculo , nesse caso, existem elementos de que ocupam as posições e e, esses elementos devem substituir e no cálculo de .[1]
Ao determinar , o conjunto passa a ter uma mediana definida, então , é uma posição obtida pela média dos elementos e , ou seja, não é um elemento novo de . Os grupos formados a partir do segundo quartil ( ) são e .[1]
- Se e conter uma quantidade par de elementos, é realizado o mesmo processo de para determinar o primeiro e o terceiro quartil. Então, a posição do grupo determina o primeiro quartil pelo cálculo . Ou seja, . Analogamente para o grupo , a posição determina o terceiro quartil pelo cálculo e então .[1]
- Se e conter uma quantidade ímpar de elementos, pela definição de mediana, o primeiro quartil é calculado por , nesse caso é utilizado o valor posicional e não é utilizado o valor numérico do elemento de para a posição e, o terceiro quartil é calculado a partir da quantidade do grupo por , também nesse caso é utilizado o valor posicional e não é utilizado o valor numérico do elemento de para a posição .[1]
O conjunto de dados tem as posições para o primeiro quartil, para o segundo quartil e para o terceiro quartil e, mais usualmente em notações para o primeiro, segundo e terceiro quartil, respectivamente e .
Quartil, quantidade ímpar de elementos
A mediana de um conjunto de dados é a posição que divide igualmente o conjunto em dois grupos, cada um com 50% dos dados. Em , são as posições dos elementos. Então, é a posição que marca o segundo quartil. Pela definição de mediana o cálculo de é e divide em dois grupos com 50% de dados em cada grupo, ou seja, e se obtém os dois grupos e , onde e .[1]
- Se e conter uma quantidade par de elementos será realizado o mesmo processo do item 1. do caso quartil quantidade par de elementos.
- Se e conter uma quantidade ímpar de elementos será realizado o mesmo processo do item 2. do caso quartil quantidade par de elementos.
O conjunto de dados tem as posições para o primeiro quartil, para o segundo quartil e para o terceiro quartil e, mais usualmente em notações para o primeiro, segundo e terceiro quartil, respectivamente e .[1]
Intervalo interquartil
A partir dos quartis e determinados.[2] A amplitude interquartil (AIQ) é
Observações
editarNa coleta de dados pode ocorrer erros de arrendamentos ou de observação e esses dados são considerados discrepantes dentro de uma mesma amostra e podem levar a erros nas análises sobre a distribuição dos dados. Portanto, estabelece-se o critério de limite inferior e superior nos quartis. E, os dados os quais estiverem além dos limites são considerados discrepantes e identifica-los obtém-se uma orientação mais precisa. Então,
Onde, e são respectivamente os limites inferior e superior. [4]Enquanto é uma constante a qual pertence aos números reais e pode assumir qualquer valor. No entanto, usualmente na literatura utiliza-se o valor , pois o valor de consegue para mais e para menos além dos limites superior e inferior captar mais de 99% dos dados embaixo de uma curva normal, mas não capta os 100% dos dados. Portanto, seguramente a definição pode ser utilizada para o cálculo dos limites superior e inferior como: [5]
Discussão
editarExistem outros métodos para encontrar as posições dos quartis. No entanto, podem gerar dúvidas. Por exemplo, ao pensar que e possuem respectivamente 25%, 50% e 75% dos dados de um conjunto , o cálculo de percentuais podem ser aplicados diretamente, como:
Onde é o número de elementos.
Ao verificar o conjunto para , mas a posição não possui 25% dos dados. Logo, esse método não pode ser o melhor.
Outro método para definir quartil é , onde é o número de elementos de um conjunto e marca a posição do quartil.[7] Então, para definir o terceiro quartil é . No entanto, a posição não possui 75% dos dados do conjunto .[7]
- ↑ a b c d e f g Morettin, Pedro A.; Bussab, Wilton de O. (2014). Estatística Básica. São Paulo: Saraiva. pp. 43 – 45
- ↑ Silva, Ermes Medeiros da; Silva, Elio Medeiros da; Gonçalves, Valter; Murolo, Afrânio Carlos (1999). Estatística. São Paulo: Atlas. 89 páginas
- ↑ Lauretto, Marcelo de Souza. «Estatística descritiva básica: Medidas de dispersão» (PDF). Escola de Artes, Ciência e Humanidades - USP. p. 6. Consultado em 7 de fevereiro de 2017
- ↑ Lauretto, Marcelo de Souza. «Estatística descritiva básica: Medidas de dispersão» (PDF). Escola de Artes, Ciência e Humanidades - USP. p. 9. Consultado em 7 de fevereiro de 2017
- ↑ Bussab, Wilton de O.; Morettin, Wilton de O. (2012). Estatística Básica. São Paulo: Saraiva. 50 páginas
- ↑ a b c Pinheiro, João Ismael D.; Carvajal, Santiago S. Ramírez; Cunha, Sonia Baptista da; Gomes, Gastão Coelho (2012). Probabilidade e Estatística. São Paulo: CAMPUS. 247 páginas
- ↑ a b «Construção dos quartis» (PDF). Instituto de Assistência Médica ao Servidor Público Estadual de São Paulo (IAMSPE). Consultado em 22 de março de 2017