Usuário:Gildemar Felix/Testes/IntervaloInterquartil

Definição formal

editar

Definir intervalo interquartil é necessário o entendimento sobre quartil e para a definição aqui apresentada é utilizado o conceito de mediana para determinar os quartis (  e  ) e, no conjunto de dados existe o caso para um quantidade ímpar ou par para determinar a posição dos quartis. Somente é possível determinar a posição dos quartis se os dados de um conjunto finito de dados qualquer estiver ordenado.[1]

Quartil, quantidade par de elementos

A mediana de um conjunto de dados   é a posição   que divide igualmente o conjunto   em dois grupos, cada um com 50% dos dados. Em  ,   são as posições dos elementos. Então,   é a posição que marca o segundo quartil. Pela definição de mediana para o caso de um conjunto de dados com quantidade par de elementos, a posição   está entre as posições   e   obtida pelo cálculo  , nesse caso, existem elementos de   que ocupam as posições   e   e, esses elementos devem substituir   e   no cálculo de  .[1]

Ao determinar  , o conjunto   passa a ter uma mediana definida, então  ,   é uma posição obtida pela média dos elementos   e  , ou seja,   não é um elemento novo de  . Os grupos formados a partir do segundo quartil ( ) são   e  .[1]

  1. Se   e   conter uma quantidade par de elementos, é realizado o mesmo processo de   para determinar o primeiro e o terceiro quartil. Então, a posição   do grupo   determina o primeiro quartil pelo cálculo   . Ou seja,  . Analogamente para o grupo  , a posição   determina o terceiro quartil pelo cálculo   e então  .[1]
  2. Se   e   conter uma quantidade ímpar de elementos, pela definição de mediana, o primeiro quartil é calculado por  , nesse caso é utilizado o valor posicional e não é utilizado o valor numérico do elemento de   para a posição   e, o terceiro quartil é calculado a partir da quantidade do grupo   por  , também nesse caso é utilizado o valor posicional e não é utilizado o valor numérico do elemento de   para a posição  .[1]

O conjunto de dados   tem as posições   para o primeiro quartil,   para o segundo quartil e   para o terceiro quartil e, mais usualmente em notações para o primeiro, segundo e terceiro quartil, respectivamente   e  .

Quartil, quantidade ímpar de elementos

A mediana de um conjunto de dados   é a posição   que divide igualmente o conjunto   em dois grupos, cada um com 50% dos dados. Em  ,   são as posições dos elementos. Então,   é a posição que marca o segundo quartil. Pela definição de mediana o cálculo de   é   e divide   em dois grupos com 50% de dados em cada grupo, ou seja,   e se obtém os dois grupos   e  , onde   e  .[1]

  1. Se   e   conter uma quantidade par de elementos será realizado o mesmo processo do item 1. do caso quartil quantidade par de elementos.
  2. Se   e   conter uma quantidade ímpar de elementos será realizado o mesmo processo do item 2. do caso quartil quantidade par de elementos.

O conjunto de dados   tem as posições   para o primeiro quartil,   para o segundo quartil e   para o terceiro quartil e, mais usualmente em notações para o primeiro, segundo e terceiro quartil, respectivamente   e  .[1]

Intervalo interquartil

A partir dos quartis   e   determinados.[2] A amplitude interquartil (AIQ) é

 [3]

Observações

editar

Na coleta de dados pode ocorrer erros de arrendamentos ou de observação e esses dados são considerados discrepantes dentro de uma mesma amostra e podem levar a erros nas análises sobre a distribuição dos dados. Portanto, estabelece-se o critério de limite inferior e superior nos quartis. E, os dados os quais estiverem além dos limites são considerados discrepantes e identifica-los obtém-se uma orientação mais precisa. Então,

 

 

Onde,   e   são respectivamente os limites inferior e superior. [4]Enquanto   é uma constante a qual pertence aos números reais  e pode assumir qualquer valor. No entanto, usualmente na literatura utiliza-se o valor  , pois o valor de   consegue para mais e para menos além dos limites superior e inferior captar mais de 99% dos dados embaixo de uma curva normal, mas não capta os 100% dos dados. Portanto, seguramente a definição pode ser utilizada para o cálculo dos limites superior e inferior como: [5]

 

 

Discussão

editar

Existem outros métodos para encontrar as posições dos quartis. No entanto, podem gerar dúvidas. Por exemplo, ao pensar que   e   possuem respectivamente 25%, 50% e 75% dos dados de um conjunto  , o cálculo de percentuais podem ser aplicados diretamente, como:

 [6]

 [6]

 [6]

Onde   é o número de elementos.

Ao verificar o conjunto   para  , mas a posição   não possui 25% dos dados. Logo, esse método não pode ser o melhor.

Outro método para definir quartil é  , onde   é o número de elementos de um conjunto   e   marca a posição do quartil.[7] Então, para definir o terceiro quartil   é  . No entanto, a posição   não possui 75% dos dados do conjunto  .[7]

  1. a b c d e f g Morettin, Pedro A.; Bussab, Wilton de O. (2014). Estatística Básica. São Paulo: Saraiva. pp. 43 – 45 
  2. Silva, Ermes Medeiros da; Silva, Elio Medeiros da; Gonçalves, Valter; Murolo, Afrânio Carlos (1999). Estatística. São Paulo: Atlas. 89 páginas 
  3. Lauretto, Marcelo de Souza. «Estatística descritiva básica: Medidas de dispersão» (PDF). Escola de Artes, Ciência e Humanidades - USP. p. 6. Consultado em 7 de fevereiro de 2017 
  4. Lauretto, Marcelo de Souza. «Estatística descritiva básica: Medidas de dispersão» (PDF). Escola de Artes, Ciência e Humanidades - USP. p. 9. Consultado em 7 de fevereiro de 2017 
  5. Bussab, Wilton de O.; Morettin, Wilton de O. (2012). Estatística Básica. São Paulo: Saraiva. 50 páginas 
  6. a b c Pinheiro, João Ismael D.; Carvajal, Santiago S. Ramírez; Cunha, Sonia Baptista da; Gomes, Gastão Coelho (2012). Probabilidade e Estatística. São Paulo: CAMPUS. 247 páginas 
  7. a b «Construção dos quartis» (PDF). Instituto de Assistência Médica ao Servidor Público Estadual de São Paulo (IAMSPE). Consultado em 22 de março de 2017