Distribuição logística

A distribuição Logística deriva do trabalho de Pierre François Verhulst, Professor de Análise na Faculdade Militar Belga, que utilizou esta distribuição para modelar o crescimento da população na Bélgica no início de 1800 [1]. A teoria da probabilidade e a estatística são dois ramos da Matemática onde a distribuição Logística é classificada como sendo uma distribuição de probabilidade contínua [2]. Um aspeto peculiar é que a distribuição de Tukey Lambda representa uma generalização da distribuição Logística uma vez que o parâmetro desta distribuição quando igualado a zero corresponde à distribuição Logística [2].

NotaçãoEditar

Seja   uma variável aleatória contínua. Se   segue uma distribuição Logística com parâmetros   e  , denota-se por  , onde   representa o parâmetro de localização e   o parâmetro de escala [3].

Quando   e  , a distribuição Logística é designada por distribuição Logística padrão ou standard,  .

Função densidade de probabilidadeEditar

A função densidade de probabilidade, abreviada por f.d.p., para a variável aleatória   é dada por

 , onde   e   [3].

Os parâmetros de localização e de escala influenciam a representação gráfica da f.d.p. da distribuição Logística. Na Figura 1 é possível observar que para diferentes valores do parâmetro de localização a função desloca-se ao longo do eixo das abcissas. O parâmetro de escala influencia a função em termos da sua altura. Consoante os diferentes valores de   a função pode-se tornar mais alta e achatada ou mais baixa e larga. Em geral, a f.d.p. é unimodal e possui apenas um único máximo global (na Figura 1 representa o "pico" da função).

A função secante hiperbólica, designada por  , é dada por  . A f.d.p. pode ser escrita em termos do quadrado desta função. Assim, é possível reescrever a f.d.p. usando   de tal forma que se obtém a seguinte expressão

 , onde   e   [2].

Função distribuiçãoEditar

A função distribuição para a variável aleatória   é dada por  , onde   e   [3].

A função logística é definida por  . Verifica-se pela expressão da função distribuição que esta se assemelha à função logística. Deste modo, o gráfico da Figura 2 é muito semelhante ao gráfico da função logística. Pela Figura 2, observa-se que para diferentes valores de   e   a curva exibe um crescimento exponencial mais ou menos acentuado.

A função tangente hiperbólica, designada por  , é dada por  . A função distribuição pode ser escrita usando a função  . Assim, a expressão anterior da função distribuição é reescrita obtendo-se

 , onde   e   [2].

Função QuantilEditar

A inversa da função distribuição é designada por função quantil sendo representada por

 , onde  ,   e   [2].

Note-se que a função quantil é uma generalização da função logit [2]. Assim, a função quantil pode ser reescrita obtendo-se

 , onde  .

Além disso, a derivada da função quantil é dada por

 , onde  ,   e   [2].

Parametrização alternativaEditar

Uma parametrização alternativa pode ser feita se se considerar que o parâmetro   possa ser substituído por  , onde  , e,   passa a ser o novo parâmetro a ter em conta [2].

Assim, a f.d.p. e a função distribuição para a variável aleatória   podem ser reescritas, respetivamente, tendo em conta as seguintes expressões

  e  , onde para ambas   e  .

PropriedadesEditar

As propriedades mais importantes de uma distribuição dizem respeito ao valor esperado (também designado por esperança ou média), variância, moda, mediana e função geradora de momentos. Assim, considerando a variável aleatória   as propriedades desta variável são dadas pelas seguintes expressões, respetivamente [3] [4].

 

 

 

 

Note-se que na expressão da função geradora de momentos a letra   designa a função Gama.

Outras duas propriedades que não são muito estudadas são a assimetria e a curtose. A assimetria é uma propriedade que referencia a assimetria da distribuição e para este caso a medidade de assimetria é  , uma vez que a distribuição Logística é simétrica [5]. A curtose é uma medida de forma que caracteriza o achatamento da curva da f.d.p. das distribuições. Para a distribuição em causa o valor da curtose é   [5]. Pelo facto da f.d.p. desta distribuição ser muito semelhante à f.d.p. da distribuição Normal, o valor da curtose ao ser um valor positivo maior que zero significa que a distribuição Logística é mais alta e afunilada que a distribuição Normal [6].

AplicaçõesEditar

A distribuição logística foi investigada pela primeira vez pelo matemático francês Pierre Verhulst nas décadas de 1830 e 1840 e recebeu seu nome num artigo de 1929 de Reed e Berkson [7]. Embora o interesse original de Verhulst tenha sido no estudo da demografia e na modelagem de populações humanas, um dos principais usos da distribuição Logística historicamente tem sido em estatística como uma ferramenta na chamada regressão logística [7].

Ainda hoje, no entanto, a distribuição logística é uma ferramenta frequentemente utilizada na análise de sobrevivência, onde é preferível sobre distribuições qualitativamente similares por exemplo, a distribuição Normal [7]. As ferramentas derivadas e inspiradas pela distribuição Logística são geralmente usadas para representar dados de tolerância em várias ciências da vida, incluindo zoologia e fisiologia, e a própria distribuição é usada em finanças matemáticas para modelar o risco de vários ativos financeiros [7]. A distribuição Logística também pode modelar uma série de fenômenos, incluindo a disseminação de doenças, crescimento celular e a disseminação de inovações [7].

Um facto interessante é que a Federação de Xadrez dos Estados Unidos e a Federação Mundial de Xadrez (FIDE) usam a distribuição Logística para calcular o nível de habilidade relativa dos jogadores de xadrez [5]. Anteriormente, ambos usavam a distribuição Normal [5].

Aplicação no software REditar

No software R, para usar a distribuição Logística é necessário a instalação do package stats que contém os comandos referentes à f.d.p., à função distribuição e à função quantil [8]. Além disso, também é possível gerar números aleatórios que seguem esta distribuição [8]. Para se usar os comandos é crucial definir primeiro os parâmetros de localização e escala. Note-se que se estes parâmetros não forem definidos previamente, o software R assume por defeito que o parâmetro de localização é  , e, o parâmetro de escala é  .

Existindo um package que contém as funções essenciais da distribuição Logística não é necessário o utilizador definir essas funções. No entanto, para exemplos ilustrativos realizou-se um pequeno exercício que demonstra que definir a função ou utilizar os comandos do R, para um determinado valor de uma sequência, os resultados são iguais. Os scripts do R encontram-se nas Figuras 3, 5, 7 e 8.

Suponha-se que se considera os parâmetros de localização e escala definidos por   e  , respetivamente, e define-se   como sendo uma sequência de valores entre   e   de tamanho  . Caso o utilizador queira definir ele próprio a f.d.p. deve utilizar o comando function() e inserir a expressão correspondente. Através do comando plot() pode-se ter acesso ao gráfico da f.d.p. definida para a sequência de valores de  . No script da Figura 3, definiu-se a função da f.d.p., fez-se o gráfico desta função que pode ser visto na Figura 4 e, por fim, para um valor da sequência,  , determinou-se o valor da função neste ponto. De seguida, utilizou-se o comando do R, dlogis(), que representa a f.d.p. já definida pelo próprio software, e, calculou-se também para o mesmo valor da sequência definido anteriormente. É espectável que estando todos os comandos bem definidos o valor é exatamente igual. Assim, considerando ambos os comandos o valor da f.d.p., para  , é dado por  .

 
Figura 4 - Gráfico da f.d.p. para a sequência definida.
 
Figura 3 - Script da f.d.p.












Realizou-se o mesmo processo para a função distribuição. O comando do R para esta função é designado por plogis(). O valor da sequência escolhido foi  . E, tal como seria de esperar, para ambos os comandos o valor da função distribuição para   é dado por  . Na Figura 5, visualiza-se o script do R para a função distribuição e o gráfico desta função, para a sequência de valores definida no script, encontra-se na Figura 6.

 
Figura 6 - Gráfico da função distribuição para a sequência definida.
 
Figura 5 - Script da função distribuição.












A função quantil é representada pelo comando qlogis(). Uma vez que a função quantil é definida por um logaritmo esta função apenas calcula quantis para valores entre   e  . Definiu-se a função quantil também pelo comando function() e, para fazer a sua representação gráfica considerou-se uma sequência de valores para   entre   e   de tamanho  , tendo obtido a Figura 9. De seguida, calculou-se o 1º Quartil, para  , a mediana, para  , e, o 3º Quartl, para  , usando o comando já existente no R e a função definida, com parâmetros dados por   e  . Na Figura 8, encontra-se o script do R para a função quantil. Assim, para o 1º Quartil obteve-se uma quantil de  , para a mediana um quantil de   e, para o 3º Quartil um quantil de  , usando ambos os comandos.

 
Figura 9 - Gráfico da função quantil para a sequência definida.
 
Figura 8 - Script da função quantil.

















Para os exemplos anteriores, considerou-se um valor inicial fixo. No entanto, o comando rlogis() permite gerar valores aleatórios da distribuição em causa para um determinando conjunto de observações. No script do R da Figura 7, gerou-se   observações da distribuição Logística com parâmetros   e   para a localização e escala, respetivamente.

 
Figura 7 - Script da geração de números aleatórios.






Todas as distribuições possuem um package que utilizando o software R o utilizador tem acesso às funções que lhes são correspondentes. Assim, uma vez que todas as distribuições são cruciais para diversos estudos, graças a esses packages não é necessário que o utilizador perca tempo em definir cada uma das funções.

Referências

  1. Viali, Prof. Dr. Lorí. «Modelos Probabilísticos Contínuos» (PDF) 
  2. a b c d e f g h «Logistic distribution». Wikipedia (em inglês) 
  3. a b c d «RPubs - Logistics Distribution Basics». rpubs.com 
  4. Oliveira, Anderson Castro. «Lista de Modelos Probabilísticos» (PDF). Lista de Modelos Probabilísticos 
  5. a b c d «Logistic Distribution». Statistics How To (em inglês) 
  6. «Curtose». Wikipédia, a enciclopédia livre 
  7. a b c d e «LogisticDistribution—Wolfram Language Documentation». reference.wolfram.com (em inglês) 
  8. a b «R: The Logistic Distribution». stat.ethz.ch