Em estatística, o termo modelo linear é usado de diferentes formas de acordo com o contexto. A ocorrência mais comum se dá em conexão com modelos de regressão e o termo é frequentemente assumido como sinônimo de modelo de regressão linear. Entretanto, o termo é também usado em análise de séries temporais com um significado diferente. Em cada caso, a designação "linear" é frequentemente usada para identificar uma subclasse de modelos para os quais uma redução substancial na complexidade da teoria estatística relacionada é possível.[1]

Modelos de regressão linear editar

 Ver artigo principal: Regressão linear

Para o caso da regressão, o modelo estatístico é como segue. Dada uma amostra (aleatória)  , a relação entre as observações   e as variáveis independentes   é formulada como:

 

em que   podem ser funções não lineares. Acima, as quantidades   são variáveis aleatórias que representam os erros na relação. A parte "linear" da designação se relaciona com o aparecimento dos coeficientes de regressão   em uma forma linear na relação acima. Alternativamente, pode-se dizer que os valores previstos correspondentes ao modelo acima, mais precisamente:

 

são funções lineares dos  . Dado que a estimativa é realizada com base em um análise de mínimos quadrados, estimativas dos parâmetros desconhecidos   são determinadas ao minimizar uma função de soma de quadrados:

 [2]

A partir disto, pode-se ver prontamente que o aspecto "linear" do modelo significa o seguinte:

  • A função a ser minimizada é uma função quadrática dos  , para a qual a minimização é um problema relativamente simples;
  • As derivadas da função são funções lineares dos  , o que torna mais fácil encontrar os valores minimizantes;
  • Os valores minimizantes   são funções lineares das observações  ;
  • Os valores minimizantes   são funções lineares dos erros aleatórios  , o que torna relativamente fácil determinar as propriedades estatísticas dos valores estimados dos  .[3]

Modelos de séries temporais editar

Um exemplo de um modelo linear de série temporal é um modelo ARMA. Aqui, o modelo para valores   em uma série temporal pode ser escrito na forma:

 

em que novamente as quantidades   são variáveis aleatórias que representam inovações, que são novos efeitos aleatórios que aparecem em um certo tempo, mas que também afetam valores de   em tempos posteriores. Neste exemplo, o uso do termo "modelo linear" se refere à estrutura da relação acima ao representar   como uma função linear dos valores passados da mesma série temporal e dos valores presentes e passados das inovações. Este aspecto particular da estrutura significa que é relativamente simples derivar relações para as propriedades de média e covariância da série temporal. Nota-se que aqui a parte "linear" do termo "modelo linear" não está se referindo ao coeficientes   e  , como seria no caso de um modelo de regressão, que parece estruturalmente semelhante.[4]

Outros usos em estatística editar

Há algumas outras instâncias em que "modelo não linear" é usado para contrastar com um modelo linearmente estruturado, embora o termo "modelo linear" não seja usualmente aplicado. Um exemplo disto é a redução de dimensionalidade não linear.[5]

Ver também editar

Referências editar

  1. Mardia, K. M.; Kent, J. T.; Bibby, J. M. (1979). Multivariate analysis. London: Academic Press. ISBN 0124712525. OCLC 6164035 
  2. Friston, K. J.; Holmes, A. P.; Worsley, K. J.; Poline, J. -P.; Frith, C. D.; Frackowiak, R. S. J. (1994). «Statistical Parametric Maps in functional imaging: A general linear approach». Human Brain Mapping. Consultado em 20 de fevereiro de 2018 
  3. Seber, George A. F.; Lee, Alan J. (2003). Linear regression analysis 2 ed. Hoboken, N.J.: Wiley-Interscience. ISBN 9781118274422. OCLC 775437886 
  4. Priestley, Maurice Bertram (1998). Non-linear and non-stationary time series analysis. London: Academic Press. ISBN 0125649118. OCLC 24107579 
  5. Lee, John Aldo; Verleysen, Michel (2007). Nonlinear dimensionality reduction. New York: Springer. ISBN 9780387393513. OCLC 191448634