Fração de variância inexplicada

tarefa de regressão em que a fração de variância da variável dependente não pode ser explicada e corretamente predita pela variável independente

Em estatística, a fração de variância inexplicada (FVI) no contexto de uma tarefa de regressão é a fração de variância do regressando (variável dependente) Y que não pode ser explicada, ou seja, que não é corretamente predita, pelas variáveis explicativas X.

Definição formal editar

Suponha que nos seja dada uma função de regressão   rendendo para cada   uma estimativa   onde   é o vetor das i-ésimas observações sobre todas as variáveis ​​explicativas.[1]:181 Definimos a fração de variância inexplicada (FVI) como:

 

onde R2 é o coeficiente de determinação e VARerr e VARtot são a variância dos resíduos e a variância amostral da variável dependente. SSerr (a soma dos erros quadráticos das previsões, equivalentemente a soma residual dos quadrados), SStot (a soma total dos quadrados), e SSreg (a soma dos quadrados da regressão, equivalentemente a soma explicada dos quadrados) são dados por

 

Alternativamente, a fração de variância inexplicada pode ser definida da seguinte forma:

 

onde   é o erro quadrático médio da função de regressão  .

Explicação editar

É útil considerar a segunda definição para entender FVI. Ao tentar prever Y, a função de regressão mais ingênua que podemos pensar é a função constante que prevê a média de Y, ou seja,  . Segue-se que o MSE desta função é igual à variância de Y; ou seja, SSerr = SStot, e SSreg = 0. Nesse caso, nenhuma variação em Y pode ser contabilizada e a FVI tem então seu valor máximo de 1.

Mais geralmente, o FVI será 1 se as variáveis ​​explicativas X não nos dizem nada sobre Y no sentido de que os valores previstos de Y não variam com Y. Mas à medida que a previsão melhora e o MSE pode ser reduzido, o FVI diminui. No caso de previsão perfeita onde   para todo i, o MSE é 0, SSerr = 0, SSreg = SStot, e o FVI é 0.

Referências

  1. Achen, C. H. (1990). «'What Does "Explained Variance" Explain?: Reply». Political Analysis. 2 (1): 173–184. doi:10.1093/pan/2.1.173