Análise de componentes principais: diferenças entre revisões
Conteúdo apagado Conteúdo adicionado
vocabulário técnico |
|||
Linha 3:
[[Imagem:GaussianScatterPCA.png|thumb|right|PCA de uma [[distribuição Gaussiana multivariada]] centrada em (1,3) com um desvio padrão de 3 aproximadamente na direção (0.878, 0.478) e desvio padrão 1 na direção ortogonal. Os vetores na figura são os autovetores da [[matriz de covariância]] multiplicados pela raiz quadrada do autovalor correspondente, e transladados de forma a iniciarem na média.]]
A '''Análise de Componentes Principais''' (ACP) ou ''Principal Component Analysis'' (PCA) é um procedimento matemático que utiliza uma [[transformação ortogonal]] (ortogonalização de
O PCA foi inventado em 1901 por [[Karl Pearson]].<ref>{{Cite journal| author = Pearson, K. | authorlink=Karl Pearson |year = 1901 | title = On Lines and Planes of Closest Fit to Systems of Points in Space | journal = Philosophical Magazine | volume = 2 | issue = 6 | pages = 559–572 | url = http://stat.smmu.edu.cn/history/pearson1901.pdf |format=PDF}}</ref> Agora, é mais comumente usado como uma ferramenta de [[análise exploratória de dados|Análise Exploratória de Dados]] e para fazer [[modelos preditivos]]. PCA pode ser feito por [[decomposição em autovalores]] (Valores Próprios) de uma matriz
O PCA é a mais simples das verdadeiras análises multivariadas por [[autovetor]]es (Vetores Próprios). Com frequência, sua operação pode ser tomada como sendo reveladora da estrutura interna dos dados, de uma forma que melhor explica a variância nos dados. Se visualizarmos um conjunto de dados multivariados em um espaço de alta [[dimensão]], com 1 eixo por variável, o PCA pode ser usado para fornecer uma visualização em dimensões mais baixas dos mesmos dados, uma verdadeira "sombra" do objeto original quando visto de seu ponto mais informativo. Isto é feito usando-se apenas os primeiros componentes principais, de forma que a dimensionalidade dos dados transformados é reduzida.
O PCA é fortemente ligado à [[análise de fatores]] (Factorial Analysis); de fato, alguns pacotes estatísticos propositadamente confluem as técnicas. A verdadeira análise de fatores faz
== Detalhes ==
|