Análise de componentes principais: diferenças entre revisões

Conteúdo apagado Conteúdo adicionado
Removi a parte de matriz de correlação, porque não necessariamente uma matriz de covariância é igual a uma matriz de correlação. Elas só serão iguais quando a média dos dados for nula.
Linha 237:
 
=== Robustez - PCA com pesos ===
Apesar do PCA encontrar o método matematicamente ótimo (no sentido de minimizar o erro quadrático), ele é sensível a ''[[outlier]]s'' nos dados, que produzem grandes erros que o PCA tenta evitar. Portanto, é de praxe remover os ''outliers'' ao calcular o PCA. No entanto, em alguns contextos, os ''outliers'' podem ser difíceis de se identificar de antemão. Por exemplo, em algoritmos de [[mineração de dados]] como ''[[:en:correlation clustering]]'', a atribuição de pontos a clusters e ''outliers'' não é conhecida de antemão. Uma generalização proposta recentemente de PCA <ref>{{citeCitar doilivro|título = A General Framework for Increasing the Robustness of PCA-Based Correlation Clustering Algorithms|url = http://link.springer.com/chapter/10.1007/978-3-540-69497-7_27|editora = Springer Berlin Heidelberg|ano = 2008-01-01|isbn = 978-3-540-69476-2|página = 418-435|doi = 10.1007/978-3-540-69497-7_27|nome = Hans-Peter|sobrenome = Kriegel|nome2 = Peer|sobrenome2 = Kröger|nome3 = Erich|sobrenome3 = Schubert|nome4 = Arthur|sobrenome4 = Zimek|editor = Bertram}}</ref> baseada em um '''PCA com pesos''' aumenta a robustez, associando pesos diferentes aos dados de acordo com sua relevância estimada.
 
== Ver também ==