Clustering: diferenças entre revisões

Conteúdo apagado Conteúdo adicionado
Dbastro (discussão | contribs)
m peq. ajustes, typos fixed: algorítmos → algoritmos utilizando AWB
Linha 1:
{{mais fontes|data=fevereiro de 2014}}
'''Clustering''' é uma técnica de [[Mineração de dados|Data Mining]] para fazer agrupamentos automáticos de dados segundo seu grau de semelhança. O critério de semelhança faz parte da definição do problema e, dependendo, do algoritmo.
 
O procedimento de Clustering também pode ser aplicado a bases de texto utilizando algoritmos de [[Mineração de texto|Text Mining]], onde o algoritmo procura agrupar textos que falem sobre o mesmo assunto e separar textos de conteúdo diferentes.
 
Normalmente o usuário do sistema deve escolher ''a priori'' o número de grupos a serem detectados. Alguns algorítmosalgoritmos mais sofisticados pedem apenas o número mínimo, outros tem a capacidade de subdividir um grupo em dois.
 
Os tipos de algoritmos de agrupamento de dados mais comuns são os: Particionais e os Hierárquicos.
Linha 29:
|primeiro1 = Toby
|último1 = Segaran
| authorlink1autorlink1 = Toby Segaran
|título= [[Programming Collective Intelligence]]
|edição= First
|publicado= O’Reilly
|ano= 2007
| isbn = 0-596-52932-5
}}
</ref>
Linha 55:
|primeiro1 = Jon
|último1 = Kleinberg
| authorlink1autorlink1 = Jon Kleinberg
|primeiro2 = Éva
|último2 = Tardos
| authorlink2autorlink2 = Éva Tardos
|título= [[Algorithm Design]]
|edição= First
Linha 152:
</big>
 
{{Referências|col=1}}
 
==== <nowiki/> ====
{{Esboço-programação}}