Clustering: diferenças entre revisões

Conteúdo apagado Conteúdo adicionado
Linha 1:
{{mais fontes|data=fevereiro de 2014}}
O '''''clustering''''' ou '''análise de agrupamento de dados''' é o conjunto de técnicas de [[Mineração de dados|prospeção de dados]] (''data mining'') que visa para fazer agrupamentos automáticos de dados segundo o seu grau de semelhança. O critério de semelhança faz parte da definição do problema e, dependendo, do algoritmo. A cada conjunto de dados resultante do processo dá-se o nome de grupo, aglomerado ou agrupamento (''cluster'').
 
O procedimento de agrupamento (''clustering'') também pode ser aplicado a bases de texto utilizando algoritmos de [[Mineração de texto|prospeção de texto]] (''text mining''), onde o algoritmo procura agrupar textos que falem sobre o mesmo assunto e separar textos de conteúdo diferentes.