Clustering: diferenças entre revisões

Conteúdo apagado Conteúdo adicionado
Linha 16:
=== Clustering de máximo espaçamento ===
Suponha que temos um conjunto <math>U</math> de n objetos <math>p_{1}, p_{2}, ..., p_{n}</math>. Para cada par, pi e pj, temos uma distância d numérica <math>(p_{i}, p_{j})</math>. Exigimos apenas que <math>d(p_{i}, p_{j}) = 0</math> para todo <math>i</math>; que <math>d(p_{i}, p_{j}) > 0</math> para <math>i</math> e <math>j</math> distintos; e que as distâncias sejam simétricas, ou seja, que <math>d(p_{i}, p_{j}) = d(p_{i}, p_{j})</math>.
Suponha que queremos dividir os objetos de <math>U</math> em k grupos, para um determinado parâmetro k. Dizemos que um k-clustering de <math>U</math> é uma partição de U em k conjuntos não vazios C1<math>C_{1}, C2C_{2}, ..., CkC_{k}</math>. Definimos o espaçamento de um k-clustering para ser a distância mínima entre qualquer par de pontos situados em diferentes clusters.
Dado que queremos pontos em diferentes clusters para serem distantes um do outro, um objetivo natural é buscar o k-clustering com o máximo espaçamento possível. Entretanto, há muitos k-clusterings diferentes de um conjunto <math>U</math>. O problema agora se resume em encontrar de forma eficiente o que tem espaçamento máximo.