Módulo III, Aula 4 (por video-conferência)
4 Junho 2020, 09:00 • Pedro Cristiano Santos Martins da Silva
Análises classificatórias: introdução, motivação e conceitos gerais.
Métricas de (dis)semelhança para dados quantitativos (distâncias de Minkoswki e distância euclideiana generalizada incluindo a distância de Mahalanobis) e para dados binários (concordância simples e de Jacard).
Algoritmo genérico de classificação hierárquica aglomerativa e dendrograma. Matriz de distâncias cofenéticas, diagrama de Sheppard e coeficientes de correlação cofenética de Pearson e Spearman. Métodos hierárquicos monótonos e não monótonos (i.e., com inversões).
Método do vizinho mais próximo (single-linkage), do vizinho mais afastado (complete-linkage), das distâncias médias entre grupos (average), do centroide, da mediana e da inércia mínima (Ward). Métodos hierárquicos via a fórmula de Lance-Williams.
Breve apontamento sobre os métodos divisivos.