Sumários
Aula suplementar (Módulo III)
12 Junho 2019, 10:30 • Pedro Cristiano Santos Martins da Silva
Comparação de classificações: índice de Rand e índice de Rand ajustado. Resolução de exercícios,
Aula 5 (Módulo III)
30 Maio 2019, 11:00 • Pedro Cristiano Santos Martins da Silva
O caso do método da variância mínima (Ward). Análises classificatórias não hierárquicas. O método dos K-médias e dos K-medoides. O método do DBSCAN. Validação interna de uma análise classificatória. Estimação do número ótimo de grupos. Resolução de exercícios
Aula 4 (Módulo III)
28 Maio 2019, 11:00 • Pedro Cristiano Santos Martins da Silva
Análise classificatória: introdução, motivação e conceitos gerais. Métricas de (dis)semelhança para dados quantitativos (distâncias de Minkoswki e distância euclideiana generalizada incluindo a distÂncia de Mahalanobis) e para dados binários (concordância simples e de Jacard). Algorítmo genérico de classificação hierárquica aglomerativa e dendrograma. Matriz de distâncias cofenéticas, diagrama de Sheppard e coeficientes de correlação cofenética de Pearson e Spearman. Métodos hierárquicos monótonos e não monótonos (i.e., com inversões). Método do vizinho mais próximo (single-linkage), do vizinho mais afastado (complete-linkage), das distâncias médias entre grupos (average), do centroide, da mediana. Métodos hierárquicos via a fórmula de Lance-Williams. e
Aula 3 (Módulo III)
23 Maio 2019, 11:00 • Jorge Filipe Campinos Landerset Cadima
[Acetatos 65-111] Ainda a Decomposição em Valores Singulares duma matriz genérica Y: relação com as Decomposições Espectrais de Y^t Y e Y Y^t. A ACP como uma DVS da matriz 1/sqrt(n-1) X^c, onde X^c é a matriz centrada dos dados. Ilustração da DVS no R (comando svd). O Teorema de Eckart-Young. O biplot, como técnica de representação simultânea dos individuos e variáveis, associando conceitos geométricos e estatísticos. O exemplo dos lavagantes. A Análise Discriminante Linear: conceitos introdutórios. A formalização do problema como um problema generalizado de valores próprios. Os eixos discriminantes: definição e propriedades. A visualização geométrica. Formulações alternativas equivalentes. A relação entre a ADL e a ANOVA a um factor. A associação de novos indivíduos aos subgrupos. Os comandos R para uma ADL e as suas características.
Aula 2 (Módulo III)
21 Maio 2019, 11:00 • Jorge Filipe Campinos Landerset Cadima
[Acetatos 40-65 + 22] Ainda o exemplo dos lavagantes. Coeficiente de correlação entre variáveis originais e CPs. Propriedades das CPs. A sensibilidade das CPs a alterações diferenciadas nas unidades de medida de cada variável. A ACP sobre os dados normalizados (isto é, sobre a matriz de correlações). Propriedades e características da ACP sobre a matriz de correlações. A representação alternativa dos dados no espaço das variáveis (R^n): conceitos estatísticos como conceitos geométricos; interpretação dos objectivos e características da ACP no espaço das variáveis. Advertências sobre a ACP. Um critério alternativo (invariante a mudanças de escala lineares) optimizados pelas ACPs sobre a matriz de correlações. O problema generalizado de valores e vectores próprios. A Decomposição em Vectores e Valores Singulares duma matriz genérica.