Sumários

Aula suplementar (Módulo III)

12 Junho 2019, 10:30 Pedro Cristiano Santos Martins da Silva

Comparação de classificações: índice de Rand e índice de Rand ajustado. Resolução de exercícios,

incluindo com exemplificação no programa R de algumas ferramentas de análise classificatória.


Aula 5 (Módulo III)

30 Maio 2019, 11:00 Pedro Cristiano Santos Martins da Silva

O caso do método da variância mínima  (Ward).  Análises classificatórias não hierárquicas. O método dos K-médias e dos K-medoides.  O método do DBSCAN. Validação interna de uma análise classificatória. Estimação do número ótimo de grupos. Resolução de exercícios


Aula 4 (Módulo III)

28 Maio 2019, 11:00 Pedro Cristiano Santos Martins da Silva

Análise classificatória: introdução, motivação e conceitos gerais.  Métricas de (dis)semelhança para dados quantitativos  (distâncias de Minkoswki e distância euclideiana generalizada incluindo a distÂncia de Mahalanobis) e para dados binários (concordância simples e de Jacard). Algorítmo genérico de classificação hierárquica aglomerativa e dendrograma. Matriz de distâncias cofenéticas, diagrama de Sheppard e coeficientes de correlação cofenética de Pearson e Spearman. Métodos hierárquicos monótonos e não monótonos (i.e., com inversões). Método do vizinho mais próximo (single-linkage), do vizinho mais afastado (complete-linkage), das distâncias médias entre grupos (average), do centroide, da mediana. Métodos hierárquicos via a fórmula de Lance-Williams. e 


Aula 3 (Módulo III)

23 Maio 2019, 11:00 Jorge Filipe Campinos Landerset Cadima

[Acetatos 65-111] Ainda  a Decomposição em Valores Singulares duma matriz genérica Y: relação com as Decomposições Espectrais de Y^t Y e Y Y^t. A ACP como uma DVS da matriz 1/sqrt(n-1) X^c, onde X^c é a matriz centrada dos dados. Ilustração da DVS no R (comando svd). O Teorema de Eckart-Young. O biplot, como técnica de representação simultânea dos individuos e variáveis, associando conceitos geométricos e estatísticos. O exemplo dos lavagantes. A Análise Discriminante Linear: conceitos introdutórios. A formalização do problema como um problema generalizado de valores próprios. Os eixos discriminantes: definição e propriedades. A visualização geométrica. Formulações alternativas equivalentes. A relação entre a ADL e a ANOVA a um factor. A associação de novos indivíduos aos subgrupos. Os comandos R para uma ADL e as suas características. 


Aula 2 (Módulo III)

21 Maio 2019, 11:00 Jorge Filipe Campinos Landerset Cadima

[Acetatos 40-65 + 22] Ainda o exemplo dos lavagantes. Coeficiente de correlação entre variáveis originais e CPs. Propriedades das CPs. A sensibilidade das CPs a alterações diferenciadas nas unidades de medida de cada variável. A ACP sobre os dados normalizados (isto é, sobre a matriz de correlações). Propriedades e características da ACP sobre a matriz de correlações. A representação alternativa dos dados no espaço das variáveis (R^n): conceitos estatísticos como conceitos geométricos; interpretação dos objectivos e características da ACP no espaço das variáveis. Advertências sobre a ACP. Um critério alternativo (invariante a mudanças de escala lineares) optimizados pelas ACPs sobre a matriz de correlações. O problema generalizado de valores e vectores próprios. A Decomposição em Vectores e Valores Singulares duma matriz genérica.