Sumários

Módulo III, Aula 6 (por vídeo-conferência)

12 Junho 2020, 15:00 Pedro Cristiano Santos Martins da Silva

Aula suplementar de resolução de exercícios e exemplificação de algumas ferramentas de análise classificatória no programa informático R.


Módulo III, Aula 5 (por vídeo-conferência)

9 Junho 2020, 15:00 Pedro Cristiano Santos Martins da Silva

O método dos K-médias móveis e dos K-medoides.  O método do DBSCAN. 

Validação interna de uma análise classificatória e critérios para decidir o número ótimo de grupos. 

Comparação de classificações: índice de Rand e índice de Rand ajustado. 

Resolução de exercícios


Módulo III, Aula 4 (por video-conferência)

4 Junho 2020, 09:00 Pedro Cristiano Santos Martins da Silva

Análises classificatórias: introdução, motivação e conceitos gerais.  

Métricas de (dis)semelhança para dados quantitativos  (distâncias de Minkoswki e distância euclideiana generalizada incluindo a distância de Mahalanobis) e para dados binários (concordância simples e de Jacard). 
Algoritmo genérico de classificação hierárquica aglomerativa e dendrograma. Matriz de distâncias cofenéticas, diagrama de Sheppard e coeficientes de correlação cofenética de Pearson e Spearman. Métodos hierárquicos monótonos e não monótonos (i.e., com inversões). 
Método do vizinho mais próximo (single-linkage), do vizinho mais afastado (complete-linkage), das distâncias médias entre grupos (average), do centroide, da mediana e da inércia mínima (Ward). Métodos hierárquicos via a fórmula de Lance-Williams. 
Breve apontamento sobre os métodos divisivos. 


Módulo III, Aula 3

2 Junho 2020, 15:00 Jorge Filipe Campinos Landerset Cadima

Esta aula decorreu por video- conferência, no dia 2.6.20, das 15h00 às 17h30, e visou substituir uma das aulas perdidas no início da fase de encerramento presencial do ISA/UL.
[Acetatos 81-134] Ainda o Teorema de Eckart-Young: interpretação e relação com a ACP. Biplots: conceito, definição, propriedades dos marcadores de variáveis. Distâncias de Mahalanobis: definição e interpretação. Propriedades dos marcadores de indivíduos num biplot. Relação com a ACP. Biplots a 2 e 3 dimensões no R: o exemplo dos lavagantes. Análise Discriminante Linear: introdução às Análises Discrimiantes e à AD Linear em particular. A matriz das variáveis indicatrizes de subgrupos, G. A matriz de projecção ortogonal sobre o espaço gerado pelas colunas dessa matriz e as propriedades dos vectores projectados sobre C(G). As normas de vectores centrados, projectados sobre o espaço das colunas de G e a sua interpretação à luz do nosso objectivo. A relação entre essas normas ao quadrado e as Somas de Quadrados duma ANOVA a um factor. O critério de Fisher: maximizar a razão entre a variabilidade inter-grupo e a variabilidade intra-grupo. A decomposição S=B+W. A solução, como aplicação do problema de valores próprios generalizados. Valores e vectores próprios de W^(-1)B. Sucessivos eixos discriminantes, as suas propriedades e capacidade discriminante. A interpretação geométrica da ADL no espaço das variáveis (R^n). Alguns critérios alternativos, mas equivalentes e a sua relação com o critério de Fisher. A relação da ADL com a ANOVA a um factor. Critérios de classificação de novos indivíduos. A ADL no R: a função lda do módulo MASS: suas particularidades. Discussão da discriminação dos lavagantes em três grupos (machos reprodutores, machos não reprodutores e fêmeas). A classificação de novos indivíduos através do método predict da função lda. Discussão dos resultados no exemplo dos lavagantes. O Exercício 17 e uma função rudimentar para efectuar uma ADL com os conceitos de Fisher.


Módulo III, Aula 2

28 Maio 2020, 10:00 Jorge Filipe Campinos Landerset Cadima

[Acetato 29 + 49-80] Produtos de matrizes envolvendo matrizes diagonais. Relação entre as matrizes de correlações e de variâncias. AInda o exmplo da ACP sobre os dados dos lavagantes: exploração dos dados. A ACP sobre os dados normalizados (sobre a matriz de correlações): vantagens; resultados diferentes. O Exemplo dos lavagantes. Centragem e normalização dos dados: interpretações na representação tradicional (em R^p) e alternativa (R^n). Interpretação de ACPs na representação alternativa (espaço das variáveis). Um critério alternativo optimizado pelas CPs sobre a matriz de correlaçoes: identificar sucessivas combinações lineares de variáveis que maximizem a soma de quadrados das correlações com as p variáveis originais. O problema generalizado de valores próprios e sua solução. Uma introdução alternativa, de base geométrica, à ACP. A Decomposição em Valores Singulares (DVS) de uma qualquer matriz. A relação entre a DVS de Y e as Decomposições Espectrais de Y^t Y e de Y Y^t.  A ACP como  uma DVS da matriz centrada de dados (vezes uma constante). A DVS como solução dum problema geométrico de redução de dimensão: o Teorema de Eckart-Young.