Sumários

Aula 20 (Módulo III)

24 Maio 2023, 09:00 Pedro Cristiano Santos Martins da Silva

Esta aula foi leccionada na quarta-feira, dia 31 de Maio, das 10h às 13h, na Sala 0.13 do PAI


Tabela de Lance-Williams contendo os parâmetros para o cálculo da fórmula do "update" de vários métodos 
de classificação hierárquica. Método hierárquico da variância mínima (Ward). 
Distâncias cofenéticas e coeficientes de correlação cofenética de Pearson e de Spearman, que podem ser usados,
para comparar diferentes métodos de classificação hierárquica. 
Métodos de classificação não-hierárquicos: método das médias móveis (k-means)
Algumas regras  e critérios de validação interna para ajudar a determinar o número ideal de grupos: 
scree plot da variância intra-grupos, Calinski-Harabaz, método da silhueta e Davies-Boudin. 
Critério de validação externa: comparação entre partições usando os índices de Rand e de Rand ajustado. 
Breve apontamento sobre a Análise Discriminante Linear (segundo Fisher) e aplicação da mesma ao conjunto dos dados dos lírios 

(slides 120 ao  177) - faltam ainda os slides da matéria de ADL dada na aula, que serão disponibilizados muito em breve


Aula 19 (Módulo III)

22 Maio 2023, 08:00 Pedro Cristiano Santos Martins da Silva

Esta aula foi leccionada na segunda-feira, dia 29 de Maio, das 14h30 às 17h30, na Sala 0.13 do PAI


Algumas considerações adicionais sobre a interpretação do biplot e sobre a interpretação da ACP.  
Resolução do exercício 7b) do grupo de exercícios de Análise Multivariada do Prof. Cadima.

Análises classificatórias: terminologia, motivação e conceitos gerais. 
Medidas de dissemelhança para dados quantitativos  (distâncias euclidiana, "taxi-cab", máximo e de Canberra), 
dados binários (concordância simples e de Jaccard) e dados categóricos (distância de chi2).
Algoritmo genérico de classificação hierárquica e dendrograma e implementação desse algoritmo no R (função hclust).
Métodos hierárquicos do vizinho mais próximo (single-linkage), vizinho mais afastado (complete-linkage
e média das distâncias entre grupos (average-linkage). Exemplos 

(slides 64 a 119)


Aula 18 (Módulo III)

17 Maio 2023, 09:00 Pedro Cristiano Santos Martins da Silva

Esta aula foi leccionada na quarta-feira, dia 24 de Maio, das 14h30 às 17h30, na Sala 2.25 do PAI


Abordagem geométrica da ACP enquanto melhor aproximação linear de dimensão r da nuvem de 
pontos dos dados obsevados (centrados), usando a decomposição em valores singulares (SVD). 
Equivalência  entre ACP via decomposição espectral da matriz de covariância/correlação e a ACP via SVD.
Biplots.
Resolução do exercício 7a) do grupo de exercícios de Análise Multivariada do Prof. Cadima.

(slides 49 ao  63)


Aula 17 (Módulo III)

15 Maio 2023, 08:00 Pedro Cristiano Santos Martins da Silva

Esta aula foi leccionada na segunda-feira, dia 22 de Maio, das 8h30 às 11h00, na Sala 0.13 do PAI

Revisão sobre alguns conceitos de Álgebra Linear, incluindo conjuntos ortonormais, noções de vetor e valor próprio,
diagonalização de matrizes simétrica e teorema de decomposição espectral. 
Breve revisão sobre algumas noções básicas de estatística univariate e multivariada
Análise em componentes principais (ACP) sobre a matriz de covariâncias: motivação, formulação do problema, 
vetores dos loadings e dos scores. Exemplos e interpretação no espaço das variáveis.
ACP sobre a matriz de correlações e comparação com ACP sobre a matriz de covariâncias. 

(slides 1 ao  48)


Aula 16 (Módulo II)

12 Maio 2023, 10:00 Jorge Filipe Campinos Landerset Cadima

Modelos Lineares Generalizados [Slides 115-123 + 129-148] e Análise de Covariância [Slides de Modelos Lineares 339-350 + 352-357] . Ainda o Exercício 1 e motivação para um modelo de Análise de Covariância (ANCOVA). Introdução às ANCOVAs através da discussão dum modelo para comparar k regressões lineares simples. A adaptação da ideia aos Modelos Lineares Generalizados: resolução do Exercício 10. A selecção de submodelos. Quadr-resumo da família exponencial de distribuições. O problema da existência dum parâmetro de dispersão Fi desconhecido. Desvio e desvio reduzido. Funções de variância e parâmetro de dispersão. Resíduos de Pearson: definição e particularizações. A Estatística de Pearson Generalizada. A estimação do parâmetro de dispersão. Resíduos do Desvio: definição e particularizações. Os resíduos no R. A necessidade de particularizar para cada MLG a discussão dos resíduos. Algumas questões finais.

Esta aula foi leccionada na quarta-feira, dia 16 de Maio, das 10h00 às 13h00, na Sala 0.13 do PAI