Disciplina Curricular
Gestão e Armazenamento de Dados GestADad
Mestrado Bolonha em Ciência de Dados em Agricultura, Alimentação, Floresta e Ambiente - M.CDAAFA 2022/2023
Contextos
Grupo: M.CDAAFA 2022/2023 > 2º Ciclo > Parte Escolar > OBRIGATÓRIAS
Período:
Peso
6.0 (para cálculo da média)
Objectivos
Os alunos que completem a UC devem ter as competências para identificar tipologias de dados quanto ao formato, fonte, taxa de produção e requisitos de uso. Identificar as propriedades de qualidade de dados, a padronização de dados e sua normalização. Compreender os modelos de dados relacionais e não relacionais, os sistemas de gestão de dados disponíveis para cada modelo. Aprender o SQL como linguagem para criação e gestão de sistemas de dados, e aprender a criar modelos de bases de dados relacionais e não relacionais. Identificar as características do big data, e introduzir os conceitos de análise de grandes volumes de dados. Identificar as tecnologias open-source e proprietárias para a gestão e armazenamento de dados, incluindo os serviços na cloud. Identificar recursos de dados abertos na web para a área do ambiente, e especificidade dos formatos de dados agro-ambientais.
Programa
1. Introdução à gestão de dados e aos sistemas de gestão de dados; 2. Tipos de bases de dados; 3. Conceito de bases de dados relacional; 4. Linguagem SQL e aplicação para criação e uso de bases de dados; 5. Principais tecnologias de bases de dados open-source e proprietárias; 6. Sistemas NoSQL e sua aplicação; 7. Princípios de qualidade de dados, vocabulários e ontologias; 8. Ferramentas e recursos para a verificação de qualidade de dados, organização e normalização; 9. Uso de identificadores únicos globais e resolúveis, rastreabilidade; 10. Recursos de dados agroambientais; 11. Introdução ao conceito de conjuntos grandes de dados e suas especificidades em relação à produção, armazenamento e análise.
Métodos de ensino e avaliação
Todas as aulas serão dadas no regime teórico-prático. A introdução dos novos conceitos teóricos será suportada por exercícios práticos, realizados na própria aula, e reforçada por exercícios adicionais a realizar pelos alunos fora do período de horas de contacto, e a ser submetido até à aula seguinte. Estes exercícios farão parte de um projecto pessoal, que cada aluno irá desenvolver ao longo da UC, e que fará parte da avaliação final. As ferramentas informáticas e linguagem de programação serão consistentes com as restantes unidades curriculares nucleares do curso, com recurso à plataforma Jupyter, de modo a favorecer a familiaridade e consolidação de um ambiente de desenvolvimento de projectos de ciência de dados. Avaliação: a avaliação terá as seguintes componentes: avaliação de conhecimentos por testes ou exame final: 30%; projeto pessoal: 50%; participação na aula: 20%