Descrição dos Assignments e do Projeto
-
#Assignment 1:
- What is machine learning
- Different ways of learning from data
- Why probabilistic graphical models
- Major types of PGMs
-
#Assignment 2:
- What is A Probabilistic Graphical Model
- Modelling Conditional Probabilities as Graphs
- Bayesian Networks
- Using pgmpy package
-
#Assignment 3:
PART 1: Hidden Markov Model for sequence annotation
- Understand sequence annotation annotation components
- Understand HMM
- Implementation and testing
PART 2: Parameter and Structure Learning
- Short context
- Parameter Learning in a Bayes Net
- Structure Learning in a Bayes Net
-
#Assignment 4:
PART 1: Variational Autoencoders
- Short context
- Understanding VAE details
- Testing a different Prior
- Comparing VAEs vs Autoencoders
- Conditional VAEs
PART 2: Generative Adversarial Networks
- Short context
- Understanding vanilla GAN architecture details
- Testing the Wasserstein-GAN
-
#Projeto:
Desenvolvido em grupo de 2 com Mafalda Duarte.
Objetivo: O objetivo deste projeto é conduzir uma análise de um dataset derivado do IMDB Movies Dataset, abrangendo técnicas de pré-processamento, visualização e modelagem de dados com vista ao desenvolvimento de modelos preditivos para perceber as relações entre eles. Estes objetivos devem ser atingidos dando especial foco nos métodos abordados na disciplina - Redes Bayesianas e Variational Autoencoders (VAE).
PART 1: Implementação de modelo Bayesiano
- Obtenção do dataset e tratamento adequado dos dados raw (Data Cleaning, missing data, Data discretization);
- Análise Exploratória;
- Construção da estrutura da Bayes Net. Avaliar estratégias de construção da estrutura da Bayes Net, incluindo Knowledge Engineering;
- Aprendizagem dos parâmetros da Bayes Net;
- Realização de inferências. Análise da Bayes Net obtida e demonstração da utilização da rede para obtenção de inferências.
PART 2: Implementação de modelo baseado em VAE
- Obtenção do dataset através do relacionamento das duas bases de dados. Exploração do dataset obtido, incluindo seleção das features de interesse e processamento das imagens;
- Implementação de modelo VAE com base nas imagens dos posters. Após o treino do VAE, o modelo deve ser usado para fazer a amostragem generativa de novos posters;
- Implementação de modelo cVAE, condicionado pelo género do filme. Extração da informação sobre o género do filme para utilizar como input do treino do cVAE. Geração de novos posters de filmes, condicionados por géneros específicos.