Skip to content

pveinberg-indra/formacao-engenharia-dados

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

19 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Pipeline de dados

Objetivos

O objetivo deste projeto é desenvolver um pipeline para movimentar dados a partir de uma fonte inicial (flatfile) até a apresentação de dashboard para tomada de decisão sobre plataforma Power BI.

  1. Arquivos disponibilizados em diretório ad-hoc
  2. Transferência dos arquivos para pasta /raw (servidor de borda)
  3. Transferência dos arquivos para filesystem HDFS, dentro do servidor Hadoop
  4. Criação de estrutura de tabelas e carga na base relacional Hive
  5. Desenvolvimento e transformação em tabelas dimensionais e persistência das mesmas
  6. Desenvolvimento de dashboard (Power BI) e configuração de conexão com servidor remoto.

About

Curso de formação em engenharia de dados

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published