Skip to content

AyltonAguiar/northwind

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

30 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Projeto Engenheiro de Dados

Descrição

O intuito do conteúdo é apresentar, de forma superficial, um conjunto de tecnologias para agregar com as resoluções do módulo de Projeto Final 1 do curso de Formação Engenharia de Dados [2022]: Domine Big Data!.

Aqui vamos criar a infraestrutura pelo terraform e adicionar os dados em conjunto. Com os dados armazenados na cloud, estaremos utilizando o python para consumir esses objetos e adicioná-los ao warehouse redshift. A organização dos dados será feita pelo dbt cloud, focando nas querys, tests, jobs e principalmente na documentação. Ao final estaremos permitindo que esses dados tratados possam ser acessados pelo looker studio. Enjoy! ;D

Documentação

Existem 2 modelos sobre as documentações com diferenças sobre a localização do mkdocs no repositório e arquivo "mkdocs-ci.yml":

  • Para a documentação com diretório específico: northwind.
  • Para a documentação com diretório na raiz: northwind-mkdocs.

"O que realmente muda em cada uma?" - você deve pensar. O primeiro modelo é para você que deseja apenas criar um diretório específico para documentação dentro do seu projeto sem a necessidade de criar um novo repositório para isso. O segundo modelo é para você separar o projeto real da documentação, em alguns momentos você não deseja compartilhar o código do projeto, mas somente a documentação com equipes específicas. Lembrando que a existência de ambos é de caráter didático.

Stack

As seguintes ferramentas e tecnologias serão utilizadas no projeto:

Tecnologia Descrição
Python Linguagem de programação de alto nível
Visual Studio Code Editor de código-fonte desenvolvido pela Microsoft para Windows, Linux e macOS
AWS Plataforma de serviços de computação em nuvem da Amazon.com
Terraform Ferramenta de código aberto para infraestrutura como configuração da HashiCorp
Dbt cloud O dbt Cloud™ é a maneira mais rápida e confiável de implantar o dbt
Looker Studio Ferramenta gratuita para transformar dados em relatórios e painéis informativos personalizados

Diagrama:

image

Pré-Requisitos

Para começar, você precisará:

  1. Instalar a CLI do Terraform
  2. Instalar a CLI da AWS
  3. Criar uma conta na AWS
  4. Configurar as credenciais AWS

Deverá ter criado: conta na AWS, as credenciais e configurado a CLI da AWS.

Observação: será utilizado o profile da CLI AWS para evitar compartilhamento de chaves de acesso.

Dúvidas e Sugestões

Caso tenha dúvidas ou deseje fornecer sugestões, entre em contato. Agradecemos o seu feedback!

Obrigado!