O intuito do conteúdo é apresentar, de forma superficial, um conjunto de tecnologias para agregar com as resoluções do módulo de Projeto Final 1 do curso de Formação Engenharia de Dados [2022]: Domine Big Data!.
Aqui vamos criar a infraestrutura pelo terraform e adicionar os dados em conjunto. Com os dados armazenados na cloud, estaremos utilizando o python para consumir esses objetos e adicioná-los ao warehouse redshift. A organização dos dados será feita pelo dbt cloud, focando nas querys, tests, jobs e principalmente na documentação. Ao final estaremos permitindo que esses dados tratados possam ser acessados pelo looker studio. Enjoy! ;D
Existem 2 modelos sobre as documentações com diferenças sobre a localização do mkdocs no repositório e arquivo "mkdocs-ci.yml":
- Para a documentação com diretório específico: northwind.
- Para a documentação com diretório na raiz: northwind-mkdocs.
"O que realmente muda em cada uma?" - você deve pensar. O primeiro modelo é para você que deseja apenas criar um diretório específico para documentação dentro do seu projeto sem a necessidade de criar um novo repositório para isso. O segundo modelo é para você separar o projeto real da documentação, em alguns momentos você não deseja compartilhar o código do projeto, mas somente a documentação com equipes específicas. Lembrando que a existência de ambos é de caráter didático.
As seguintes ferramentas e tecnologias serão utilizadas no projeto:
Tecnologia | Descrição |
---|---|
Python | Linguagem de programação de alto nível |
Visual Studio Code | Editor de código-fonte desenvolvido pela Microsoft para Windows, Linux e macOS |
AWS | Plataforma de serviços de computação em nuvem da Amazon.com |
Terraform | Ferramenta de código aberto para infraestrutura como configuração da HashiCorp |
Dbt cloud | O dbt Cloud™ é a maneira mais rápida e confiável de implantar o dbt |
Looker Studio | Ferramenta gratuita para transformar dados em relatórios e painéis informativos personalizados |
Para começar, você precisará:
- Instalar a CLI do Terraform
- Instalar a CLI da AWS
- Criar uma conta na AWS
- Configurar as credenciais AWS
Deverá ter criado: conta na AWS, as credenciais e configurado a CLI da AWS.
Observação: será utilizado o profile da CLI AWS para evitar compartilhamento de chaves de acesso.
Caso tenha dúvidas ou deseje fornecer sugestões, entre em contato. Agradecemos o seu feedback!