Skip to content

brunobapa/data-engineering-projects

Repository files navigation

Data Engineering Projects

Projetos práticos de Engenharia de Dados desenvolvidos com foco em ETL, pipelines de dados, processamento em larga escala e análise orientada por dados.


📌 Sobre este repositório

Este repositório reúne projetos práticos voltados à Engenharia de Dados, com aplicação de boas práticas de ingestão, transformação, armazenamento e análise de dados.
Os projetos foram desenvolvidos com o objetivo de consolidar conhecimentos técnicos e simular cenários reais do mercado.


🚀 Projetos

1️⃣ Pipeline ETL com API Pública

📁 Pasta: projeto-etl-api

Descrição:
Pipeline ETL automatizado que realiza a ingestão de dados a partir de uma API pública, executa processos de limpeza e transformação dos dados, armazena em banco relacional e disponibiliza informações para análise e visualização.

Tecnologias:

  • Python
  • SQL (PostgreSQL)
  • APIs REST
  • Pandas
  • Apache Airflow
  • Power BI

2️⃣ Processamento de Dados com Apache Spark

📁 Pasta: projeto-spark-bigdata

Descrição:
Projeto focado no processamento de grandes volumes de dados utilizando Apache Spark, aplicando conceitos de Big Data, processamento distribuído e análise de dados escalável.

Tecnologias:

  • Apache Spark (PySpark)
  • Python
  • SQL
  • MongoDB
  • Jupyter Notebook

📎 Autor

Bruno Almeida
Engenharia de Dados | Python | SQL | ETL | Big Data
📍 Brasil
🔗 LinkedIn: https://www.linkedin.com/in/bruno-almeida-38992528a/

About

Projetos práticos de Engenharia de Dados com Python, SQL, ETL e Big Data

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages