Uma plataforma de engenharia de dados moderna implementando o Model Context Protocol (MCP) para garantir governança e interoperabilidade.
Este projeto implementa uma arquitetura completa de engenharia de dados com:
- Ingestão de múltiplas fontes (APIs, bancos SQL/NoSQL, Kafka)
- Armazenamento em Data Lake e Data Warehouse
- Transformação com dbt e Apache Spark
- Orquestração com Apache Airflow
- Monitoramento e qualidade de dados com Great Expectations
- Exposição de dados via APIs REST (FastAPI) e dashboards (Metabase)
- Implementação do Model Context Protocol (MCP) para governança
- Python 3.10+
- Docker e Docker Compose
- Acesso a serviços de nuvem (opcional para implantação)
- Clone este repositório
- Copie
.env.examplepara.enve configure suas variáveis - Crie um ambiente virtual:
uv venv .venv - Ative o ambiente:
source .venv/bin/activate - Instale as dependências:
uv pip install -r requirements.txt
mcp-project/ ├── data/ # Armazenamento local de dados ├── scripts/ # Scripts utilitários ├── airflow/ # DAGs e configurações do Airflow ├── dbt/ # Modelos de transformação dbt ├── spark/ # Jobs Spark para processamento ├── api/ # API FastAPI para exposição de dados ├── config/ # Configurações, incluindo MCP └── tests/ # Testes unitários e de integração Copy
[Documentação detalhada de uso será adicionada...]