# Projeto de Gestão de Preços e Gestão de Demanda de Medicamentos

### 1. ENTENDIMENTO DO NEGÓCIO (BUSINESS UNDERSTANDING)

Este projeto de Engenharia de Dados visa criar uma plataforma analítica robusta para a gestão de riscos e oportunidades nas compras públicas de medicamentos. O objetivo é transformar dados transacionais brutos e voláteis em inteligência acionável e auditável.


#### 1.1. Contexto Geral e Missão

O cenário de compras públicas é marcado por grande volume de transações, falta de padronização de dados e flutuações de preços. Isso dificulta a identificação de sobrepreço, o planejamento de estoque e a gestão de fornecedores.

| Missão do Projeto | Descrição |
| :--- | :--- |
| **Geração de Inteligência** | Transformar dados transacionais de volume em métricas de risco quantificáveis (ex: Z-Score). |
| **Otimização de Custos** | Fornecer a visibilidade necessária para identificar e priorizar oportunidades de economia e evitar sobrepreço. |
| **Compliance & Auditoria** | Criar um Data Mart (Star Schema) que suporte auditorias detalhadas, rastreando o risco até a transação de origem. |


#### 1.2. Metodologia e Abordagem Profissional

Todo o pipeline (do raw ao outputs) foi desenvolvido utilizando a metodologia CRISP-DM (Cross-Industry Standard Process for Data Mining), garantindo que a solução técnica estivesse sempre alinhada com as necessidades do negócio.

| Fase do CRISP-DM | Entregável no Projeto | Módulos Envolvidos |
| :--- | :--- | :--- |
| **1. Entendimento do Negócio** | Este Notebook (01_Entendimento_Negocio.ipynb) | - |
| **2. Entendimento dos Dados** | Glossário e Dicionário (02_Glossario_e_Dicionario.ipynb) | - |
| **3. Preparação dos Dados (ETL)** | Scripts de Limpeza e Consolidação (etl_antigos.py, etl_novos.py) | 03 e 04_Revisao_ETL_Limpeza.ipynb |
| **4. Modelagem (Feature Eng.)** | Geração de Indicadores de Risco (modelagem_dim.py) | 06_Modelagem.ipynb |
| **5. Avaliação** | Validação estatística de Z-Score e análise de ociosidade de fornecedores. | 06_Modelagem.ipynb |
| **6. Deployment (Implantação)** | Orquestrador Central e Geração do Star Schema (main.py) | 07_Main.ipynb e dimensoes.py |


#### 1.3. Definição do Problema e Fontes de Dados

O projeto foca em enriquecer e modelar a informação de preços de medicamentos para que a análise de risco seja feita com base em um benchmark de mercado dinâmico.

##### Fonte Primária de Dados

| Fonte | Período de Cobertura | Uso no Projeto | 
| :--- | :--- | :--- |
| **OpenDataSUS - BPS** | 2020 a 2025 | Fornece o volume, o preço unitário, as datas, os fornecedores e as instituições envolvidas nas transações de compra de medicamentos. |


#### 1.4. Objetivos Estratégicos e Questões-Chave

O objetivo final é disponibilizar um Painel de Análise (Data Mart/Power BI) baseado em um Star Schema otimizado, que responda às seguintes questões-chave do negócio:

| Questão-Chave | Métrica no Data Mart | Solução de Engenharia |
| :--- | :--- | :--- |
| **Onde está o sobrepreço?** | Z-Score de Risco e Desvio % Oportunidade. | Cálculo do Z-Score para identificar preços estatisticamente atípicos (outliers). |
| **Quais produtos são instáveis?** | Risco de Intermitência (Meses sem compra / Período Total). | Normalização da demanda ao longo do tempo. |
| **Quão vulnerável é a cadeia?** | Concentração de Fornecedor (Gasto no fornecedor principal). | Cálculo da proporção de gasto por produto. |
| **Onde devo focar meus esforços?** | Índice de Priorização e Economia por Linha. | Combinação e ranqueamento de todas as métricas em um único índice. |


#### 1.5. Critérios de Sucesso e Entregáveis

O sucesso do projeto é medido pela sua capacidade de entregar um ambiente analítico auditável, eficiente e escalável.

| Critério de Sucesso | Medida de Sucesso | Entregável Principal |
| :--- | :--- | :--- |
| **Economicidade** | Quantificação do Potencial de Economia (R$) em transações com preço acima do benchmark mediano. | Coluna Economia_por_Linha na Tabela Fato. |
| **Eficiência** | Tempo de processamento rápido e alta velocidade de consulta no Power BI. | Orquestrador Central (main.py) e Star Schema otimizado. |
| **Integridade** | Taxa de Unicidade e Completude de dados > 99%. | Relatórios de Qualidade (gerados nas fases ETL). |
| **Analítico** | Painel de controle (Dashboard) capaz de aplicar Drill-through e responder às 4 Questões-Chave. | Data Mart Final (Arquivos na pasta data/outputs/). |

