## Introdução
O projeto tem como objetivo o desenvolvimento de um modelo preditivo de riscos ESG (Environmental, Social, Governance) para investimentos sustentáveis. A seguir, detalho a arquitetura, as etapas do desenvolvimento e as decisões tomadas.

## Configuração Inicial do Ambiente de Desenvolvimento
1. **Criação do Ambiente Virtual**
   Para isolar as dependências, configurei o ambiente virtual com os seguintes comandos:
   ```bash
   cd /Users/tatiana.massoco/Desktop/TCC_ESG_Model
   python3 -m venv esg_model_env
   source esg_model_env/bin/activate
   pip install pandas numpy matplotlib seaborn scikit-learn flask
   ```

2. **Controle de Versão com Git**
   Configurei o controle de versão para rastrear alterações e evitar perda de dados:
   ```bash
   git init
   git remote add origin https://github.com/Tati-Prado/TCC_ESG_Model.git
   git add .
   git commit -m "Início do controle de versão do projeto TCC_ESG_Model"
   git push origin main
   
   ```
   
   ## Comandos iniciais principais executados no Terminal

```bash
# Inicialização do repositório
git init
git add .
git commit -m "Configuração inicial do projeto"

# Conexão com o repositório remoto
git remote add origin https://github.com/Tati-Prado/TCC_ESG_Model.git
git push -u origin main

# Configuração do ambiente virtual
python -m venv esg_model_env
source esg_model_env/bin/activate  # Para Mac/Linux
pip install -r requirements.txt

# Atualizações no código e commits subsequentes
git add src/data_cleaning.py
git commit -m "Adiciona análise de outliers para anos específicos no script de limpeza"
git push origin main


   ```
   
## Organização dos Dados
- **Script: `load_datasets.py`**
   - Verifica a existência dos arquivos usando `os`.
   - Carrega os arquivos com `pandas` e inspeciona a estrutura.
   - Identifica e trata erros, como arquivos ausentes.

Após análise, identifiquei `ESGData.csv` como o dataset principal, contendo métricas ESG por país de 1960 a 2020.

## Limpeza e Transformação dos Dados
- **Remoção de Colunas Irrelevantes**: Excluí colunas com valores nulos, como `Unnamed: 66`.
- **Transformação Logarítmica**: Usei `log1p` para normalizar distribuições e lidar com outliers.
- **Visualização das Distribuições**: Gerei histogramas antes e depois da transformação.

### Código para Transformação Logarítmica
```python
import numpy as np

anos_para_transformacao = ["1960", "1970", "1980", "1990", "2000", "2010", "2020"]
for ano in anos_para_transformacao:
    if ano in dados.columns:
        dados[f"{ano}_log"] = np.log1p(dados[ano])


Flask
-----
O que é?
Flask é um framework web minimalista para Python. Ele é amplamente utilizado para construir APIs (Application Programming Interfaces) e aplicações web. É ideal para projetos onde você precisa de algo leve, rápido e fácil de usar.

Por que usar?
- Simplicidade: É ideal para criar APIs REST, permitindo que sua aplicação exponha previsões de risco ESG para outros sistemas em tempo real.
- Flexibilidade: Permite integração com bibliotecas de machine learning, como scikit-learn, TensorFlow ou PyTorch.

Como usar Flask?
1. Instale o Flask:
   pip install flask

2. Crie um arquivo Python para sua API, por exemplo, `app.py`:
   from flask import Flask, request, jsonify

   app = Flask(__name__)

   @app.route('/predict', methods=['POST'])
   def predict():
       # Exemplo de input de dados
       data = request.get_json()
       # Substitua pela lógica do seu modelo
       prediction = {"risk_score": 0.75}
       return jsonify(prediction)

   if __name__ == '__main__':
       app.run(debug=True)

3. Execute o Flask:
   python app.py

4. Acesse a API em http://127.0.0.1:5000.

---

Prometheus
----------
O que é?
Prometheus é uma ferramenta de monitoramento e alertas usada principalmente para aplicações em produção. Ele coleta métricas de sistemas e exibe essas informações em dashboards ou envia alertas.

Por que usar?
- Monitoramento detalhado: Permite monitorar a performance da API, como tempo de resposta e taxas de erro.
- Alertas: Configura alertas para problemas em produção.

Como usar Prometheus?
1. Instale o Prometheus:
   - Download e instruções: https://prometheus.io/download/

2. Configure o arquivo `prometheus.yml` para incluir seu aplicativo:
   scrape_configs:
     - job_name: 'flask_app'
       static_configs:
         - targets: ['localhost:5000']  # Porta onde seu Flask está rodando

3. Inicie o Prometheus:
   ./prometheus --config.file=prometheus.yml

4. Acesse o Prometheus em http://localhost:9090.

---

Grafana
-------
O que é?
Grafana é uma plataforma de visualização de dados que se integra ao Prometheus para criar dashboards interativos.

Por que usar?
- Visualização: Gráficos claros e personalizáveis para monitorar métricas em tempo real.
- Integração: Conecta-se facilmente ao Prometheus.

Como usar Grafana?
1. Instale o Grafana:
   - Download e instruções: https://grafana.com/get/

2. Inicie o Grafana:
   ./bin/grafana-server

3. Acesse http://localhost:3000.

4. Adicione o Prometheus como fonte de dados:
   - Vá para **Configuration > Data Sources > Add data source**.
   - Escolha Prometheus e insira a URL do Prometheus: `http://localhost:9090`.

5. Crie um dashboard:
   - Configure gráficos para exibir métricas como latência, taxa de erro ou uso de recursos da API.

---

Fluxo Completo
--------------
1. **Desenvolvimento**:
   - Crie a API com Flask.
   - Teste localmente com dados simulados.

2. **Monitoramento**:
   - Configure o Prometheus para monitorar métricas.
   - Use o Grafana para visualizar e analisar dados.

3. **Automação**:
   - Use GitHub Actions para automatizar o deploy, integrando mudanças no código diretamente para produção.
