# ETAPA 8 ‚Äî Desenvolvimento da API com FastAPI

## Objetivo desta etapa

Nesta etapa, iniciaremos o desenvolvimento de uma API RESTful em FastAPI, que ser√° respons√°vel por servir o modelo de classifica√ß√£o de cr√©dito treinado e versionado previamente com MLflow. Essa API ser√° o componente intermedi√°rio entre o frontend (Streamlit) e os artefatos de modelo armazenados no backend (MinIO via DVC).

A API ser√° desenvolvida dentro de um novo notebook t√©cnico, seguindo o protocolo de engenharia progressiva em ambiente containerizado. O c√≥digo posteriormente ser√° consolidado em um ou mais arquivos `.py` para versionamento est√°vel no reposit√≥rio Git.

## Componentes que ser√£o implementados

A arquitetura da API inclui:

1. Endpoint principal `/predict` (POST)  
   - Recebe os dados do cliente via JSON.  
   - Aplica o pr√©-processamento necess√°rio (OrdinalEncoder treinado).  
   - Carrega o modelo Random Forest Tuned a partir do reposit√≥rio MLflow (usando o `run_id` consolidado).  
   - Realiza a infer√™ncia e retorna a classe predita (`Good`, `Standard`, `Poor`).

2. Autentica√ß√£o por API Key  
   - Chave secreta validada no cabe√ßalho da requisi√ß√£o (`X-API-Key`).  
   - Requisi√ß√µes n√£o autenticadas ser√£o rejeitadas com HTTP 401.

3. Throttling via `slowapi`  
   - Limita o n√∫mero de requisi√ß√µes por IP para evitar abuso.  
   - Exemplo: m√°ximo 10 requisi√ß√µes por minuto.

4. Middlewares auxiliares  
   - CORS configurado (caso o frontend esteja hospedado em outro host).  
   - Logger b√°sico das requisi√ß√µes e respostas.

## Tecnologias e bibliotecas

- `fastapi` ‚Äî framework principal da API  
- `uvicorn` ‚Äî servidor ASGI leve para execu√ß√£o local  
- `pydantic` ‚Äî defini√ß√£o do schema de entrada (valida√ß√£o autom√°tica)  
- `mlflow.sklearn` ‚Äî para carregar o modelo versionado com rastreamento  
- `slowapi` ‚Äî controle de taxa de requisi√ß√µes (throttling)  
- `python-dotenv` ‚Äî carregamento seguro da chave da API via `.env`

## Processo de desenvolvimento

O desenvolvimento seguir√° estas fases no notebook:

1. Defini√ß√£o do schema do input via Pydantic.  
2. Carregamento do modelo RandomForestClassifier treinado com MLflow.  
3. Cria√ß√£o da fun√ß√£o de pr√©-processamento com o mesmo OrdinalEncoder usado no treino.  
4. Constru√ß√£o do app FastAPI com endpoint `/predict` e autentica√ß√£o.  
5. Testes locais com `requests` para simular chamadas reais.  
6. Cria√ß√£o dos arquivos finais `api.py` e `.env.example` para deploy.

## Observa√ß√µes finais

- O modelo que ser√° servido j√° est√° salvo em `runs:/4e56a5afe29a4a26b962c220fef03f5d/random_forest_tuned_model`.  
- A API ser√° testada localmente no DevContainer via `uvicorn`.  
- Todo o desenvolvimento ser√° realizado de forma incremental, validando cada componente separadamente antes da integra√ß√£o completa.




# ETAPA: Defini√ß√£o do schema de entrada para o endpoint /predict

Nesta c√©lula, definimos o schema de entrada que ser√° usado pela API FastAPI para validar os dados recebidos no endpoint `/predict`.  
Utilizamos o `pydantic.BaseModel` para garantir que todas as features esperadas estejam presentes e no formato correto.

Esse schema deve refletir exatamente as colunas necess√°rias para o modelo `RandomForestClassifier` treinado, com exce√ß√£o do target (`Credit_Score`), que n√£o ser√° fornecido no input.

A valida√ß√£o ser√° autom√°tica: se algum campo estiver ausente ou mal formatado, a API responder√° com erro HTTP 422.

As vari√°veis esperadas correspondem ao conjunto `X_test` no pipeline `curated_v1_1`, com os mesmos nomes e tipos.


In [1]:
# ETAPA: Defini√ß√£o do schema de entrada para o endpoint /predict

from pydantic import BaseModel
from typing import Literal, Optional

class InputData(BaseModel):
    Age_Binned: int
    Amount_invested_monthly_Binned: int
    Annual_Income_Binned: int
    Changed_Credit_Limit_Binned: int
    Credit_History_Age: float
    Credit_History_Age_Binned: int
    Credit_Mix: int
    Credit_Utilization_Ratio_Binned: int
    Delay_from_due_date_Binned: int
    Interest_Rate_Binned: int
    Monthly_Balance_Binned: int
    Monthly_Inhand_Salary_Binned: int
    Num_Bank_Accounts_Binned: int
    Num_Credit_Card_Binned: int
    Num_Credit_Inquiries_Binned: int
    Num_of_Delayed_Payment_Binned: int
    Num_of_Loan_Binned: int
    Occupation: int
    Outstanding_Debt_Binned: int
    Payment_of_Min_Amount: int
    Total_EMI_per_month_Binned: int
    Type_of_Loan: int


# ETAPA: Carregamento do modelo Random Forest Tuned e pr√©-processamento com OrdinalEncoder

Nesta c√©lula, implementamos os dois componentes fundamentais que ser√£o reutilizados pela API:

1. Carregamento do modelo `RandomForestClassifier` salvo no MLflow (via `run_id` fixado);
2. Reaplica√ß√£o do `OrdinalEncoder`, treinado sobre as mesmas colunas categ√≥ricas utilizadas na etapa de modelagem.

Ambos os passos devem ocorrer **fora da rota** da API (no escopo global do `api.py`), para que o modelo e o encoder sejam carregados **uma √∫nica vez** no momento em que o servidor for iniciado, garantindo desempenho na infer√™ncia.

O `OrdinalEncoder` √© treinado com o mesmo conjunto `train_curated_v1_1.csv` para manter a consist√™ncia do encoding.

O `model_uri` e o caminho do CSV devem ser ajust√°veis em vari√°veis fixas no in√≠cio do script.


In [2]:
# ETAPA: Carregamento do modelo Random Forest Tuned e pr√©-processamento com OrdinalEncoder

import pandas as pd
import mlflow
import mlflow.sklearn
from sklearn.preprocessing import OrdinalEncoder

# Define o tracking URI para acesso local ao .mlruns
mlflow.set_tracking_uri("file:/workspace/.mlruns")

# Caminhos fixos
MODEL_RUN_ID = "4e56a5afe29a4a26b962c220fef03f5d"
MODEL_URI = f"runs:/{MODEL_RUN_ID}/random_forest_tuned_model"
TRAIN_CSV = "/workspace/data/curated/train_curated_v1_1.csv"

# Carrega o modelo uma √∫nica vez
model = mlflow.sklearn.load_model(MODEL_URI)
print("Modelo carregado com sucesso.")

# Carrega o treino e extrai colunas categ√≥ricas
df_train = pd.read_csv(TRAIN_CSV)
X_train = df_train.drop(columns=["Credit_Score"])
object_cols = X_train.select_dtypes(include="object").columns.tolist()

# Treina o encoder nas colunas categ√≥ricas
encoder = OrdinalEncoder(handle_unknown="use_encoded_value", unknown_value=-1)
encoder.fit(X_train[object_cols])
print(f"OrdinalEncoder ajustado nas colunas: {object_cols}")


  from .autonotebook import tqdm as notebook_tqdm
Downloading artifacts:   0%|          | 0/1 [00:00<?, ?it/s]
Downloading artifacts: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 5/5 [00:00<00:00, 31.02it/s]  


Modelo carregado com sucesso.
OrdinalEncoder ajustado nas colunas: ['Age_Binned', 'Amount_invested_monthly_Binned', 'Annual_Income_Binned', 'Changed_Credit_Limit_Binned', 'Credit_History_Age', 'Credit_History_Age_Binned', 'Credit_Mix', 'Credit_Utilization_Ratio_Binned', 'Delay_from_due_date_Binned', 'Interest_Rate_Binned', 'Monthly_Balance_Binned', 'Monthly_Inhand_Salary_Binned', 'Num_Bank_Accounts_Binned', 'Num_Credit_Card_Binned', 'Num_Credit_Inquiries_Binned', 'Num_of_Delayed_Payment_Binned', 'Num_of_Loan_Binned', 'Occupation', 'Outstanding_Debt_Binned', 'Payment_of_Min_Amount', 'Total_EMI_per_month_Binned', 'Type_of_Loan']


# ETAPA: Cria√ß√£o do app FastAPI com rota /predict e autentica√ß√£o por API Key

Nesta c√©lula, criamos a estrutura do app FastAPI com os seguintes recursos:

- **Rota `/predict` (POST):** recebe um objeto JSON no formato validado por `InputData`, aplica o `OrdinalEncoder` e realiza a infer√™ncia usando o modelo Random Forest j√° carregado.

- **Autentica√ß√£o com API Key:** a chave ser√° esperada no cabe√ßalho `X-API-Key`. A chave real ser√° lida de uma vari√°vel de ambiente (`API_KEY`), recomendando-se uso de `.env`.

- **Resposta da rota:** a classe predita √© retornada como texto (`Good`, `Standard` ou `Poor`), convertendo de valor num√©rico (0, 1, 2) para r√≥tulo humano.

Essa estrutura permite que apenas usu√°rios autenticados fa√ßam chamadas ao modelo, preparando a aplica√ß√£o para uso em ambiente controlado.

A defini√ß√£o da chave (`API_KEY`) deve ser feita no arquivo `.env` ou via `os.environ`.


In [3]:
# ETAPA: Cria√ß√£o do app FastAPI com rota /predict e autentica√ß√£o por API Key

from fastapi import FastAPI, Header, HTTPException
from pydantic import BaseModel
import os

# Classe para validar input (deve estar no mesmo arquivo ou importada)
from typing import Literal
from fastapi.middleware.cors import CORSMiddleware

app = FastAPI()

# Carrega API_KEY do ambiente
API_KEY = os.environ.get("API_KEY", "default_secret")  # Substituir em produ√ß√£o

# Middleware opcional para permitir chamadas locais (ex: Streamlit em outra porta)
app.add_middleware(
    CORSMiddleware,
    allow_origins=["*"],  # Pode ser restrito depois
    allow_credentials=True,
    allow_methods=["*"],
    allow_headers=["*"],
)

# Mapeia n√∫mero para r√≥tulo
label_map = {0: "Poor", 1: "Standard", 2: "Good"}

@app.post("/predict")
def predict(data: InputData, x_api_key: str = Header(...)):

    if x_api_key != API_KEY:
        raise HTTPException(status_code=401, detail="Invalid API Key")

    # Converte o input em DataFrame
    input_df = pd.DataFrame([data.dict()])

    # Aplica o encoder nas colunas categ√≥ricas
    input_df[object_cols] = encoder.transform(input_df[object_cols])

    # Faz a predi√ß√£o
    prediction = model.predict(input_df)[0]
    label = label_map.get(prediction, "Unknown")

    return {"prediction": label}


# Etapa: Execu√ß√£o Local do Servidor FastAPI com `uvicorn` a partir do arquivo `api.py`

Este bloco t√©cnico realiza a execu√ß√£o do servidor FastAPI utilizando o m√≥dulo `uvicorn`, com o objetivo de validar o endpoint `/predict` localmente na porta 8000.

A estrutura da API j√° foi definida anteriormente, com autentica√ß√£o via API Key, aplica√ß√£o de encoder e carregamento do modelo. O arquivo `api.py` encontra-se fixado na raiz do diret√≥rio `/workspace/`, conforme decis√£o t√©cnica consolidada.

A execu√ß√£o ser√° feita em modo persistente (sem `reload`), assumindo que:

- A porta 8000 esteja dispon√≠vel.
- O ambiente j√° tenha os modelos carregados corretamente no `api.py`.
- A vari√°vel de ambiente `API_KEY` esteja configurada para autentica√ß√£o.

Se houver ocupa√ß√£o da porta 8000, o processo atual ser√° identificado e encerrado de forma controlada antes da nova execu√ß√£o.


In [6]:
# ETAPA: Execu√ß√£o local do servidor FastAPI com Uvicorn a partir de /workspace/api.py

import subprocess
import os
import signal

# 1Ô∏è‚É£ Identifica se j√° existe processo escutando na porta 8000
try:
    pid_check = subprocess.run(["lsof", "-t", "-i:8000"], capture_output=True, text=True)
    pid = pid_check.stdout.strip()

    if pid:
        print(f"Processo detectado na porta 8000 (PID {pid}). Encerrando...")
        os.kill(int(pid), signal.SIGTERM)
        print("‚úîÔ∏è Processo encerrado.")
    else:
        print("‚úîÔ∏è Porta 8000 est√° livre.")

except FileNotFoundError:
    print("‚ö†Ô∏è Comando 'lsof' n√£o dispon√≠vel. Recomendado instalar via apt install lsof.")

# 2Ô∏è‚É£ Executa o servidor uvicorn diretamente no workspace
print("Iniciando uvicorn com api.py localizado em /workspace...")

# Executa uvicorn for√ßando o diret√≥rio correto como raiz
result = subprocess.run([
    "uvicorn",
    "api:app",
    "--host", "0.0.0.0",
    "--port", "8000"
], cwd="/workspace")

print(f"\nüîö uvicorn finalizado com c√≥digo: {result.returncode}")

‚úîÔ∏è Porta 8000 est√° livre.
Iniciando uvicorn com api.py localizado em /workspace...


Downloading artifacts:   0%|          | 0/1 [00:00<?, ?it/s]
Downloading artifacts: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 5/5 [00:00<00:00, 33.48it/s]   
INFO:     Started server process [155723]
INFO:     Waiting for application startup.
INFO:     Application startup complete.
INFO:     Uvicorn running on http://0.0.0.0:8000 (Press CTRL+C to quit)
INFO:     Shutting down
INFO:     Waiting for application shutdown.
INFO:     Application shutdown complete.
INFO:     Finished server process [155723]


KeyboardInterrupt: 