# Tech Challenge Fase 1

## O Problema 

**Desafio: Criação de uma API Pública para Consulta de Livros**

Você foi contratado(a) como Engenheiro(a) de Machine Learning para um 
projeto de recomendação de livros. A empresa está em sua fase inicial e ainda 
não possui uma base de dados estruturada.  

Seu primeiro desafio será montar a infraestrutura de extração, 
transformação e disponibilização de dados via API pública para que cientistas de 
dados e serviços de recomendação possam usar esses dados com facilidade.  

Assim,  seu  objetivo  será  desenvolver  um  pipeline  completo  de  dados  e 
uma  API  pública  para  servir  esses  dados,  pensando  na  escalabilidade  e 
reusabilidade futura em modelos de machine learning. 

## Entregáveis Obrigatórios

1. Repositório do GitHub Organizado 

-  Código estruturado em módulos (scripts/, api/, data/, etc.). 
-  README completo contendo: 
    - Descrição do projeto e arquitetura. 
    - Instruções de instalação e configuração. 
    - Documentação das rotas da API. 
    - Exemplos de chamadas com requests/responses. 
    - Instruções para execução. 
 
2. Sistema de Web Scraping 

-  Script automatizado para extrair dados de https://books.toscrape.com/ 
-  Dados armazenados localmente em um arquivo CSV. 
-  Script executável e bem documentado. 

3. API RESTful Funcional 

-  API implementada em Flask ou FastAPI. 
-  Endpoints obrigatórios (listados a seguir). 
-  Documentação da API (Swagger). 

4. Deploy Público 
-  API deployada em Heroku, Render, Vercel, Fly.io ou similar. 
-  Link compartilhável funcional. 
-  API totalmente operacional no ambiente de produção. 

5. Plano Arquitetural 
-  Diagrama ou documento detalhando: 
    - Pipeline desde ingestão → processamento → API → consumo. 
    - Arquitetura pensada para escalabilidade futura. 
    - Cenário de uso para cientistas de dados/ML. 
    - Plano de integração com modelos de ML. 

6. Vídeo de Apresentação (3-12 minutos) 

-  Demonstração técnica (no macro apenas, sem aprofundamento). 
-  Apresentação da arquitetura e pipeline de dados. 
-  Execução de chamadas reais à API em produção. 
-  Comentários sobre boas práticas implementadas.

## Objetivos Técnicos Core 

### Web Scraping Robusto 

-  Extrair todos os livros disponíveis no site. 
-  Capturar: título, preço, rating, disponibilidade, categoria, imagem. 

### Endpoints Obrigatórios da API 

**Endpoints Core**

-  GET /api/v1/books: lista todos os livros disponíveis na base de dados. 
-  GET /api/v1/books/{id}: retorna detalhes completos de um livro 
específico pelo ID. 
-  GET /api/v1/books/search?title={title}&category={category}: busca 
livros por título e/ou categoria. 
-  GET /api/v1/categories: lista todas as categorias de livros disponíveis. 
-  GET  /api/v1/health:  verifica  status  da  API  e  conectividade  com  os 
dados. 

### Endpoints Opcionais da API 

**Endpoints de Insights**

-  GET  /api/v1/stats/overview:  estatísticas  gerais  da  coleção  (total  de 
livros, preço médio, distribuição de ratings). 
-  GET  /api/v1/stats/categories:  estatísticas  detalhadas  por  categoria 
(quantidade de livros, preços por categoria). 
-  GET  /api/v1/books/top-rated:  lista  os  livros  com  melhor  avaliação 
(rating mais alto). 
-  GET /api/v1/books/price-range?min={min}&max={max}: filtra livros 
dentro de uma faixa de preço específica. 

### Desafios Adicionais (Bônus) 

**Desafio 1: Sistema de Autenticação**

Implementar JWT Authentication para proteger rotas sensíveis: 

-  POST /api/v1/auth/login - obter token. 
-  POST /api/v1/auth/refresh - renovar token. 
-  Proteger endpoints de admin como /api/v1/scraping/trigger. 

**Desafio 2: Pipeline ML-Ready**

Criar endpoints pensados para consumo de modelos ML: 
-  GET /api/v1/ml/features - dados formatados para features. 
-  GET /api/v1/ml/training-data - dataset para treinamento. 
-  POST /api/v1/ml/predictions - endpoint para receber predições. 

**Desafio 3: Monitoramento & Analytics**

-  Logs estruturados de todas as chamadas. 
-  Métricas de performance da API. 
-  Dashboard simples de uso (Streamlit recomendado). 

Lembre-se  de  que  você  poderá  apresentar  o  desenvolvimento  do  seu 
projeto durante as lives com professores(as). Essa é uma boa oportunidade para 
discutir  as  dificuldades  encontradas  e  pegar  dicas  valiosas  com  docentes 
especialistas e colegas de turma. 

### Entrega            

Subir na plataforma um arquivo no formato .txt com o repositório do seu 
github, em que o arquivo README deve conter: 

-  Descrição completa do projeto (objetivos, como reproduzir, descrição 
dos endpoints e afins). 
-  Link do deploy. 
-  Link do vídeo. 
-  Diagrama (arquitetura) visual do projeto