## üìã O que voc√™ vai construir nesta aula

Ao final desta aula, voc√™ ter√° criado um **pipeline completo de coleta de dados** que:

1. ‚úÖ Conecta com uma API externa (TMDb)
2. ‚úÖ Coleta dados de m√∫ltiplos filmes
3. ‚úÖ Estrutura dados usando classes Python
4. ‚úÖ Persiste dados em arquivos JSON
5. ‚úÖ Versiona c√≥digo com Git
6. ‚úÖ Implementa tratamento de erros
7. ‚úÖ Adiciona logging profissional

**Resultado final**: Um sistema reutiliz√°vel para coleta e estrutura√ß√£o de dados de filmes.

## Exerc√≠cio 1: Setup e Request

1. Instale requests
2. Obtenha API key: https://www.themoviedb.org/settings/api
3. Crie `config.json`:
   ```json
   {"tmdb": {"api_key": "KEY", "base_url": "https://api.themoviedb.org/3", "language": "pt-BR"}}
   ```
4. GET `/movie/550` - trate status 200/401/404
5. Crie `dados/` e salve `dados/filme_550.json`
6. Leia e exiba dados do arquivo

Valida se: status 200, arquivo salvo, leitura funciona

In [1]:
# Implementa√ß√£o



## Exerc√≠cio 2: Coleta em Massa

1. GET `/movie/popular` - extraia 10 IDs do campo `results`
2. Fun√ß√£o `buscar_filme_por_id(id)`: retorna dict ou None, delay 0.5s
3. Loop: colete 10 filmes, salve `dados/filme_{id}.json`, conte erros
4. Crie `dados/indice_filmes.json`: lista com id, title, release_date, vote_average ordenada por nota

Valida: 10 arquivos criados, √≠ndice completo, erros tratados, rate limiting ativo

In [2]:
# Implementa√ß√£o



## Exerc√≠cio 3: Classes

1. `@dataclass Movie`:
   - Obrigat√≥rios: id, title, original_title, release_date, vote_average, vote_count
   - Opcionais: budget=0, revenue=0, runtime=0, overview=""

2. `@staticmethod from_json(data: dict) -> Movie`: converte JSON API para Movie

3. Properties:
   - `year -> int`: extrai ano de release_date (YYYY-MM-DD)
   - `profit -> int`: revenue - budget
   - `is_profitable -> bool`: profit > 0

4. `__post_init__`: valide id>0, 0<=vote_average<=10, runtime>=0, budget>=0, revenue>=0. Raise ValueError se inv√°lido.

Valida: instancia de JSON, properties corretas, valida√ß√µes funcionam, type hints presentes

In [3]:
# Implementa√ß√£o



## Exerc√≠cio 4: Git

1. `git init` + configure user.name e user.email

2. `.gitignore`: dados/, config.json, __pycache__/, *.pyc, venv/, *.log

3. Organize c√≥digo:
   - `tmdb_client.py`: load_config(), get_popular_movies(), get_movie_by_id()
   - `models.py`: classe Movie
   - `pipeline.py`: l√≥gica principal

4. Commits:
   ```bash
   git add .gitignore && git commit -m "chore: adiciona .gitignore"
   git add tmdb_client.py && git commit -m "feat: cliente TMDb"
   git add models.py && git commit -m "feat: classe Movie"
   git add pipeline.py && git commit -m "feat: pipeline coleta"
   ```

5. Branch: `git checkout -b feature/error-handling`, adicione try/except, commit, merge em main

Valida: repo inicializado, .gitignore funciona, 3 m√≥dulos, commits feat/fix/chore, branch mergeada

In [4]:
# Comandos Git (terminal)



## Exerc√≠cio 5: Logging e Pipeline

1. Configure logging: FileHandler + StreamHandler, formato `%(asctime)s - %(levelname)s - %(message)s`

2. `run_pipeline(num_movies=10)`:
   - Load config ‚Üí get popular ‚Üí extract IDs ‚Üí loop coleta ‚Üí convert Movie ‚Üí validate ‚Üí save ‚Üí √≠ndice ‚Üí m√©tricas
   - Log in√≠cio e fim com tempo decorrido

3. M√©tricas: total solicitado, sucesso, erro, tempo, nota m√©dia, mais popular (vote_count), mais lucrativo (profit)

4. `gerar_relatorio(filmes)`: salva JSON em `dados/relatorio.json` com timestamp, total, estat√≠sticas

Valida: logs em arquivo+console, pipeline end-to-end, m√©tricas corretas, relat√≥rio gerado, aceita par√¢metros

In [5]:
# Implementa√ß√£o



## Checklist

Infraestrutura:
- [ ] Python 3.8+, requests, API key, config.json

C√≥digo:
- [ ] tmdb_client.py, models.py, pipeline.py
- [ ] Type hints, docstrings

Funcionalidades:
- [ ] Coleta 10+ filmes, convers√£o Movie, valida√ß√µes
- [ ] Error handling, rate limiting, logging
- [ ] √çndice e relat√≥rio gerados

Git:
- [ ] Repo inicializado, .gitignore, 5+ commits
- [ ] C√≥digo modular, branch mergeada

Qualidade:
- [ ] PEP 8, nomes descritivos, fun√ß√µes √∫nicas
- [ ] Sem c√≥digo comentado, sem print()

## Extras (Opcional)

N1: genres em Movie, filtro nota m√≠nima, tqdm
N2: cache local, busca por nome, CLI argparse
N3: pytest, GitHub Actions, Docker
N4: SQLite, FastAPI, Streamlit

## Estrutura

```
.git/, .gitignore, config.json, tmdb_client.py, models.py, pipeline.py
dados/filme_*.json, indice_filmes.json, relatorio.json
logs/pipeline_*.log
```

## Refer√™ncias

TMDb API: https://developers.themoviedb.org/3
Endpoints: /movie/popular, /movie/{id}
Docs: requests, dataclasses, logging (Python stdlib)

## Pr√≥ximo

Aula 2: SQL/schema/queries | Aula 3: FastAPI/REST | Aula 4: Streamlit/Docker/deploy

## Stack T√©cnica

- Python 3.8+
- requests (HTTP client)
- dataclasses (estrutura√ß√£o de dados)
- json, pathlib (built-in)
- logging (monitoramento)
- Git (versionamento)

## API Utilizada

TMDb API v3
- Base URL: `https://api.themoviedb.org/3`
- Requer cadastro gratuito para obter API key
- Documenta√ß√£o: https://developers.themoviedb.org/3

## Exerc√≠cio 1: Setup e Primeira Requisi√ß√£o

### Tarefas

1. Configure o ambiente:
   - Verifique Python 3.8+
   - Instale `requests`
   - Obtenha API key em https://www.themoviedb.org/settings/api

2. Crie arquivo `config.json`:
```json
{
  "tmdb": {
    "api_key": "sua_chave_aqui",
    "base_url": "https://api.themoviedb.org/3",
    "language": "pt-BR"
  }
}
```

3. Fa√ßa requisi√ß√£o GET para `/movie/{movie_id}`:
   - Teste com ID 550 (Fight Club)
   - Trate status codes (200, 401, 404)
   - Parse JSON response

4. Persista dados:
   - Crie diret√≥rio `dados/`
   - Salve response em `dados/filme_550.json`
   - Implemente fun√ß√£o de leitura

### Crit√©rios de valida√ß√£o

- Requisi√ß√£o retorna status 200
- JSON √© salvo corretamente
- Consegue ler e exibir dados do arquivo

In [6]:
# Implementa√ß√£o Exerc√≠cio 1



## Exerc√≠cio 2: Coleta Automatizada

### Tarefas

1. Liste filmes populares:
   - Endpoint: `/movie/popular`
   - Extraia IDs dos primeiros 10 filmes
   - Parse campo `results` do JSON

2. Implemente fun√ß√£o `buscar_filme_por_id(movie_id)`:
   - Retorna dict com dados do filme
   - Retorna None se erro
   - Adiciona delay de 0.5s (rate limiting)

3. Loop de coleta:
   - Itere pelos 10 IDs
   - Salve cada filme em `dados/filme_{id}.json`
   - Conte sucessos e falhas

4. Crie √≠ndice:
   - Arquivo `dados/indice_filmes.json`
   - Estrutura: lista de objetos com id, title, release_date, vote_average
   - Ordene por vote_average (descendente)

### Crit√©rios de valida√ß√£o

- 10 arquivos JSON criados
- √çndice cont√©m todos os filmes
- Tratamento de erros implementado
- Rate limiting funciona

In [7]:
# Implementa√ß√£o Exerc√≠cio 2



## Exerc√≠cio 3: Estrutura√ß√£o com Classes

### Tarefas

1. Crie classe `Movie` usando `@dataclass`:

Campos obrigat√≥rios:
- id: int
- title: str
- original_title: str
- release_date: str
- vote_average: float
- vote_count: int

Campos opcionais (com default):
- budget: int = 0
- revenue: int = 0
- runtime: int = 0
- overview: str = ""

2. Implemente m√©todo construtor:
```python
@staticmethod
def from_json(data: dict) -> 'Movie':
    # Converte dict da API para objeto Movie
    # Trata campos None e opcionais
    pass
```

3. Adicione propriedades calculadas:
```python
@property
def year(self) -> int:
    # Extrai ano de release_date (formato: YYYY-MM-DD)
    pass

@property
def profit(self) -> int:
    # Calcula revenue - budget
    pass

@property
def is_profitable(self) -> bool:
    # Retorna True se profit > 0
    pass
```

4. Implemente valida√ß√µes em `__post_init__`:
- id > 0
- 0 <= vote_average <= 10
- runtime >= 0
- budget >= 0
- revenue >= 0

Levante `ValueError` com mensagem descritiva se inv√°lido.

### Crit√©rios de valida√ß√£o

- Classe instancia corretamente de JSON da API
- Propriedades calculam valores corretos
- Valida√ß√µes impedem dados inv√°lidos
- Type hints em todos os m√©todos

In [8]:
# Implementa√ß√£o Exerc√≠cio 3



## Exerc√≠cio 4: Versionamento com Git

### Tarefas

1. Inicialize reposit√≥rio:
```bash
git init
git config user.name "Seu Nome"
git config user.email "email@example.com"
```

2. Crie `.gitignore`:
```
# Dados e configura√ß√µes
dados/
config.json

# Python
__pycache__/
*.pyc
*.pyo
.venv/
venv/

# Logs
*.log
```

3. Organize c√≥digo em m√≥dulos:

`tmdb_client.py`:
- Fun√ß√µes de requisi√ß√£o HTTP
- load_config()
- get_popular_movies()
- get_movie_by_id()

`models.py`:
- Classe Movie completa
- Valida√ß√µes e propriedades

`pipeline.py`:
- L√≥gica principal de coleta
- Loop de processamento
- Salvamento de arquivos

4. Commits estruturados:
```bash
git add .gitignore
git commit -m "chore: adiciona .gitignore"

git add tmdb_client.py
git commit -m "feat: adiciona cliente HTTP para TMDb API"

git add models.py
git commit -m "feat: adiciona classe Movie com valida√ß√µes"

git add pipeline.py
git commit -m "feat: implementa pipeline de coleta de dados"
```

5. Branch de feature:
```bash
git checkout -b feature/error-handling
# Adicione try/except robusto
git add .
git commit -m "feat: adiciona tratamento de erros HTTP"
git checkout main
git merge feature/error-handling
```

### Crit√©rios de valida√ß√£o

- Reposit√≥rio inicializado
- .gitignore impede commit de dados sens√≠veis
- C√≥digo separado em 3 m√≥dulos
- Mensagens de commit seguem conven√ß√£o (feat/fix/chore)
- Branch criada e mergeada com sucesso

In [9]:
# Refer√™ncia de comandos Git
# Execute no terminal, n√£o nesta c√©lula

"""
# Status e hist√≥rico
git status
git log --oneline --graph

# Branches
git branch
git branch -a
git checkout -b nome-branch

# Merge
git checkout main
git merge nome-branch
git branch -d nome-branch
"""

'\n# Status e hist√≥rico\ngit status\ngit log --oneline --graph\n\n# Branches\ngit branch\ngit branch -a\ngit checkout -b nome-branch\n\n# Merge\ngit checkout main\ngit merge nome-branch\ngit branch -d nome-branch\n'

## Exerc√≠cio 5: Pipeline Completo com Logging

### Tarefas

1. Configure logging em `pipeline.py`:
```python
import logging
from datetime import datetime

# Criar logger
logger = logging.getLogger(__name__)
logger.setLevel(logging.INFO)

# Handler para arquivo
fh = logging.FileHandler(f'pipeline_{datetime.now().strftime("%Y%m%d_%H%M%S")}.log')
fh.setLevel(logging.INFO)

# Handler para console
ch = logging.StreamHandler()
ch.setLevel(logging.INFO)

# Formato
formatter = logging.Formatter(
    '%(asctime)s - %(name)s - %(levelname)s - %(message)s'
)
fh.setFormatter(formatter)
ch.setFormatter(formatter)

logger.addHandler(fh)
logger.addHandler(ch)
```

2. Implemente pipeline principal:
```python
def run_pipeline(num_movies: int = 10):
    logger.info("Iniciando pipeline de coleta")
    start_time = datetime.now()
    
    # 1. Carregar configura√ß√£o
    # 2. Buscar filmes populares
    # 3. Extrair IDs
    # 4. Loop de coleta
    # 5. Converter para objetos Movie
    # 6. Validar dados
    # 7. Salvar arquivos
    # 8. Gerar √≠ndice
    # 9. Calcular m√©tricas
    
    end_time = datetime.now()
    logger.info(f"Pipeline conclu√≠do em {end_time - start_time}")
```

3. M√©tricas a registrar:
- Total de filmes solicitados
- Total processado com sucesso
- Total com erro
- Tempo de execu√ß√£o
- M√©dia de nota dos filmes
- Filme mais popular (maior vote_count)
- Filme mais lucrativo

4. Gere relat√≥rio final:
```python
def gerar_relatorio(filmes: list[Movie]):
    report = {
        "timestamp": datetime.now().isoformat(),
        "total": len(filmes),
        "estatisticas": {
            "nota_media": ...,
            "mais_popular": ...,
            "mais_lucrativo": ...
        }
    }
    
    with open("dados/relatorio.json", "w") as f:
        json.dump(report, f, indent=2)
```

### Crit√©rios de valida√ß√£o

- Logs aparecem em arquivo e console
- Pipeline executa end-to-end sem interven√ß√£o
- M√©tricas calculadas corretamente
- Relat√≥rio JSON gerado
- C√≥digo aceita par√¢metros (num_movies)

In [10]:
# Implementa√ß√£o Exerc√≠cio 5



## Checklist de Entrega

### Infraestrutura
- [ ] Python 3.8+ configurado
- [ ] requests instalado
- [ ] API key do TMDb funcional
- [ ] config.json criado (n√£o commitado)

### C√≥digo
- [ ] tmdb_client.py com fun√ß√µes HTTP
- [ ] models.py com classe Movie
- [ ] pipeline.py com l√≥gica principal
- [ ] Type hints em todas as fun√ß√µes
- [ ] Docstrings nos m√≥dulos principais

### Funcionalidades
- [ ] Coleta autom√°tica de 10+ filmes
- [ ] Convers√£o para objetos Movie
- [ ] Valida√ß√£o de dados
- [ ] Tratamento de erros HTTP
- [ ] Rate limiting implementado
- [ ] Logging estruturado
- [ ] Gera√ß√£o de √≠ndice
- [ ] Gera√ß√£o de relat√≥rio

### Versionamento
- [ ] Reposit√≥rio Git inicializado
- [ ] .gitignore configurado
- [ ] M√≠nimo 5 commits descritivos
- [ ] C√≥digo organizado em m√≥dulos
- [ ] Branch criada e mergeada

### Qualidade
- [ ] C√≥digo segue PEP 8
- [ ] Nomes descritivos de vari√°veis
- [ ] Fun√ß√µes com responsabilidade √∫nica
- [ ] Sem c√≥digo comentado
- [ ] Sem print() (usar logging)

## Desafios Adicionais (Opcional)

Para quem quer ir al√©m:

### N√≠vel 1
- Adicione campo `genres` √† classe Movie (lista de g√™neros)
- Implemente filtro por nota m√≠nima
- Adicione progresso visual (tqdm)

### N√≠vel 2
- Implemente cache local (evita requisi√ß√µes duplicadas)
- Adicione suporte a busca por nome do filme
- Crie CLI com argparse (aceita argumentos via terminal)

### N√≠vel 3
- Implemente testes unit√°rios (pytest)
- Adicione CI/CD com GitHub Actions
- Crie container Docker

### N√≠vel 4
- Adicione banco de dados SQLite
- Implemente API REST com FastAPI
- Dashboard com Streamlit

## Estrutura de Diret√≥rios Esperada

```
Aula1_Pipeline_Versionado/
‚îú‚îÄ‚îÄ .git/
‚îú‚îÄ‚îÄ .gitignore
‚îú‚îÄ‚îÄ config.json              (n√£o commitado)
‚îú‚îÄ‚îÄ tmdb_client.py
‚îú‚îÄ‚îÄ models.py
‚îú‚îÄ‚îÄ pipeline.py
‚îú‚îÄ‚îÄ README.md                (opcional)
‚îú‚îÄ‚îÄ requirements.txt         (opcional)
‚îú‚îÄ‚îÄ dados/
‚îÇ   ‚îú‚îÄ‚îÄ filme_*.json        (n√£o commitados)
‚îÇ   ‚îú‚îÄ‚îÄ indice_filmes.json  (n√£o commitado)
‚îÇ   ‚îî‚îÄ‚îÄ relatorio.json      (n√£o commitado)
‚îî‚îÄ‚îÄ logs/
    ‚îî‚îÄ‚îÄ pipeline_*.log       (n√£o commitados)
```

## Recursos

### Documenta√ß√£o Oficial
- TMDb API: https://developers.themoviedb.org/3
- Python requests: https://requests.readthedocs.io/
- Python dataclasses: https://docs.python.org/3/library/dataclasses.html
- Python logging: https://docs.python.org/3/library/logging.html
- Git: https://git-scm.com/doc

### Endpoints TMDb √öteis
```
GET /movie/popular
GET /movie/{movie_id}
GET /search/movie?query={texto}
GET /genre/movie/list
```

### Exemplo de Response da API
```json
{
  "id": 550,
  "title": "Fight Club",
  "release_date": "1999-10-15",
  "vote_average": 8.4,
  "budget": 63000000,
  "revenue": 100853753,
  "runtime": 139
}
```

## Pr√≥ximas Aulas

### Aula 2 - SQL e Bancos de Dados
Modelar schema relacional, inserir dados coletados, queries anal√≠ticas

### Aula 3 - APIs REST
Criar API pr√≥pria com FastAPI, endpoints CRUD, documenta√ß√£o autom√°tica

### Aula 4 - Integra√ß√£o e Deploy
Dashboard Streamlit, containeriza√ß√£o Docker, deploy na nuvem

## üìã O que voc√™ vai construir nesta aula

Ao final desta aula, voc√™ ter√° criado um **pipeline completo de coleta de dados** que:

1. ‚úÖ Conecta com uma API externa (TMDb)
2. ‚úÖ Coleta dados de m√∫ltiplos filmes
3. ‚úÖ Estrutura dados usando classes Python
4. ‚úÖ Persiste dados em arquivos JSON
5. ‚úÖ Versiona c√≥digo com Git
6. ‚úÖ Implementa tratamento de erros
7. ‚úÖ Adiciona logging profissional

**Resultado final**: Um sistema reutiliz√°vel para coleta e estrutura√ß√£o de dados de filmes.

## üöÄ Parte 1: Setup e Primeira Requisi√ß√£o

### Objetivos
- Configurar ambiente Python
- Obter e configurar API key do TMDb
- Fazer sua primeira requisi√ß√£o HTTP
- Entender resposta JSON

### Desafios

**Desafio 1.1**: Configure seu ambiente
- Verifique a vers√£o do Python (3.8+)
- Instale a biblioteca `requests`
- Crie o arquivo `config.json` com sua API key

**Desafio 1.2**: Fa√ßa sua primeira requisi√ß√£o
- Busque informa√ß√µes do filme ID 550 (Clube da Luta)
- Imprima o t√≠tulo e a nota do filme
- Identifique 5 campos interessantes no JSON de resposta

**Desafio 1.3**: Persist√™ncia
- Crie uma pasta `dados/`
- Salve o JSON do filme em `dados/filme_550.json`
- Leia o arquivo e mostre o t√≠tulo

### Perguntas para refletir
1. O que √© uma API REST?
2. O que significa status code 200? E 404?
3. Por que usar JSON para armazenar dados?
4. Como proteger sua API key?

In [11]:
# Espa√ßo para seus testes - Parte 1
# Configure seu ambiente e fa√ßa a primeira requisi√ß√£o aqui


## üì¶ Parte 2: Coleta em Massa

### Objetivos
- Buscar lista de filmes populares
- Iterar e coletar m√∫ltiplos filmes
- Implementar tratamento de erros
- Criar √≠ndice de dados coletados

### Desafios

**Desafio 2.1**: Liste filmes populares
- Use o endpoint `/movie/popular`
- Extraia os IDs dos 10 primeiros filmes
- Mostre t√≠tulo e nota de cada um

**Desafio 2.2**: Coleta automatizada
- Crie uma fun√ß√£o `buscar_filme_por_id(id)`
- Use um loop para coletar os 10 filmes
- Salve cada filme em `dados/filme_{id}.json`
- Adicione um delay de 0.5s entre requisi√ß√µes (rate limiting)

**Desafio 2.3**: Tratamento de erros
- O que acontece se o ID n√£o existir?
- Implemente try/except para capturar erros
- Teste com um ID inv√°lido (999999999)

**Desafio 2.4**: √çndice
- Crie um arquivo `dados/indice_filmes.json`
- Liste todos os filmes coletados com:
  - ID, t√≠tulo, ano, nota

### Perguntas para refletir
1. Por que √© importante tratar erros HTTP?
2. O que √© rate limiting e por que usamos delay?
3. Como voc√™ organizaria 1000 filmes?
4. Qual a diferen√ßa entre dados brutos e dados processados?

In [12]:
# Espa√ßo para seus testes - Parte 2
# Implemente a coleta automatizada aqui


## üèóÔ∏è Parte 3: Estrutura√ß√£o com Classes

### Objetivos
- Transformar dicion√°rios em objetos Python
- Usar dataclasses para modelagem
- Implementar valida√ß√µes
- Adicionar propriedades calculadas

### Desafios

**Desafio 3.1**: Crie a classe Movie
- Use `@dataclass` do Python
- Campos: id, title, release_date, vote_average, budget, revenue, runtime
- Implemente `__post_init__` para valida√ß√µes

**Desafio 3.2**: M√©todo construtor
- Crie `@staticmethod def from_json(data)`
- Converta JSON da API para objeto Movie
- Trate campos opcionais/nulos

**Desafio 3.3**: Propriedades calculadas
- `@property def year`: extrair ano de release_date
- `@property def profit`: calcular revenue - budget
- `@property def is_profitable`: retornar boolean

**Desafio 3.4**: Valida√ß√µes
- ID deve ser positivo
- Nota entre 0 e 10
- Dura√ß√£o maior que 0
- Budget e revenue n√£o negativos

### Perguntas para refletir
1. Qual a vantagem de usar classes vs dicion√°rios?
2. O que s√£o dataclasses e por que us√°-las?
3. Quando usar @property vs m√©todo normal?
4. Como valida√ß√µes previnem bugs?

In [13]:
# Espa√ßo para seus testes - Parte 3
# Crie sua classe Movie aqui


## üìù Parte 4: Versionamento com Git

### Objetivos
- Inicializar reposit√≥rio Git
- Criar commits significativos
- Trabalhar com branches
- Entender .gitignore

### Desafios

**Desafio 4.1**: Inicialize o reposit√≥rio
```bash
git init
git config user.name "Seu Nome"
git config user.email "seu@email.com"
```

**Desafio 4.2**: Primeiro commit
- Crie `.gitignore` (ignorar `dados/`, `config.json`, `__pycache__/`)
- Adicione seus scripts Python
- Commit: "feat: adiciona coleta de dados TMDb"

**Desafio 4.3**: Organize em arquivos
- `tmdb_client.py`: fun√ß√µes de requisi√ß√£o
- `models.py`: classe Movie
- `main.py`: pipeline principal
- Commit cada arquivo separadamente

**Desafio 4.4**: Branch de feature
- Crie branch `feature/validacoes`
- Adicione valida√ß√µes √† classe Movie
- Merge de volta para main

### Perguntas para refletir
1. Por que versionamento √© importante?
2. O que n√£o deve ser versionado?
3. Como escrever boas mensagens de commit?
4. Quando criar uma branch?

In [14]:
# Comandos Git - execute no terminal
# Este √© apenas um guia de refer√™ncia

"""
# Inicializar
git init

# Adicionar arquivos
git add models.py
git commit -m "feat: adiciona classe Movie"

# Ver status
git status
git log --oneline

# Branches
git branch feature/validacoes
git checkout feature/validacoes
# ... fazer mudan√ßas ...
git checkout main
git merge feature/validacoes
"""

'\n# Inicializar\ngit init\n\n# Adicionar arquivos\ngit add models.py\ngit commit -m "feat: adiciona classe Movie"\n\n# Ver status\ngit status\ngit log --oneline\n\n# Branches\ngit branch feature/validacoes\ngit checkout feature/validacoes\n# ... fazer mudan√ßas ...\ngit checkout main\ngit merge feature/validacoes\n'

## üìä Parte 5: Pipeline Completo com Logging

### Objetivos
- Implementar logging estruturado
- Integrar todas as partes
- Criar pipeline end-to-end
- Adicionar m√©tricas de execu√ß√£o

### Desafios

**Desafio 5.1**: Configure logging
```python
import logging

logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s - %(levelname)s - %(message)s',
    handlers=[
        logging.FileHandler('pipeline.log'),
        logging.StreamHandler()
    ]
)
```

**Desafio 5.2**: Pipeline principal
Crie um script que:
1. Carrega configura√ß√£o
2. Busca filmes populares
3. Coleta detalhes de cada filme
4. Converte para objetos Movie
5. Salva dados estruturados
6. Gera relat√≥rio final

**Desafio 5.3**: M√©tricas
- Total de filmes processados
- Tempo de execu√ß√£o
- Sucesso vs erros
- Estat√≠sticas (m√©dia de notas, etc.)

**Desafio 5.4**: Torne reutiliz√°vel
- Aceite par√¢metros (quantos filmes coletar)
- Permita diferentes endpoints
- Adicione op√ß√µes de configura√ß√£o

### Perguntas para refletir
1. Por que logging √© melhor que print()?
2. Quais n√≠veis de log usar quando?
3. Como monitorar um pipeline em produ√ß√£o?
4. O que torna c√≥digo "production-ready"?

In [15]:
# Espa√ßo para seu pipeline completo
# Integre tudo aqui


## üéØ Checklist de Conclus√£o

Marque conforme voc√™ completa cada item:

### Setup B√°sico
- [ ] Python 3.8+ instalado e funcionando
- [ ] requests instalado
- [ ] API key do TMDb obtida e configurada
- [ ] config.json criado

### Coleta de Dados
- [ ] Requisi√ß√£o simples funcionando
- [ ] Coleta de 10+ filmes implementada
- [ ] Tratamento de erros HTTP
- [ ] Dados salvos em JSON
- [ ] √çndice de filmes criado

### Estrutura√ß√£o
- [ ] Classe Movie implementada com dataclass
- [ ] M√©todo from_json funcionando
- [ ] Propriedades calculadas (year, profit, etc.)
- [ ] Valida√ß√µes implementadas
- [ ] Testes com dados reais

### Versionamento
- [ ] Reposit√≥rio Git inicializado
- [ ] .gitignore configurado
- [ ] Commits organizados e descritivos
- [ ] C√≥digo separado em m√≥dulos
- [ ] Branch criada e mergeada

### Pipeline Completo
- [ ] Logging configurado
- [ ] Pipeline end-to-end funcionando
- [ ] M√©tricas implementadas
- [ ] C√≥digo reutiliz√°vel
- [ ] Documenta√ß√£o b√°sica

### B√¥nus (Desafios Extra)
- [ ] Type hints em todas as fun√ß√µes
- [ ] Docstrings em classes e m√©todos
- [ ] Testes unit√°rios b√°sicos
- [ ] CLI com argparse
- [ ] README.md completo

## üí° Dicas para Alunos Avan√ßados

### Se voc√™ j√° tem experi√™ncia
1. **Pule o b√°sico**: V√° direto para os desafios que te interessam
2. **Adicione complexidade**: Implemente os desafios b√¥nus
3. **Explore mais**: 
   - Adicione mais campos √† classe Movie
   - Colete dados de s√©ries (TV shows)
   - Implemente cache de requisi√ß√µes
   - Crie testes automatizados

### Se voc√™ est√° aprendendo
1. **V√° devagar**: Fa√ßa um desafio por vez
2. **Use os notebooks numerados**: Eles t√™m explica√ß√µes detalhadas
3. **Experimente**: Mude valores, quebre o c√≥digo, aprenda com erros
4. **Pergunte**: As perguntas de reflex√£o s√£o importantes

### Recursos Adicionais
- **TMDb API Docs**: https://developers.themoviedb.org/3
- **Python Requests**: https://requests.readthedocs.io/
- **Dataclasses**: https://docs.python.org/3/library/dataclasses.html
- **Git Basics**: https://git-scm.com/book/en/v2

## üèÜ Pr√≥ximos Passos

Ap√≥s completar esta aula, voc√™ estar√° pronto para:

### Aula 2 - SQL e Bancos de Dados
- Modelar dados relacionais
- Criar schemas SQL
- Inserir dados coletados
- Fazer queries anal√≠ticas

### Aula 3 - APIs REST
- Criar sua pr√≥pria API
- Servir dados via HTTP
- Implementar endpoints RESTful
- Documenta√ß√£o com Swagger

### Aula 4 - Integra√ß√£o e Deploy
- Dashboard interativo
- Deploy em Docker
- Automa√ß√£o com CI/CD
- Monitoramento em produ√ß√£o

---

**Boa sorte! üöÄ**

Lembre-se: o importante n√£o √© s√≥ fazer funcionar, mas **entender como e por que funciona**.