## O que é um Notebook?

Um Notebook é um documento interativo que mistura:
- Texto explicativo (como este que você está lendo agora)
- Código Python (que você pode executar)
- Resultados da execução do código

É como um caderno digital onde você escreve e testa código ao mesmo tempo.

## Como usar este arquivo

### Células

Este arquivo é dividido em "células". Cada caixa que você vê é uma célula.

Existem 2 tipos:
- **Markdown**: texto explicativo (como esta célula)
- **Código**: código Python que pode ser executado

### Como executar uma célula de código

1. Clique na célula de código (ela fica destacada)
2. Pressione `Shift + Enter` (Shift e Enter juntos)
3. O código será executado e o resultado aparece abaixo

Vamos testar agora.

In [None]:
# Esta é uma célula de código
# Clique nela e pressione Shift + Enter

print("Olá! Você acabou de executar seu primeiro código Python!")

## Teste você mesmo

Execute a célula abaixo. Ela faz um cálculo simples.

In [None]:
# Calcular uma soma
resultado = 10 + 25
print(f"10 + 25 = {resultado}")

## Conceitos básicos de Python

Não se preocupe se você nunca programou. Vamos ver o essencial.

### Variáveis

Variáveis guardam valores. Pense nelas como caixas com etiquetas.

In [None]:
# Criar variáveis
nome = "Maria"
idade = 25
altura = 1.65

# Mostrar os valores
print(nome)
print(idade)
print(altura)

### Tipos de dados

Python trabalha com diferentes tipos de informação:
- Texto: `"Maria"` (chamado de string)
- Números inteiros: `25` (chamado de int)
- Números decimais: `1.65` (chamado de float)
- Verdadeiro/Falso: `True` ou `False` (chamado de bool)

In [None]:
# Verificar o tipo de uma variável
texto = "Olá"
numero = 42
decimal = 3.14
verdadeiro = True

print(type(texto))
print(type(numero))
print(type(decimal))
print(type(verdadeiro))

### Listas

Listas guardam vários valores juntos.

In [None]:
# Criar uma lista de nomes
nomes = ["Ana", "Bruno", "Carlos"]

# Mostrar a lista completa
print(nomes)

# Acessar um item específico (começa do 0)
print(nomes[0])  # Primeiro item
print(nomes[1])  # Segundo item

### Dicionários

Dicionários guardam pares de "chave: valor". Como uma agenda telefônica.

In [None]:
# Criar um dicionário com informações de uma pessoa
pessoa = {
    "nome": "João",
    "idade": 30,
    "cidade": "São Paulo"
}

# Acessar valores
print(pessoa["nome"])
print(pessoa["idade"])

### Funções

Funções são blocos de código que fazem uma tarefa específica. Você pode usá-las várias vezes.

In [None]:
# Definir uma função
def saudacao(nome):
    mensagem = f"Olá, {nome}! Bem-vindo ao curso."
    return mensagem

# Usar a função
resultado1 = saudacao("Ana")
resultado2 = saudacao("Pedro")

print(resultado1)
print(resultado2)

### Loops (repetições)

Loops executam o mesmo código várias vezes.

In [None]:
# Loop for: repetir para cada item
frutas = ["maçã", "banana", "laranja"]

for fruta in frutas:
    print(f"Eu gosto de {fruta}")

## O que vamos construir neste curso

Vamos criar um **Pipeline de Dados** completo. Mas o que é isso?

### Pipeline de Dados

É um sistema automático que:
1. Busca dados de uma fonte externa (API de filmes)
2. Organiza esses dados
3. Salva em arquivos
4. Processa e analisa
5. Gera relatórios

### Exemplo prático

Imagine que você quer saber:
- Quais filmes estão em alta?
- Qual a nota média deles?
- Quais gêneros são mais populares?

Nosso pipeline vai buscar essas informações automaticamente e organizar para você.

## De onde vêm os dados?

Vamos usar a **API do TMDb** (The Movie Database).

### O que é uma API?

API é como um garçom de restaurante:
- Você faz um pedido (requisição)
- O garçom leva para a cozinha (servidor)
- A cozinha prepara (processa)
- O garçom traz o prato (resposta com dados)

### Exemplo simples

Quando você pede: "Me dê informações do filme Matrix"

A API responde com algo assim:
```json
{
  "titulo": "Matrix",
  "ano": 1999,
  "nota": 8.7,
  "generos": ["Ação", "Ficção Científica"]
}
```

## Estrutura do curso

O curso tem 5 notebooks (arquivos como este). Cada um ensina uma parte do pipeline.

## Notebook 01: Setup e Primeira Requisição

**O que você vai aprender:**
- Instalar bibliotecas Python necessárias
- Configurar sua chave de API (senha para acessar os dados)
- Fazer sua primeira requisição para buscar um filme
- Salvar os dados em um arquivo JSON

**O que é JSON?**
É um formato de arquivo para guardar dados estruturados. Como uma tabela, mas em texto.

**Tempo estimado:** 30 minutos

**Você vai sair sabendo:**
- Conectar com uma API
- Buscar dados da internet
- Salvar dados no computador

## Notebook 02: Coleta de Múltiplos Filmes

**O que você vai aprender:**
- Buscar uma lista de filmes populares
- Criar um loop para buscar vários filmes de uma vez
- Tratar erros (o que fazer quando algo dá errado)
- Criar um índice de todos os filmes coletados

**Conceito importante: Automação**
Em vez de buscar filme por filme manualmente, você cria um código que faz isso automaticamente.

**Tempo estimado:** 45 minutos

**Você vai sair sabendo:**
- Automatizar tarefas repetitivas
- Lidar com erros
- Organizar múltiplos arquivos

## Notebook 03: Estruturação com Classes

**O que você vai aprender:**
- Criar classes Python (moldes para organizar dados)
- Transformar dados brutos em objetos organizados
- Adicionar validações (garantir que os dados estão corretos)
- Calcular informações derivadas (ex: lucro = receita - orçamento)

**Conceito importante: Orientação a Objetos**
Em vez de trabalhar com dados soltos, você cria "objetos" que representam coisas reais (como um Filme).

**Tempo estimado:** 60 minutos

**Você vai sair sabendo:**
- Organizar código de forma profissional
- Criar estruturas de dados reutilizáveis
- Validar qualidade dos dados

## Notebook 04: Versionamento com Git

**O que você vai aprender:**
- Usar Git para versionar seu código
- Fazer commits (salvar versões do seu trabalho)
- Criar branches (ramificações para testar coisas novas)
- Organizar código em múltiplos arquivos

**Conceito importante: Controle de Versão**
Git é como um "Ctrl+Z infinito" para código. Você pode voltar para qualquer versão anterior.

**Tempo estimado:** 45 minutos

**Você vai sair sabendo:**
- Versionar código profissionalmente
- Trabalhar em equipe (cada um em sua branch)
- Organizar projetos maiores

## Notebook 05: Pipeline Completo com Logging

**O que você vai aprender:**
- Configurar sistema de logs (registros do que o código faz)
- Integrar todas as partes anteriores
- Criar um pipeline que roda do início ao fim
- Gerar relatórios automáticos com estatísticas

**Conceito importante: Logging**
Logs são como um diário do seu programa. Registram tudo que acontece para você poder debugar e monitorar.

**Tempo estimado:** 60 minutos

**Você vai sair sabendo:**
- Criar sistemas completos e integrados
- Monitorar execução de código
- Gerar relatórios automatizados

## Como usar o VS Code com Notebooks

### Abrir um Notebook

1. No VS Code, vá em: File > Open (Arquivo > Abrir)
2. Navegue até a pasta do curso
3. Clique no arquivo `.ipynb` que quer abrir

### Executar células

**Opção 1:** Clique no botão ▶ (play) que aparece ao lado esquerdo da célula

**Opção 2:** Selecione a célula e pressione `Shift + Enter`

**Opção 3:** Use o menu: Run > Run Cell (Executar > Executar Célula)

### Adicionar novas células

- Clique no botão `+ Code` (para código) ou `+ Markdown` (para texto)
- Eles aparecem quando você passa o mouse entre as células

### Salvar o arquivo

- `Ctrl + S` (Windows/Linux)
- `Cmd + S` (Mac)
- Ou: File > Save (Arquivo > Salvar)

## Dicas importantes

### Execute as células em ordem

Sempre execute de cima para baixo. Pular células pode causar erros.

### Leia os comentários

Linhas que começam com `#` são comentários. Elas explicam o que o código faz.

```python
# Isto é um comentário
x = 5  # Comentários podem vir depois do código também
```

### Erros são normais

Se aparecer uma mensagem de erro (texto vermelho):
1. Leia a mensagem (geralmente diz o que está errado)
2. Verifique se executou as células anteriores
3. Procure por erros de digitação

### Peça ajuda

Se travar em algum ponto, pergunte ao instrutor. Nenhuma pergunta é "boba".

## Preparação do ambiente

Antes de começar o Notebook 01, você precisa:

### 1. Verificar se Python está instalado

Execute a célula abaixo. Deve mostrar uma versão 3.8 ou superior.

In [None]:
import sys
print(f"Python versão: {sys.version}")

### 2. Extensões do VS Code

Certifique-se de ter instalado:
- Python (da Microsoft)
- Jupyter (da Microsoft)

**Como verificar:**
1. Clique no ícone de extensões na barra lateral (ícone de quadrados)
2. Procure por "Python" e "Jupyter"
3. Se não estiverem instalados, clique em "Install"

### 3. Criar conta no TMDb

1. Acesse: https://www.themoviedb.org/signup
2. Crie uma conta gratuita
3. Confirme seu email
4. Vá em: Configurações > API
5. Solicite uma chave de API (escolha "Developer")

Você vai precisar dessa chave no Notebook 01.

## Teste final

Vamos testar se tudo está funcionando. Execute as células abaixo.

In [None]:
# Teste 1: Verificar Python
print("Teste 1: Python funcionando!")

In [None]:
# Teste 2: Operações básicas
x = 10
y = 20
soma = x + y
print(f"Teste 2: 10 + 20 = {soma}")

In [None]:
# Teste 3: Trabalhar com texto
mensagem = "Você está pronto para começar!"
print(f"Teste 3: {mensagem}")

## Próximos passos

Se todos os testes acima funcionaram, você está pronto!

**Agora abra o Notebook 01: Setup**

Caminho: `01_setup.ipynb`

Lá você vai:
1. Instalar a biblioteca `requests`
2. Configurar sua chave de API
3. Buscar seu primeiro filme
4. Salvar os dados

Boa sorte e bom aprendizado!

## Resumo visual do fluxo

```
Notebook 00 (este) → Introdução e setup básico
    ↓
Notebook 01 → Primeira requisição HTTP + salvar arquivo
    ↓
Notebook 02 → Loop para múltiplos filmes + índice
    ↓
Notebook 03 → Classes para estruturar dados
    ↓
Notebook 04 → Git para versionar código
    ↓
Notebook 05 → Pipeline completo integrado

RESULTADO: Sistema automático de coleta de dados funcionando!
```

## Glossário de termos

**API**: Interface que permite acessar dados de um serviço externo

**JSON**: Formato de arquivo para guardar dados estruturados

**Requisição HTTP**: Pedido feito para um servidor na internet

**Loop**: Repetição de código para processar múltiplos itens

**Classe**: Molde para criar objetos com estrutura definida

**Git**: Sistema de controle de versão de código

**Commit**: Salvar uma versão do código no Git

**Branch**: Ramificação do código para desenvolver features separadas

**Logging**: Registro de eventos e ações do programa

**Pipeline**: Sequência automatizada de etapas de processamento