# Aula 1 — Fundamentos de Python e Programação

Esta é a primeira aula do minicurso **Python para Epidemiologistas**. Nesta etapa vamos
aprender os conceitos básicos de programação em Python, a sintaxe para estruturas
de dados fundamentais e o controle de fluxo. Também veremos como criar funções,
utilizar *list comprehensions* e ler dados de um arquivo CSV. Ao final, você será
capaz de escrever pequenos scripts e aplicar essas técnicas em contextos de
epidemiologia.

## Cronograma Geral
| Aula  | Título e foco                                               | Principais tópicos                                                                                                                                                                            |
| ----- | ----------------------------------------------------------- | --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
| **1** | **Fundamentos de Python e Programação**                     | Tipos de variáveis, operadores, listas/tuplas/dicionários, condicionais, loops, funções, list comprehensions, leitura e processamento de CSV; 11 exercícios (10 progressivos + 1 integrador). |
| **2** | **Do R ao Python no Colab**                  | Colab 101, sintaxe básica, manipulação de dados com `pandas` (seleção, filtros, `assign`, `query`, `groupby().agg()`), comparações R↔Python, mini‑EDA com dados sintéticos.                   |
| **3** | **Datas, Joins, Reshapes e Curva Epidêmica**  | Conversão e manipulação de datas, `resample`, `melt`/`pivot`, `merge`, construção de curvas epidêmicas por região e cálculo de taxas por 100 k habitantes.                                    |
| **4** | **Visualização para Epidemiologia**         | Gráficos de barras e linhas com Matplotlib/Seaborn, faceting, personalização de eixos e temas, interatividade simples via `#@title`, exercícios de gráficos.                                  |
| **5** | **Modelos básicos e Reprodutibilidade**    | GLM Poisson e Logística com `statsmodels`/`scikit-learn`, métricas simples, interpretação epidemiológica, organização de código, exportação de resultados e compartilhamento no Drive.        |



## Como usar este notebook no Colab

1. Clique em "Open in Colab" (caso disponível) ou faça upload do arquivo no Google Colab.
2. Execute as células em sequência (Ctrl/Cmd + Enter ou clicar no botão de play).
3. Leia o texto explicativo antes de rodar o código.
4. Para salvar sua própria cópia, vá em **File → Save a copy in Drive**.
5. Para resetar o ambiente, use **Runtime → Restart runtime**.

> **Observação:** Sinta‑se à vontade para experimentar modificações nas células. Evite usar a assitência da IA. Evite ver a solução dos exercícios antes de tentar resolver por conta própria.


## 1. Tipos de variáveis e operadores básicos

Python possui alguns tipos de dados fundamentais:

- **Inteiros (`int`)**: números sem parte decimal, e.g. `1`, `42`, `-5`.
- **Pontos flutuantes (`float`)**: números com parte decimal, e.g. `3.14`, `-0.5`.
- **Strings (`str`)**: sequências de caracteres delimitadas por aspas simples `'` ou duplas `"`, e.g. `'epidemiologia'`, `"Python"`.
- **Booleanos (`bool`)**: valores lógicos `True` ou `False`.

Operadores aritméticos básicos:

| Operador | Descrição       | Exemplo       | Resultado |
|---------|----------------|---------------|-----------|
| `+`     | adição         | `3 + 2`       | `5`       |
| `-`     | subtração      | `5 - 7`       | `-2`      |
| `*`     | multiplicação  | `4 * 3`       | `12`      |
| `/`     | divisão        | `10 / 4`      | `2.5`     |
| `//`    | divisão inteira| `10 // 4`     | `2`       |
| `%`     | resto (módulo) | `10 % 3`      | `1`       |
| `**`    | exponenciação  | `2 ** 3`      | `8`       |

Operadores relacionais (retornam `True` ou `False`): `==`, `!=`, `>`, `<`, `>=`, `<=`.

Operadores lógicos: `and`, `or`, `not`.


In [None]:
# Exemplos de tipos e operadores
int_num = 10
float_num = 3.5
text = "Python para Epidemiologia"
flag = True

print("Tipo de int_num:", type(int_num))
print("Tipo de float_num:", type(float_num))
print("Tipo de text:", type(text))
print("Tipo de flag:", type(flag))

# Operadores aritméticos
a = 5
b = 2
print("a + b =", a + b)
print("a - b =", a - b)
print("a * b =", a * b)
print("a / b =", a / b)
print("a // b =", a // b)
print("a % b =", a % b)
print("a ** b =", a ** b)

# Operadores relacionais
print("a > b:", a > b)
print("a == b:", a == b)
print("a != b:", a != b)

# Operadores lógicos
print("(a > 3) and (b < 5):", (a > 3) and (b < 5))
print("not flag:", not flag)


## 2. Estruturas de dados: listas, tuplas e dicionários

As estruturas de dados permitem agrupar valores. As mais comuns em Python são:

### Listas

Listas são coleções ordenadas e mutáveis. Podem conter elementos de tipos diferentes.

```python
lista = [1, 2, 3, 'quatro']
lista.append(5)     # adiciona ao final
lista[0]            # acessa o primeiro elemento
lista[1:3]          # fatia (do elemento 1 até o 2)
```

### Tuplas

Tuplas são coleções ordenadas e **imutáveis** (não podem ser modificadas após criadas).

```python
tupla = (10, 20, 30)
tupla[1]           # acessa o segundo elemento
```

### Dicionários

Dicionários armazenam pares **chave→valor**. Chaves devem ser únicas e imutáveis.

```python
pessoa = {'nome': 'Ana', 'idade': 28, 'cidade': 'Fortaleza'}
pessoa['idade']     # acessa o valor associado à chave 'idade'
pessoa['altura'] = 1.65  # adiciona nova chave/valor
```

Essas estruturas são essenciais para organizar dados antes de trabalharmos com
DataFrames no `pandas` (que veremos nas próximas aulas).


In [None]:
# Trabalhando com listas
frutas = ['maçã', 'banana', 'caju']
print(frutas)
frutas.append('uva')  # adiciona
print(frutas)
print("Primeira fruta:", frutas[0])
print("Últimas duas frutas:", frutas[-2:])

# Tuplas
coordinates = (3.0, 4.5)
print("Tupla de coordenadas:", coordinates)

# Dicionários
vacina = {'nome': 'COVIDShield', 'doses': 2}
vacina['eficacia'] = 0.85
print("Dicionário vacina:", vacina)
print("Número de doses:", vacina['doses'])


## 3. Estruturas de controle: condicionais e loops

Para controlar o fluxo de execução do seu programa, usamos condicionais e laços.

### Condicionais (`if`, `elif`, `else`)

Permitem executar blocos de código dependendo de condições.

```python
idade = 20
if idade >= 18:
    print('Você é maior de idade.')
elif idade >= 12:
    print('Você é adolescente.')
else:
    print('Você é criança.')
```

### Loops

#### `for`

Repete um bloco de código para cada elemento de uma sequência (lista, string, etc.).

```python
nomes = ['Carlos', 'Joana', 'Miguel']
for nome in nomes:
    print('Olá,', nome)
```

#### `while`

Repete enquanto a condição for verdadeira. Use com cuidado para evitar loops infinitos.

```python
contador = 0
while contador < 5:
    print('Contador:', contador)
    contador += 1
```

Loços permitem automatizar tarefas repetitivas e iterar sobre estruturas de dados.


In [None]:
# Condicional
temperatura = 37.8
if temperatura >= 38:
    print('Febre detectada')
else:
    print('Sem febre')

# Loop for
idades = [23, 45, 12, 37]
for idx, idade in enumerate(idades):
    print(f'Índice {idx}: idade = {idade}')

# Loop while
count = 0
while count < 3:
    print('Count é', count)
    count += 1


### Exercícios (Parte 1 — conceitos básicos)

1. **Aquecimento:** Crie três variáveis (`a`, `b`, `c`) com valores numéricos e calcule a média deles. Exiba o resultado.
2. **Listas e índices:** Crie uma lista com os dias da semana e imprima apenas o terceiro e o sexto elementos.
3. **Dicionários:** Crie um dicionário representando uma pessoa com chaves `nome`, `idade` e `profissão`. Em seguida, adicione uma nova chave `cidade` com o valor `"Fortaleza"`.
4. **Condicionais:** Peça para o usuário (usando `input()`) digitar um número inteiro. Verifique se ele é positivo, negativo ou zero e imprima uma mensagem apropriada.
5. **Loop e contagem:** Dada a lista `idades = [12, 17, 24, 8, 65, 30]`, conte quantas idades são maiores ou iguais a 18 e imprima o resultado.

Resolva os exercícios nas células abaixo e, quando terminar, consulte a solução colapsada para conferir seu raciocínio.


In [None]:
# 1. Crie três variáveis e calcule a média
# Escreva seu código aqui

a = 10
b = 5
c = 3
media = (a + b + c) / 3
print('A média é', media)

<details><summary>✅ Clique para ver a solução do exercício 1</summary>

```python
a = 10
b = 5
c = 3
media = (a + b + c) / 3
print('A média é', media)
```

**Explicação:** basta somar os três valores e dividir por 3 para obter a média aritmética.
```
</details>


In [None]:
# 2. Liste o terceiro e o sexto dia da semana
# Escreva seu código aqui


<details><summary>✅ Clique para ver a solução do exercício 2</summary>

```python
dias = ['segunda', 'terça', 'quarta', 'quinta', 'sexta', 'sábado', 'domingo']
print(dias[2])  # quarta
print(dias[5])  # sábado
```

**Explicação:** Em Python, a indexação começa em 0, portanto `dias[2]` corresponde ao terceiro elemento.
```
</details>


In [None]:
# 3. Crie um dicionário com informações de uma pessoa
# Escreva seu código aqui



<details><summary>✅ Clique para ver a solução do exercício 3</summary>

```python
pessoa = {'nome': 'Maria', 'idade': 32, 'profissão': 'Epidemiologista'}
pessoa['cidade'] = 'Fortaleza'
print(pessoa)
```

**Explicação:** Um dicionário pode ser expandido adicionando novas chaves como `pessoa['cidade'] = 'Fortaleza'`.
```
</details>


In [None]:
# 4. Peça ao usuário um número e classifique
# Escreva seu código aqui
# Dica 1: usa a função input(prompt='') para ler uma entrada do usuário
# Dica 2: para converter tipos em Python, basta usar int(), float() ou str()


<details><summary>✅ Clique para ver a solução do exercício 4</summary>

```python
num = int(input('Digite um número inteiro: '))
if num > 0:
    print('Positivo')
elif num < 0:
    print('Negativo')
else:
    print('Zero')
```

**Explicação:** convertemos a entrada para `int` e usamos condicionais para verificar se é maior, menor ou igual a zero.
```
</details>


In [None]:
# 5. Conte quantos valores são >= 18

idades = [12, 17, 24, 8, 65, 30]

# Escreva seu código aqui



<details><summary>✅ Clique para ver a solução do exercício 5</summary>

```python
idades = [12, 17, 24, 8, 65, 30]
contador_maiores = 0
for idade in idades:
    if idade >= 18:
        contador_maiores += 1
print('Número de maiores de idade:', contador_maiores)
```

**Explicação:** iteramos sobre a lista e incrementamos o contador quando a condição `idade >= 18` é verdadeira.
```
</details>


---
## Intervalo
---


## 4. Funções em Python

Funções são blocos reutilizáveis de código que podem receber argumentos e retornar valores. São úteis para organizar tarefas e evitar repetição.

A sintaxe básica é:

```python
def nome_da_funcao(param1, param2=valor_padrao):
    '''Docstring: descreve o que a função faz.'''
    # corpo da função
    resultado = param1 + param2
    return resultado
```

Observe que usamos três apóstrofos (`'''`) para delimitar a docstring dentro da função. É uma convenção comum em Python para documentar funções.

Exemplo simples de função que calcula o Índice de Massa Corporal (IMC):
```python
def calcula_imc(peso_kg, altura_m):
    imc = peso_kg / (altura_m ** 2)
    return imc

print(calcula_imc(70, 1.75))
```
Além da palavra‑chave `def` e dos parênteses com parâmetros, usamos `return` para devolver o valor calculado.


In [None]:
# Exemplo de função: cálculo de IMC
def calcula_imc(peso_kg, altura_m):
    '''Calcula o Índice de Massa Corporal dado peso e altura.'''
    imc = peso_kg / (altura_m ** 2)
    return imc

# Chamada da função
print('IMC de 70 kg e 1,75 m:', calcula_imc(70, 1.75))


## 5. List comprehensions

Uma *list comprehension* é uma forma concisa de criar listas aplicando uma transformação ou filtro a uma sequência. A sintaxe geral é:

```python
[expressão for item in iterável if condição]
```

Exemplo: gerar uma lista com os quadrados dos números de 0 a 5.
```python
quadrados = [x**2 for x in range(6)]  # [0, 1, 4, 9, 16, 25]
```

Podemos adicionar uma condição para filtrar: gerar apenas números pares ao quadrado.
```python
pares_ao_quadrado = [x**2 for x in range(11) if x % 2 == 0]
```
List comprehensions tornam o código mais legível e compacto quando usadas com moderação.


In [None]:
# Exemplos de list comprehensions
numeros = [1, 2, 3, 4, 5]
quadrados = [n**2 for n in numeros]
print('Quadrados:', quadrados)

# Gerar uma lista de idades ao quadrado apenas para maiores de idade
idades = [12, 17, 24, 8, 65, 30]
idades_quadrado_maior18 = [idade**2 for idade in idades if idade >= 18]
print('Idades^2 (>=18):', idades_quadrado_maior18)


## 6. Leitura e processamento de dados de um arquivo CSV

O Python possui bibliotecas integradas para manipular arquivos. Aqui usaremos o módulo `csv` da biblioteca padrão para ler um arquivo `.csv` simples. Em contextos mais complexos, usaremos `pandas`, mas por enquanto nos concentremos no básico.

Vamos primeiro **gerar** um arquivo CSV com algumas informações para praticar. Em seguida, vamos ler e processar esse arquivo.

### Gerando um CSV
O código abaixo cria um arquivo `dados_pessoas.csv` com colunas `nome`, `idade` e `cidade`.


In [None]:
import csv

# Criar dados
pessoas = [
    {'nome': 'Alice', 'idade': 30, 'cidade': 'Fortaleza'},
    {'nome': 'Bruno', 'idade': 22, 'cidade': 'Sobral'},
    {'nome': 'Carlos', 'idade': 17, 'cidade': 'Juazeiro'},
    {'nome': 'Daniela', 'idade': 45, 'cidade': 'Fortaleza'},
    {'nome': 'Eduardo', 'idade': 28, 'cidade': 'Crato'}
]

with open('dados_pessoas.csv', 'w', newline='', encoding='utf-8') as csvfile:
    writer = csv.DictWriter(csvfile, fieldnames=['nome', 'idade', 'cidade'])
    writer.writeheader()
    for pessoa in pessoas:
        writer.writerow(pessoa)
print('Arquivo CSV criado!')


### Lendo o CSV
Vamos ler o arquivo que acabamos de gerar. Usaremos o `csv.DictReader` para obter cada linha como um dicionário.


In [None]:
# Lendo dados de um arquivo CSV
dados = []
with open('dados_pessoas.csv', 'r', encoding='utf-8') as csvfile:
    reader = csv.DictReader(csvfile)
    for linha in reader:
        # Converter a idade de string para inteiro
        linha['idade'] = int(linha['idade'])
        dados.append(linha)

print('Primeiras linhas:', dados[:3])

# Exemplo de processamento: calcular idade média e listar pessoas de Fortaleza
idades = [p['idade'] for p in dados]
media_idade = sum(idades) / len(idades)
fortaleza = [p['nome'] for p in dados if p['cidade'] == 'Fortaleza']

print('Idade média:', media_idade)
print('Pessoas de Fortaleza:', fortaleza)


### Exercícios (Parte 2 — funções, list comprehensions e CSV)

6. **Função IMC aprimorada:** Escreva uma função que receba listas de pesos e alturas de várias pessoas e retorne uma lista com o IMC de cada uma delas. Use um loop `for` internamente.
7. **Verificar se um número é primo:** Crie uma função que receba um número inteiro e retorne `True` se for primo e `False` caso contrário.
8. **List comprehension com condição:** Usando list comprehension, gere uma lista com os números pares entre 1 e 30 elevados ao cubo.
9. **Filtrar pessoas adultas do CSV:** A partir dos dados lidos do CSV, crie uma list comprehension que retorne apenas os nomes das pessoas com 18 anos ou mais.
10. **Função de leitura e estatística:** Crie uma função chamada `le_e_calcula_media` que aceite o nome de um arquivo CSV, leia as idades e retorne a idade média. Teste com o arquivo `dados_pessoas.csv`.

### Exercício final — Integração de conceitos

Escreva um programa que: (a) leia o arquivo `dados_pessoas.csv`; (b) crie uma nova lista de dicionários contendo apenas as pessoas cujo nome comece com a letra **'A'** ou **'D'**; (c) use uma list comprehension para extrair as idades dessas pessoas e calcule a média das idades; e (d) defina uma função para classificar cada pessoa como **"adulto"** (idade ≥ 18) ou **"menor"**, retornando um dicionário com o nome e a classificação.

Implemente cada parte passo a passo na célula de código abaixo. Consulte as soluções colapsadas para verificar sua abordagem.


In [None]:
# 6. Função que calcula IMC para listas de pesos e alturas

pesos = [60, 72, 80]
alturas = [1.60, 1.80, 1.75]

# Escreva seu código aqui
# Dica: se preferir, use a função zip() para auxiliar na iteração de tuplas


<details><summary>✅ Clique para ver a solução do exercício 6</summary>

```python
def lista_imc(pesos, alturas):
    imcs = []
    for p, h in zip(pesos, alturas):
        imcs.append(p / (h**2))
    return imcs

# Teste
pesos = [60, 72, 80]
alturas = [1.60, 1.80, 1.75]
print(lista_imc(pesos, alturas))
```

**Explicação:** usamos `zip` para percorrer duas listas simultaneamente e calculamos o IMC de cada par.
```
</details>


In [None]:
# 7. Função que verifica se um número é primo
# Escreva seu código aqui
# Dica: um número primo é divisível apenas por 1 e por ele mesmo.


<details><summary>✅ Clique para ver a solução do exercício 7</summary>

```python
def eh_primo(n):
    if n < 2:
        return False
    for i in range(2, int(n ** 0.5) + 1):
        if n % i == 0:
            return False
    return True

# Teste
print(eh_primo(7))  # True
print(eh_primo(15)) # False
```

**Explicação:** um número primo é divisível apenas por 1 e por ele mesmo. Iteramos até a raiz quadrada de `n` para checar divisores.
```
</details>


In [None]:
# 8. Números pares entre 1 e 30 elevados ao cubo
# Escreva seu código aqui


<details><summary>✅ Clique para ver a solução do exercício 8</summary>

```python
cubos_pares = [x**3 for x in range(1, 31) if x % 2 == 0]
print(cubos_pares)
```

**Explicação:** usamos `range(1, 31)` para gerar os números de 1 a 30 e filtramos apenas os pares com `x % 2 == 0`.
```
</details>


In [None]:
# 9. Filtrar nomes das pessoas com 18 anos ou mais

print(dados)

# Escreva seu código aqui


<details><summary>✅ Clique para ver a solução do exercício 9</summary>

```python
# Supondo que 'dados' contém as linhas lidas do CSV
adultos = [p['nome'] for p in dados if p['idade'] >= 18]
print(adultos)
```

**Explicação:** com list comprehension, percorremos cada dicionário e filtramos pela condição `idade >= 18`.
```
</details>


In [None]:
# 10. Função para ler CSV e calcular média das idades
# Escreva seu código aqui



<details><summary>✅ Clique para ver a solução do exercício 10</summary>

```python
def le_e_calcula_media(nome_arquivo):
    import csv
    idades = []
    with open(nome_arquivo, 'r', encoding='utf-8') as f:
        reader = csv.DictReader(f)
        for row in reader:
            idades.append(int(row['idade']))
    return sum(idades) / len(idades)

# Teste com o arquivo gerado
print(le_e_calcula_media('dados_pessoas.csv'))
```

**Explicação:** a função lê o arquivo linha a linha, converte as idades para inteiros e retorna a média usando `sum/len`.
```
</details>


In [None]:
# Exercício final: integrar conceitos
# 1) Leia o arquivo dados_pessoas.csv
# 2) Filtre as pessoas cujo nome começa com 'A' ou 'D'
# 3) Use list comprehension para extrair as idades e calcule a média
# 4) Defina uma função que classifique cada pessoa como 'adulto' (>=18) ou 'menor'
#    e retorne um dicionário com o nome e a classificação
# Escreva seu código aqui



<details><summary>✅ Clique para ver a solução do exercício final</summary>

```python
import csv

# 1) Ler o CSV
pessoas = []
with open('dados_pessoas.csv', 'r', encoding='utf-8') as f:
    reader = csv.DictReader(f)
    for row in reader:
        row['idade'] = int(row['idade'])
        pessoas.append(row)

# 2) Filtrar nomes com inicial A ou D
filtro = [p for p in pessoas if p['nome'].startswith(('A', 'D'))]

# 3) List comprehension para idades e média
idades_filtradas = [p['idade'] for p in filtro]
media_idade = sum(idades_filtradas) / len(idades_filtradas)
print('Média das idades filtradas:', media_idade)

# 4) Função de classificação
def classifica_idade(registro):
    return {
        'nome': registro['nome'],
        'classificacao': 'adulto' if registro['idade'] >= 18 else 'menor'
    }

classificacoes = [classifica_idade(p) for p in filtro]
print(classificacoes)
```

**Explicação:**
1. Utilizamos `csv.DictReader` para ler o arquivo e converter a coluna `idade` para inteiro.
2. Utilizamos um filtro simples com `startswith` para selecionar nomes que começam com 'A' ou 'D'.
3. Extraímos as idades com list comprehension e calculamos a média. A função `sum` soma os elementos da lista.
4. Definimos uma função que retorna um dicionário com a classificação de acordo com a idade e aplicamos essa função aos registros filtrados.
```
</details>


## 7. Encerramento e próximos passos

Parabéns por concluir a Aula 1! Nesta aula você:

- Conheceu os tipos básicos de dados e operadores em Python.
- Aprendeu a trabalhar com listas, tuplas e dicionários.
- Controlou o fluxo do programa usando condicionais e loops.
- Escreveu funções, compreendeu list comprehensions e leu dados de arquivos CSV.
- Praticou com **11 exercícios**, incluindo um desafio integrador.

No próximo encontro (Aula 2) iremos mergulhar no `pandas`, biblioteca essencial para manipular dados tabulares. Você verá como importar dados reais, limpar e transformar DataFrames e comparar a sintaxe com o `dplyr` em R.

**Checklist de competências**
1. [ ] Entender a diferença entre `int`, `float`, `str` e `bool`.
2. [ ] Criar e manipular listas, tuplas e dicionários.
3. [ ] Escrever condicionais e loops (`for`, `while`).
4. [ ] Definir e chamar funções em Python.
5. [ ] Utilizar list comprehensions para construir listas de forma concisa.
6. [ ] Ler e processar arquivos CSV usando a biblioteca padrão.

**Tarefa recomendada:** explore mais funções embutidas de Python e tente resolver problemas do seu dia a dia usando as estruturas estudadas. Por exemplo, escreva um script que leia uma lista de casos de uma doença e conte quantos são de cada categoria.
