# M√≥dulo 6: T√©cnicas Avan√ßadas no Pandas


Este m√≥dulo aborda t√©cnicas mais avan√ßadas da biblioteca Pandas, ideais para quem j√° domina o b√°sico e deseja analisar dados mais complexos e em maior volume. Abaixo, explicamos cada t√©cnica usada, seguida de exemplos pr√°ticos.

## 1. Sele√ß√£o de Colunas e Linhas com `loc` e `iloc`

- `loc`: sele√ß√£o baseada em **r√≥tulos** (nomes de linhas/colunas).
```python
df.loc[0:5, ['Data', 'Valor']]
```

- `iloc`: sele√ß√£o baseada em **√≠ndices num√©ricos** (posi√ß√£o das linhas/colunas).
```python
df.iloc[0:5, [0, 2]]
```
Essas sele√ß√µes s√£o √∫teis para isolar partes do DataFrame para an√°lise ou visualiza√ß√£o espec√≠fica.


## 2. Manipula√ß√£o de DataFrames Grandes com `chunksize`

Ao lidar com arquivos grandes, √© comum process√°-los em peda√ßos (chunks). O par√¢metro `chunksize` do `read_csv()` permite isso:
```python
for chunk in pd.read_csv("arquivo.csv", chunksize=100):
    # Processar cada peda√ßo separadamente
```
Essa t√©cnica evita sobrecarregar a mem√≥ria RAM e permite processar dados em lote.


## 3. Opera√ß√µes com Dados Temporais e `resample`

Pandas facilita a manipula√ß√£o de datas, especialmente ao usar `resample()` para agrupar dados por per√≠odos:
```python
df['Data'] = pd.to_datetime(df['Data'])
df.set_index('Data', inplace=True)
df['Valor'].resample('M').mean()
```
Essa abordagem permite calcular m√©dias, somas e contagens por m√™s, semana ou ano.


## 4. Tabelas Din√¢micas: `pivot_table` e `crosstab`

- `pivot_table`: resume valores em uma tabela din√¢mica com agrega√ß√µes.
```python
pd.pivot_table(df, values='Valor', index='Categoria', columns='M√™s', aggfunc='mean')
```

- `crosstab`: calcula frequ√™ncias entre categorias.
```python
pd.crosstab(df['Categoria'], df['Ano'])
```
Essas ferramentas s√£o ideais para sumariza√ß√£o e an√°lises comparativas.


## 5. Aplica√ß√£o de Fun√ß√µes Personalizadas com `apply`

Com `apply`, podemos aplicar fun√ß√µes customizadas em colunas ou linhas:
```python
def classificar(x):
    if x >= 80:
        return 'Alto'
    elif x >= 50:
        return 'M√©dio'
    else:
        return 'Baixo'

df['Classifica√ß√£o'] = df['Valor'].apply(classificar)
```
Isso √© √∫til para categorizar ou transformar dados de forma din√¢mica.


---

‚úÖ Agora que voc√™ entendeu os conceitos principais, vamos praticar com um exerc√≠cio real.

Na pr√≥xima c√©lula, voc√™ encontrar√° o enunciado de uma atividade que engloba tudo o que foi explicado at√© aqui.



## üß† Desafio Final: Explorando e Transformando Dados com Pandas

Neste desafio, voc√™ ir√° aplicar tudo o que aprendeu neste m√≥dulo: sele√ß√£o com `loc` e `iloc`, manipula√ß√£o de grandes volumes de dados, an√°lise temporal com `resample`, tabelas din√¢micas com `pivot_table`, contagens com `crosstab` e fun√ß√µes personalizadas com `apply`.

---

### üì¶ Etapa 1: Criando seu pr√≥prio DataFrame

Antes de come√ßar, crie um DataFrame com os seguintes requisitos:

- Uma coluna `Data` com pelo menos 60 datas (pode usar `pd.date_range()`).
- Uma coluna `Categoria` com valores aleat√≥rios entre `'A'`, `'B'`, `'C'`.
- Uma coluna `Valor` com n√∫meros decimais (simulando valores monet√°rios entre R$ 10,00 e R$ 100,00).
- (Opcional) Uma coluna `Grupo`, com valores como `'Online'` ou `'Loja F√≠sica'`.

Voc√™ pode usar `numpy.random` para gerar os dados aleat√≥rios. Exemplo de cria√ß√£o de datas:

```python
pd.date_range(start="2023-01-01", periods=60, freq='D')


### üìù Etapa 2: Tarefas do Desafio

Com seu DataFrame criado, realize as tarefas a seguir:

---

#### 1Ô∏è‚É£ Filtrar por categoria
Crie um novo DataFrame contendo apenas os dados da **Categoria B**.

---

#### 2Ô∏è‚É£ Classifica√ß√£o por faixa de valor
Adicione uma nova coluna chamada `FaixaValor`, de acordo com a regra:

- `"Baixo"` ‚Üí se o valor for **menor que 40**
- `"M√©dio"` ‚Üí se o valor estiver **entre 40 e 70**
- `"Alto"` ‚Üí se o valor for **70 ou mais**

Voc√™ pode usar a fun√ß√£o `apply()` com uma fun√ß√£o personalizada.

---

#### 3Ô∏è‚É£ M√©dia semanal com `resample()`
Utilize `resample()` para calcular a **m√©dia semanal** da coluna `Valor`.

> üí° Certifique-se de que a coluna `Data` esteja no formato datetime e seja o √≠ndice do DataFrame.

---

#### 4Ô∏è‚É£ Tabela din√¢mica (pivot table)
Crie uma `pivot_table` que mostre a **m√©dia do valor** para cada combina√ß√£o entre:

- **Linha**: `FaixaValor`
- **Coluna**: semana (pode ser obtida com `.dt.isocalendar().week`)

---

#### 5Ô∏è‚É£ Tabela de frequ√™ncia (crosstab)
Crie um `crosstab` com a **contagem de registros** de cada `FaixaValor` por **m√™s** (use `.dt.month`).

---

‚úÖ Ao final, observe se h√° padr√µes ou tend√™ncias:
- H√° mais registros "Altos" em algum m√™s?
- A m√©dia semanal varia muito?
- Alguma faixa de valor domina?

Explore e reflita sobre os dados!
