# Mini Curso: Pandas DataFrame e AWS Wrangler

Este mini curso de 1 hora cobre o uso do Pandas DataFrame e AWS Wrangler com exemplos práticos de utilização.

## 1. Introdução
O Pandas é uma biblioteca de manipulação de dados em Python, enquanto o AWS Wrangler facilita a integração com serviços da AWS, como o Athena.

## 2. Configurando o Ambiente
Instale as bibliotecas necessárias usando:
```python
!pip install pandas awswrangler
```

Importe as bibliotecas no seu código:
```python
import pandas as pd
import awswrangler as wr
```

## 3. Baixar Dados do Athena
Conecte-se ao AWS Athena e baixe dados para um DataFrame:
```python
import awswrangler as wr

# Configurar conexão com Athena
df = wr.athena.read_sql_query(
    sql="SELECT * FROM sua_tabela LIMIT 10;",
    database="seu_banco_de_dados"
)
print(df.head())
```

## 4. Criar Tabela no Athena
Crie uma tabela no Athena usando SQL:
```python
query = """
CREATE TABLE sua_tabela (
    coluna1 STRING,
    coluna2 INT
);
"""
wr.athena.start_query_execution(query=query, database="seu_banco_de_dados")
```

## 5. Amostra de DataFrame
Crie e visualize um DataFrame:
```python
data = {
    'A': [1, 2, 3],
    'B': [4, 5, 6]
}
df = pd.DataFrame(data)
print(df)
```

## 6. Manipulações Básicas do DataFrame
Exemplos de manipulações básicas:
```python
# Seleção de coluna
df['A']

# Filtragem
df[df['A'] > 1]

# Ordenação
df.sort_values(by='B')
```

## 7. Group By
Exemplo de uso de `groupby` e agregações:
```python
df_grouped = df.groupby('A').sum()
print(df_grouped)
```

## 8. Pivot
Exemplo de uso de `pivot`:
```python
df_pivot = df.pivot(index='A', columns='B', values='A')
print(df_pivot)
```

## 9. Uso de Memória RAM
Dicas para monitorar e otimizar o uso de memória:
```python
# Verificar uso de memória
df.memory_usage(deep=True)

# Converter tipos de dados para economizar memória
df['A'] = df['A'].astype('int8')
```

## 10. Tipos de Variáveis e Conversão de Colunas
Identifique e converta tipos de variáveis:
```python
print(df.dtypes)
df['A'] = df['A'].astype('float32')
```

## 11. Pandas Series
O que é uma Pandas Series e como manipulá-la:
```python
s = pd.Series([1, 2, 3])
print(s)
```

## 12. Criação de Coluna com Condição Usando `iloc`
Crie uma coluna com base em condições:
```python
df.loc[df['A'] > 1, 'Novo'] = 'Valor'
print(df)
```

## 13. Uso de `apply` na Coluna
Exemplo de aplicação de funções:
```python
df['A_squared'] = df['A'].apply(lambda x: x**2)
print(df)
```

## 14. Exemplo de `inplace`
Exemplo de uso do parâmetro `inplace`:
```python
df.drop(columns=['B'], inplace=True)
print(df)
```

## 15. Descrição do DataFrame com `describe`
Exemplo de como usar `describe`:
```python
print(df.describe())
```

## 16. Exportação de DataFrame para CSV/Parquet/XLSX
Exemplos de exportação:
```python
# Exportar para CSV
df.to_csv('data.csv', index=False)

# Exportar para Parquet
df.to_parquet('data.parquet', index=False)

# Exportar para XLSX
df.to_excel('data.xlsx', index=False)
```

## 17. Filtragem de DataFrame
Exemplos de filtragem:
```python
# Filtrar com condição
filtered_df = df[df['A'] < 3]
print(filtered_df)
```

## 18. Outras Manipulações Úteis
Manipulações adicionais:
```python
# Alterar índice
df.set_index('A', inplace=True)

# Resetar índice
df.reset_index(inplace=True)
```

## Conclusão
Este notebook forneceu uma visão geral dos principais recursos e manipulações que você pode realizar com Pandas DataFrame e AWS Wrangler.