# Lendo dados com Pandas
Pandas √© a principal biblioteca de Python para an√°lise de dados tabulares (tipo Excel).

Ela permite:
- Ler arquivos de dados
- Manipular colunas e linhas
- Fazer c√°lculos e estat√≠sticas
- Criar filtros e agrupamentos


## üìå C√≥digo completo
```python
import pandas as pd

df = pd.read_csv("clientes.csv")
df.head()
```

In [None]:
import pandas as pd

In [None]:
df_clientes_raw = pd.read_csv("/content/clientes_dataset.csv")

In [None]:
df_clientes_raw.head()

## Linha 1: `import pandas as pd`
- Importa a biblioteca `pandas`, que √© usada para an√°lise de dados em Python.
- O `as pd` √© um **apelido** para evitar escrever `pandas` toda hora.

## Linha 2: `df = pd.read_csv("clientes.csv")`
- L√™ um arquivo CSV chamado `clientes.csv`.
- O conte√∫do vira um **DataFrame**, que √© uma tabela com linhas e colunas.
- `df` √© o nome que damos para esse DataFrame.


## Linha 3: `df.head()`
- Mostra as 5 primeiras linhas do DataFrame.
- Muito √∫til para **verificar se a leitura do arquivo funcionou corretamente**.

## Extras √∫teis:
- `df.shape` ‚Üí mostra quantas linhas e colunas existem
- `df.columns` ‚Üí mostra os nomes das colunas
- `df.info()` ‚Üí mostra tipos de dados e valores nulos
- `df.describe()` ‚Üí mostra estat√≠sticas b√°sicas das colunas num√©ricas

##Como saber se precisa de par√™nteses?

- Se for algo que voc√™ quer ‚Äúver‚Äù ou ‚Äúpegar‚Äù ‚Üí provavelmente √© atributo (sem par√™nteses).

- Se for algo que voc√™ quer ‚Äúfazer‚Äù ou ‚Äúpedir‚Äù para rodar ‚Üí provavelmente √© fun√ß√£o (com par√™nteses).

In [None]:
df_clientes_raw.shape

In [None]:
df_clientes_raw.columns

In [None]:
df_clientes_raw.info()

In [None]:
df_clientes_raw.describe()

# Problemas comuns

Nem todo arquivo de dados est√° bem formatado. Aqui est√£o os erros mais comuns e como resolv√™-los.

## 1Ô∏è‚É£ Separador errado
- O pandas assume que o separador √© v√≠rgula (`,`)
- No Brasil, muitos arquivos usam ponto e v√≠rgula (`;`)

### Sintoma:
- S√≥ aparece **uma coluna** com tudo misturado

### Solu√ß√£o:
```python
df = pd.read_csv("arquivo.csv", sep=";")
```

## 2Ô∏è‚É£ Problema de codifica√ß√£o (encoding)
- Arquivos com acentos ou √ß podem estar com codifica√ß√£o diferente de UTF-8

### Sintoma:
- Erros como `UnicodeDecodeError`
- Caracteres estranhos: `√É`, `√É¬©`, `√É¬ß`

### Solu√ß√£o:
```python
df = pd.read_csv("arquivo.csv", encoding="latin1")
```

## 3Ô∏è‚É£ Cabe√ßalho na linha errada
- √Äs vezes o nome das colunas n√£o est√° na primeira linha do arquivo

### Sintoma:
- Colunas chamadas `Unnamed: 0`, `Unnamed: 1`, etc.

### Solu√ß√£o:
```python
df = pd.read_csv("arquivo.csv", header=1)  # pula a primeira linha
```

## 4Ô∏è‚É£ Arquivo Excel com m√∫ltiplas abas
- O `read_excel()` por padr√£o l√™ apenas a primeira aba

### Solu√ß√£o:
```python
df = pd.read_excel("arquivo.xlsx", sheet_name="Planilha2")
```

In [None]:
df_clientes_excel_raw = pd.read_excel("/content/clientes_dataset.csv")

In [None]:
df_clientes_excel_raw.head()

## ‚úÖ Boas pr√°ticas para evitar erros
- Sempre olhe o arquivo em um editor de texto antes (como Bloco de Notas)
- Use `df.head()` e `df.info()` para conferir se os dados foram lidos corretamente
- Teste manualmente diferentes par√¢metros: `sep`, `encoding`, `header`, `sheet_name`
- Documente suas decis√µes de leitura no notebook!