# Aula 6 - Inspeção e Operações Básicas com Pandas


Nesta aula, vamos explorar métodos de inspeção de dados com pandas, realizar operações básicas e praticar com a leitura e manipulação de arquivos CSV.
---

## Parte 1: Métodos de inspeção
Vamos começar carregando o pandas e criando um DataFrame de exemplo:


In [None]:
import pandas as pd

df = pd.DataFrame({
    'nome': ['Ana', 'Bruno', 'Carlos', 'Daniela', 'Eduardo','Ferreira','Guilherme','Hugo','Igor','João'],
    'idade': [23, 35, 45, 19, 31, 20, 52, 43, 23, 32],
    'nota': [8.5, 7.0, 9.2, 6.8, 7.5, 8.3, 9.8, 10, 3.5, 0]
})
df.head()

Unnamed: 0,nome,idade,nota
0,Ana,23,8.5
1,Bruno,35,7.0
2,Carlos,45,9.2
3,Daniela,19,6.8
4,Eduardo,31,7.5



### `.head()`
Exibe as primeiras 5 primeiras linhas do DataFrame.

### `.info()`
Mostra um resumo com número de entradas, tipos de dados e valores nulos.


In [None]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 10 entries, 0 to 9
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   nome    10 non-null     object 
 1   idade   10 non-null     int64  
 2   nota    10 non-null     float64
dtypes: float64(1), int64(1), object(1)
memory usage: 372.0+ bytes



### `.describe()`
Estatísticas descritivas para colunas numéricas.


In [None]:
df.describe()

Unnamed: 0,idade,nota
count,10.0,10.0
mean,32.3,7.06
std,11.421714,3.111341
min,19.0,0.0
25%,23.0,6.85
50%,31.5,7.9
75%,41.0,9.025
max,52.0,10.0



### `.shape` e `.dtypes`
Ver dimensões e tipos de dados.


In [None]:
df.shape

(10, 3)

In [None]:
df.dtypes

Unnamed: 0,0
nome,object
idade,int64
nota,float64


## Parte 2: Operações básicas

### Adicionar e remover colunas

**Adicionar uma Serie em um DataFrame**

In [None]:
import pandas as pd

df = pd.DataFrame({
    'nome': ['Ana', 'Bruno', 'Carlos'],
    'idade': [23, 35, 45]
})

nova_serie = pd.Series([7.5, 8.0, 6.9])

df['nota'] = nova_serie
print(df)

**Adicionar a um dataframe com condição**

In [None]:
df['aprovado'] = df['nota'] >= 7
df.drop(columns=['idade'],inplace=True)
df

Unnamed: 0,nome,nota,aprovado
0,Ana,8.5,True
1,Bruno,7.0,True
2,Carlos,9.2,True
3,Daniela,6.8,False
4,Eduardo,7.5,True
5,Ferreira,8.3,True
6,Guilherme,9.8,True
7,Hugo,10.0,True
8,Igor,3.5,False
9,João,0.0,False


In [None]:
df.head()

Unnamed: 0,nome,nota,aprovado
0,Ana,8.5,True
1,Bruno,7.0,True
2,Carlos,9.2,True
3,Daniela,6.8,False
4,Eduardo,7.5,True


### Renomear colunas

In [None]:
df.rename(columns={'nota': 'media_final'}, inplace=True)
df.head()

Unnamed: 0,nome,media_final,aprovado
0,Ana,8.5,True
1,Bruno,7.0,True
2,Carlos,9.2,True
3,Daniela,6.8,False
4,Eduardo,7.5,True


### Filtros com boolean masks

In [None]:
df[df['media_final'] > 7]

Unnamed: 0,nome,media_final,aprovado
0,Ana,8.5,True
2,Carlos,9.2,True
4,Eduardo,7.5,True
5,Ferreira,8.3,True
6,Guilherme,9.8,True
7,Hugo,10.0,True


### Tipos de dados e conversões (`astype`)

In [None]:
df['media_final'] = df['media_final'].astype(str)
df.dtypes

Unnamed: 0,0
nome,object
media_final,object
aprovado,bool


## Parte 3: Leitura e escrita de arquivos CSV

In [None]:
# Salvar arquivo CSV
df.to_csv('nome_do_arquivo.csv', index=False)
#df é o nome do Data Frame que está usando
# Ler arquivo CSV
df_lido = pd.read_csv('nome_do_arquivo.csv')
df_lido.head()

Unnamed: 0,nome,media_final,aprovado
0,Ana,8.5,True
1,Bruno,7.0,True
2,Carlos,9.2,True
3,Daniela,6.8,False
4,Eduardo,7.5,True



## Parte 4: Prática Guiada

Vamos colocar em prática os conceitos vistos até agora usando um arquivo real de dados no formato CSV.

Neste exercício, trabalharemos com o arquivo `directors.csv`, que contém informações sobre diretores de cinema.

---

### 📝 Instruções:

1. Leia o arquivo CSV e armazene em um DataFrame.
2. Inspecione os dados utilizando os métodos `.head()`, `.info()`, `.describe()` e `.dtypes`.
3. Aplique **filtros** com base em condições (ex: diretores que dirigiram após o ano 2000).
4. Crie **novas colunas** com base em dados existentes (ex: uma classificação de idade, ou um texto dizendo se dirigiu após 2000).
5. Realize **conversões de tipo** se necessário com `.astype()`.
6. Salve o DataFrame final em um novo arquivo CSV.
