# Módulo 2: Operações Básicas com Data Frames

Neste módulo, vamos nos concentrar nas operações básicas que podemos realizar em DataFrames com o Pandas. Vamos aprender a ler e escrever arquivos de diferentes formatos, a filtrar dados com base em condições específicas e a manipular os índices dos DataFrames.

## Tópicos deste Módulo:

- Leitura e Escrita de Arquivos CSV, Excel, JSON e Parquet
- Filtragem de Dados com Condições
- Manipulação de Índices (set_index, reset_index)

---

## 1. Leitura e Escrita de Arquivos

Pandas facilita a leitura e escrita de diferentes tipos de arquivos. Vamos cobrir os formatos CSV, Excel, JSON e Parquet.

### Leitura de Arquivos CSV

Para ler um arquivo CSV, usamos o método `pd.read_csv()`:

```python
import pandas as pd

# Leitura de um arquivo CSV
df = pd.read_csv('caminho_do_arquivo/arquivo.csv')
print(df.head())
# Salvando o DataFrame em um arquivo CSV
df.to_csv('caminho/para/arquivo_salvo.csv', index=False)

```

### Leitura de Arquivos Excel

Para ler um arquivo CSV, usamos o método `pd.read_excel()`:

```python
import pandas as pd

# Leitura de um arquivo Excel
df_excel = pd.read_excel('caminho_do_arquivo/arquivo.xlsx')

# Escrita de um arquivo Excel
df.to_excel('caminho_do_arquivo/arquivo_salvo.xlsx', index=False)

```
### Leitura de Arquivos JSON

Para ler um arquivo CSV, usamos o método `pd.read_json()`:

```python
import pandas as pd

# Leitura de um arquivo JSON
df_json = pd.read_json('caminho_do_arquivo/arquivo.json')

# Escrita de um arquivo JSON
df.to_json('caminho_do_arquivo/arquivo_salvo.json')
```

### Notas:

Cada tipo específico de formato de arquivo (`.json`, `.xlsl`, `.csv`, `etc...`) tem sua proía leitura, que pode ser consultada na documentação do pandas


## Filtragem de Dados com Condições


### Filtragem Simples

In [11]:
# Selecionar todas as linhas onde a coluna 'idade' é maior que 30
import pandas as pd

# Criando o DataFrame com 15 elementos
df = {
    'Nome': ['Ana', 'Bruno', 'Carlos', 'Daniela', 'Eduardo', 'Fernanda', 'Gabriel', 'Helena', 'Igor', 'Joana', 
             'Kleber', 'Laura', 'Marcos', 'Nina', 'Otávio'],
    'Idade': [23, 35, 22, 28, 40, 30, 25, 27, 32, 31, 29, 24, 38, 26, 33],
    'Cidade': ['São Paulo', 'Rio de Janeiro', 'Curitiba', 'Salvador', 'Brasília', 'Fortaleza', 'Belo Horizonte',
               'Porto Alegre', 'Recife', 'Manaus', 'Belém', 'Goiânia', 'Florianópolis', 'Campo Grande', 'São Paulo']
}

df = pd.DataFrame(df)


df_filtrado = df[df['Idade'] > 30]
print(df_filtrado)

       Nome  Idade          Cidade
1     Bruno     35  Rio de Janeiro
4   Eduardo     40        Brasília
8      Igor     32          Recife
9     Joana     31          Manaus
12   Marcos     38   Florianópolis
14   Otávio     33       São Paulo


### Filtragem com Múltiplas Condições

- Você pode combinar condições usando operadores lógicos (`&`, `|`):

In [12]:
# Selecionar linhas onde a idade é maior que 30 e a cidade é 'São Paulo'


df_filtrado = df[(df['Idade'] > 30) & (df['Cidade'] == 'São Paulo')]
print(df_filtrado)

      Nome  Idade     Cidade
14  Otávio     33  São Paulo


## Manipulação de Índices

- Os índices no Pandas ajudam a organizar os dados. Você pode definir ou redefinir o índice de um DataFrame.

### Definir um Índice com `set_index()`

 - O método `set_index()` define uma coluna como o índice do DataFrame:

In [14]:
# Definir a coluna 'nome' como índice
df_indexado = df.set_index('Nome')
print(df_indexado.head())

         Idade          Cidade
Nome                          
Ana         23       São Paulo
Bruno       35  Rio de Janeiro
Carlos      22        Curitiba
Daniela     28        Salvador
Eduardo     40        Brasília


### Redefinir o Índice com reset_index()
- Se você quiser transformar o índice de volta em uma coluna, use `reset_index()`:

In [15]:
# Resetar o índice, tornando-o uma coluna normal novamente
df_resetado = df_indexado.reset_index()
print(df_resetado.head())

      Nome  Idade          Cidade
0      Ana     23       São Paulo
1    Bruno     35  Rio de Janeiro
2   Carlos     22        Curitiba
3  Daniela     28        Salvador
4  Eduardo     40        Brasília


# Exercício: Operações Básicas com DataFrames

Neste exercício, você aplicará os conceitos de leitura, filtragem de dados e manipulação de índices que aprendeu no Módulo 2.

## Instruções

### Parte 1: Abrir um DataFrame
1. ler o arquivo `mod2arq.csv` com as seguintes colunas:
   - **Nome**: Lista com 15 nomes de pessoas.
   - **Idade**: Lista com 15 idades correspondentes.
   - **Cidade**: Lista com 15 cidades diferentes.
   
Observação: passar o caminho correto em que o arquivo está e se atentar de realizar a leitura certa baseada em sua extensão
   
### Parte 2: Filtrar os Dados
1. Selecione todas as linhas onde a coluna **Idade** seja maior que 30.
2. Exiba o DataFrame filtrado.

### Parte 3: Manipulação de Índices
1. Defina a coluna **Nome** e **Idade** como o índice do DataFrame.
2. Resete o índice, transformando-o novamente em uma coluna normal.






In [30]:
#insira o código abaixo