### Introdução aos DataFrames no Pandas

Começaremos importando o Pandas e criando um DataFrame simples para nossos exemplos.

In [1]:
import pandas as pd
import numpy as np

# Criando um DataFrame de exemplo
data = {
    'Nome': ['Ana', 'Bruno', 'Carlos', 'Diana', 'Eduardo'],
    'Idade': [23, 34, 45, 22, 33],
    'Cidade': ['São Paulo', 'Rio de Janeiro', 'Belo Horizonte', 'Porto Alegre', 'Salvador']
}
df = pd.DataFrame(data)


### Selecionando Colunas

Você pode selecionar uma única coluna ou múltiplas colunas de um DataFrame.

In [2]:
# Selecionando uma única coluna
print(df['Nome'])

# Selecionando múltiplas colunas
print(df[['Nome', 'Idade']])


0        Ana
1      Bruno
2     Carlos
3      Diana
4    Eduardo
Name: Nome, dtype: object
      Nome  Idade
0      Ana     23
1    Bruno     34
2   Carlos     45
3    Diana     22
4  Eduardo     33



### Selecionando Linhas por Índices

Linhas podem ser selecionadas usando índices numéricos ou índices baseados em rótulos.

In [3]:
# Selecionando a primeira linha
print(df.iloc[0])

# Selecionando as primeiras três linhas
print(df.iloc[:3])


Nome            Ana
Idade            23
Cidade    São Paulo
Name: 0, dtype: object
     Nome  Idade          Cidade
0     Ana     23       São Paulo
1   Bruno     34  Rio de Janeiro
2  Carlos     45  Belo Horizonte


# Selecionando Dados com `loc` e `iloc`

-   `loc` é usado para selecionar por rótulo.
-   `iloc` é usado para selecionar por posição numérica.


In [5]:
# Selecionando uma linha pelo rótulo do índice
print(df.loc[0])

# Selecionando uma célula específica com loc
print(df.loc[0, 'Nome'])

# Selecionando uma subseção do DataFrame com iloc
print(df.iloc[2:4, 0:2])


Nome            Ana
Idade            23
Cidade    São Paulo
Name: 0, dtype: object
Ana
     Nome  Idade
2  Carlos     45
3   Diana     22


### Seleção Condicional

Você pode selecionar dados com base em condições booleanas.

In [7]:
df[df["Idade"]>30]


Unnamed: 0,Nome,Idade,Cidade
1,Bruno,34,Rio de Janeiro
2,Carlos,45,Belo Horizonte
4,Eduardo,33,Salvador


### Modificando DataFrames com Seleção

Após selecionar dados, você pode modificá-los. Por exemplo, podemos aumentar a idade de todos em 1.

In [8]:
df['Idade'] = df['Idade'] + 1
print(df)

      Nome  Idade          Cidade
0      Ana     24       São Paulo
1    Bruno     35  Rio de Janeiro
2   Carlos     46  Belo Horizonte
3    Diana     23    Porto Alegre
4  Eduardo     34        Salvador


### Selecionando com Métodos `query`

O método `query` permite uma seleção mais dinâmica e legível em algumas situações.

In [9]:
# Selecionando usando query
print(df.query('Idade > 30'))

      Nome  Idade          Cidade
1    Bruno     35  Rio de Janeiro
2   Carlos     46  Belo Horizonte
4  Eduardo     34        Salvador
