# Aula 3 – Seleção, filtragem e manipulação de dados

**🎯 Objetivo da Aula**

Aprender a selecionar, filtrar e modificar dados em um DataFrame, dominando as ferramentas que permitem trabalhar com subconjuntos de dados — base de qualquer análise.

**1. Teoria simples**

No pandas, é essencial saber como acessar partes específicas de um DataFrame.
Existem três principais formas:

| Método    | Quando usar                                   | Exemplo                 |
| --------- | --------------------------------------------- | ----------------------- |
| `[]`      | seleção simples de colunas                    | `df["coluna"]`          |
| `.loc[]`  | seleção por **rótulo** (nome de linha/coluna) | `df.loc["A1", "Preço"]` |
| `.iloc[]` | seleção por **posição numérica**              | `df.iloc[0, 1]`         |


Esses métodos são usados para:

* selecionar colunas ou linhas específicas,

* aplicar filtros condicionais,

* reordenar ou excluir dados,

* criar novas colunas derivadas.

**2. Demonstração prática**

In [1]:
import pandas as pd

df = pd.DataFrame({
    "Produto": ["Notebook", "Mouse", "Teclado", "Monitor", "Headset"],
    "Preço": [2500, 45.90, 120, 899.99, 199.50],
    "Quantidade": [20, 13, 35, 50, 45],
    "Categoria": ["Eletrônicos", "Acessórios", "Acessórios", "Eletrônicos", "Acessórios"]
})


**🔹 Selecionando colunas**

In [2]:
df["Produto"]
df[["Produto", "Preço"]]

Unnamed: 0,Produto,Preço
0,Notebook,2500.0
1,Mouse,45.9
2,Teclado,120.0
3,Monitor,899.99
4,Headset,199.5


**🔹 Selecionando linhas**

In [3]:
df.loc[0]           # Linha com índice 0
df.iloc[1]          # Linha posição 1

Produto            Mouse
Preço               45.9
Quantidade            13
Categoria     Acessórios
Name: 1, dtype: object

**🔹 Seleção de intervalo**

In [4]:
df.loc[1:3, ["Produto", "Preço"]]  # Linhas 1 a 3, colunas específicas

Unnamed: 0,Produto,Preço
1,Mouse,45.9
2,Teclado,120.0
3,Monitor,899.99


**🔹 Filtragem condicional**

In [5]:
# Produtos com preço acima de 500
filtro_preco = df["Preço"] > 500
print(df[filtro_preco])

# Acessórios com mais de 20 unidades
filtro_cat = (df["Categoria"] == "Acessórios") & (df["Quantidade"] > 20)
print(df[filtro_cat])

    Produto    Preço  Quantidade    Categoria
0  Notebook  2500.00          20  Eletrônicos
3   Monitor   899.99          50  Eletrônicos
   Produto  Preço  Quantidade   Categoria
2  Teclado  120.0          35  Acessórios
4  Headset  199.5          45  Acessórios


**🔹 Ordenação e exclusão**

In [6]:
# Ordenar por preço decrescente
df.sort_values(by="Preço", ascending=False)

# Remover coluna
df_sem_preco = df.drop(columns="Preço")

# Remover linha
df_sem_linha0 = df.drop(index=0)

**3. Exemplo do mundo real: análise de produtos**

Imagine que você quer identificar:

1. Os produtos mais caros,

2. Quais acessórios têm estoque alto,

3. E criar uma nova coluna com o valor total de estoque.

In [7]:
df["Valor_Total"] = df["Preço"] * df["Quantidade"]
top_preco = df.sort_values(by="Preço", ascending=False)
estoque_alto = df[df["Quantidade"] > 30]

print("Produtos mais caros:\n", top_preco[["Produto", "Preço"]])
print("\nProdutos com estoque alto:\n", estoque_alto[["Produto", "Quantidade"]])

Produtos mais caros:
     Produto    Preço
0  Notebook  2500.00
3   Monitor   899.99
4   Headset   199.50
2   Teclado   120.00
1     Mouse    45.90

Produtos com estoque alto:
    Produto  Quantidade
2  Teclado          35
3  Monitor          50
4  Headset          45


# Exercícios

**Fácil**

Usando o DataFrame `df` acima:

Mostre apenas a coluna `Produto`.

Mostre as 3 primeiras linhas com `.loc[]`.

Selecione apenas as colunas `Produto` e `Preço`.

In [18]:
print(df)
print("\nProdutos:\n", df["Produto"])
print("\nTrês Primeira linhas:\n", df.loc[0:2])
print("\nProduto e Preço:\n", df[["Produto", "Preço"]])

    Produto    Preço  Quantidade    Categoria  Valor_Total
0  Notebook  2500.00          20  Eletrônicos      50000.0
1     Mouse    45.90          13   Acessórios        596.7
2   Teclado   120.00          35   Acessórios       4200.0
3   Monitor   899.99          50  Eletrônicos      44999.5
4   Headset   199.50          45   Acessórios       8977.5

Produtos:
 0    Notebook
1       Mouse
2     Teclado
3     Monitor
4     Headset
Name: Produto, dtype: object

Três Primeira linhas:
     Produto   Preço  Quantidade    Categoria  Valor_Total
0  Notebook  2500.0          20  Eletrônicos      50000.0
1     Mouse    45.9          13   Acessórios        596.7
2   Teclado   120.0          35   Acessórios       4200.0

Produto e Preço:
     Produto    Preço
0  Notebook  2500.00
1     Mouse    45.90
2   Teclado   120.00
3   Monitor   899.99
4   Headset   199.50


**Intermediário**

1. Crie um filtro para mostrar apenas produtos com preço acima de R$500.

2. Crie outro filtro para mostrar apenas produtos da categoria “Acessórios”.

3. Combine os dois filtros para ver acessórios caros.

In [None]:
filtro_acima_500 = df["Preço"] > 500
print(df[filtro_acima_500])

filtro_acessorios = df["Categoria"] == "Acessórios"
print(df[filtro_acessorios])

filtro_combinado = filtro_acessorios & filtro_acima_500
print(df[filtro_combinado])

    Produto    Preço  Quantidade    Categoria  Valor_Total
0  Notebook  2500.00          20  Eletrônicos      50000.0
3   Monitor   899.99          50  Eletrônicos      44999.5
   Produto  Preço  Quantidade   Categoria  Valor_Total
1    Mouse   45.9          13  Acessórios        596.7
2  Teclado  120.0          35  Acessórios       4200.0
4  Headset  199.5          45  Acessórios       8977.5
Empty DataFrame
Columns: [Produto, Preço, Quantidade, Categoria, Valor_Total]
Index: []


**Desafio (análise real)**

Monte um DataFrame chamado estoque_loja com colunas:
Produto, Categoria, Preço, Estoque, Data_Entrada.

1. Mostre apenas produtos da categoria “Eletrônicos” com estoque acima de 30.

2. Ordene por preço em ordem decrescente.

3. Crie uma nova coluna Valor_Estoque = Preço * Estoque.

4. Mostre o produto com maior valor total em estoque.

💡 Dica: Use .sort_values() e .iloc[0] para pegar o primeiro após ordenar.

In [43]:
estoque_loja = pd.DataFrame({
    "Produto" : ["Notebook Dell", "Mouse Gamer", "Teclado Mecânico", "Monitor 24", "Headphone Bluetooth", "Tablet Samsung", "Cadeira Gamer", "SSD 1TB", "Webcam 1080p", "Impressora Laser"],
    "Categoria" : ["Eletrônicos", "Periféricos", "Periféricos", "Eletrônicos", "Áudio", "Eletrônicos", "Móveis", "Hardware", "Periféricos", "Eletrônicos"],
    "Preço" : [3200.00, 89.90, 249.00, 899.00, 199.50, 1150.00, 1299.00, 389.90, 159.00, 689.00],
    "Estoque" : [15, 42, 28, 36, 35, 32, 5, 50, 25, 10],
    "Data_Entrada" : ["15/01/2025", "22/01/2025", "05/02/2025", "18/02/2025", "01/03/2025", "10/03/2025", "25/02/2025", "12/01/2025", "08/03/2025", "20/02/2025"]
})

print(estoque_loja)
filtro_eletronicos_estoque_30 = (estoque_loja["Categoria"] == "Eletrônicos") & (estoque_loja["Estoque"] > 30)
print("\nEletrônicos:\n", estoque_loja[filtro_eletronicos_estoque_30])

preco_descrecente = estoque_loja.sort_values(by="Preço", ascending=False)
print(f"\n{preco_descrecente}")

estoque_loja["Valor_Estoque"] = estoque_loja["Preço"] * estoque_loja["Estoque"]
print(f"\n{estoque_loja}")

produto_maior_valor = estoque_loja.sort_values(by="Valor_Estoque", ascending=False).iloc[0]
print(f"\nProduto com maior valor de estoque:\n{produto_maior_valor}" )


               Produto    Categoria   Preço  Estoque Data_Entrada
0        Notebook Dell  Eletrônicos  3200.0       15   15/01/2025
1          Mouse Gamer  Periféricos    89.9       42   22/01/2025
2     Teclado Mecânico  Periféricos   249.0       28   05/02/2025
3           Monitor 24  Eletrônicos   899.0       36   18/02/2025
4  Headphone Bluetooth        Áudio   199.5       35   01/03/2025
5       Tablet Samsung  Eletrônicos  1150.0       32   10/03/2025
6        Cadeira Gamer       Móveis  1299.0        5   25/02/2025
7              SSD 1TB     Hardware   389.9       50   12/01/2025
8         Webcam 1080p  Periféricos   159.0       25   08/03/2025
9     Impressora Laser  Eletrônicos   689.0       10   20/02/2025

Eletrônicos:
           Produto    Categoria   Preço  Estoque Data_Entrada
3      Monitor 24  Eletrônicos   899.0       36   18/02/2025
5  Tablet Samsung  Eletrônicos  1150.0       32   10/03/2025

               Produto    Categoria   Preço  Estoque Data_Entrada
0        