# [M1S05] Ex. 03 - Operações com Dataframes
Realize operações para cruzar e resumir os dados.




In [None]:
import pandas as pd
import numpy as np

In [None]:
clientes_df = pd.read_csv('../../data/clientes.csv')
pedidos_df = pd.read_csv('../../data/pedidos.csv')
produtos_df = pd.read_csv('../../data/produtos.csv')

In [None]:
pedidos_clientes = pedidos_df.groupby('id_cliente')['valor_total'].sum()
pedidos_clientes

Unnamed: 0_level_0,valor_total
id_cliente,Unnamed: 1_level_1
1,320.5
2,780.0
3,150.0
4,540.9
5,220.0
6,980.0
7,430.0
8,1200.0
9,310.0
10,150.0


## Agrupando pedidos por cliente

Agrupamos os pedidos por cliente para calcular o valor total gasto por cada um. Isso permite identificar os clientes mais valiosos para o negócio.

In [None]:
clientes_pedidos_merge = pd.merge(clientes_df, pedidos_df, on='id_cliente')
clientes_pedidos_merge

Unnamed: 0,id_cliente,nome,idade,cidade,id_pedido,data_pedido,valor_total
0,1,Ana Souza,28,Fortaleza,101,2025-09-01,320.5
1,2,Carlos Lima,35,Recife,102,2025-09-03,780.0
2,3,Mariana Alves,42,Salvador,103,2025-09-05,150.0
3,4,João Pereira,31,Belo Horizonte,104,2025-09-07,540.9
4,5,Luciana Costa,25,São Paulo,105,2025-09-10,220.0
5,6,Rafael Mendes,38,Rio de Janeiro,106,2025-09-12,980.0
6,7,Beatriz Rocha,29,Curitiba,107,2025-09-15,430.0
7,8,Felipe Martins,45,Porto Alegre,108,2025-09-18,1200.0
8,9,Juliana Silva,33,Campinas,109,2025-09-20,310.0
9,10,Daniel Oliveira,27,Natal,110,2025-09-22,150.0


## Mesclando clientes e pedidos

Realizamos o merge entre os DataFrames de clientes e pedidos, unificando as informações em uma única tabela. Assim, podemos analisar os pedidos juntamente com os dados dos clientes.

In [None]:
produtos_df.pivot_table(values='preco', index='categoria', aggfunc='mean')

Unnamed: 0_level_0,preco
categoria,Unnamed: 1_level_1
Eletrônicos,1725.54
Livros,89.9
Móveis,464.45
Papelaria,59.9
Utilidades,39.9


## Análise de preços por categoria de produto

Utilizamos uma tabela dinâmica para calcular o preço médio dos produtos por categoria. Essa análise ajuda a entender o posicionamento de preços em cada segmento.

In [None]:
novo_registro = {
    'id_cliente': 10,
    'nome': 'Daniel Oliveira',
    'idade': 27,
    'cidade': 'Natal',
    'id_pedido': 110,
    'data_pedido': '2025-09-22',
    'valor_total': 150.0
}

clientes_pedidos_merge.loc[10] = novo_registro
clientes_pedidos_merge

Unnamed: 0,id_cliente,nome,idade,cidade,id_pedido,data_pedido,valor_total
0,1,Ana Souza,28,Fortaleza,101,2025-09-01,320.5
1,2,Carlos Lima,35,Recife,102,2025-09-03,780.0
2,3,Mariana Alves,42,Salvador,103,2025-09-05,150.0
3,4,João Pereira,31,Belo Horizonte,104,2025-09-07,540.9
4,5,Luciana Costa,25,São Paulo,105,2025-09-10,220.0
5,6,Rafael Mendes,38,Rio de Janeiro,106,2025-09-12,980.0
6,7,Beatriz Rocha,29,Curitiba,107,2025-09-15,430.0
7,8,Felipe Martins,45,Porto Alegre,108,2025-09-18,1200.0
8,9,Juliana Silva,33,Campinas,109,2025-09-20,310.0
9,10,Daniel Oliveira,27,Natal,110,2025-09-22,150.0


## Adicionando um novo registro

Adicionamos um novo registro ao DataFrame para simular a inclusão de um novo cliente e pedido. Isso demonstra como manipular e expandir os dados.

In [None]:
clientes_pedidos_merge.duplicated()

Unnamed: 0,0
0,False
1,False
2,False
3,False
4,False
5,False
6,False
7,False
8,False
9,False


In [None]:
clientes_pedidos_merge_limpo = clientes_pedidos_merge.drop_duplicates()
clientes_pedidos_merge_limpo

Unnamed: 0,id_cliente,nome,idade,cidade,id_pedido,data_pedido,valor_total
0,1,Ana Souza,28,Fortaleza,101,2025-09-01,320.5
1,2,Carlos Lima,35,Recife,102,2025-09-03,780.0
2,3,Mariana Alves,42,Salvador,103,2025-09-05,150.0
3,4,João Pereira,31,Belo Horizonte,104,2025-09-07,540.9
4,5,Luciana Costa,25,São Paulo,105,2025-09-10,220.0
5,6,Rafael Mendes,38,Rio de Janeiro,106,2025-09-12,980.0
6,7,Beatriz Rocha,29,Curitiba,107,2025-09-15,430.0
7,8,Felipe Martins,45,Porto Alegre,108,2025-09-18,1200.0
8,9,Juliana Silva,33,Campinas,109,2025-09-20,310.0
9,10,Daniel Oliveira,27,Natal,110,2025-09-22,150.0
