- Necessidade : agrupar os dados de uma tabela por região e calcular a média de vendas em cada uma. 
- Usando Python puro, você teria que percorrer cada linha, verificar a região e calcular a média manualmente. Com um DataFrame, você pode fazer isso em poucas linhas de código, de forma muito mais simples e legível.

In [4]:
import pandas as pd
import numpy as np

In [5]:
# Dados fictícios
dados = [
    {"regiao": "Norte", "vendas": 100},
    {"regiao": "Sul", "vendas": 200},
    {"regiao": "Norte", "vendas": 150},
    {"regiao": "Sul", "vendas": 250},
]


In [7]:
# Dicionário para armazenar as médias
medias = {}

In [8]:
for linha in dados:
    regiao = linha["regiao"]
    vendas = linha["vendas"]
    
    if regiao not in medias:
        medias[regiao] = {"total": 0, "qtd": 0}
    
    medias[regiao]["total"] += vendas
    medias[regiao]["qtd"] += 1

for regiao, valores in medias.items():
    media = valores["total"] / valores["qtd"]
    print(f"Média de vendas na região {regiao}: {media}")

Média de vendas na região Norte: 125.0
Média de vendas na região Sul: 225.0


In [9]:
# Dados fictícios
dados = {
    "regiao": ["Norte", "Sul", "Norte", "Sul"],
    "vendas": [100, 200, 150, 250]
}

In [10]:
df = pd.DataFrame(dados)

In [None]:
# Cálculo das médias
medias = df.groupby("regiao")["vendas"].mean()
print(medias)

regiao
Norte    125.0
Sul      225.0
Name: vendas, dtype: float64


: 

# O que é um DataFrame?
Um DataFrame é como uma "super tabela" que ajuda a organizar e manipular dados de forma eficiente em Python. Ele é uma das estruturas de dados fundamentais na análise e engenharia de dados, tornando as tarefas mais intuitivas e produtivas.