#Funções de Agregação

As funções de agregação no Pandas permitem resumir e analisar dados, agrupando-os
com base em uma ou mais chaves e aplicando funções estatísticas ou outras
operações. Isso é fundamental para obter insights a partir de grandes conjuntos de
dados.
##groupby()
- O método groupby() é um dos mais poderosos do Pandas. Ele permite agrupar dados
com base em uma ou mais colunas e, em seguida, aplicar uma função de agregação a
cada grupo. O processo geralmente envolve três etapas:
1. Splitting (Divisão): Os dados são divididos em grupos com base em algum
critério.
2. Applying (Aplicação): Uma função é aplicada a cada grupo de forma
independente.
3. Combining (Combinação): Os resultados de cada grupo são combinados em
uma única estrutura de dados.


In [None]:
#Criação do DataFrame
import pandas as pd
df = pd.DataFrame({
'Cidade': ['São Paulo', 'Rio de Janeiro', 'São Paulo', 'Belo Horizonte',
'Rio de Janeiro', 'São Paulo'],
'Vendas': [100, 150, 120, 80, 200, 90],
'Produto': ['A', 'B', 'A', 'C', 'B', 'A']
})
print('--- DataFrame Original ---\n', df)

In [None]:
# Agrupar por 'Cidade' e calcular a soma das 'Vendas'
vendas_por_cidade = df.groupby('Cidade')['Vendas'].sum()
print('\n--- Vendas por Cidade (sum) ---\n', vendas_por_cidade)

In [None]:
# Agrupar por 'Cidade' e 'Produto' e calcular a média das 'Vendas'
media_vendas_por_cidade_produto = df.groupby(['Cidade', 'Produto'])
['Vendas'].mean()
print('\n--- Média de Vendas por Cidade e Produto (mean) ---\n',
media_vendas_por_cidade_produto)

Após agrupar os dados com groupby() , você pode aplicar várias funções de
agregação:
- mean() : Calcula a média dos valores em cada grupo.
- sum() : Calcula a soma dos valores em cada grupo.
- count() : Conta o número de valores não nulos em cada grupo.
- agg() : Permite aplicar múltiplas funções de agregação a uma ou mais colunas
simultaneamente. Você pode passar uma lista de strings (nomes das funções) ou
um dicionário (para aplicar funções diferentes a colunas diferentes)

In [None]:
#Criando o Segundo DataFrame
df2 = pd.DataFrame({
'Departamento': ['RH', 'TI', 'RH', 'TI', 'Vendas', 'Vendas', 'RH'],
'Salario': [5000, 8000, 5500, 9000, 6000, 6500, 5200],
'Anos_Experiencia': [2, 5, 3, 6, 4, 3, 2]
})
print('--- DataFrame Original ---\n', df2)

In [None]:
# Média de salário por departamento
media_salario = df2.groupby('Departamento')['Salario'].mean()
print('\n--- Média de Salário por Departamento ---\n', media_salario)

In [None]:
# Soma dos anos de experiência por departamento
soma_experiencia = df2.groupby('Departamento')['Anos_Experiencia'].sum()
print('\n--- Soma de Anos de Experiência por Departamento ---\n',soma_experiencia)

In [None]:
# Contagem de funcionários por departamento
contagem_funcionarios = df2.groupby('Departamento')['Salario'].count()
print('\n--- Contagem de Funcionários por Departamento ---\n',contagem_funcionarios)

In [None]:
# Usando agg() para múltiplas agregações
multi_agg = df2.groupby('Departamento').agg({
'Salario': ['mean', 'min', 'max'],
'Anos_Experiencia': 'sum'})
print('\n--- Múltiplas Agregações com agg() ---\n', multi_agg)