# 💼 Projeto Desafio com Python – Inteligência de Dados

### ✅ Etapa 1: ETL + Criação de Banco de Dados

In [6]:
#Criar as tabelas no PostgreSQL a partir dos CSVs
#Realizar a carga dos dados (Load) OK (As bases de dados já foram extraídas e tratadas, só falatava fazer o load delas)
#Fazer verificações básicas de consistência (NULLs, duplicações, etc.)
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sb

df_funcionarios = pd.read_csv("funcionarios.csv")
df_vendas = pd.read_csv("vendas.csv")
df_funcionarios.isnull()
df_funcionarios.info()
df_funcionarios.isnull().sum().sum()
df_vendas.isnull().sum().sum()

Unnamed: 0,id_funcionario,nome,departamento,cargo,data_admissao
0,1,Funcionario_1,Vendas,Gerente,2022-11-16
1,2,Funcionario_2,Vendas,Analista,2021-11-15
2,3,Funcionario_3,TI,Gerente,2022-12-29
3,4,Funcionario_4,Financeiro,Gerente,2019-06-22
4,5,Funcionario_5,TI,Gerente,2022-08-16
5,6,Funcionario_6,Financeiro,Gerente,2023-07-27
6,7,Funcionario_7,TI,Assistente,2019-11-22
7,8,Funcionario_8,RH,Analista,2022-12-04
8,9,Funcionario_9,Financeiro,Assistente,2022-02-15
9,10,Funcionario_10,RH,Assistente,2021-04-15


0

### ✅ Etapa 2: Análise com Python (Pandas, Matplotlib, Seaborn)

#### **Parte A – Vendas**
- Total e média de vendas por produto
- Variação mensal das vendas
- Ranking de vendedores por valor vendido
- Gráfico de linha das vendas totais por mês

In [33]:
## RESOLUÇÂO PARTE A: ##
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sb

df_vendas = pd.read_csv("vendas.csv")
display(df_vendas)

# Total e média de vendas por produto
total_vendas = df_vendas[["id_venda", "produto", "valor"]].groupby("produto").count()
media_vendas = df_vendas[["produto", "valor"]].groupby("produto").mean("valor")
display(media_vendas)

# Variação mensal das Vendas
df_vendas["data_venda"] = pd.to_datetime(df_vendas["data_venda"], errors='coerce')
df_vendas.set_index('data_venda', inplace=True)
df_vendas['variacao_mensal'] = df_vendas['valor'].pct_change()
display(df_vendas)

#Ranking de vendedores por valor de venda mensal
ranking_vendedores = df_vendas[["vendedor", "valor"]].groupby("vendedor").sum().nlargest(1, "valor")
display(ranking_vendedores)

#Gráfico de linha das vendas totais por mês
df_vendas["data_venda"] = pd.to_datetime(df_vendas["data_venda"], errors='coerce') #Transformando a coluna de data em datetime
df_vendas["AnoMes"] = df_vendas["data_venda"].dt.to_period("M").astype(str) #Fazendo uma coluna auxiliar AnoMes
vendas_totais = df_vendas[["AnoMes", "valor"]].groupby("AnoMes").sum("valor") #Agrupando por mes e somando a coluna Valor
plt.figure(figsize=(10,5))
sns.lineplot(data=vendas_totais, x="AnoMes", y="valor", marker="o", linewidth=2)
plt.title("Relação de vendas totais por mes")
plt.xlabel("Mês")
plt.ylabel("Total de vendas")
plt.xticks(rotation=45)
plt.grid(True)
plt.tight_layout()
plt.show()

Unnamed: 0,id_venda,produto,vendedor,data_venda,valor
0,1,Smartphone,Carlos,2024-04-12,155.63
1,2,Monitor,Diana,2024-12-14,2396.44
2,3,Notebook,Bruno,2024-09-27,375.89
3,4,Mouse,Bruno,2024-04-16,682.21
4,5,Notebook,Eduardo,2024-03-12,675.88
...,...,...,...,...,...
195,196,Smartphone,Bruno,2024-04-22,2731.82
196,197,Teclado,Bruno,2024-11-13,2975.52
197,198,Smartphone,Carlos,2024-02-21,3752.65
198,199,Monitor,Carlos,2024-09-24,2215.13


Unnamed: 0_level_0,valor
produto,Unnamed: 1_level_1
Monitor,2591.79381
Mouse,2277.877
Notebook,2450.279149
Smartphone,2402.315556
Teclado,2825.625111


Unnamed: 0_level_0,id_venda,produto,vendedor,valor,variacao_mensal
data_venda,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
2024-04-12,1,Smartphone,Carlos,155.63,
2024-12-14,2,Monitor,Diana,2396.44,14.398317
2024-09-27,3,Notebook,Bruno,375.89,-0.843147
2024-04-16,4,Mouse,Bruno,682.21,0.814919
2024-03-12,5,Notebook,Eduardo,675.88,-0.009279
...,...,...,...,...,...
2024-04-22,196,Smartphone,Bruno,2731.82,4.194463
2024-11-13,197,Teclado,Bruno,2975.52,0.089208
2024-02-21,198,Smartphone,Carlos,3752.65,0.261175
2024-09-24,199,Monitor,Carlos,2215.13,-0.409716


Unnamed: 0_level_0,valor
vendedor,Unnamed: 1_level_1
Eduardo,124957.13


### ✅ Etapa 2: Análise com Python (Pandas, Matplotlib, Seaborn)

#### **Parte B – RH**
- Média salarial por cargo e departamento
- Reajustes salariais (funcionários com mais de 1 valor no ano)
- Tempo de casa dos funcionários
- Gráfico de barras com folha salarial por mês

In [34]:
## RESOLUÇÃO DA PARTE B: ##
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sb
from datetime import datetime

df_funcionarios = pd.read_csv("funcionarios.csv")
df_salarios = pd.read_csv("salarios.csv")

#Resolução da média salarial por departamento e por cargo
df_merged = pd.merge(df_salarios, df_funcionarios, on="id_funcionario")
media_salario = df_merged.groupby(["departamento", "cargo"])["salario"].mean().reset_index()
display(media_salario)

#Resolução para Reajustes Salariais
df_merged = pd.merge(df_salarios, df_funcionarios, on="id_funcionario")
reajustes = df_salarios.groupby("id_funcionario")["salario"].nunique().reset_index()
reajustes = reajustes[reajustes["salario"] > 1]
reajustes = pd.merge(reajustes, df_funcionarios, on="id_funcionario")[["id_funcionario", "nome", "cargo"]]
display(reajustes)

#Resolução para Tempo de casa dos funcionários


In [9]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sb
from datetime import datetime
df_funcionarios = pd.read_csv("funcionarios.csv")
df_salarios = pd.read_csv("salarios.csv")

today = pd.to_datetime(datetime.today().date()) #Captura a data atual
df_funcionarios["Tempo_de_empresa_anos"] = (today - df_funcionarios["data_admissao"]).dt.days / 365.25
df_funcionarios["tempo_de_casa_anos"] = df_funcionarios["tempo_de_casa_anos"].round(1) # Exibir tempo de empresa arredondada
display(df_funcionarios[["nome", "data_admissao", "tempo_de_casa_anos"]])


TypeError: unsupported operand type(s) for -: 'Timestamp' and 'str'