In [None]:
# Importação de Bibliotecas
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Configurações de Estilo
sns.set(style='whitegrid')
plt.style.use('fivethirtyeight')

# Carregar dados limpos
df = pd.read_csv('../data/cleaned_Amazon_Sale_Report.csv')

# Análise Descritiva
print("Descriptive Statistics:")
print(df.describe())

# Distribuição de Vendas por Estado
plt.figure(figsize=(14, 7))
sns.countplot(y='ship-state', data=df, order=df['ship-state'].value_counts().index)
plt.title('Distribuição de Vendas por Estado')
plt.xlabel('Contagem')
plt.ylabel('Estado')
plt.show()

# Vendas ao Longo do Tempo
df['Date'] = pd.to_datetime(df['Date'])
df.set_index('Date', inplace=True)
monthly_sales = df.resample('M').sum()['TotalPrice']
plt.figure(figsize=(14, 7))
monthly_sales.plot()
plt.title('Vendas Mensais')
plt.xlabel('Mês')
plt.ylabel('Total de Vendas')
plt.show()

# Produtos Mais Vendidos
top_products = df.groupby('SKU')['Qty'].sum().sort_values(ascending=False).head(10)
plt.figure(figsize=(14, 7))
sns.barplot(x=top_products.values, y=top_products.index)
plt.title('Top 10 Produtos Mais Vendidos')
plt.xlabel('Quantidade Vendida')
plt.ylabel('Produto')
plt.show()

# Análise de Correlação
correlation_matrix = df.corr()
plt.figure(figsize=(12, 8))
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm')
plt.title('Matriz de Correlação')
plt.show()

# Receita Total por Estado
state_revenue = df.groupby('ship-state')['TotalPrice'].sum().sort_values(ascending=False)
plt.figure(figsize=(14, 7))
sns.barplot(x=state_revenue.values, y=state_revenue.index)
plt.title('Receita Total por Estado')
plt.xlabel('Receita Total')
plt.ylabel('Estado')
plt.show()

# Receita Média por Produto
average_revenue_per_product = df.groupby('SKU')['TotalPrice'].mean().sort_values(ascending=False).head(10)
plt.figure(figsize=(14, 7))
sns.barplot(x=average_revenue_per_product.values, y=average_revenue_per_product.index)
plt.title('Receita Média por Produto')
plt.xlabel('Receita Média')
plt.ylabel('Produto')
plt.show()

# Vendas por Hora do Dia
df['Hour'] = df.index.hour
hourly_sales = df.groupby('Hour')['TotalPrice'].sum()
plt.figure(figsize=(14, 7))
hourly_sales.plot(kind='bar')
plt.title('Vendas por Hora do Dia')
plt.xlabel('Hora')
plt.ylabel('Total de Vendas')
plt.show()

# Vendas por Dia da Semana
df['Day of Week'] = df.index.dayofweek
weekly_sales = df.groupby('Day of Week')['TotalPrice'].sum()
plt.figure(figsize=(14, 7))
weekly_sales.plot(kind='bar')
plt.title('Vendas por Dia da Semana')
plt.xlabel('Dia da Semana')
plt.ylabel('Total de Vendas')
plt.xticks(ticks=range(7), labels=['Segunda', 'Terça', 'Quarta', 'Quinta', 'Sexta', 'Sábado', 'Domingo'])
plt.show()


: 