<a href="https://colab.research.google.com/github/danielasberna/projetos/blob/main/analise_ecommerce.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# Leitura dos dados
df = pd.read_csv('ecommerce_preparados.csv')
print(df.head().to_string())

# Tratamento de dados
print(df.dtypes)
df['Qtd_Vendidos'] = pd.to_numeric(df['Qtd_Vendidos'], errors='coerce')
df['Qtd_Vendidos'] = df['Qtd_Vendidos'].fillna(0)
df['Marca'] = df['Marca'].astype('category').cat.codes
df['N_Avaliações'] = pd.to_numeric(df['N_Avaliações'], errors='coerce')
df['N_Avaliações'] = df['N_Avaliações'].fillna(0)
print(df.dtypes)

# Gráfico de Pairplot - Dispersão e Histograma
sns.pairplot(df[['Qtd_Vendidos', 'Marca', 'N_Avaliações']])
plt.show()

# Gráfico de Dispersão entre Marca e Quantidade de Vendas
plt.scatter(df['Marca'], df['Qtd_Vendidos'])
plt.title('Dispersão - Marca e Quantidade de Vendas')
plt.xlabel('Marca')
plt.ylabel('Quantidade de Vendas')
plt.show()

# Mapa de Calor entre Marca e Quantidade de Vendas
corr = df[['Marca', 'Qtd_Vendidos']].corr()
plt.figure(figsize=(6, 4))
sns.heatmap(corr, annot=True, cmap='coolwarm')
plt.title('Correlação Marca e Quantidade de Vendas')
plt.tight_layout()
plt.show()

# Gráfico de Barras com correlação de 'Marca' e 'Total de Avaliações'
plt.figure(figsize=(10, 6))
top_marcas = df['Marca'].value_counts().head(5).sort_values(ascending=True)
df['N_Avaliações'].value_counts().head(5).plot(kind='barh', color='#fb1063')
plt.title('Marca e Total de Avaliações')
plt.xlabel('Total de Avaliações', fontsize=10, labelpad=10)
plt.ylabel('Marcas', fontsize=10, labelpad=10)
plt.xticks(rotation=0)
plt.show()

# Gráfico de Pizza com melhores avaliações
x = df['N_Avaliações'].value_counts().head(5).index
y = df['N_Avaliações'].value_counts().head(5).values
plt.figure(figsize=(10, 6))
plt.pie(y, labels=x, autopct='%.1f%%', startangle=90)
plt.title('Marcas com Melhores Avaliações')
plt.show()

# Gráfico de Densidade corrigido - Qtd de Vendidos
df['Qtd_Vendidos'] = pd.to_numeric(df['Qtd_Vendidos'], errors='coerce')
df = df[df['Qtd_Vendidos'].notnull()]  # remove valores inválidos
plt.figure(figsize=(10, 6))
sns.kdeplot(df['Qtd_Vendidos'], fill=True, color='#ff8ed2')
plt.title('Densidade de Quantidade de Vendas')
plt.xlabel('Quantidade de Vendas')
plt.show()

# Gráfico de Regressão
sns.regplot(x='N_Avaliações', y='Marca', data=df, color='#ff9de7',
            scatter_kws={'alpha': 0.5, 'color':  '#ff1dc8'})
plt.title('Regressão de Marca por Avaliações')
plt.xlabel('Avaliações')
plt.ylabel('Marca')
plt.show()
