In [None]:
# ==============================
# üìä Projeto Final - M√≥dulo 10
# Visualiza√ß√£o e an√°lise de dados
# ==============================

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# ==============================
# CONFIGURA√á√ïES INICIAIS
# ==============================
sns.set_theme(style="whitegrid")
pd.set_option('display.max_columns', None)

# ==============================
# 1Ô∏è‚É£ LEITURA DOS DADOS
# ==============================
df = pd.read_csv("ecommerce_preparados.csv")

# ==============================
# 2Ô∏è‚É£ INFORMA√á√ïES GERAIS
# ==============================
print("=== INFORMA√á√ïES GERAIS DO DATASET ===")
print(df.info(), "\n")

# ==============================
# 3Ô∏è‚É£ ESTAT√çSTICAS DESCRITIVAS
# ==============================
print("=== ESTAT√çSTICAS DESCRITIVAS ===")
print(df.describe(), "\n")

# ==============================
# 4Ô∏è‚É£ GR√ÅFICOS
# ==============================

# üîπ Histograma ‚Äì distribui√ß√£o dos pre√ßos
plt.figure(figsize=(8, 5))
sns.histplot(df["Pre√ßo"].dropna(), bins=30, kde=True, color="skyblue")
plt.title("Distribui√ß√£o de Pre√ßos")
plt.xlabel("Pre√ßo (R$)")
plt.ylabel("Frequ√™ncia")
plt.tight_layout()
plt.show()

# üîπ Gr√°fico de Dispers√£o ‚Äì rela√ß√£o entre Pre√ßo e Nota
plt.figure(figsize=(8, 5))
sns.scatterplot(data=df, x="Pre√ßo", y="Nota", alpha=0.6, color="teal")
plt.title("Rela√ß√£o entre Pre√ßo e Nota")
plt.xlabel("Pre√ßo (R$)")
plt.ylabel("Nota M√©dia")
plt.tight_layout()
plt.show()

# üîπ Mapa de Calor ‚Äì correla√ß√£o entre vari√°veis num√©ricas
plt.figure(figsize=(10, 7))
sns.heatmap(df.corr(numeric_only=True), annot=True, cmap="coolwarm", fmt=".2f")
plt.title("Mapa de Calor das Correla√ß√µes")
plt.tight_layout()
plt.show()

# üîπ Gr√°fico de Barras ‚Äì top 10 marcas mais frequentes
top_marcas = df["Marca"].value_counts().head(10)
plt.figure(figsize=(10, 6))
sns.barplot(x=top_marcas.index, y=top_marcas.values, hue=top_marcas.index, palette="viridis", legend=False)
plt.title("Top 10 Marcas Mais Frequentes")
plt.xlabel("Marca")
plt.ylabel("Frequ√™ncia")
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

# üîπ Gr√°fico de Pizza ‚Äì propor√ß√£o de produtos por temporada
plt.figure(figsize=(7, 7))
df["Temporada"].value_counts().plot(
    kind="pie",
    autopct="%1.1f%%",
    startangle=90,
    colors=sns.color_palette("pastel")
)
plt.title("Distribui√ß√£o de Produtos por Temporada")
plt.ylabel("")
plt.tight_layout()
plt.show()

# üîπ Gr√°fico de Densidade ‚Äì distribui√ß√£o da nota dos produtos
plt.figure(figsize=(8, 5))
sns.kdeplot(df["Nota"].dropna(), fill=True, color="green")
plt.title("Densidade das Notas dos Produtos")
plt.xlabel("Nota")
plt.ylabel("Densidade")
plt.tight_layout()
plt.show()

# üîπ Gr√°fico de Regress√£o ‚Äì rela√ß√£o entre Desconto e Pre√ßo
plt.figure(figsize=(8, 5))
sns.regplot(
    data=df,
    x="Desconto",
    y="Pre√ßo",
    scatter_kws={"alpha": 0.5},
    line_kws={"color": "red"}
)
plt.title("Rela√ß√£o entre Desconto e Pre√ßo dos Produtos")
plt.xlabel("Desconto (%)")
plt.ylabel("Pre√ßo (R$)")
plt.tight_layout()
plt.show()

# ==============================
# 5Ô∏è‚É£ AN√ÅLISE AUTOM√ÅTICA
# ==============================
print("\n=== AN√ÅLISE AUTOM√ÅTICA ===")

# Correla√ß√£o geral
corr = df.corr(numeric_only=True)

# Insight 1 ‚Äì Pre√ßo x Nota
if "Pre√ßo" in corr.columns and "Nota" in corr.columns:
    preco_nota = corr.loc["Pre√ßo", "Nota"]
    if preco_nota < -0.3:
        print(f"‚Üí Produtos com pre√ßos mais altos tendem a ter notas mais baixas (correla√ß√£o {preco_nota:.2f}).")
    elif preco_nota > 0.3:
        print(f"‚Üí Produtos mais caros tendem a receber notas mais altas (correla√ß√£o {preco_nota:.2f}).")
    else:
        print(f"‚Üí O pre√ßo e a nota n√£o t√™m rela√ß√£o significativa (correla√ß√£o {preco_nota:.2f}).")

# Insight 2 ‚Äì Desconto x Pre√ßo
if "Desconto" in corr.columns and "Pre√ßo" in corr.columns:
    preco_desc = corr.loc["Desconto", "Pre√ßo"]
    if preco_desc < -0.3:
        print(f"‚Üí Produtos com maiores descontos t√™m pre√ßos mais baixos (correla√ß√£o {preco_desc:.2f}).")
    elif preco_desc > 0.3:
        print(f"‚Üí Produtos com maiores descontos s√£o, em geral, os mais caros (correla√ß√£o {preco_desc:.2f}).")
    else:
        print(f"‚Üí Descontos e pre√ßos n√£o t√™m correla√ß√£o forte (correla√ß√£o {preco_desc:.2f}).")

# Insight 3 ‚Äì Nota m√©dia
nota_media = df["Nota"].mean()
print(f"‚Üí A nota m√©dia geral dos produtos √© {nota_media:.2f}.")

# Insight 4 ‚Äì Marcas mais populares
marca_top = df["Marca"].mode()[0]
print(f"‚Üí A marca mais frequente no conjunto de dados √© '{marca_top}'.")

# Insight 5 ‚Äì Temporada dominante
temporada_top = df["Temporada"].mode()[0]
print(f"‚Üí A temporada com mais produtos √© '{temporada_top}'.")

print("\n‚úÖ An√°lise conclu√≠da com sucesso! Todos os gr√°ficos e insights foram gerados.")
