# üìä Visualiza√ß√µes e An√°lises Explorat√≥rias ‚Äî Camada Gold (Views)

Este notebook tem como objetivo construir **vis√µes anal√≠ticas tempor√°rias** com base na **camada Silver**, permitindo an√°lises explorat√≥rias sobre a evolu√ß√£o e o comportamento dos pre√ßos de criptoativos.

As visualiza√ß√µes aqui propostas foram pensadas para:
- Ajudar stakeholders a entender tend√™ncias de mercado
- Facilitar o monitoramento da volatilidade intradi√°ria
- Comparar o desempenho dos diferentes ativos

‚ö†Ô∏è **Importante**: As views s√£o geradas diretamente no notebook via bibliotecas de visualiza√ß√£o, de forma que possam ser exportadas e visualizadas em reposit√≥rios como o GitHub.

## üîß Tecnologias
- PySpark (leitura da camada Silver)
- Pandas (manipula√ß√£o leve dos dados)
- Matplotlib / Seaborn / Plotly (gr√°ficos)

---

In [0]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

In [0]:
catalogo = "lakehouse"
schema = "silver"
table = "cripto"
full_table_name = f"{catalogo}.{schema}.{table}"

# üìä 1. Evolu√ß√£o do Pre√ßo por Ativo ao Longo do Tempo

In [0]:
# Leitura dos dados da camada Silver
df_silver = spark.read.table(f"{full_table_name}")
df_price = df_silver.select("timestamp", "asset_name", "price_usd").toPandas()

# Convers√£o e ordena√ß√£o
df_price["timestamp"] = pd.to_datetime(df_price["timestamp"])
df_price = df_price.sort_values(by="timestamp")

# Plot
plt.figure(figsize=(14, 6))
sns.lineplot(data=df_price, x="timestamp", y="price_usd", hue="asset_name")
plt.title("üìà Evolu√ß√£o do Pre√ßo USD ao Longo do Tempo")
plt.xlabel("Data")
plt.ylabel("Pre√ßo em USD")
plt.legend(title="Criptoativo")
plt.grid(True)
plt.tight_layout()
plt.show()


#  üìâ 2. Varia√ß√£o Di√°ria (%) por Ativo

In [0]:
# C√°lculo da varia√ß√£o percentual di√°ria
df_var = df_price.copy()
df_var["pct_change"] = df_var.groupby("asset_name")["price_usd"].pct_change() * 100

# Plot
plt.figure(figsize=(14, 6))
sns.lineplot(data=df_var.dropna(), x="timestamp", y="pct_change", hue="asset_name")
plt.title("üìä Varia√ß√£o Percentual Di√°ria do Pre√ßo")
plt.xlabel("Data")
plt.ylabel("Varia√ß√£o (%)")
plt.axhline(0, linestyle="--", color="gray")
plt.grid(True)
plt.tight_layout()
plt.show()

# ‚è∞ 3. Distribui√ß√£o de Pre√ßo por Hora (Intradi√°rio)

In [0]:
# Extrair hora
df_hourly = df_price.copy()
df_hourly["hour"] = df_hourly["timestamp"].dt.hour

# Plot
plt.figure(figsize=(14, 6))
sns.boxplot(data=df_hourly, x="hour", y="price_usd", hue="asset_name")
plt.title("üïì Distribui√ß√£o de Pre√ßos por Hora (Intradi√°rio)")
plt.xlabel("Hora do Dia")
plt.ylabel("Pre√ßo em USD")
plt.grid(True)
plt.tight_layout()
plt.show()

# 4. üìå Ranking de Valoriza√ß√£o no Per√≠odo

In [0]:
# Agrupamento por ativo - pre√ßo inicial e final
df_rank = df_price.groupby("asset_name").agg(
    inicio=("price_usd", lambda x: x.iloc[0]),
    fim=("price_usd", lambda x: x.iloc[-1])
).reset_index()

# C√°lculo da valoriza√ß√£o
df_rank["valorizacao_pct"] = ((df_rank["fim"] - df_rank["inicio"]) / df_rank["inicio"]) * 100
df_rank = df_rank.sort_values(by="valorizacao_pct", ascending=False)

# Plot
plt.figure(figsize=(10, 6))
sns.barplot(data=df_rank, x="valorizacao_pct", y="asset_name", palette="viridis")
plt.title("üìå Ranking de Valoriza√ß√£o (%) no Per√≠odo")
plt.xlabel("Valoriza√ß√£o (%)")
plt.ylabel("Criptoativo")
plt.grid(True, axis='x')
plt.tight_layout()
plt.show()
