# üìò Ejemplo completo: Sensores + Spark + MariaDB + Jupyter

Este notebook demuestra c√≥mo:
1. Conectarse desde Jupyter (PySpark) al cl√∫ster de Spark
2. Leer datos reales desde MariaDB (tabla `sensores`)
3. Visualizarlos en un gr√°fico con Matplotlib
4. Guardar la imagen en `/home/jovyan/work/shared/`

In [None]:
from pyspark.sql import SparkSession

# Ruta del conector JDBC
jdbc_driver_path = "/opt/spark/jars/mariadb-java-client.jar"

# Crear sesi√≥n de Spark
spark = (
    SparkSession.builder
    .appName("LeerSensores")
    .master("spark://spark-master:7077")
    .config("spark.jars", jdbc_driver_path)
    .config("spark.driver.extraClassPath", jdbc_driver_path)
    .config("spark.executor.extraClassPath", jdbc_driver_path)
    .getOrCreate()
)

print("‚úÖ SparkSession creada correctamente")
print("Versi√≥n:", spark.version)

In [None]:
# --- Lectura de datos desde MariaDB ---
jdbc_url = "jdbc:mysql://mariadb:3306/bigdata_db?allowPublicKeyRetrieval=true&useSSL=false&permitMysqlScheme"

try:
    df = (
        spark.read.format("jdbc")
        .option("url", jdbc_url)
        .option("dbtable", "sensores")
        .option("user", "bigdata_user")
        .option("password", "bigdata_pass")
        .option("driver", "org.mariadb.jdbc.Driver")
        .load()
    )

    print("‚úÖ Datos cargados correctamente desde MariaDB")
    df.printSchema()
    df.show(10)
except Exception as e:
    print("‚ùå Error al leer los datos:")
    print(e)

In [None]:
# --- Gr√°fico de temperatura y humedad ---
import matplotlib.pyplot as plt
import pandas as pd

try:
    # Convertir a Pandas (solo las columnas necesarias)
    pdf = df.select("fecha", "temperatura", "humedad").toPandas()
    pdf = pdf.sort_values("fecha")

    plt.figure(figsize=(10, 5))
    plt.plot(pdf["fecha"], pdf["temperatura"], label="Temperatura (¬∞C)", color="red")
    plt.plot(pdf["fecha"], pdf["humedad"], label="Humedad (%)", color="blue")
    plt.xlabel("Fecha")
    plt.ylabel("Valor")
    plt.title("Registro de Sensores")
    plt.legend()
    plt.grid(True)
    plt.show()
    print("‚úÖ Gr√°fico generado correctamente")

except Exception as e:
    print("‚ùå Error al graficar:")
    print(e)

In [None]:
# --- Guardar el gr√°fico en carpeta compartida ---
output_dir = "/home/jovyan/work/shared"
output_path = f"{output_dir}/grafico_sensores.png"

try:
    plt.figure(figsize=(10, 5))
    plt.plot(pdf["fecha"], pdf["temperatura"], label="Temperatura (¬∞C)", color="red")
    plt.plot(pdf["fecha"], pdf["humedad"], label="Humedad (%)", color="blue")
    plt.xlabel("Fecha")
    plt.ylabel("Valor")
    plt.title("Registro de Sensores")
    plt.legend()
    plt.grid(True)
    plt.savefig(output_path, bbox_inches='tight')

    print(f"‚úÖ Gr√°fico guardado en: {output_path}")

except Exception as e:
    print("‚ùå Error al guardar el gr√°fico:")
    print(e)

In [None]:
spark.stop()