# Librerías

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Constantes

In [None]:
COLORES = ["cornflowerblue", "mediumpurple", "indianred", "mediumseagreen", 'gold']

FICHERO_DATOS = './data/lagoon_hourly_filled.csv'
FICHERO_HIST = './data/historical_air_temp.csv'



# Carga de datos

In [None]:
data = pd.read_csv(FICHERO_DATOS)

data['date'] = pd.to_datetime(data['date'])  
data = data.sort_values(by='date')

# Reiniciar los índices después de ordenar
data = data.reset_index(drop=True)

In [None]:
data.info()

In [None]:
data.isnull().sum()

# Análisis descriptivo

In [None]:
data[["fondo", "superficie", "ambiente", "nivel"]].describe()

In [None]:
plt.figure(figsize=(15, 10))
plt.suptitle('Análisis de la distribución los parámetros', fontsize=16)
plt.tight_layout(rect=[0, 0, 1, 0.96])


# Histograma de Temperatura en Fondo
ax1 = plt.subplot(2, 2, 1)
sns.histplot(data=data, x='fondo', kde=True, color=COLORES[0])
ax1.set_title('')
ax1.spines['top'].set_visible(False)  
ax1.spines['right'].set_visible(False)
ax1.set_ylabel('Temperatura (ºC)', fontsize=14) 
ax1.set_xlabel('Tª agua en el Fondo', fontsize=14) 
# Ajustar el tamaño de las etiquetas de los ejes
ax1.tick_params(axis='both', which='major', labelsize=12)


# Histograma de Temperatura en Superficie
ax2 = plt.subplot(2, 2, 2)
sns.histplot(data=data, x='superficie', kde=True, color=COLORES[1])
ax2.set_title('')
ax2.spines['top'].set_visible(False)  
ax2.spines['right'].set_visible(False)
ax2.set_ylabel('Temperatura (ºC)', fontsize=14)  
ax2.set_xlabel('Tª agua en la Superficie', fontsize=14) 
ax2.tick_params(axis='both', which='major', labelsize=12)

# Histograma de Temperatura Ambiente
ax3 = plt.subplot(2, 2, 3)
sns.histplot(data=data, x='ambiente', kde=True, color=COLORES[2])
ax3.set_title('')
ax3.spines['top'].set_visible(False)  
ax3.spines['right'].set_visible(False)
ax3.set_ylabel('Temperatura (ºC)', fontsize=14) 
ax3.set_xlabel('Tª ambiente', fontsize=14) 
ax3.tick_params(axis='both', which='major', labelsize=12)

# Histograma del Nivel del Agua
ax4 = plt.subplot(2, 2, 4)
sns.histplot(data=data, x='nivel', kde=True, color=COLORES[3])
ax4.set_title('')
ax4.spines['top'].set_visible(False)  
ax4.spines['right'].set_visible(False)
ax4.set_ylabel('Nivel (cm)', fontsize=14)  
ax4.set_xlabel('Nivel del agua', fontsize=14) 
ax4.tick_params(axis='both', which='major', labelsize=12)
plt.tight_layout()

# Guardar el gráfico en una carpeta con buena resolución
plt.savefig(f"histogramas.png", dpi=300, bbox_inches='tight')
plt.show()

In [None]:

# Boxplot de las temperaturas en fondo, superficie y ambiente
plt.figure(figsize=(10, 10))
plt.suptitle('Análisis de los parámetros', fontsize=16)
plt.tight_layout(rect=[0, 0, 1, 0.96])
plt.subplot(2, 2, 1)

ax1 = sns.boxplot(data=data, y='fondo', color = COLORES[0])
# plt.title('Boxplot de Temperatura en Fondo')
ax1.spines['top'].set_visible(False)  
ax1.spines['right'].set_visible(False)
ax1.set_ylabel('Temperatura (ºC)', fontsize=14) 
ax1.set_xlabel('Tª agua en el Fondo', fontsize=14) 
ax1.tick_params(axis='both', which='major', labelsize=12)

plt.subplot(2, 2, 2)
ax2 = sns.boxplot(data=data, y='superficie', color = COLORES[1])
# plt.title('Boxplot de Temperatura en Superficie')
ax2.spines['top'].set_visible(False)  
ax2.spines['right'].set_visible(False)
ax2.set_ylabel('Temperatura (ºC)', fontsize=14)  
ax2.set_xlabel('Tª agua en la Superficie', fontsize=14) 
ax2.tick_params(axis='both', which='major', labelsize=12)

plt.subplot(2, 2, 3)
ax3 = sns.boxplot(data=data, y='ambiente', color = COLORES[2])
# plt.title('Boxplot de Temperatura Ambiente')
ax3.spines['top'].set_visible(False)  
ax3.spines['right'].set_visible(False)
ax3.set_ylabel('Temperatura (ºC)', fontsize=14) 
ax3.set_xlabel('Tª ambiente', fontsize=14) 
ax3.tick_params(axis='both', which='major', labelsize=12)

plt.subplot(2, 2, 4)
ax4 = sns.boxplot(data=data, y='nivel', color = COLORES[3])
# plt.title('Boxplot de Nivel del agua')
ax4.spines['top'].set_visible(False)  
ax4.spines['right'].set_visible(False)
ax4.set_ylabel('Nivel (cm)', fontsize=14)  
ax4.set_xlabel('Nivel del agua', fontsize=14) 
ax4.tick_params(axis='both', which='major', labelsize=12)

plt.tight_layout()

# Guardar el gráfico en una carpeta con buena resolución
plt.savefig(f"boxplots.png", dpi=300, bbox_inches='tight')
plt.show()

In [None]:
# Convierte la columna 'date' a tipo datetime
data['date'] = pd.to_datetime(data['date'])

# Configuración del gráfico
plt.figure(figsize=(15,7))
# Configuración de los ejes y títulos
plt.xlabel('Fecha', fontsize=14)
plt.ylabel('Temperatura (ºC)', fontsize=14)
plt.title(f'Distribución de los parámetros en el tiempo', fontsize=16)

# Quitar los bordes superior y derecho
ax = plt.gca()
ax.spines['top'].set_visible(False)
ax.spines['right'].set_visible(False)

# Ajustar el tamaño de las etiquetas de los ejes
ax.tick_params(axis='both', which='major', labelsize=12)

# Configurar la cuadrícula
ax.grid(True, which='both', linestyle='--', linewidth=0.7, color='grey', alpha = 0.5)


# Gráfico de dispersión para 'fondo', 'superficie' y 'ambiente'
plt.scatter(data['date'], data['ambiente'], label='Tª ambiente', marker='o', alpha=1, color = COLORES[2], s=5)
plt.scatter(data['date'], data['nivel'], label='Nivel del agua', marker='o', alpha=1, color = COLORES[3], s=5)

plt.scatter(data['date'], data['superficie'], label='Tª agua en la Superficie', marker='o', alpha=1, color = COLORES[1], s=5)
plt.scatter(data['date'], data['fondo'], label='Tª agua en el Fondo', marker='o', alpha=1, color = COLORES[0], s=5)

# # Mostrar una leyenda en la parte superior izquierda
# plt.legend(loc='upper left')
# Ajustar el tamaño de la leyenda
plt.legend(fontsize=12)
legend = ax.legend(fontsize=12)
for handle in legend.legendHandles:
    handle._sizes = [20]  # Ajusta el tamaño de los marcadores en la leyenda





# Mostrar el gráfico
plt.tight_layout()
# Guardar el gráfico en una carpeta con buena resolución
plt.savefig(f"dispersion_inicial.png", dpi=300, bbox_inches='tight')
plt.show()

In [None]:
data_filled = data.fillna(0)

correlacion = data_filled[['fondo', 'superficie', 'ambiente', 'nivel']].corr()

correlacion

In [None]:
plt.figure(figsize=(8, 6))
sns.heatmap(correlacion, annot=True, cmap='coolwarm', fmt=".2f")
plt.title('Mapa de Calor de Correlación')
plt.show()

In [None]:
data.info()

# Datos AEMET

## Carga datos

In [None]:
data_hist = pd.read_csv(FICHERO_HIST)

data_hist['fecha'] = pd.to_datetime(data_hist['fecha'], format='%d/%m/%Y')  
data_hist = data_hist.sort_values(by='fecha')

# Reiniciar los índices después de ordenar
data_hist = data_hist.reset_index(drop=True)

# data_hist.set_index('fecha', inplace=True)

In [None]:
data_hist

In [None]:
plt.figure(figsize=(15, 6))
plt.suptitle('Análisis del histórico de la temperatura ambiente', fontsize=16)
plt.tight_layout(rect=[0, 0, 1, 0.96])


# Histograma de Temperatura en Fondo
ax1 = plt.subplot(1, 2, 1)
sns.histplot(data=data_hist, x='ambiente', kde=True, color=COLORES[4])
ax1.set_title('')
ax1.spines['top'].set_visible(False)  
ax1.spines['right'].set_visible(False)
ax1.set_ylabel('Temperatura (ºC)', fontsize=14) 
ax1.set_xlabel('Tª ambiente', fontsize=14) 
ax1.tick_params(axis='both', which='major', labelsize=12)

plt.subplot(1, 2, 2)
ax2 = sns.boxplot(data=data_hist, y='ambiente', color = COLORES[4])
plt.title('')
ax2.spines['top'].set_visible(False)  
ax2.spines['right'].set_visible(False)
ax2.set_ylabel('Temperatura (ºC)', fontsize=14) 
ax2.set_xlabel('Tª ambiente', fontsize=14) 
ax2.tick_params(axis='both', which='major', labelsize=12)


plt.tight_layout()

# Guardar el gráfico en una carpeta con buena resolución
plt.savefig(f"histo_AEMET.png", dpi=300, bbox_inches='tight')
plt.show()

In [None]:
data_hist.describe()

In [None]:
# Convierte la columna 'date' a tipo datetime
data_hist['fecha'] = pd.to_datetime(data_hist['fecha'])

# Configuración de los ejes y títulos
plt.figure(figsize=(15,7))
plt.xlabel('Fecha', fontsize=14)
plt.ylabel('Temperatura (ºC)', fontsize=14)
plt.title('Distribución del histórico de la temperatura ambiente en el tiempo', fontsize=16)

# Quitar los bordes superior y derecho
ax = plt.gca()
ax.spines['top'].set_visible(False)
ax.spines['right'].set_visible(False)

# Ajustar el tamaño de las etiquetas de los ejes
ax.tick_params(axis='both', which='major', labelsize=12)

# Gráfico de dispersión para 'fondo', 'superficie' y 'ambiente'
plt.scatter(data_hist['fecha'], data_hist['ambiente'], marker='o', alpha=0.7, color = COLORES[4], s = 5, zorder = 3)

# Configurar la cuadrícula
ax.grid(True, which='both', linestyle='--', linewidth=0.7, color='grey', alpha = 0.5, zorder = 2)

plt.tight_layout()

# Guardar el gráfico en una carpeta con buena resolución
plt.savefig(f"dispersion_AEMET.png", dpi=300, bbox_inches='tight')
plt.show()

In [None]:
# Convierte la columna 'date' a tipo datetime
data_hist['fecha'] = pd.to_datetime(data_hist['fecha'])

# Configuración de los ejes y títulos
plt.figure(figsize=(15,7))
plt.xlabel('Fecha', fontsize=14)
plt.ylabel('Temperatura (ºC)', fontsize=14)
plt.title('Distribución del histórico de la temperatura ambiente en el tiempo', fontsize=16)

# Quitar los bordes superior y derecho
ax = plt.gca()
ax.spines['top'].set_visible(False)
ax.spines['right'].set_visible(False)

# Ajustar el tamaño de las etiquetas de los ejes
ax.tick_params(axis='both', which='major', labelsize=12)

# Gráfico de dispersión para 'fondo', 'superficie' y 'ambiente'
plt.plot(data_hist['fecha'], data_hist['ambiente'], color = COLORES[4], zorder = 3)

# Configurar la cuadrícula
ax.grid(True, which='both', linestyle='--', linewidth=0.7, color='grey', alpha = 0.5, zorder = 2)

plt.tight_layout()

# Guardar el gráfico en una carpeta con buena resolución
plt.savefig(f"evolucion_AEMET.png", dpi=300, bbox_inches='tight')
plt.show()