# **Predicción del Movimiento de Nubes para la Optimización de Plantas Fotovoltaicas en Colombia**

## 1) Descarga de imágenes

A continuación se muestra el código empleado para la descarga de imágenes correspondientes a la banda 13 para el periodo de tiempo comprendido entre el 01/01/2024 y el 31/12/2024. Ingresar al siguiente repositorio de github: https://github.com/alwos19/monografia_esp_cd

## 2) Obtención del dataset

A partir de las imagenes obtenidas se realiza la construcción de una dataset en el que las columnas correspondan a cada hora del día y las filas a cada día del año, dentro de cada celda se ubica la imagen correspondiente con una tamaño de 920X920, el valor de cada pixel corresponde a los valores de radiancia para le día y la hora correspondientes.

In [9]:
import os
import numpy as np
import pandas as pd
from datetime import datetime
import matplotlib.pyplot as plt

# Ruta donde están almacenados los archivos .npy
ruta_archivos = "./rad13"  # Cambia esto por la ruta real

# Lista para almacenar los datos
datos = []

# Recorrer todos los archivos en la carpeta
for archivo in os.listdir(ruta_archivos):
    if archivo.endswith(".npy") and archivo.startswith("RadFC_"):
        # Extraer la parte de fecha y hora del nombre del archivo
        nombre = archivo.replace("RadFC_", "").replace("_Rad13.npy", "")
        fecha_str = nombre[:12]  # 'YYYYMMDDHHMM'

        try:
            # Convertir a objeto datetime
            fecha_datetime = datetime.strptime(fecha_str, "%Y%m%d%H%M")
            hora = fecha_datetime.strftime("%H:%M")

            # Cargar los valores de radiancia
            ruta_completa = os.path.join(ruta_archivos, archivo)
            radiancia = np.load(ruta_completa)

            # Validar que la dimensión sea 920 x 920
            if radiancia.shape == (920, 920):
                datos.append({
                    "fecha": fecha_datetime,
                    "hora": hora,
                    "radiancia": radiancia
                })
            else:
                print(f"Dimensiones incorrectas en: {archivo}")
        except ValueError:
            print(f"Formato de fecha inválido en: {archivo}")

# Crear el DataFrame
df_imagenes = pd.DataFrame(datos)

# Mostrar primeras filas
print(df_imagenes.head())

                fecha   hora  \
0 2024-01-01 02:00:00  02:00   
1 2024-01-01 00:00:00  00:00   
2 2024-01-01 03:00:00  03:00   
3 2024-01-01 01:00:00  01:00   
4 2024-01-01 04:00:00  04:00   

                                           radiancia  
0  [[98.684944, 98.82213, 98.684944, 98.86786, 98...  
1  [[97.861824, 97.67891, 97.22162, 97.084435, 97...  
2  [[97.99901, 98.41057, 98.684944, 98.776405, 98...  
3  [[94.24924, 98.776405, 99.27942, 99.23369, 99....  
4  [[99.096504, 98.95932, 98.684944, 98.59348, 98...  


In [10]:
df_imagenes.head(2)

Unnamed: 0,fecha,hora,radiancia
0,2024-01-01 02:00:00,02:00,"[[98.684944, 98.82213, 98.684944, 98.86786, 98..."
1,2024-01-01 00:00:00,00:00,"[[97.861824, 97.67891, 97.22162, 97.084435, 97..."


In [None]:
# Calcular el promedio de radiancia para cada imagen
df_imagenes["radiancia_promedio"] = df_imagenes["radiancia"].apply(np.mean)

# Verificar número de registros
assert len(df_imagenes) == 6, "La cantidad de registros no es 6002."

# Calcular la media global de los promedios de radiancia
media_global = df_imagenes["radiancia_promedio"].mean()

# Graficar el histograma
plt.figure(figsize=(10, 6))
plt.hist(df_imagenes["radiancia_promedio"], bins=50, color='skyblue', edgecolor='black')
plt.axvline(media_global, color='red', linestyle='--', linewidth=2, label=f"Media = {media_global:.2f}")
plt.title("Histograma de Radiancia Promedio por Imagen")
plt.xlabel("Radiancia Promedio")
plt.ylabel("Frecuencia")
plt.legend()
plt.grid(True)
plt.tight_layout()
plt.show()

AssertionError: La cantidad de registros no es 6002.

In [5]:
df_imagenes['fecha'] = pd.to_datetime(df_imagenes['fecha'])

In [6]:
df_imagenes

Unnamed: 0,fecha,hora,radiancia
0,2024-01-01 02:00:00,02:00,"[[98.684944, 98.82213, 98.684944, 98.86786, 98..."
1,2024-01-01 00:00:00,00:00,"[[97.861824, 97.67891, 97.22162, 97.084435, 97..."
2,2024-01-01 03:00:00,03:00,"[[97.99901, 98.41057, 98.684944, 98.776405, 98..."
3,2024-01-01 01:00:00,01:00,"[[94.24924, 98.776405, 99.27942, 99.23369, 99...."
4,2024-01-01 04:00:00,04:00,"[[99.096504, 98.95932, 98.684944, 98.59348, 98..."
5,2024-01-01 05:00:00,05:00,"[[98.273384, 97.99901, 98.684944, 99.32515, 99..."
