# # Generación de energía solar
## Contexto

## Trabajo
### Hipótesis
Buscamos predecir la producción de energía de un campo solar, utilizando las predicciones de las condiciones climáticas. Estas condiciones incluyen las temperaturas y la nubocidad (humedad) como principales variables que afectan a la radiación receptada por los paneles.

- De haber una relación entre las condiciones climáticas y la radiación solar receptada por paneles solares, se puede predecir la generación de energía de un campo de paneles solares según el pronóstico.

### Conjunto de Datos y preprocesamiento
Se inicia esta exploración enfocandose en la Región Metropolitana, tomando datos de la estación de Cerro Calán proporcionados por el Ministerio de Energía del Gobierno de Chile.

Estos datos contiene registros de mediciones cada 10 minutos desde 2013-08-09 hasta el 2019-05-31, con los siguientes datos:

- Fecha y hora: YYYY-MM-DD hh:mm:ss
- Radiación Solar (Global y Difusa de seguimiento, Global horizontal): W/m2
- Temperatura: ºC
- Humedad relativa: porcentual
- Velocidad viento (promedio, minima y máxima): m/s
- Voltaje batería: V
- Radiación directa normal: W/m2

Dados los objetivos que buscamos se procesaron los datos de manera de tener registros diarios con los siguientes atributos:

- Fecha: YYMMDD
- anno: YYYY
- mes: MM
- dia: DD
- Fecha2: YYYY-MM-DD
- Promedios y Maximas por dia de: Temperatura (T), Humedad relativa (H), Velocidad del viento (V),  Radiación Solar Global de Seguimiento(RSGS),  Radiación Solar Difusa de Seguimiento(RSDS),  Radiación Solar Global Horizontal(RSGH), Radiación directa normal (RDN)


In [5]:
# Imports used on the script

import matplotlib
matplotlib.use('tkagg')

import matplotlib.pyplot as plt
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
from sklearn.pipeline import Pipeline
from sklearn.impute import SimpleImputer
import pandas as pd

In [6]:
# Import calan station data
df = pd.read_csv("C:/Users/Ann/Documents/Universidad/Mineria de Datos/intro_mineria_dcc_2019/Proyecto/InfoSolar/CalanDiarioClean.csv")
#df['Fecha'] = pd.to_datetime(df['Fecha'])    
#df['Fecha_rel'] = (df['Fecha'] - df['Fecha'].min())  / np.timedelta64(1,'D')

# Example of how the table looks
df.head()

Unnamed: 0,Fecha,anno,mes,dia,Fecha2,Tpromedio,Tmax,Hpromedio,Hmax,Vpromedio,Vmax,RSGSpromedio,RSGSmax,RSDSpromedio,RSDSmax,RSGHpromedio,RSGHmax,RDNpromedio,RDNmax
0,130809,2013.0,8.0,9.0,2013-08-09,6.728125,49.6,51.303125,99.5,2.569531,6.69,4380.484375,22698,4354.703125,22589,4379.28125,22428,25.6875,512
1,130810,2013.0,8.0,10.0,2013-08-10,9.679861,17.2,44.088194,62.4,2.696042,6.86,241.361111,893,27.006944,155,171.875,724,214.194444,849
2,130811,2013.0,8.0,11.0,2013-08-11,8.779861,11.6,62.810417,94.2,2.625903,6.79,19.048611,91,14.5,71,19.541667,93,4.409722,19
3,130812,2013.0,8.0,12.0,2013-08-12,7.497917,13.6,88.534028,100.0,1.815208,4.22,93.902778,671,24.659722,202,64.715278,596,69.083333,557
4,130813,2013.0,8.0,13.0,2013-08-13,7.915278,15.2,63.185417,100.0,2.884375,6.7,280.701389,901,24.048611,89,186.923611,724,256.451389,851
