# Wind energy prospection: 
## Pipelines for wind power analysis from IDEAM database.

### 1. Load libraries and datasets:

In [2]:
# import libraries
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import janitor
import missingno as msno
import os
import zipfile
from glob import glob
from scipy.special import gamma
from utils import wind

In [4]:
# Searching for datasets in the directory
datasets_dir = "./raw_data/"
search_pattern = "*.zip"
zip_files = glob(os.path.join(datasets_dir, search_pattern))
print(zip_files)

['./raw_data/data_2.zip', './raw_data/data_1.zip', './raw_data/data_3.zip']


In [6]:
# Unzip datasets
try:
    for key in zip_files:
        directory = os.path.join("processed_data",os.path.basename(key)[:-4])
        with zipfile.ZipFile(key, "r") as zf:
            zf.extractall(directory)
except FileExistsError:
    pass

#### 1.2 Loading Datasets:

In [7]:
guajira = pd.read_csv("./processed_data/data_1/excel.csv.csv", header=0)
guajira_2 = pd.read_csv("./processed_data/data_2/excel.csv.csv", header=0)
meta = pd.read_csv("./processed_data/data_3/excel.csv.csv", header=0)

  meta = pd.read_csv("./processed_data/data_3/excel.csv.csv", header=0)


## 2. Explore Data

In [8]:
meta.head()

Unnamed: 0,CodigoEstacion,NombreEstacion,Latitud,Longitud,Altitud,Categoria,Entidad,AreaOperativa,Departamento,Municipio,...,FechaSuspension,IdParametro,Etiqueta,DescripcionSerie,Frecuencia,Fecha,Valor,Grado,Calificador,NivelAprobacion
0,35035020,AEROPUERTO VANGUARDIA [35035020],4.161919,-73.617578,422,Sinóptica Principal,INSTITUTO DE HIDROLOGIA METEOROLOGIA Y ESTUDIO...,Area Operativa 03 - Meta-Guaviare-Guainía,Meta,Villavicencio,...,,VEL VIENTO,VVAG_CON,Velocidad del viento de las 24 horas,Horaria,1977-04-01 04:00,0.0,50,,900
1,35035020,AEROPUERTO VANGUARDIA [35035020],4.161919,-73.617578,422,Sinóptica Principal,INSTITUTO DE HIDROLOGIA METEOROLOGIA Y ESTUDIO...,Area Operativa 03 - Meta-Guaviare-Guainía,Meta,Villavicencio,...,,VEL VIENTO,VVAG_CON,Velocidad del viento de las 24 horas,Horaria,1977-04-01 05:00,0.0,50,,900
2,35035020,AEROPUERTO VANGUARDIA [35035020],4.161919,-73.617578,422,Sinóptica Principal,INSTITUTO DE HIDROLOGIA METEOROLOGIA Y ESTUDIO...,Area Operativa 03 - Meta-Guaviare-Guainía,Meta,Villavicencio,...,,VEL VIENTO,VVAG_CON,Velocidad del viento de las 24 horas,Horaria,1977-04-01 06:00,0.5,50,,900
3,35035020,AEROPUERTO VANGUARDIA [35035020],4.161919,-73.617578,422,Sinóptica Principal,INSTITUTO DE HIDROLOGIA METEOROLOGIA Y ESTUDIO...,Area Operativa 03 - Meta-Guaviare-Guainía,Meta,Villavicencio,...,,VEL VIENTO,VVAG_CON,Velocidad del viento de las 24 horas,Horaria,1977-04-01 07:00,0.0,50,,900
4,35035020,AEROPUERTO VANGUARDIA [35035020],4.161919,-73.617578,422,Sinóptica Principal,INSTITUTO DE HIDROLOGIA METEOROLOGIA Y ESTUDIO...,Area Operativa 03 - Meta-Guaviare-Guainía,Meta,Villavicencio,...,,VEL VIENTO,VVAG_CON,Velocidad del viento de las 24 horas,Horaria,1977-04-01 08:00,0.0,50,,900


In [9]:
meta.columns

Index(['CodigoEstacion', 'NombreEstacion', 'Latitud', 'Longitud', 'Altitud',
       'Categoria', 'Entidad', 'AreaOperativa', 'Departamento', 'Municipio',
       'FechaInstalacion', 'FechaSuspension', 'IdParametro', 'Etiqueta',
       'DescripcionSerie', 'Frecuencia', 'Fecha', 'Valor', 'Grado',
       'Calificador', 'NivelAprobacion'],
      dtype='object')

In [10]:
meta.dtypes

CodigoEstacion        int64
NombreEstacion       object
Latitud             float64
Longitud            float64
Altitud               int64
Categoria            object
Entidad              object
AreaOperativa        object
Departamento         object
Municipio            object
FechaInstalacion     object
FechaSuspension      object
IdParametro          object
Etiqueta             object
DescripcionSerie     object
Frecuencia           object
Fecha                object
Valor               float64
Grado                 int64
Calificador          object
NivelAprobacion       int64
dtype: object

In [11]:
meta.wclean.useful_columns()

Unnamed: 0,NombreEstacion,Categoria,Municipio,DescripcionSerie,Frecuencia,Valor,Fecha
0,AEROPUERTO VANGUARDIA [35035020],Sinóptica Principal,Villavicencio,Velocidad del viento de las 24 horas,Horaria,0.000,1977-04-01 04:00
1,AEROPUERTO VANGUARDIA [35035020],Sinóptica Principal,Villavicencio,Velocidad del viento de las 24 horas,Horaria,0.000,1977-04-01 05:00
2,AEROPUERTO VANGUARDIA [35035020],Sinóptica Principal,Villavicencio,Velocidad del viento de las 24 horas,Horaria,0.500,1977-04-01 06:00
3,AEROPUERTO VANGUARDIA [35035020],Sinóptica Principal,Villavicencio,Velocidad del viento de las 24 horas,Horaria,0.000,1977-04-01 07:00
4,AEROPUERTO VANGUARDIA [35035020],Sinóptica Principal,Villavicencio,Velocidad del viento de las 24 horas,Horaria,0.000,1977-04-01 08:00
...,...,...,...,...,...,...,...
284378,AEROPUERTO VANGUARDIA [35035020],Sinóptica Principal,Villavicencio,Velocidad del viento de las 24 horas,Horaria,1.071,2018-10-18 07:00
284379,AEROPUERTO VANGUARDIA [35035020],Sinóptica Principal,Villavicencio,Velocidad del viento de las 24 horas,Horaria,0.510,2018-10-18 08:00
284380,AEROPUERTO VANGUARDIA [35035020],Sinóptica Principal,Villavicencio,Velocidad del viento de las 24 horas,Horaria,1.581,2018-10-18 09:00
284381,AEROPUERTO VANGUARDIA [35035020],Sinóptica Principal,Villavicencio,Velocidad del viento de las 24 horas,Horaria,1.581,2018-10-18 10:00


In [12]:
meta.wclean.time_convert()

ValueError: Can only use .dt accessor with datetimelike values, your column is not datetimelike