# Trabajo de análisis módulo 3: Estadística para data science
## Introducción - Limpieza de datos
Se posee un dataset que corresponde a los incendios foretales ocurridos en las regiones de Valparaíso y Bío-Bío entre los años 2017 y 2018. El data set se compone de las siguientes columnas:
- Región
- Provincia
- Comuna
- Nombre del incendio
- UTM E (Universal Transversal Mercator para la coordenada este)
- UTM N (Universal Transversal Mercator para la coordenada norte)
- Huso (Cuadrícula uso mundial a Chile 18 y 19)
- Latitud en formato de grado, minuto y segundo
- Longitud en formato de grado, minuto y segundo
- Pino 0 a 10 (Pino entre 0 a 10 años)
- Pino 11 a 17 (Pino entre 11 a 17 años)
- Puno 18 o más (Pino entre 18 y más años)
- Eucalipto (Especie exótica)
- Otras plantaciones (Corresponde en mayoría a álamos)
- Subtotal Plantaciones (Suma de pino, eucalipto y otras)
- Arbolado (Especies nativas)
- Matorral (Corresponde a especies no leñosas)
- Pastizal (Especies de pasto)
- Subtotal vegetación natural (Suma de arbolado, matorral y pastizal)
- Agrícola (Trigo, avena o cereales por mencionar algunos)
- Desechos (material que queda después de una explotación del bosque o cosecha agrícola)
- Subtotal otras superficies (Suma de lo agrícola y desechos)
- Superficie total efectada (en hectáreas)
- Inicio
- Detección
- Aviso
- Primer ataque
- Control
- Extición
- Duración en horas
- Día de inicio
- Temperatura (en grados celcius)
- Humedad relativa (%)
- Dirección del viento
- Velocidad del viento (en kilómetros por hora)
- Topografía
- Pendiente (%)

<hr>

Los tipos de variables que corresponden para cada columna son los siguientes:

|Nombre columna|Tipo de variable|
|---|---|
|Región|Cadena de carácteres|
|Provincia|Cadena de carácteres|
|Comuna|Cadena de carácteres|
|Nombre Inciendio|Cadena de carácteres|
|UTM E|Cadena de carácteres|
|UTM N|Cadena de carácteres|
|Huso|Cadena de carácteres|
|Lat|Cadena de carácteres|
|Lon|Cadena de carácteres|
|Pino 0 a 10|Numérico|
|Pino 11 a 17|Numérico|
|Pino 18 o más|Numérico|
|Eucalipto|Numérico|
|Otras Plantaciones|Numérico|
|Subtotal Plantaciones|Numérico|
|Arbolado|Numérico|
|Matorral|Numérico|
|Pastizal|Numérico|
|Subtotal Vegetación Natural|Numérico|
|Agrícola|Numérico|
|Desechos|Numérico|
|Subtotal otras Superficies|Numérico|
|Superficie Total Afectada Has|Numérico|
|Inicio|Cadena de carácteres|
|Detección|Cadena de carácteres|
|Aviso|Cadena de carácteres|
|Primer ataque|Cadena de carácteres|
|Control|Cadena de carácteres|
|Extinsión|Cadena de carácteres|
|Duración Hrs.|Numérico|
|Día de Inicio|Cadena de carácteres|
|Temperatura °C|Numérico|
|Humedad Relativa %|Numérico|
|Dirección Viento|Cadena de carácteres|
|Velocidad Viento Hm/Hra|Numérico|
|Topografía|Cadena de carácteres|
|Pendiente %|Cadena de carácteres|

## Pasos a seguir
- 1. Se realiza una conversión de tipos de datos, para que exista una coherencia de éstos al interior del conjunto, con el fin de facilitar el posterior análisis de la información.
- 2. Se eliminarán aquellas columnas que no aportan información relevante para lo que se desea analizar o que sean información redundante.
- 3. Se normalizarán a letras mayúsculas todos los textos y se suprimirán las tildes de cada tipo de vocal, reemplazandolas por su equivalente sin tilde.

In [13]:
# Importacion de librerias que se emplearan
import pandas as pd
import numpy as np
from datetime import datetime
import matplotlib.pyplot as plt
import re

# Configuracion de pandas para que no bloque asignaciones masivas
pd.options.mode.chained_assignment = None

# Lectura del dataset y previsualizacion de los datos
df = pd.read_excel("Base_Datos_IFs_V_VIII_Temp_2017_2018.xls")
df.head()

Unnamed: 0,Región,Provincia,Comuna,Nombre Incendio,UTM E,UTM N,Huso,Lat,Lon,Pino 0 a 10,...,Control,Extinción,Duración Hrs.,Día de Inicio,Temperatura °C,Humedad Relativa %,Dirección Viento,Velocidad Viento Km/Hra,Topografía,Pendiente %
0,Valparaíso,Isla de Pascua,Isla de Pascua,HANGA HEMU,659590 E,6994435 S,12J,"27°09'48"" S","109°23'21"" O",0.0,...,5-jul-2017 13:45,5-jul-2017 14:10,1.8,Miércoles,22.0,64.0,NW,11.0,Suave,5 %
1,Valparaíso,Isla de Pascua,Isla de Pascua,VAITOIRI,669460 E,6997125 S,12J,"27°08'17"" S","109°17'24"" O",0.0,...,7-jul-2017 13:45,7-jul-2017 14:00,1.7,Viernes,22.0,76.0,NW,9.0,Suave,5 %
2,Valparaíso,Isla de Pascua,Isla de Pascua,HANGA MAI HIKU,668612 E,6997319 S,12J,"27°08'11"" S","109°17'55"" O",0.0,...,14-jul-2017 09:20,14-jul-2017 09:20,2.7,Viernes,20.0,73.0,N,16.0,Suave,0 %
3,Valparaíso,Isla de Pascua,Isla de Pascua,VAITOIRI 1,669477 E,6997080 S,12J,"27°08'18"" S","109°17'24"" O",0.0,...,19-jul-2017 13:15,19-jul-2017 13:50,2.1,Miércoles,22.0,58.0,N,9.0,Suave,5 %
4,Valparaíso,Isla de Pascua,Isla de Pascua,VAITOIRI 2,669460 E,6997125 S,12J,"27°08'17"" S","109°17'24"" O",0.0,...,19-jul-2017 13:45,19-jul-2017 14:00,1.6,Miércoles,22.0,58.0,N,9.0,Suave,5 %


<hr>

### Se convierten las coordenadas de Latitud y Longitud, de formato "degree" a formato "numérico" por medio de un procedimiento específico. Estos se almacenan en una nueva columna llamada "Lat_Number" y "Long_Number" respectivamente

In [14]:
def dms2dd(degrees, minutes, seconds, direction):
    dd = float(degrees) + float(minutes)/60 + float(seconds)/(60*60);
    if direction == 'S' or direction == 'W':
        dd *= -1
    return dd;

def dd2dms(deg):
    d = int(deg)
    md = abs(deg - d) * 60
    m = int(md)
    sd = (md - m) * 60
    return [d, m, sd]

# Funcion para convertir de degrees a numero
def parse_dms(dms):
    dms = dms.replace("\"", "'")
    dms = dms.replace("O", "W")
    parts = re.split('[^\d\w]+', dms)
    lat = dms2dd(parts[0], parts[1], parts[2], parts[3])
    return lat

# Se aplica la conversion
df["Lat_Number"] = df["Lat"].apply(parse_dms)
df["Long_Number"] = df["Lon"].apply(parse_dms)

# Se verifica que se hayan añadido exitosamente las dos nuevas columnas
print(df[["Lat_Number", "Long_Number"]].dtypes)
df[["Lat_Number", "Long_Number", "Lat", "Lon"]].head()

Lat_Number     float64
Long_Number    float64
dtype: object


Unnamed: 0,Lat_Number,Long_Number,Lat,Lon
0,-27.163333,-109.389167,"27°09'48"" S","109°23'21"" O"
1,-27.138056,-109.29,"27°08'17"" S","109°17'24"" O"
2,-27.136389,-109.298611,"27°08'11"" S","109°17'55"" O"
3,-27.138333,-109.29,"27°08'18"" S","109°17'24"" O"
4,-27.138056,-109.29,"27°08'17"" S","109°17'24"" O"


<hr>

### Se convierten las columnas de Inicio, Detección, Aviso, Primer ataque, Control y Extinsión a formato "datetime" para mejor manipulación de los datos y componentes de la fecha y hora

In [15]:
# Se crea un diccionario de meses
diccionario_meses = {
    "ene": "01",
    "feb": "02",
    "mar": "03",
    "abr": "04",
    "may": "05",
    "jun": "06",
    "jul": "07",
    "ago": "08",
    "sep": "09",
    "oct": "10",
    "nov": "11",
    "dic": "12"
}

# Procedimiento para convertir la palabra del mes en numero
def limpiar_meses(fecha_str):
    for key in diccionario_meses:
        fecha_str = fecha_str.replace(key, diccionario_meses[key])
    return fecha_str

# Procedimiento para convertir a formato fecha
def convert_date(fecha):
    if (fecha is not np.nan):
        fecha = limpiar_meses(fecha)
        return datetime.strptime(fecha, "%d-%m-%Y %H:%M")
    else:
        return np.nan

# Se convierte cada columna de fecha al tipo de variable de fecha
df["Fecha_Inicio"] = df["Inicio"].apply(convert_date)
df["Fecha_Deteccion"] = df["Detección"].apply(convert_date)
df["Fecha_Aviso"] = df["Aviso"].apply(convert_date)
df["Fecha_PrimerAtaque"] = df["Primer ataque"].apply(convert_date)
df["Fecha_Control"] = df["Control"].apply(convert_date)
df["Fecha_Extinsion"] = df["Extinción"].apply(convert_date)
# Se verifica que la conversion se haya realizado correctamente
print(df[["Fecha_Inicio", "Fecha_Deteccion", "Fecha_Aviso", "Fecha_PrimerAtaque", "Fecha_Control", "Fecha_Extinsion"]].dtypes)

Fecha_Inicio          datetime64[ns]
Fecha_Deteccion       datetime64[ns]
Fecha_Aviso           datetime64[ns]
Fecha_PrimerAtaque    datetime64[ns]
Fecha_Control         datetime64[ns]
Fecha_Extinsion       datetime64[ns]
dtype: object


<hr>

### Se convierte el % de pendiente en un valor numérico

In [16]:
# Se crea funcion para eliminar el "%" y los espacios al inicio y fin
def limpiar_pendiente (pendiente):
    pendiente = pendiente.replace("%", "").strip()
    if(len(pendiente) > 0):
        return float(pendiente)
    else:
        return np.nan

df["Pendiente_Num"] = df["Pendiente %"].apply(limpiar_pendiente)
df["Pendiente_Num"].dtypes

dtype('float64')

<hr>

### Eliminación de aquellas columnas que no son útiles o son redudantes.
A continuación se procederá a eliminar aquellas columnas del dataset que son redundantes o que ya no son útiles debido a la transformación de tipos de variables. Las columnas a suprimir del dataset son:
- UTM E: Corresponde a otra forma de ubicar la localización geográfica del incendio. Como se tiene transformada la latitud, no es necesaria.
- UTM N: Corresponde a otra forma de ubicar la localización geográfica del incendio. Como se tiene transformada la latitud, no es necesaria.
- Huso: Es redundante ya que todos los incendios ocurren en Chile.
- Lat: Es redundante ya que se convirtió a una variable de tipo numérica en la columna Lat_Number.
- Lon: Es redundante ya que se convirtió a una variable de tipo numérica en la columna Long_Number.
- Inicio: Es redundante ya que se convirtió a una variable de tipo datetime en la columna Fecha_Inicio.
- Detección: Es redundante ya que se convirtió a una variable de tipo datetime en la columna Fecha_Deteccion.
- Aviso: Es redundante ya que se convirtió a una variable de tipo datetime en la columna Fecha_Aviso.
- Primer Ataque: Es redundante ya que se convirtió a una variable de tipo datetime en la columna Fecha_PrimerAviso.
- Control: Es redundante ya que se convirtió a una variable de tipo datetime en la columna Fecha_Control.
- Extinción: Es redundante ya que se convirtió a una variable de tipo datetime en la columna Fecha_Extinsion.
- Duración Hrs: Es redundante ya que se tiene la fecha de inicio y de extinsión en formato datetime, entonces se puede calcular restando ambas fechas y pasándo el resultado a horas.
- Pendiente %: Es redundante ya que se convirtió a una variable de tipo numérica en la columna Pendiente_Num.

In [17]:
del df["UTM E"]
del df["UTM N"]
del df["Huso"]
del df["Lat"]
del df["Lon"]
del df["Inicio"]
del df["Detección"]
del df["Aviso"]
del df["Primer ataque"]
del df["Control"]
del df["Extinción"]
del df[" Duración Hrs."]
del df["Pendiente %"]
# Se verifica el borrado de las columnas
df.columns

Index(['Región', 'Provincia', 'Comuna', 'Nombre Incendio', 'Pino 0 a 10',
       'Pino 11 a 17', 'Pino 18 o más', 'Eucalipto', 'Otras Plantaciones',
       'Subtotal Plantaciones', 'Arbolado', 'Matorral', 'Pastizal',
       'Subtotal Vegetación Natural', 'Agrícola', 'Desechos',
       'Subtotal otras Superficies', 'Superficie Total Afectada Has',
       'Día de Inicio', 'Temperatura °C', 'Humedad Relativa %',
       'Dirección Viento', 'Velocidad Viento Km/Hra', 'Topografía',
       'Lat_Number', 'Long_Number', 'Fecha_Inicio', 'Fecha_Deteccion',
       'Fecha_Aviso', 'Fecha_PrimerAtaque', 'Fecha_Control', 'Fecha_Extinsion',
       'Pendiente_Num'],
      dtype='object')

<hr>

### Se cambia el nombre de algunas columnas
- Región => Region
- Nombre Incendio => Nombre_Incendio
- Pino 0 a 10 => Pino_0_10
- Pino 11 a 17 => Pino_11_17
- Pino 18 o más => Pino_18
- Otras Plantaciones => Otras_Plantaciones
- Subtotal Plantaciones => Sub_Plantaciones
- Subtotal Vegetación Natural => Sub_Veg_Natural
- Agrícola => Agricola
- Subtotal otras Superficies => Sub_Otras_Sup
- Superficie Total Afectada Has => Sup_Afectada
- Día de Inicio => Inicio
- Temperatura °C => Temp
- Humedad Relativa % => Humedad
- Dirección Viento => Dir_Viento
- Velocidad Viento Km/Hra => Vel_Viento
- Topografía => Topografia
- Pendiente_Num => Pendiente_Ptje

In [18]:
#Diccionario de los nuevos nombres
nombres_col = {
     "Región" : "Region",
     "Nombre Incendio" : "Nombre_Incendio",
     "Pino 0 a 10" : "Pino_0_10",
     "Pino 11 a 17" : "Pino_11_17",
     "Pino 18 o más" : "Pino_18",
     "Otras Plantaciones" : "Otras_Plantaciones",
     "Subtotal Plantaciones" : "Sub_Plantaciones",
     "Subtotal Vegetación Natural" : "Sub_Veg_Natural",
     "Agrícola" : "Agricola",
     "Subtotal otras Superficies" : "Sub_Otras_Sup",
     "Superficie Total Afectada Has" : "Sup_Afectada",
     "Día de Inicio" : "Inicio",
     "Temperatura °C" : "Temp",
     "Humedad Relativa %" : "Humedad",
     "Dirección Viento" : "Dir_Viento",
     "Velocidad Viento Km/Hra" : "Vel_Viento",
     "Topografía" : "Topografia",
     "Pendiente_Num" : "Pendiente_Ptje"
}
df = df.rename(columns=nombres_col)
df.columns

Index(['Region', 'Provincia', 'Comuna', 'Nombre_Incendio', 'Pino_0_10',
       'Pino_11_17', 'Pino_18', 'Eucalipto', 'Otras_Plantaciones',
       'Sub_Plantaciones', 'Arbolado', 'Matorral', 'Pastizal',
       'Sub_Veg_Natural', 'Agricola', 'Desechos', 'Sub_Otras_Sup',
       'Sup_Afectada', 'Inicio', 'Temp', 'Humedad', 'Dir_Viento', 'Vel_Viento',
       'Topografia', 'Lat_Number', 'Long_Number', 'Fecha_Inicio',
       'Fecha_Deteccion', 'Fecha_Aviso', 'Fecha_PrimerAtaque', 'Fecha_Control',
       'Fecha_Extinsion', 'Pendiente_Ptje'],
      dtype='object')

<hr>

### Se reordenan las columnas

In [19]:
df = df[[
    "Region", 
    "Provincia", 
    "Comuna", 
    "Lat_Number", 
    "Long_Number", 
    "Nombre_Incendio",
    "Pino_0_10",
    "Pino_11_17", 
    "Pino_18", 
    "Eucalipto",
    "Otras_Plantaciones",
    "Sub_Plantaciones",
    "Arbolado",
    "Matorral",
    "Pastizal",
    "Sub_Veg_Natural",
    "Agricola",
    "Desechos",
    "Sub_Otras_Sup",
    "Sup_Afectada",
    "Inicio",
    "Temp",
    "Humedad",
    "Pendiente_Ptje",
    "Dir_Viento",
    "Vel_Viento",
    "Topografia",
    "Fecha_Inicio",
    "Fecha_Deteccion",
    "Fecha_Aviso",
    "Fecha_PrimerAtaque",
    "Fecha_Control",
    "Fecha_Extinsion"]]
df.columns

Index(['Region', 'Provincia', 'Comuna', 'Lat_Number', 'Long_Number',
       'Nombre_Incendio', 'Pino_0_10', 'Pino_11_17', 'Pino_18', 'Eucalipto',
       'Otras_Plantaciones', 'Sub_Plantaciones', 'Arbolado', 'Matorral',
       'Pastizal', 'Sub_Veg_Natural', 'Agricola', 'Desechos', 'Sub_Otras_Sup',
       'Sup_Afectada', 'Inicio', 'Temp', 'Humedad', 'Pendiente_Ptje',
       'Dir_Viento', 'Vel_Viento', 'Topografia', 'Fecha_Inicio',
       'Fecha_Deteccion', 'Fecha_Aviso', 'Fecha_PrimerAtaque', 'Fecha_Control',
       'Fecha_Extinsion'],
      dtype='object')

In [20]:
# Se aprecian aquellos campos que sean de tipo cadena de caracteres
print(df.dtypes)

Region                        object
Provincia                     object
Comuna                        object
Lat_Number                   float64
Long_Number                  float64
Nombre_Incendio               object
Pino_0_10                    float64
Pino_11_17                   float64
Pino_18                      float64
Eucalipto                    float64
Otras_Plantaciones           float64
Sub_Plantaciones             float64
Arbolado                     float64
Matorral                     float64
Pastizal                     float64
Sub_Veg_Natural              float64
Agricola                     float64
Desechos                     float64
Sub_Otras_Sup                float64
Sup_Afectada                 float64
Inicio                        object
Temp                         float64
Humedad                      float64
Pendiente_Ptje               float64
Dir_Viento                    object
Vel_Viento                   float64
Topografia                    object
F

In [21]:
# Se normalizan los campos de texto
def LimpiarCampo(texto):
    if(texto is not np.nan):
        texto = texto.upper()
        texto = re.sub(r"Á|Ä|Â|À", "A", texto)
        texto = re.sub(r"É|Ë|Ê|È", "E", texto)
        texto = re.sub(r"Í|Ï|Î|Ì", "I", texto)
        texto = re.sub(r"Ó|Ö|Ô|Ò", "O", texto)
        texto = re.sub(r"Ú|Ü|Û|Ù", "U", texto)
        return texto
    else:
        return np.nan

df["Region"] = df["Region"].apply(LimpiarCampo)
df["Provincia"] = df["Provincia"].apply(LimpiarCampo)
df["Comuna"] = df["Comuna"].apply(LimpiarCampo)
df["Nombre_Incendio"] = df["Nombre_Incendio"].apply(LimpiarCampo)
df["Inicio"] = df["Inicio"].apply(LimpiarCampo)
df["Dir_Viento"] = df["Dir_Viento"].apply(LimpiarCampo)
df["Topografia"] = df["Topografia"].apply(LimpiarCampo)
df.head()

Unnamed: 0,Region,Provincia,Comuna,Lat_Number,Long_Number,Nombre_Incendio,Pino_0_10,Pino_11_17,Pino_18,Eucalipto,...,Pendiente_Ptje,Dir_Viento,Vel_Viento,Topografia,Fecha_Inicio,Fecha_Deteccion,Fecha_Aviso,Fecha_PrimerAtaque,Fecha_Control,Fecha_Extinsion
0,VALPARAISO,ISLA DE PASCUA,ISLA DE PASCUA,-27.163333,-109.389167,HANGA HEMU,0.0,0.0,0.0,0.0,...,5.0,NW,11.0,SUAVE,2017-07-05 12:20:00,2017-07-05 12:25:00,2017-07-05 12:25:00,2017-07-05 13:15:00,2017-07-05 13:45:00,2017-07-05 14:10:00
1,VALPARAISO,ISLA DE PASCUA,ISLA DE PASCUA,-27.138056,-109.29,VAITOIRI,0.0,0.0,0.0,0.0,...,5.0,NW,9.0,SUAVE,2017-07-07 12:20:00,2017-07-07 12:25:00,2017-07-07 12:25:00,2017-07-07 13:30:00,2017-07-07 13:45:00,2017-07-07 14:00:00
2,VALPARAISO,ISLA DE PASCUA,ISLA DE PASCUA,-27.136389,-109.298611,HANGA MAI HIKU,0.0,0.0,0.0,0.0,...,0.0,N,16.0,SUAVE,2017-07-14 06:40:00,2017-07-14 06:50:00,2017-07-14 06:50:00,2017-07-14 06:50:00,2017-07-14 09:20:00,2017-07-14 09:20:00
3,VALPARAISO,ISLA DE PASCUA,ISLA DE PASCUA,-27.138333,-109.29,VAITOIRI 1,0.0,0.0,0.0,0.0,...,5.0,N,9.0,SUAVE,2017-07-19 11:45:00,2017-07-19 11:47:00,2017-07-19 11:48:00,2017-07-19 12:45:00,2017-07-19 13:15:00,2017-07-19 13:50:00
4,VALPARAISO,ISLA DE PASCUA,ISLA DE PASCUA,-27.138056,-109.29,VAITOIRI 2,0.0,0.0,0.0,0.0,...,5.0,N,9.0,SUAVE,2017-07-19 12:25:00,2017-07-19 12:28:00,2017-07-19 12:30:00,2017-07-19 13:30:00,2017-07-19 13:45:00,2017-07-19 14:00:00


### Se exporta el nuevo dataframe

In [22]:
df_copia = df
# Se crea el objeto que escribe el dataset
writer = pd.ExcelWriter('Dataset_IncendiosForestales_Limpio.xlsx')
# Se setea el data set sin los indices que atribuye pandas
df_copia.to_excel(writer, index=False)
# Se guarda el dataset en cuestion
writer.save()
print('Se ha exportado el excel.')

Se ha exportado el excel.


### Se revisa que el dataset se haya exportado y se hayan respetado los tipos de variables

In [23]:
df2 = pd.read_excel("Dataset_IncendiosForestales_Limpio.xlsx")
df2.head()

Unnamed: 0,Region,Provincia,Comuna,Lat_Number,Long_Number,Nombre_Incendio,Pino_0_10,Pino_11_17,Pino_18,Eucalipto,...,Pendiente_Ptje,Dir_Viento,Vel_Viento,Topografia,Fecha_Inicio,Fecha_Deteccion,Fecha_Aviso,Fecha_PrimerAtaque,Fecha_Control,Fecha_Extinsion
0,VALPARAISO,ISLA DE PASCUA,ISLA DE PASCUA,-27.163333,-109.389167,HANGA HEMU,0.0,0.0,0.0,0.0,...,5.0,NW,11.0,SUAVE,2017-07-05 12:20:00.000000,2017-07-05 12:25:00,2017-07-05 12:25:00.000000,2017-07-05 13:15:00.000001,2017-07-05 13:44:59.999999,2017-07-05 14:10:00.000000
1,VALPARAISO,ISLA DE PASCUA,ISLA DE PASCUA,-27.138056,-109.29,VAITOIRI,0.0,0.0,0.0,0.0,...,5.0,NW,9.0,SUAVE,2017-07-07 12:20:00.000000,2017-07-07 12:25:00,2017-07-07 12:25:00.000000,2017-07-07 13:30:00.000000,2017-07-07 13:44:59.999999,2017-07-07 14:00:00.000001
2,VALPARAISO,ISLA DE PASCUA,ISLA DE PASCUA,-27.136389,-109.298611,HANGA MAI HIKU,0.0,0.0,0.0,0.0,...,0.0,N,16.0,SUAVE,2017-07-14 06:40:00.000000,2017-07-14 06:50:00,2017-07-14 06:50:00.000000,2017-07-14 06:50:00.000000,2017-07-14 09:20:00.000000,2017-07-14 09:20:00.000000
3,VALPARAISO,ISLA DE PASCUA,ISLA DE PASCUA,-27.138333,-109.29,VAITOIRI 1,0.0,0.0,0.0,0.0,...,5.0,N,9.0,SUAVE,2017-07-19 11:45:00.000001,2017-07-19 11:47:00,2017-07-19 11:48:00.000000,2017-07-19 12:45:00.000000,2017-07-19 13:15:00.000001,2017-07-19 13:50:00.000000
4,VALPARAISO,ISLA DE PASCUA,ISLA DE PASCUA,-27.138056,-109.29,VAITOIRI 2,0.0,0.0,0.0,0.0,...,5.0,N,9.0,SUAVE,2017-07-19 12:25:00.000000,2017-07-19 12:28:00,2017-07-19 12:30:00.000001,2017-07-19 13:30:00.000000,2017-07-19 13:44:59.999999,2017-07-19 14:00:00.000001


In [24]:
df2.dtypes

Region                        object
Provincia                     object
Comuna                        object
Lat_Number                   float64
Long_Number                  float64
Nombre_Incendio               object
Pino_0_10                    float64
Pino_11_17                   float64
Pino_18                      float64
Eucalipto                    float64
Otras_Plantaciones           float64
Sub_Plantaciones             float64
Arbolado                     float64
Matorral                     float64
Pastizal                     float64
Sub_Veg_Natural              float64
Agricola                     float64
Desechos                     float64
Sub_Otras_Sup                float64
Sup_Afectada                 float64
Inicio                        object
Temp                         float64
Humedad                      float64
Pendiente_Ptje               float64
Dir_Viento                    object
Vel_Viento                   float64
Topografia                    object
F