In [1]:
#Importamos las bibliotecas que usameros
import pandas as pd
import numpy as np
import matplotlib as plt
import matplotlib.pyplot as plt
import plotly.tools as tls
import plotly.plotly as py

In [2]:
#Cargamos nuestra base de datos con la que trabajaremos y le cambiamos algunas propiedades
df0= pd.read_csv('caborca.txt', skiprows=20, skipfooter=1, sep='\s+',header=None, names=["NFECHA","PRECIP","EVAP","TMAX","TMIN"], engine='python')
df0.head()

Unnamed: 0,NFECHA,PRECIP,EVAP,TMAX,TMIN
0,01/08/1977,0,11.5,40,27
1,02/08/1977,0,10.9,39,27
2,03/08/1977,0,11.5,42,25
3,04/08/1977,0,11.5,43,24
4,05/08/1977,0,10.8,43,24


In [3]:
#Le damos estructura a los datos
df = pd.DataFrame(df0)

In [4]:
#Tipos de datos que Pandas decteca en nuestros datos
df.dtypes

NFECHA    object
PRECIP    object
EVAP      object
TMAX      object
TMIN      object
dtype: object

In [5]:
#Cambiamos los valores nulos a NaN
df['PRECIP']=df['PRECIP'].str.replace('Nulo','NaN').astype(np.float64)
df['EVAP']=df['EVAP'].str.replace('Nulo','NaN').astype(np.float64)
df['TMAX']=df['TMAX'].str.replace('Nulo','NaN').astype(np.float64)
df['TMIN']=df['TMIN'].str.replace('Nulo','NaN').astype(np.float64)

In [6]:
#Cambiamos el tipo de fecha: de object a Time
df['FECHA']=pd.to_datetime(df.apply(lambda x: x['NFECHA'],1), dayfirst=True)
df=df.drop(['NFECHA'],1)
df.head()

Unnamed: 0,PRECIP,EVAP,TMAX,TMIN,FECHA
0,0.0,11.5,40.0,27.0,1977-08-01
1,0.0,10.9,39.0,27.0,1977-08-02
2,0.0,11.5,42.0,25.0,1977-08-03
3,0.0,11.5,43.0,24.0,1977-08-04
4,0.0,10.8,43.0,24.0,1977-08-05


In [7]:
df.dtypes

PRECIP           float64
EVAP             float64
TMAX             float64
TMIN             float64
FECHA     datetime64[ns]
dtype: object

In [8]:
#Creando nuevas columnas para los meses y los años
df['MONTH']=df['FECHA'].dt.month
df['YEAR']=df['FECHA'].dt.year
df.head()

Unnamed: 0,PRECIP,EVAP,TMAX,TMIN,FECHA,MONTH,YEAR
0,0.0,11.5,40.0,27.0,1977-08-01,8,1977
1,0.0,10.9,39.0,27.0,1977-08-02,8,1977
2,0.0,11.5,42.0,25.0,1977-08-03,8,1977
3,0.0,11.5,43.0,24.0,1977-08-04,8,1977
4,0.0,10.8,43.0,24.0,1977-08-05,8,1977


In [10]:
#Calculando número de días con heladas por año (FD: Tmin < 0ºC)
#Temperaturas que son menores a 0°C
FD = pd.DataFrame(df.loc[df['TMIN']<0])

FD=pd.DataFrame(FD.groupby('YEAR').count())  
#Creando el DataFrame
FDdf=FD.filter(['TMIN'],axis=1)
FDdf['Días con T<0°C'] = FDdf['TMIN']
FDdf= FDdf.drop(['TMIN'],1)

FDdf = FDdf.reset_index()
FDdf

Unnamed: 0,YEAR,Días con T<0°C
0,1978,3
1,1984,1
2,2001,2
3,2002,6
4,2003,8
5,2004,12


In [15]:
#Calculando número de días de verano por año (SU: Tmax > 25ºC)
#Temperaturas que son mayores a 25°C
SU = pd.DataFrame(df.loc[df['TMAX']>25])

SU = pd.DataFrame(SU.groupby('YEAR').count())
#Creando el DataFrame
SUdf = SU.filter(['TMAX'],axis=1)
SUdf['Dias con T>25ºC'] = SUdf['TMAX']
SUdf = SUdf.drop(['TMAX'],1)

SUdf = SUdf.reset_index()
SUdf.head()

Unnamed: 0,YEAR,Dias con T>25ºC
0,1977,113
1,1978,191
2,1979,224
3,1980,242
4,1981,261


In [20]:
#Calculando número de noches tropicales por año (TR: Tmin > 20ºC)

TR = pd.DataFrame(df[df['TMIN']>25])

TR = pd.DataFrame(TR.groupby('YEAR').count())

TRdf = TR.filter(['TMIN'],axis=1)
TRdf['Noches tropicales']= TRdf['TMIN']
TRdf= TRdf.drop(['TMIN'], 1)

TRdf= TRdf.reset_index()
TRdf

Unnamed: 0,YEAR,Noches tropicales
0,1977,10
1,1978,10
2,1979,8
3,1980,17
4,1981,23
5,1982,9
6,1983,19
7,1984,6
8,2001,28
9,2002,22
