In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

In [2]:
sentinels = {'PRECIP': ['Nulo'], 'EVAP': ['Nulo'], 'TMAX': ['Nulo'],'TMIN': ['Nulo']}

In [3]:
datos_df = pd.read_csv("cajeme.txt",skiprows=0, sep='\s+',na_values=sentinels)

In [4]:
df = pd.DataFrame(datos_df)

In [5]:
df['FECHAN'] = pd.to_datetime(df.apply(lambda x: x['FECHA'], 1), dayfirst=True)
df = df.drop(['FECHA'], 1)

In [6]:
df['MES'] = df['FECHAN'].dt.month
df['AÑO'] = df['FECHAN'].dt.year

In [7]:
#Contamos el número de valores disponibles por año.
df.groupby('AÑO').count()

Unnamed: 0_level_0,PRECIP,EVAP,TMAX,TMIN,FECHAN,MES
AÑO,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
1980,366,366,366,366,366,366
1981,365,365,365,365,365,365
1982,365,365,365,365,365,365
1983,120,120,120,120,120,120
1984,275,275,275,275,275,275
1985,182,182,182,182,182,182
1986,242,242,242,242,242,242
1987,245,245,245,245,245,245
1988,305,305,300,301,305,305
1989,31,31,31,31,31,31


In [8]:
#Seleccionamos los días con heladas; es decir temperaturas mínimas menores a 0C, y contamos el número de ocurrencia para
#cada año.
TempHel = pd.DataFrame(df.loc[df['TMIN']<0])
TempHel.groupby('AÑO').count()

Unnamed: 0_level_0,PRECIP,EVAP,TMAX,TMIN,FECHAN,MES
AÑO,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
1985,1,1,1,1,1,1
1987,3,3,3,3,3,3
2011,3,0,3,3,3,3


In [9]:
#Seleccionamos los días con temperaturas de verano; es decir, temperaturas máximas mayores a 25C, y contamos el número de
#ocurrencia para cada año.
TempVer = pd.DataFrame(df.loc[df['TMAX']>25])
TempVer.groupby('AÑO').count()

Unnamed: 0_level_0,PRECIP,EVAP,TMAX,TMIN,FECHAN,MES
AÑO,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
1980,313,313,313,313,313,313
1981,302,302,302,302,302,302
1982,295,295,295,295,295,295
1983,83,83,83,83,83,83
1984,222,222,222,222,222,222
1985,110,110,110,110,110,110
1986,224,224,224,224,224,224
1987,202,202,202,202,202,202
1988,263,263,263,263,263,263
1989,4,4,4,4,4,4


In [10]:
#Seleccionamos los días con noches tropicales; es decir, temperaturas míximas mayores a 20C, y contamos el número de
#ocurrencia para cada año.
TempVer = pd.DataFrame(df.loc[df['TMIN']>20])
TempVer.groupby('AÑO').count()

Unnamed: 0_level_0,PRECIP,EVAP,TMAX,TMIN,FECHAN,MES
AÑO,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
1980,124,124,124,124,124,124
1981,126,126,126,126,126,126
1982,99,99,99,99,99,99
1984,112,112,112,112,112,112
1985,4,4,4,4,4,4
1986,57,57,57,57,57,57
1987,63,63,63,63,63,63
1988,59,59,59,59,59,59
1990,116,116,116,116,116,116
1991,108,108,108,108,108,108


In [11]:
df['TPROM'] = (df.TMAX + df.TMIN)/2
df

Unnamed: 0,PRECIP,EVAP,TMAX,TMIN,FECHAN,MES,AÑO,TPROM
0,0.0,1.2,25.0,7.0,1980-01-01,1,1980,16.00
1,0.0,1.7,22.0,8.0,1980-01-02,1,1980,15.00
2,0.0,1.9,25.0,9.0,1980-01-03,1,1980,17.00
3,0.0,1.8,26.0,6.0,1980-01-04,1,1980,16.00
4,0.0,2.0,26.0,4.0,1980-01-05,1,1980,15.00
5,0.0,1.8,20.0,7.0,1980-01-06,1,1980,13.50
6,0.0,1.3,25.0,6.0,1980-01-07,1,1980,15.50
7,0.0,1.9,25.0,4.0,1980-01-08,1,1980,14.50
8,0.0,1.8,25.0,6.0,1980-01-09,1,1980,15.50
9,0.0,2.0,26.0,8.0,1980-01-10,1,1980,17.00


In [12]:
#Realizamos un contador que cuente los dìas donde la temperatura promedio es mayor a 5C, así como los primeros seis días
#consecutivos en donde se cumple lo anterior. Llamamos a estos días como "primeros días" ya que son los primeros días
#de la Estación de Cultivo.
primdias = []
primseis=-1

for j in range(df["AÑO"][0],df["AÑO"][len(df)-1]+1):
    for i in range(5,len(df)-1):
        if(df["AÑO"][i-5] == j):
            if(df["TPROM"][i-5] > 5 and df["TPROM"][i-4] > 5 and df["TPROM"][i-3] > 5 and
               df["TPROM"][i-2] > 5 and df["TPROM"][i-1] > 5 and df["TPROM"][i]   > 5):
                    primseis = i
                    break
    if(primseis != -1):
        primdias.append(primseis)
        primseis= -1
    else:
        primdias.append("NA")

In [13]:
#Realizamos ahora un contador que cuente los dìas donde la temperatura promedio es menor a 5C, así como los primeros seis días
#consecutivos en donde se cumple lo anterior. Llamamos a estos días como los "últimos días" ya que son los últimos días 
#de la Temporada de Cultivo.
ultdias = []
ultseis = -1

for j in range(df["AÑO"][len(df)-1],df["AÑO"][0]-1,-1):
    for i in range(len(df)-1,5,-1):
        if(df["AÑO"][i] == j):
            if(df["TPROM"][i-5] < 5 and df["TPROM"][i-4] < 5 and df["TPROM"][i-3] < 5 and
               df["TPROM"][i-2] < 5 and df["TPROM"][i-1] < 5 and df["TPROM"][i]   < 5):
                    ultseis = i-5
                    break
    if(ultseis != -1):
        ultdias.append(ultseis)
        ultseis= -1
    else:
        ultdias.append("NA")

In [14]:
#Con los valores que obtuvimos con los pasos anteriores, calculamos la Temporada de Cultivo (Growing Season Large)
#de nuestra región. Este intervalo se interpreta como desde los primeros seis días seguidos donde la temperatura 
#fue mayor a 5C hasta los últimos seis días donde la temperatura fue menor a 5C, calculando esto como una diferencia 
#de número de días entre ambos arreglos.
GSL = []
inicial = df['AÑO'][0]
for i in range(0,len(ultdias)):
    if(ultdias[i]!="NA" and primdias[i]!="NA"):
        GSL.append(ultdias[i]-primdias[i])
    if(ultdias[i]=='NA'):
            GSL.append( len(df[df['AÑO'] == inicial].index) )
    else:
        if(primdias[i]=='NA'):
            GSL.append(0)
    inicial=inicial+1

In [15]:
#Mostramos los días de Temporada de Cultivo (GSL)
GSL

[366,
 365,
 365,
 120,
 275,
 182,
 242,
 245,
 305,
 31,
 365,
 365,
 366,
 365,
 365,
 365,
 366,
 365,
 365,
 365,
 366,
 365,
 365,
 365,
 366,
 365,
 365,
 365,
 366,
 365,
 365,
 365]

In [17]:
#Buscamos la temperatura máxima mensual de la Temperatura Máxima (TXx)
TXx=[]
inicial=df['AÑO'][0]
nAños=df['AÑO'].nunique()


for i in range(0,nAños):
        df_año = df[df['AÑO']==inicial]
        for j in range (1,13):
                df_mes = df_año[df_año['MES']==j]
                TMAXMES = df_mes.TMAX.max()
                TXx.append(TMAXMES)    
        inicial=inicial+1

In [18]:
#Buscamos la temperatura máxima mensual de la Temperatura Mínima (TNX)
TNx=[]
inicial=df['AÑO'][0]
nAños=df['AÑO'].nunique()


for i in range(0,nAños):
        df_año = df[df['AÑO']==inicial]
        for j in range (1,13):
                df_mes = df_año[df_año['MES']==j]
                TMAXMES = df_mes.TMIN.max()
                TNx.append(TMAXMES)
        inicial=inicial+1

In [19]:
#Buscamos la temperatura mínima mensual de la Temperatura Máxima (TXn)
TXn=[]
inicial=df['AÑO'][0]
nAños=df['AÑO'].nunique()


for i in range(0,nAños):
        df_año = df[df['AÑO']==inicial]
        for j in range (1,13):
                df_mes = df_año[df_año['MES']==j]
                TMINMES = df_mes.TMAX.min()
                TXn.append(TMINMES)
        inicial=inicial+1

In [20]:
#Buscamos la temperatura mínima mensual de la Temperatura Mínima (TNn)
TNn=[]
inicial=df['AÑO'][0]
nAños=df['AÑO'].nunique()


for i in range(0,nAños):
        df_año = df[df['AÑO']==inicial]
        for j in range (1,13):
                df_mes = df_año[df_año['MES']==j]
                TMINMES = df_mes.TMIN.min()
                TNn.append(TMINMES)
        inicial=inicial+1

In [23]:
#Calculamos la diferencia de temperaturas y colocamos los valores en una columna de nuestro
#dataframe
df['TDIF'] = (df.TMAX - df.TMIN)

#Para el promedio mensual de diferencia de temperaturas, realizamos un arreglo que calcule el promedio de cada mes:
DTR=[]
inicial=df['AÑO'][0]
nAños=df['AÑO'].nunique()


for i in range(0,nAños):
        df_año = df[df['AÑO']==inicial]
        for j in range (1,13):
                df_mes = df_año[df_año['MES']==j]
                TDIFPROM = df_mes.TDIF.mean()
                DTR.append(TDIFPROM)
    
        inicial=inicial+1
DTR

[15.935483870967742,
 16.103448275862068,
 16.483870967741936,
 19.433333333333334,
 18.70967741935484,
 12.566666666666666,
 10.903225806451612,
 10.064516129032258,
 11.433333333333334,
 14.983870967741936,
 18.8,
 17.677419354838708,
 12.35483870967742,
 17.678571428571427,
 17.06451612903226,
 18.4,
 16.451612903225808,
 11.666666666666666,
 10.193548387096774,
 12.35483870967742,
 12.033333333333333,
 14.580645161290322,
 19.266666666666666,
 19.032258064516128,
 16.29032258064516,
 18.535714285714285,
 19.161290322580644,
 21.3,
 18.64516129032258,
 16.6,
 11.483870967741936,
 12.67741935483871,
 14.766666666666667,
 19.64516129032258,
 16.033333333333335,
 14.096774193548388,
 16.096774193548388,
 18.107142857142858,
 18.774193548387096,
 20.5,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 16.774193548387096,
 20.103448275862068,
 21.419354838709676,
 nan,
 nan,
 12.4,
 11.64516129032258,
 11.258064516129032,
 13.933333333333334,
 14.580645161290322,
 nan,
 14.35483870967742,

In [24]:
#Calculamos la precipitación diaria máxima mensual en 1 día (Rx1day)
Rx1day = []
inicial=df['AÑO'][0]
nAños=df['AÑO'].nunique()

for i in range(0,nAños):
    df_año = df[df['AÑO']==inicial]
    for j in range(1,13):
        df_mes = df_año[df_año['MES']==j]
        if(df_mes['PRECIP'].mean()!=0 and df_mes['PRECIP'].count()!=0):
            valmaxid = df_mes['PRECIP'].idxmax()
            valmax = df_mes['PRECIP'][valmaxid]
            Rx1day.append(valmax)
        else:  
            Rx1day.append(0.0)
            
    inicial=inicial+1

In [None]:
#Calculamos la precipitación diaria máxima mensual en 5 días (Rx5day)
Rx1day = []
inicial=df['AÑO'][0]
nAños=df['AÑO'].nunique()

for i in range(0,nAños):
    df_año = df[df['AÑO']==inicial]
    for j in range(1,13):
        df_mes = df_año[df_año['MES']==j]
        if(df_mes['PRECIP'].mean()!=0 and df_mes['PRECIP'].count()!=0):
            valmaxid = df_mes['PRECIP'].idxmax()
            valmax = df_mes['PRECIP'][valmaxid]
            Rx1day.append(valmax)
        else:  
            Rx1day.append(0.0)
            
    inicial=inicial+1