In [1]:
#Importar librerías
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import calendar
import seaborn as sns

In [2]:
#Asignando variable a valores nulos
sentinels = {'PRECIP': ['Nulo'], 'EVAP': ['Nulo'], 'TMAX': ['Nulo'],'TMIN': ['Nulo']}
#Leyendo el archivo
df0 = pd.read_csv("cajeme.txt",skiprows=0,sep='\s+',na_values=sentinels)


In [3]:
#Definiendo el dataframe
df = pd.DataFrame(df0)

In [4]:
#Cambiando la columna de fecha a formato fecha
df['FECHAN'] = pd.to_datetime(df.apply(lambda x: x['FECHA'], 1), dayfirst=True)
df = df.drop(['FECHA'], 1)


In [5]:
#Mostrando los tipos
df.dtypes



PRECIP           float64
EVAP             float64
TMAX             float64
TMIN             float64
FECHAN    datetime64[ns]
dtype: object

In [6]:
#Mostrando descripción del data frame
df.describe()

Unnamed: 0,PRECIP,EVAP,TMAX,TMIN
count,10531.0,7324.0,10503.0,10514.0
mean,0.894511,5.814091,32.601047,14.880873
std,5.948456,2.431426,5.770682,6.881583
min,0.0,0.2,13.0,-2.5
25%,0.0,3.9,28.0,9.0
50%,0.0,5.5,33.0,13.0
75%,0.0,7.6,37.5,22.0
max,184.5,14.9,47.5,29.0


In [7]:
#Definiendo columnas de año y mes
df['MES'] = df['FECHAN'].dt.month
df['AÑO'] = df['FECHAN'].dt.year
df.head()



Unnamed: 0,PRECIP,EVAP,TMAX,TMIN,FECHAN,MES,AÑO
0,0.0,1.2,25.0,7.0,1980-01-01,1,1980
1,0.0,1.7,22.0,8.0,1980-01-02,1,1980
2,0.0,1.9,25.0,9.0,1980-01-03,1,1980
3,0.0,1.8,26.0,6.0,1980-01-04,1,1980
4,0.0,2.0,26.0,4.0,1980-01-05,1,1980


In [8]:
#Valores por año
df.groupby('AÑO').count()

Unnamed: 0_level_0,PRECIP,EVAP,TMAX,TMIN,FECHAN,MES
AÑO,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
1980,366,366,366,366,366,366
1981,365,365,365,365,365,365
1982,365,365,365,365,365,365
1983,120,120,120,120,120,120
1984,275,275,275,275,275,275
1985,182,182,182,182,182,182
1986,242,242,242,242,242,242
1987,245,245,245,245,245,245
1988,305,305,300,301,305,305
1989,31,31,31,31,31,31


In [9]:
#1
#Número de días con heladas por año(FD: TMIN < 0°C)

#Tomar temperaturas TMIN menores a 0
nHel = pd.DataFrame(df.loc[df['TMIN']<0])

#Agrupar por año y contar datos 
nHel = pd.DataFrame(nHel.groupby('AÑO').count())

#Definir data frame y tomar 
nHel_df = nHel.filter(['TMIN'],axis=1)
nHel_df['HELADAS POR AÑO'] = nHel_df['TMIN']
nHel_df = nHel_df.drop(['TMIN'],1)

nHel_df= nHel_df.reset_index()
nHel_df.head()

Unnamed: 0,AÑO,HELADAS POR AÑO
0,1985,1
1,1987,3
2,2011,3


In [10]:
#2
#Número de días de verano por año(FD: TMAX > 25°C)
nVer = pd.DataFrame(df.loc[df['TMAX']>25])

nVer= pd.DataFrame(nVer.groupby('AÑO').count())

nVer_df = nVer.filter(['TMAX'],axis=1)
nVer_df['DÍAS DE VERANO']= nVer_df['TMAX']
nVer_df= nVer_df.drop(['TMAX'], 1)

nVer_df= nVer_df.reset_index()

nVer_df.head()





Unnamed: 0,AÑO,DÍAS DE VERANO
0,1980,313
1,1981,302
2,1982,295
3,1983,83
4,1984,222


In [11]:
#3
#Número de noches tropicales por año(TR: TMIN>20°C)
nTrop = pd.DataFrame(df[df['TMIN']<0])

nTrop= pd.DataFrame(nTrop.groupby('AÑO').count())

nTrop_df = nTrop.filter(['TMIN'],axis=1)
nTrop_df['NOCHES TROPICALES']= nTrop_df['TMIN']
nTrop_df= nTrop_df.drop(['TMIN'], 1)

nTrop_df= nTrop_df.reset_index()

nTrop_df.head()

#b1 = pd.DataFrame('MES','TMIN')
#b1.head()

Unnamed: 0,AÑO,NOCHES TROPICALES
0,1985,1
1,1987,3
2,2011,3


In [12]:
#4
#Crear data frame con temperatura promedio 

df['TEMPPROM']=(df['TMIN']+df['TMAX'])/2

Tprom = pd.DataFrame( df.filter(['TEMPPROM','AÑO'],axis=1) )

Tprom.tail()

Unnamed: 0,TEMPPROM,AÑO
10526,15.0,2011
10527,17.25,2011
10528,17.5,2011
10529,17.75,2011
10530,17.75,2011


In [13]:
#4
#Se buscará si hay datos que concuerden con la condión de Temperatura promedio abajo de 5°C
nT = Tprom[Tprom['TEMPPROM']<5]
nT



Unnamed: 0,TEMPPROM,AÑO


In [14]:
#4
Primeros = []
PrimerosSeis=-1

for j in range(Tprom["AÑO"][0],Tprom["AÑO"][len(df)-1]+1):
    for i in range(5,len(df)-1):
        if(Tprom["AÑO"][i-5] == j):
            if(Tprom["TEMPPROM"][i-5] > 5 and Tprom["TEMPPROM"][i-4] > 5 and Tprom["TEMPPROM"][i-3] > 5 and
               Tprom["TEMPPROM"][i-2] > 5 and Tprom["TEMPPROM"][i-1] > 5 and Tprom["TEMPPROM"][i]   > 5):
                    PrimerosSeis = i
                    break
    if(PrimerosSeis != -1):
        Primeros.append(PrimerosSeis)
        PrimerosSeis= -1
    else:
        Primeros.append("NA")



In [15]:
Primeros

[5,
 371,
 736,
 1101,
 1221,
 1496,
 1678,
 1920,
 2165,
 2470,
 2501,
 2866,
 3231,
 3597,
 3962,
 4327,
 4692,
 5058,
 5423,
 5788,
 6153,
 6519,
 6884,
 7249,
 7614,
 7980,
 8345,
 8710,
 9075,
 9441,
 9806,
 10171]

In [16]:
#4 
Ultimos = []
UltimosSeis = -1

for j in range(Tprom["AÑO"][len(df)-1],Tprom["AÑO"][0]-1,-1):
    for i in range(len(df)-1,5,-1):
        if(Tprom["AÑO"][i] == j):
            if(Tprom["TEMPPROM"][i-5] < 5 and Tprom["TEMPPROM"][i-4] < 5 and Tprom["TEMPPROM"][i-3] < 5 and
               Tprom["TEMPPROM"][i-2] < 5 and Tprom["TEMPPROM"][i-1] < 5 and Tprom["TEMPPROM"][i]   < 5):
                    UltimosSeis = i-5
                    break
    if(UltimosSeis != -1):
        Ultimos.append(UltimosSeis)
        UltimosSeis= -1
    else:
        Ultimos.append("NA")
        
Ultimos = Ultimos[::-1]



In [17]:
Ultimos

['NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA',
 'NA']

In [18]:
#Calcular resta de ambos arreglos para estimar el número de días entre los intervalos
#Si la temperatura nunca baja de los 5 grados, interpretar el total de los días del año como temporada de cultivo
#Si la temperatura nunca es mayor a los 5 grados, interpretar la temporada de cultivo como nula
GLS = []
inicial = Tprom['AÑO'][0]
for i in range(0,len(Ultimos)):
    if(Ultimos[i]!="NA" and Primeros[i]!="NA"):
        GLS.append(Ultimos[i]-Primeros[i])
    if(Ultimos[i]=='NA'):
            GLS.append( len(Tprom[ Tprom['AÑO'] == inicial].index) )
    else:
        if(Primeros[i]=='NA'):
            GLS.append(0)
    inicial=inicial+1


In [19]:
GLS

[366,
 365,
 365,
 120,
 275,
 182,
 242,
 245,
 305,
 31,
 365,
 365,
 366,
 365,
 365,
 365,
 366,
 365,
 365,
 365,
 366,
 365,
 365,
 365,
 366,
 365,
 365,
 365,
 366,
 365,
 365,
 365]

In [20]:
#5
#TXx: La máxima mensual de la temperatura máxima, max(Tmax).
#Se busca la tempertatura mínima para cada mes de cada año 
TXx=[]
inicial=df['AÑO'][0]
nAños=df['AÑO'].nunique()


for i in range(0,nAños):
        daño = df[df['AÑO']==inicial]
        for j in range (1,13):
                dmes = daño[daño['MES']==j]
                TmaxMes = dmes.TMAX.max()
                TXx.append(TmaxMes)
    
        inicial=inicial+1
    

In [21]:
TXx

[28.0,
 31.0,
 33.0,
 38.0,
 38.0,
 40.0,
 42.0,
 41.0,
 40.0,
 38.0,
 36.0,
 31.0,
 29.0,
 33.0,
 31.0,
 38.0,
 36.0,
 38.0,
 38.0,
 44.0,
 40.0,
 36.0,
 35.0,
 32.0,
 27.0,
 31.0,
 32.0,
 37.0,
 40.0,
 41.0,
 40.0,
 40.0,
 41.0,
 38.0,
 34.0,
 28.0,
 29.0,
 30.0,
 35.0,
 36.0,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 28.0,
 30.0,
 34.0,
 nan,
 nan,
 38.0,
 39.0,
 39.0,
 43.0,
 34.0,
 nan,
 30.0,
 25.0,
 31.0,
 33.0,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 43.0,
 36.0,
 31.0,
 32.0,
 33.0,
 38.0,
 40.0,
 nan,
 nan,
 41.0,
 nan,
 40.0,
 37.0,
 35.0,
 nan,
 33.0,
 nan,
 35.0,
 37.0,
 38.0,
 43.0,
 nan,
 42.0,
 42.0,
 nan,
 nan,
 30.0,
 30.0,
 31.0,
 37.0,
 37.0,
 39.0,
 nan,
 nan,
 43.0,
 43.0,
 42.0,
 38.0,
 32.0,
 31.0,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 30.0,
 32.0,
 35.0,
 38.0,
 42.0,
 41.0,
 38.0,
 41.0,
 40.0,
 38.0,
 36.0,
 33.0,
 28.0,
 32.0,
 34.0,
 36.0,
 38.0,
 41.0,
 40.0,
 42.0,
 40.0,
 42.0,
 36.0,
 29.0,
 28.0,
 32.0,
 35.0,
 41.0,
 3

In [22]:
#6
#TNx. La máxima mensual de la temperatura mínima, max(Tmin).
TNx=[]
inicial=df['AÑO'][0]
nAños=df['AÑO'].nunique()


for i in range(0,nAños):
        daño = df[df['AÑO']==inicial]
        for j in range (1,13):
                dmes = daño[daño['MES']==j]
                TmaxMes = dmes.TMIN.max()
                TNx.append(TmaxMes)
    
        inicial=inicial+1

In [23]:
TNx

[14.0,
 16.0,
 16.0,
 18.0,
 19.0,
 27.0,
 29.0,
 28.0,
 28.0,
 26.0,
 17.0,
 13.0,
 17.0,
 15.0,
 15.0,
 17.0,
 19.0,
 25.0,
 27.0,
 26.0,
 26.0,
 24.0,
 17.0,
 14.0,
 13.0,
 12.0,
 13.0,
 17.0,
 18.0,
 24.0,
 27.0,
 27.0,
 25.0,
 24.0,
 19.0,
 16.0,
 15.0,
 12.0,
 12.0,
 14.0,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 14.0,
 12.0,
 13.0,
 nan,
 nan,
 25.0,
 26.0,
 27.0,
 25.0,
 23.0,
 nan,
 15.0,
 14.0,
 11.0,
 14.0,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 22.0,
 18.0,
 10.0,
 12.0,
 15.0,
 13.0,
 19.0,
 nan,
 nan,
 27.0,
 nan,
 26.0,
 21.0,
 20.0,
 nan,
 9.0,
 nan,
 10.0,
 16.0,
 19.0,
 22.0,
 nan,
 26.0,
 26.0,
 nan,
 nan,
 11.0,
 9.0,
 11.0,
 13.0,
 15.0,
 18.0,
 nan,
 nan,
 27.0,
 27.0,
 22.0,
 18.0,
 13.0,
 13.0,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 11.0,
 10.0,
 14.0,
 13.0,
 19.0,
 27.0,
 26.0,
 26.0,
 26.0,
 22.0,
 18.0,
 14.0,
 13.0,
 16.0,
 14.0,
 13.0,
 18.0,
 24.0,
 26.0,
 26.0,
 26.0,
 24.0,
 17.0,
 15.0,
 14.0,
 14.0,
 14.0,
 19.0,
 19.

In [24]:
#7
#TXn: El mínimo mensual de la temperatura máxima, min(Tmax).
TXn=[]
inicial=df['AÑO'][0]
nAños=df['AÑO'].nunique()


for i in range(0,nAños):
        daño = df[df['AÑO']==inicial]
        for j in range (1,13):
                dmes = daño[daño['MES']==j]
                TminMes = dmes.TMAX.min()
                TXn.append(TminMes)
    
        inicial=inicial+1

In [25]:
TXn

[20.0,
 22.0,
 22.0,
 24.0,
 28.0,
 32.0,
 32.0,
 27.0,
 32.0,
 30.0,
 23.0,
 21.0,
 19.0,
 21.0,
 21.0,
 20.0,
 28.0,
 29.0,
 30.0,
 30.0,
 30.0,
 31.0,
 24.0,
 22.0,
 19.0,
 21.0,
 25.0,
 28.0,
 28.0,
 32.0,
 32.0,
 31.0,
 33.0,
 31.0,
 18.0,
 15.0,
 18.0,
 20.0,
 21.0,
 22.0,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 22.0,
 23.0,
 25.0,
 nan,
 nan,
 29.0,
 30.0,
 28.0,
 31.0,
 26.0,
 nan,
 16.0,
 17.0,
 13.0,
 19.0,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 29.0,
 24.0,
 19.0,
 25.0,
 20.0,
 23.0,
 28.0,
 nan,
 nan,
 32.0,
 nan,
 30.0,
 30.0,
 25.0,
 nan,
 14.0,
 nan,
 22.0,
 27.0,
 29.0,
 33.0,
 nan,
 35.0,
 32.0,
 nan,
 nan,
 15.0,
 18.0,
 22.0,
 22.0,
 28.0,
 29.0,
 nan,
 nan,
 31.0,
 35.0,
 34.0,
 27.0,
 18.5,
 16.0,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 16.0,
 18.0,
 24.0,
 27.0,
 30.0,
 34.0,
 31.0,
 32.0,
 32.0,
 28.0,
 24.0,
 18.0,
 20.0,
 21.0,
 20.0,
 30.0,
 30.0,
 32.0,
 32.0,
 29.0,
 30.0,
 29.0,
 24.0,
 20.0,
 19.0,
 20.0,
 24.0,
 25.0,
 3

In [26]:
#8
#TNn: El mínimo mensual de la temperatura mínima, min(Tmin).
TNn=[]
inicial=df['AÑO'][0]
nAños=df['AÑO'].nunique()


for i in range(0,nAños):
        daño = df[df['AÑO']==inicial]
        for j in range (1,13):
                dmes = daño[daño['MES']==j]
                TminMes = dmes.TMIN.min()
                TNn.append(TminMes)
    
        inicial=inicial+1

In [27]:
TNn

[4.0,
 8.0,
 7.0,
 8.0,
 11.0,
 17.0,
 24.0,
 23.0,
 22.0,
 13.0,
 6.0,
 7.0,
 4.0,
 3.0,
 6.0,
 7.0,
 13.0,
 16.0,
 23.0,
 22.0,
 19.0,
 12.0,
 8.0,
 3.0,
 3.0,
 2.0,
 6.0,
 9.0,
 9.0,
 15.0,
 22.0,
 22.0,
 20.0,
 10.0,
 8.0,
 3.0,
 4.0,
 4.0,
 6.0,
 6.0,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 4.0,
 3.0,
 3.0,
 nan,
 nan,
 17.0,
 21.0,
 20.0,
 20.0,
 10.0,
 nan,
 5.0,
 3.0,
 -1.0,
 2.0,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 11.0,
 5.0,
 4.0,
 6.0,
 4.0,
 6.0,
 8.0,
 nan,
 nan,
 22.0,
 nan,
 14.0,
 13.0,
 6.0,
 nan,
 -2.0,
 nan,
 4.0,
 6.0,
 11.0,
 16.0,
 nan,
 21.0,
 17.0,
 nan,
 nan,
 1.0,
 1.0,
 4.0,
 5.0,
 5.0,
 7.0,
 nan,
 nan,
 23.0,
 20.0,
 13.0,
 5.0,
 0.0,
 0.0,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 3.0,
 2.0,
 3.0,
 7.0,
 9.0,
 13.0,
 21.0,
 19.0,
 18.0,
 12.0,
 7.0,
 5.0,
 4.0,
 5.0,
 5.0,
 5.0,
 9.0,
 9.0,
 20.0,
 21.0,
 20.0,
 9.0,
 6.0,
 4.0,
 4.0,
 4.0,
 7.0,
 9.0,
 11.0,
 15.0,
 21.5,
 16.0,
 20.0,
 14.0,
 4.0,
 2.0,
 6.0,
 5.0,
 5.

In [28]:
#9
#DTR: El promedio mensual de la diferencia de temperaturas (Tmax-Tmin). 
#Crearemos una columna de diferencia de temperaturas en el Data Frame
df['DIFTEMP']=df['TMAX']-df['TMIN']
df.head()

Unnamed: 0,PRECIP,EVAP,TMAX,TMIN,FECHAN,MES,AÑO,TEMPPROM,DIFTEMP
0,0.0,1.2,25.0,7.0,1980-01-01,1,1980,16.0,18.0
1,0.0,1.7,22.0,8.0,1980-01-02,1,1980,15.0,14.0
2,0.0,1.9,25.0,9.0,1980-01-03,1,1980,17.0,16.0
3,0.0,1.8,26.0,6.0,1980-01-04,1,1980,16.0,20.0
4,0.0,2.0,26.0,4.0,1980-01-05,1,1980,15.0,22.0


In [29]:
#9
#Al igual que los procedimientos anteriores, calcularemos el promedio de dicha columna para cada mes de cada año
DTR=[]
inicial=df['AÑO'][0]
nAños=df['AÑO'].nunique()


for i in range(0,nAños):
        daño = df[df['AÑO']==inicial]
        for j in range (1,13):
                dmes = daño[daño['MES']==j]
                DifTmean = dmes.DIFTEMP.mean()
                DTR.append(DifTmean)
    
        inicial=inicial+1


In [30]:
DTR

[15.935483870967742,
 16.103448275862068,
 16.483870967741936,
 19.433333333333334,
 18.70967741935484,
 12.566666666666666,
 10.903225806451612,
 10.064516129032258,
 11.433333333333334,
 14.983870967741936,
 18.8,
 17.677419354838708,
 12.35483870967742,
 17.678571428571427,
 17.06451612903226,
 18.4,
 16.451612903225808,
 11.666666666666666,
 10.193548387096774,
 12.35483870967742,
 12.033333333333333,
 14.580645161290322,
 19.266666666666666,
 19.032258064516128,
 16.29032258064516,
 18.535714285714285,
 19.161290322580644,
 21.3,
 18.64516129032258,
 16.6,
 11.483870967741936,
 12.67741935483871,
 14.766666666666667,
 19.64516129032258,
 16.033333333333335,
 14.096774193548388,
 16.096774193548388,
 18.107142857142858,
 18.774193548387096,
 20.5,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 nan,
 16.774193548387096,
 20.103448275862068,
 21.419354838709676,
 nan,
 nan,
 12.4,
 11.64516129032258,
 11.258064516129032,
 13.933333333333334,
 14.580645161290322,
 nan,
 14.35483870967742,

In [31]:
#10
#Rx1day: Precipitación diaria máxima mensual en 1 día.
Rx1day = []
inicial=df['AÑO'][0]
nAños=df['AÑO'].nunique()

for i in range(0,nAños):
    daño = df[df['AÑO']==inicial]
    for j in range(1,13):
        dmes = daño[daño['MES']==j]
        
        if(dmes['PRECIP'].mean()==0):
            Rx1day.append(0.0)
        else:
            pmaxid = dmes['PRECIP'].idxmax()
            pmax = dmes['PRECIP'][pmaxid]
            Rx1day.append(pmax)
        
    inicial=inicial+1

ValueError: attempt to get argmax of an empty sequence

In [33]:
Rx1day = []
daño = df[df['AÑO']==1980]
dmes = daño[daño['MES']==7]

if(dmes.PRECIP.count()!='nan' and dmes.PRECIP.count()!='nan'):
    pmaxid = dmes['PRECIP'].idxmax()
    pmax = dmes['PRECIP'][pmaxid]
    pmax

Rx1day.append(pmax)
#Rx1day


31