In [None]:
# Cargar a la memoria de trabajo las bibliotecas: Pandas (manejo de datos, 
# Numpy (numerical python) y la biblioteca de gráficas Matplotlib
# Se asignan nombres cortos.
import pandas as pd
import numpy as np
import matplotlib
import matplotlib.pyplot as plt

# Usar "Shift+Enter" para procesar la información de la celda
#

In [None]:
sentinels = {'PRECIP': ['Nulo'],'EVAP':['Nulo'],'TMAX':['Nulo'],'TMIN':['Nulo']}

In [None]:
# Descarga los datos de la Información Climatológica por Estado.
# http://smn.cna.gob.mx/es/informacion-climatologica-por-estado?estado=son
# Lee un archivo de texto con la función Pandas "read_csv", con elementos separados por mas de 
# un espacio, brincándose 20 renglones del inicio (encabezados)
df0 = pd.read_csv('Bacadehuachi.txt', skiprows=20, sep='\s+', header=None,names = ["DD/MM/AAAA", "PRECIP", "EVAP", "TMAX", "TMIN"],na_values=sentinels)
#Precipitación y Evaporación en milímetros.
#Temperatura máxima y mínima en °C.
# "Shift + Enter"

In [None]:
#Se muestran los primeros 5 renglones del archivo.
df0.head()

In [None]:
#Se muestran los últimos 5 valores de la tabla.
df0.tail()

In [None]:
#Tipos de variables.
df0.dtypes

In [None]:
# Convertir la columna Fecha a una variable tiempo.
# Se crea una nueva columna "Fecha" al final con formato de tiempo.
# Eliminamos las dos primeras columnas que ya no necesitaremos
df0['FECHA'] = pd.to_datetime(df0.apply(lambda x: x['DD/MM/AAAA'] , 1), dayfirst=True)
df0 = df0.drop(['DD/MM/AAAA'], 1)

In [None]:
#Vuelvo a mostrar los primeros renglones de la tabla.
df0.head()

In [None]:
#Verificación de la variable fecha como variable de tiempo.
df0.dtypes

In [None]:
#Calcular el promedio de cada columna.
df0.mean()

In [None]:
#Desviación estándar de cada columna.
df0.std()

In [None]:
#Mediana de los datos de cada columna.
df0.median()

In [None]:
#Valor máximo en cada columna.
df0.max()

In [None]:
#Valor mínimo de cada columna.
df0.min()

In [None]:
#Valores de la tabla
df0.describe()

In [None]:
#Para localizar un dato
df0.iloc[[74]]

In [None]:
#Para localizar el índice con la temperatura máxima
tmax=df0.TMAX.idxmax()
tmax

In [None]:
#Mostrar entonces la fila con el índice con la temperatura máxima
df0.iloc[[tmax]]

In [None]:
#Sumatoria de los datos de cada columna
df0.sum()

In [None]:
#Creamos una nueva columna columna para el mes.
#La tabla solo tiene los meses de noviembre y diciembre del año 1963, y enero de 1964.
df0['MES'] = df0['FECHA'].dt.month
df0['AÑO'] = df0['FECHA'].dt.year
df0.head()

In [None]:
#Asignamos el mes correspondiente a cada número.
df0_ENE = df0[df0.MES==1]
df0_FEB = df0[df0.MES==2]
df0_MAR = df0[df0.MES==3]
df0_ABR = df0[df0.MES==4]
df0_MAY = df0[df0.MES==5]
df0_JUN = df0[df0.MES==6]
df0_JUL = df0[df0.MES==7]
df0_AGO = df0[df0.MES==8]
df0_SEP = df0[df0.MES==9]
df0_OCT = df0[df0.MES==10]
df0_NOV = df0[df0.MES==11]
df0_DIC = df0[df0.MES==12]

In [None]:
#Hacemos la sumatoria de las precipitaciones.
#SP es el promedio de precipitación de cada mes.
SP_ENE = df0_ENE.PRECIP.sum()
print("Enero = ",SP_ENE)
SP_FEB = df0_FEB.PRECIP.sum()
print("Febrero = ",SP_FEB)
SP_MAR = df0_MAR.PRECIP.sum()
print("Marzo = ",SP_MAR)
SP_ABR = df0_ABR.PRECIP.sum()
print("Abril = ",SP_ABR)
SP_MAY = df0_MAY.PRECIP.sum()
print("Mayo = ",SP_MAY)
SP_JUN = df0_JUN.PRECIP.sum()
print("Junio = ",SP_JUN)
SP_JUL = df0_JUL.PRECIP.sum()
print("Julio = ",SP_JUL)
SP_AGO = df0_AGO.PRECIP.sum()
print("Agosto = ",SP_AGO)
SP_SEP = df0_SEP.PRECIP.sum()
print("Septiembre = ",SP_SEP)
SP_OCT = df0_OCT.PRECIP.sum()
print("Octubre = ",SP_OCT)
SP_NOV = df0_NOV.PRECIP.sum()
print("Noviembre = ",SP_NOV)
SP_DIC = df0_DIC.PRECIP.sum()
print("Diciembre = ",SP_DIC)

In [None]:
#Graficamos el promedio de precipitación de cada mes:
meses = ('ENE','FEB','MAR','ABR','MAY','JUN','JUL','AGO','SEP','OCT','NOV','DIC')
#Para que la tabla abarque los valores de los promedio de las precipitaciones.
y_pos = np.arange(len(meses))
PreTot = [SP_ENE,SP_FEB,SP_MAR,SP_ABR,SP_MAY,SP_JUN,SP_JUL,SP_AGO,SP_SEP,SP_OCT,SP_NOV,SP_DIC]

#Para hacer la gráfica:
plt.bar(y_pos, PreTot,align='center', alpha=0.3)

#Poner los meses en el eje de las "x".
plt.xticks(y_pos, meses)
plt.ylabel('Precipitación por mes (mm)')
plt.title('Total de precipitación por meses (1963-2011)')
plt.savefig('RainMeses',plt=2000)
plt.show()

In [None]:
#Por lo tanto, podemos observar que el mes con más precipitaciones 
#es el mes de Julio.

In [None]:
#Para calcular los meses más fríos, sacamos un promedio de las temperaturas mínimas de cada mes.
TMIN_ENE = df0_ENE.TMIN.mean()
print("Tmin Enero = ",TMIN_ENE)
TMIN_FEB = df0_FEB.TMIN.mean()
print("Tmin Febrero = ",TMIN_FEB)
TMIN_MAR = df0_MAR.TMIN.mean()
print("Tmin Marzo = ",TMIN_MAR)
TMIN_ABR = df0_ABR.TMIN.mean()
print("Tmin Abril = ",TMIN_ABR)
TMIN_MAY = df0_MAY.TMIN.mean()
print("Tmin Mayo = ",TMIN_MAY)
TMIN_JUN = df0_JUN.TMIN.mean()
print("Tmin Junio = ",TMIN_JUN)
TMIN_JUL = df0_JUL.TMIN.mean()
print("Tmin Julio = ",TMIN_JUL)
TMIN_AGO = df0_AGO.TMIN.mean()
print("Tmin Agosto = ",TMIN_AGO)
TMIN_SEP = df0_SEP.TMIN.mean()
print("Tmin Septiembre = ",TMIN_SEP)
TMIN_OCT = df0_OCT.TMIN.mean()
print("Tmin Octubre = ",TMIN_OCT)
TMIN_NOV = df0_NOV.TMIN.mean()
print("Tmin Noviembre = ",TMIN_NOV)
TMIN_DIC = df0_DIC.TMIN.mean()
print("Tmin Diciembre = ",TMIN_DIC)

In [None]:
#Graficamos las temperaturas mínimas promedio con respecto a los meses.
meses = ('ENE','FEB','MAR','ABR','MAY','JUN','JUL','AGO','SEP','OCT','NOV','DIC')
#Para que la tabla abarque los valores de los promedio de las precipitaciones.
y_pos = np.arange(len(meses))
TminT = [TMIN_ENE,TMIN_FEB,TMIN_MAR,TMIN_ABR,TMIN_MAY,TMIN_JUN,TMIN_JUL,TMIN_AGO,TMIN_SEP,TMIN_OCT,TMIN_NOV,TMIN_DIC]

#Para hacer la gráfica:
plt.bar(y_pos, TminT,align='center', alpha=0.6)

#Poner los meses en el eje de las "x".
plt.xticks(y_pos, meses)
plt.ylabel('Promedio de temperaturas mínimas por meses (°C)')
plt.title('Promedio de temperaturas mínimas por meses (1963-2011)')
plt.savefig('TempMinMeses',plt=2000)
plt.show()


In [None]:
#Podemos observar que el mes con las temperaturas más bajas en promedio es Enero
#con una temperatura media de alrededor de 2.5°C.

In [None]:
#Para calcular los meses más cálidos, sacamos un promedio de las temperaturas máximas de cada mes.
TMAX_ENE = df0_ENE.TMAX.mean()
print("Tmáx Enero = ",TMAX_ENE)
TMAX_FEB = df0_FEB.TMAX.mean()
print("Tmáx Febrero = ",TMAX_FEB)
TMAX_MAR = df0_MAR.TMAX.mean()
print("Tmáx Marzo = ",TMAX_MAR)
TMAX_ABR = df0_ABR.TMAX.mean()
print("Tmáx Abril = ",TMAX_ABR)
TMAX_MAY = df0_MAY.TMAX.mean()
print("Tmáx Mayo = ",TMAX_MAY)
TMAX_JUN = df0_JUN.TMAX.mean()
print("Tmáx Junio = ",TMAX_JUN)
TMAX_JUL = df0_JUL.TMAX.mean()
print("Tmáx Julio = ",TMAX_JUL)
TMAX_AGO = df0_AGO.TMAX.mean()
print("Tmáx Agosto = ",TMAX_AGO)
TMAX_SEP = df0_SEP.TMAX.mean()
print("Tmáx Septiembre = ",TMAX_SEP)
TMAX_OCT = df0_OCT.TMAX.mean()
print("Tmáx Octubre = ",TMAX_OCT)
TMAX_NOV = df0_NOV.TMAX.mean()
print("Tmáx Noviembre = ",TMAX_NOV)
TMAX_DIC = df0_DIC.TMAX.mean()
print("Tmáx Diciembre = ",TMAX_DIC)

In [None]:
#Graficamos las temperaturas mínimas promedio con respecto a los meses.
meses = ('ENE','FEB','MAR','ABR','MAY','JUN','JUL','AGO','SEP','OCT','NOV','DIC')
#Para que la tabla abarque los valores de los promedio de las precipitaciones.
y_pos = np.arange(len(meses))
TmaxT = [TMAX_ENE,TMAX_FEB,TMAX_MAR,TMAX_ABR,TMAX_MAY,TMAX_JUN,TMAX_JUL,TMAX_AGO,TMAX_SEP,TMAX_OCT,TMAX_NOV,TMAX_DIC]

#Para hacer la gráfica:
plt.bar(y_pos, TmaxT,align='center', alpha=0.9)

#Poner los meses en el eje de las "x".
plt.xticks(y_pos, meses)
plt.ylabel('Promedio de temperaturas máximas por meses (°C)')
plt.title('Promedio de temperaturas máximas por meses (1963-2011)')
plt.savefig('TampMaxMeses',plt=2000)
plt.show()

In [None]:
#Se puede observar entonves que Junio es el mes más cálido con una temperatura
#promedio máxima de alrededor de 40°C. 

In [None]:
#Para calcular cuáles han sido los años más húmedos, nos basamos en la suma de precipitaciones por año
#Creamos un arreglo con los años y con la precipitación total por año
#inicio es el año donde empezamos a contar, en un rango de 48 años hasta el 2011.
#YEAR es el arreglo con los 48 años.
#PYEAR es el arreglo con la suma de precipitaciones por año de los 48 años.
inicio = 1963
YEAR = [inicio + i for i in range(0, 49)]
PYEAR = [ df0[df0.AÑO==(inicio + i)].PRECIP.sum() for i in range(0, 49)]


In [None]:
#Creamos un nuevo Data Frame para los años y las precipitaciones totales.
d0 = {'AÑO': YEAR, 'PRECIPITACIÓN TOTAL': PYEAR}
df1 = pd.DataFrame(data=d0)
df1.head()

In [None]:
df1.tail()

In [None]:
#Graficamos las precipitaciones totales por año.
date = YEAR
T = np.arange(len(date))
Rain = PYEAR

plt.bar(T, Rain, width=0.4, align='center', alpha=0.4)
plt.xticks(T, date, size='xx-small', rotation=90)
plt.ylabel('Precipitación (mm)')
plt.title('Precipitación total por años (1963-2011)')
plt.show()

In [None]:
#De la tabla se puede concluir que el año más húmedo es el de 2007.
#Y de igual manera podemos concluir que el año más seco fue el menos
#lluvioso, en este caso, en 1999.

In [None]:
#Seleccionamos las temperaturas máximas y mínimas de los meses de invierno (diciembre, enero y febrero)
TEMPINV = pd.DataFrame(df0.loc[df0['MES'].isin([12,1,2])])
TEMPINV.head()


In [None]:
#Creamos arreglos para la temperatura promedio máxima y mínima de cada año
#Winter Max
WMAX = [TEMPINV[TEMPINV.AÑO==(inicio + i)].TMAX.mean() for i in range(0,49)]
WMIN = [TEMPINV[TEMPINV.AÑO==(inicio + i)].TMIN.mean() for i in range(0,49)]


In [None]:
#Creamos otro DataFrame para las temperaturas promedio por año
d3 = {'AÑO': YEAR, 'TMAXI': WMAX, 'TMINI': WMIN }
df3 = pd.DataFrame(data=d3)
df3


In [None]:
#Creamos gráficas para la temperatura promedio máxima y mínima en invierno por cada año.
N = np.arange(len(date))

plt.bar(N,WMAX,width=0.4,align='center',alpha=0.7,color='C')
plt.xticks(N,YEAR,size='small',color='c',rotation=90)

plt.bar(N,WMIN,width=0.4,align='center',alpha=0.6,color='y')
plt.xticks(N,YEAR,size='small',color='k',rotation=90)

plt.ylabel('Temperatura (°C)')
plt.title('Temperatura promedio máxima y mínima en invierno (1963-2011)')
plt.gca().legend(('TMAX','TMIN'),frameon=False,loc='upper left')
plt.savefig('Temperaturasprom_invierno',plt=2000)
plt.show()

In [None]:
#Temperatura mínima de las temperaturas máximas.
min=df3.TMINI.idxmin()
df3.iloc[[min]]

In [None]:
#5 temperaturas mínimas
df3.nsmallest(5,'TMINI',keep='first')

In [None]:
df3.nsmallest(5,'TMAXI',keep='first')

In [None]:
df3.iloc[[35]]

In [None]:
#Seleccionamos las temperaturas máximas y mínimas en los meses de verano (Junio, Julio, Agosto, Septiembre)
TV = pd.DataFrame(df0.loc[df0['MES'].isin([6,7,8,9])])
TV.head()

In [None]:
#Creamos arreglos de las temperaturas promedio máximas y mínimas de verano de cada año.
SMAX = [TV[TV.AÑO==(inicio + i)].TMAX.mean() for i in range(0,49)]
SMIN = [TV[TV.AÑO==(inicio + i)].TMIN.mean() for i in range(0,49)]


In [None]:
#Creamos un Dataframe para las temperaturas promedio en verano por cada año.
d4 = {'AÑO': YEAR, 'TVMAX': SMAX, 'TVMIN': SMIN }
df4 = pd.DataFrame(data=d4)
df4


In [None]:
#Creamos gráficas para la temperatura promedio máxima y mínima en invierno por cada año.
N = np.arange(len(date))

plt.bar(N,SMAX,width=0.4,align='center',alpha=0.7,color='R')
plt.xticks(N,YEAR,size='small',color='c',rotation=90)

plt.bar(N,SMIN,width=0.4,align='center',alpha=0.6,color='Y')
plt.xticks(N,YEAR,size='small',color='k',rotation=90)

plt.ylabel('Temperatura (°C)')
plt.title('Temperatura promedio máxima y mínima en verano (1963-2011)')
plt.gca().legend(('TMAX','TMIN'),frameon=False,loc='upper left')
plt.savefig('Temperaturasprom_verano',plt=2000)
plt.show()


In [None]:
#Temperaturas mínimas de verano
df4.nlargest(5,'TVMAX', keep='first')

In [None]:
#Temperatura mensual promedio
inicio = 1963
YEAR = [inicio + i for i in range(0,49)]
TMAXAÑO = [df0[df0.AÑO==(inicio + i)].TMAX.mean() for i in range(0,49)]
TMINAÑO = [df0[df0.AÑO==(inicio + i)].TMIN.mean() for i in range(0,49)]


In [None]:
#Creamos el DataFrame para la temperatura promedio máxima y mínima anual.
d5 = {'AÑO': YEAR, 'TMAXA': TMAXAÑO, 'TMINA': TMINAÑO }
df5 = pd.DataFrame(data=d5)
df5


In [None]:
#Creando gráfica para temperatura promedio mínima y máxima por año
N = np.arange(len(YEAR)) 

plt.bar(N,TMAXAÑO, width=0.5, align='center', alpha=0.4,color='b')
plt.xticks(N, YEAR, size = 'small', color = 'r', rotation = 90)

plt.bar(N, TMINAÑO, width=0.5, align='center', alpha=0.7,color='m')
plt.xticks(N, YEAR, size = 'small', color = 'k', rotation = 90)

plt.ylabel('Temperatura (°C)')
plt.title('Temperatura promedio máxima y mínima anual (1963-2011)')
plt.gca().legend(('TMAX','TMIN'),frameon=False,loc='upper left')
plt.savefig('TempProm_anual',plt=2000)
plt.show()

In [None]:
#Se puede deducir que en los últimos 20 años de datos (desde 1991) la temperatura promedio se ha
#mantenido un poco estable.

In [None]:
#Para ver qué ha suciedido con las precipitaciones en los últimos 20 años
#observaremos de nuevo la tabla que se realizó previamente:



#Graficamos las precipitaciones totales por año.
date = YEAR
T = np.arange(len(date))
Rain = PYEAR

plt.bar(T, Rain, width=0.4, align='center', alpha=0.4)
plt.xticks(T, date, size='xx-small', rotation=90)
plt.ylabel('Precipitación (mm)')
plt.title('Precipitación total por años (1963-2011)')
plt.savefig('Lluvia_anual',plt=2000)
plt.show()

In [None]:
#En el municipio de Bacadehuachi, en los últimos 20 años de datos, las precipitaciones han ido
#fluctuando de manera significativa, teniendo años donde casi no llueve, y otros donde llueve
#de mas.

ACTIVIDAD 4

In [None]:
#Gráfica de barras de precipitación mensual acumulada promedio
#Hacemos el promedio de las precipitaciones.
#PP es el promedio de precipitación de cada mes.
PP_ENE = df0_ENE.PRECIP.mean()
print("Enero = ",PP_ENE)
PP_FEB = df0_FEB.PRECIP.mean()
print("Febrero = ",PP_FEB)
PP_MAR = df0_MAR.PRECIP.mean()
print("Marzo = ",PP_MAR)
PP_ABR = df0_ABR.PRECIP.mean()
print("Abril = ",PP_ABR)
PP_MAY = df0_MAY.PRECIP.mean()
print("Mayo = ",PP_MAY)
PP_JUN = df0_JUN.PRECIP.mean()
print("Junio = ",PP_JUN)
PP_JUL = df0_JUL.PRECIP.mean()
print("Julio = ",PP_JUL)
PP_AGO = df0_AGO.PRECIP.mean()
print("Agosto = ",PP_AGO)
PP_SEP = df0_SEP.PRECIP.mean()
print("Septiembre = ",PP_SEP)
PP_OCT = df0_OCT.PRECIP.mean()
print("Octubre = ",PP_OCT)
PP_NOV = df0_NOV.PRECIP.mean()
print("Noviembre = ",PP_NOV)
PP_DIC = df0_DIC.PRECIP.mean()
print("Diciembre = ",PP_DIC)

In [None]:
#Graficamos el promedio de precipitación de cada mes:
meses = ('ENE','FEB','MAR','ABR','MAY','JUN','JUL','AGO','SEP','OCT','NOV','DIC')
#Para que la tabla abarque los valores de los promedio de las precipitaciones.
y_pos = np.arange(len(meses))
PreTotProm = [PP_ENE,PP_FEB,PP_MAR,PP_ABR,PP_MAY,PP_JUN,PP_JUL,PP_AGO,PP_SEP,PP_OCT,PP_NOV,PP_DIC]

#Para hacer la gráfica:
plt.bar(y_pos, PreTotProm,align='center', alpha=0.3)

#Poner los meses en el eje de las "x".
plt.xticks(y_pos, meses)
plt.ylabel('Promedio de precipitación por mes (mm)')
plt.title('Promedio de precipitación por meses (1963-2011)')
plt.savefig('PromRainMeses',plt=2000)
plt.show()

In [None]:
#Gráfica de barras de precipitación acumulada para cada año de la misma colección.  
#Dicha tabla se ovtuvo en la práctica pasada:
#Graficamos las precipitaciones totales por año.
date = YEAR
T = np.arange(len(date))
Rain = PYEAR

plt.bar(T, Rain, width=0.4, align='center', alpha=0.4)
plt.xticks(T, date, size='xx-small', rotation=90)
plt.ylabel('Precipitación (mm)')
plt.title('Precipitación total por años (1963-2011)')
plt.savefig('Lluvia_anual',plt=2000)
plt.show()

In [None]:
df0.head()

In [None]:
#Gráfica de la evolución de la temperatura máxima y mínima en la misma figura, como función del tiempo de la colección de datos

#plt.plot_date(x=df0.FECHA, y=df0.TMAX, fmt='r')
#plt.plot_date(x=df0.FECHA, y=df0.TMIN, fmt='c')

#plt.xlabel('Tiempo (años)')
#plt.ylabel('Temperatura °C')
#plt.title('Gráfica de evolución de la Temperatura máxima y mínima')

#plt.savefig('Tmaxmin evolución',plt=2000)
#df0.plot.line()
#plt.show()


#y_pos = np.arange(len(YEAR))
#fig, ax = plt.subplots()
#ax.plot(y_pos, (df0.TMAX,df0.TMIN))

#ax.set(xlabel='Tiempo (años)', ylabel='Temperatura °C',
      # title='Gráfica de evolución de la Temperatura máxima y mínima')
#ax.grid()

#fig.savefig("test.png")
#plt.show()

In [None]:
#Gráfica de la evolución de la temperatura máxima y mínima en la misma figura, como función del tiempo de la colección de datos

inicio = 1963
YEAR = [inicio + i for i in range(0,49)]
TMAXAÑO = [df0[df0.AÑO==(inicio + i)].TMAX.mean() for i in range(0,49)]
TMINAÑO = [df0[df0.AÑO==(inicio + i)].TMIN.mean() for i in range(0,49)]


fig, ax = plt.subplots()
x1 = TMAXAÑO
x2 = TMINAÑO
y = YEAR
ax.plot(y, x1)

#Agregamos los datos de la temperatura mínima

ax.plot(y,x2)

ax.set(xlabel='Tiempo (años)', ylabel='Temperatura °C',
       title='Gráfica de evolución de la Temperatura máxima y mínima')
ax.grid()

fig.savefig('Tmaxmin evolución',plt=2000)
plt.show()

In [None]:
plt.plot_date(x=df0.FECHA, y=df0.TMAX, fmt="m")
plt.plot_date(x=df0.FECHA, y=df0.TMIN, fmt="b-")
plt.legend(loc='best')
plt.title("Gráfica de evolución de la Temperatura máxima y mínima")
plt.ylabel("Temperatura ºC")
plt.grid(True)
fig.savefig('Tmaxmin2 evolución',plt=2000)
plt.show()

In [None]:
#Declaramos el promedio de temperaturas mensuales, sumando


In [None]:
#d6 = {'MESES': MES, 'TMAXA': TMAXAÑO, 'TMINA': TMINAÑO }
#df6.Dataframe(data=d6)
#df6