# NumPy: Entrada/Salida

I/O es leer y escribir datos en archivos, algo que es necesario hacer con relativa frecuencia, y en NumPy es sencillo de realizar. Para el caso de la **lectura** se usa la función `np.loadtxt`.

## Ejemplo 1: datos de temperaturas 

Leer el archivo `temperaturas.csv` que contiene datos diarios de temperaturas en Nueva York entre el 1 de enero de 2013 y el 1 de enero de 2014, obtenidos gratuitamente de http://ncdc.noaa.gov/. 

In [None]:
!head ../data/temperaturas.csv  # Esta línea no funciona en Windows

In [None]:
import numpy as np

In [None]:
datos = np.loadtxt("../data/temperaturas.csv",
                   skiprows=1,  # Saltamos una línea
                   usecols=(1, 2, 3),  # Solo columnas 2, 3 y 4
                   delimiter=',')  # Separados por comas

In [None]:
datos[:9]

La primera columna es un entero con formato "AAAAMMDD" que se va a ignorar. Las temperaturas están medidas en décimas de grado Celsius, así que hay que pasarlas a grados Celsius. También calcular la temperatura media.

In [None]:
Tmax = datos[:, 1] / 10
Tmin = datos[:, 2] / 10
Tavg = (Tmax + Tmin) / 2

Como se va a ignorar la columna de las fechas se creará un dominio para el eje x mediante un array de enteros de 0 hasta 365.

In [None]:
x = np.arange(366)

Suponers que se necesita guardar la tabla de datos en un archivo txt, para poder cargarlo ya modificado más adelante. Una manera fácil de hacerlo es mediante la función de NumPy: `np.savetxt`. Se usará con los argumentos opcionales  `fmt='%.5f', newline = '\r\n'`.

In [None]:
matriz_datos = np.zeros([366, 4])
matriz_datos[:, 0] = x
matriz_datos[:, 1] = Tmax
matriz_datos[:, 2] = Tmin
matriz_datos[:, 3] = Tavg

print(matriz_datos[:10])

# np.savetxt('archivo_datos.txt', matriz_datos, fmt='%.5f', newline = '\r\n')

### Gráfica de la variación de temperatura

In [None]:
import matplotlib.pyplot as plt

In [None]:
fig, ax = plt.subplots()

ax.plot(x, Tavg, 'k')
ax.set_xlim(0, 366)
ax.set_title("Temperatura promedio diaria")
ax.set_xlabel("Días")
ax.set_ylabel("Temperatura (C)")

---

## Ejemplo 2: datos calidad del aire 

### Cargando los datos

In [None]:
# loading the data
# ./data/barrio_del_pilar-20160322.csv
data1 = np.genfromtxt('../data/barrio_del_pilar-20160322.csv', skip_header=3, delimiter=';', usecols=(2,3,4))
data1

### Valores faltantes

In [None]:
np.mean(data1, axis=0)

In [None]:
np.nanmean(data1, axis=0)

In [None]:
# usando arreglos enmascarados
data1 = np.ma.masked_invalid(data1)
np.mean(data1, axis=0)

In [None]:
data2 = np.genfromtxt('../data/barrio_del_pilar-20151222.csv', skip_header=3, delimiter=';', usecols=(2,3,4))
data2 = np.ma.masked_invalid(data2)

In [None]:
#graficando datos
plt.plot(data1[:, 1], label='2016')
plt.plot(data2[:, 1], label='2015')

plt.legend()

plt.hlines(200, 0, 200, linestyles='--')
plt.ylim(0, 220)

### Referencias
1. [numpy.ma.masked_invalid](https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.ma.masked_invalid.html)