# Curso: "El lenguaje de programación Python para la docencia en el ámbito científico"

&nbsp;  
<img src="../images/logo_python_letras.png" align="center" style="width:350px;"/>

<strong><div style="text-align: center"> [Mabel Delgado Babiano](https://es.linkedin.com/in/mabeldelgadob)</div></strong>

&nbsp;  
<div style="text-align: center">Heredia, Costa Rica</div>
<div style="text-align: center">4 - 7 Febrero 2019</div>


# NumPy: Entrada/Salida

*En esta clase vamos a aprender a **leer y escribir ficheros de datos con NumPy**, ya que es algo que necesitaremos hacer con relativa frecuencia.*
  
 *¿Estás preparado/a? ¡¡Pues Empezamos!!*

## A. Ejemplo con datos de temperaturas 

### A.1. Leer los datos y trabajar con ellos

Para practicar, vamos a leer el archivo `temperaturas.csv` que contiene datos diarios de temperaturas en Nueva York entre el 1 de enero de 2013 y el 1 de enero de 2014, obtenidos gratuitamente de http://ncdc.noaa.gov/. Como los hemos descargado en formato CSV habrá que tener algunas precauciones a la hora de leer el archivo.

In [28]:
# preserve

# Windows
#!type ..\data\temperaturas.csv

# Linux
!head ../data/temperaturas.csv

STATION,DATE,TMAX,TMIN
GHCND:USW00094728,20130101,44,-33
GHCND:USW00094728,20130102,6,-56
GHCND:USW00094728,20130103,0,-44
GHCND:USW00094728,20130104,28,-11
GHCND:USW00094728,20130105,56,0
GHCND:USW00094728,20130106,78,11
GHCND:USW00094728,20130107,72,28
GHCND:USW00094728,20130108,89,17
GHCND:USW00094728,20130109,94,39


In [None]:
# importamos numpy

In [None]:
# Cargando los datos

La primera columna es un entero con formato "AAAAMMDD" que vamos a ignorar. Las temperaturas están medidas en décimas de grado Celsius, así que hay que pasarlas a grados Celsius. Vamos a calcular también la temperatura media.

In [None]:
# Tmax = 
# Tmin = 
# Tavg = 

Como vamos a ignorar la columna de las fechas tenemos que crear un dominio para el eje x. Simplemente construiremos un array de enteros desde 0 hasta 365.

###Representar los datos

A continuación, vamos a representar la evolución de la temperatura media (por ejemplo de color negro), indicando "Daily summaries" en el título, "Days" en el eje x y "Temperature (C)" en el eje y, usando la interfaz orientada a objetos de matplotlib (función `plt.subplots`). Podemos crear una zona rellena entre la máxima y la mínima con la función `fill_between(x, max, min)` (por ejemplo de color #4f88b1). Si los límites del eje x no quedan como queremos podemos usar la función `set_xlim(xmin, xmax)`.

### A.2. Representar los datos

### A.3. Guardar los datos nuevos

Supongamos que ahora queremos guardar nuestra tabla de datos en un archivo txt, para poder cargarlo ya modificado más adelante. Una manera fácil de hacerlo sería con otra función de NumPy: `np.savetxt`. Lo usaremos con los argumentos opcionales  `fmt='%.5f', newline = '\r\n'` para obtener un fichero *bonito* que podamos entender de un vistazo.

In [None]:
# Creamos el array donde guardaremos los datos
# Guardamos por columnas
# Comprobamos el contenido
# Salvamos en un txt

---

## B. Ejemplo datos calidad del aire 

In [14]:
from IPython.display import HTML
HTML('<iframe src="http://www.mambiente.munimadrid.es/sica/scripts/index.php" \
            width="700" height="400"></iframe>')

### B.1. Cargando los datos

In [37]:
# preserve

# Windows command
# !type ..\data\barrio_del_pilar-20160322.csv

# Linux command 
!head ../data/barrio_del_pilar-20160322.csv

﻿Estación: Barrio del Pilar;;;;
Fecha;Hora;CO;NO2;O3
;;mg/m³;µg/m³;µg/m³
22/03/2016;01:00;0.2;14;73
22/03/2016;02:00;0.2;10;77
22/03/2016;03:00;0.2;9;75
22/03/2016;04:00;0.2;3;81
22/03/2016;05:00;0.2;3;81
22/03/2016;06:00;0.2;6;79
22/03/2016;07:00;0.2;24;59


Usaremos la función `loadtxt` para cargar los datos de 2016  en un array. Usaremos los argumentos opcionales `skiprows`, `delimiter` y `usecols` para captar los datos que queremos.

In [None]:
# loading the data:
# ./data/barrio_del_pilar-20160322.csv

### Valores inexistentes

El archivo que contiene los datos de 2015 tiene algunos agujeros por errores de medida. Como alternativa a `loadtxt`, podremos usar la función `genfromtxt`, teniendo cuidado de que el ella el argumento opcional de saltar líneas pasa a llamarse `skip_header`.

In [None]:
# Windows command
# Linux command 
# !head ../data/barrio_del_pilar-20151222.csv

In [None]:
# loading the data:
#../data/barrio_del_pilar-20151222.csv

In [None]:
#Loading the data 2:
#../data/barrio_del_pilar-20151222.csv

In [None]:
# Media

In [None]:
# Media sin nan

In [None]:
# masking invalid data

Probemos a calcular la diferencia entre ambos años:

### B.2. Representando los datos

**Valores máximos** obtenidos de: http://www.mambiente.munimadrid.es/opencms/export/sites/default/calaire/Anexos/valores_limite_1.pdf

* NO2
    - Media anual: 40 µg/m3
    - **Media horaria: 200 µg/m3 **

In [None]:
# evolución a lo largo del día
# leyenda
# línea horizontal: valor límite

In [47]:
from IPython.display import HTML
HTML('<iframe src="http://ccaa.elpais.com/ccaa/2015/12/24/madrid/1450960217_181674.html" width="700" height="400"></iframe>')

* CO 
    - **Máxima diaria de las medias móviles octohorarias: 10 mg/m³**

In [None]:
# http://docs.scipy.org/doc/numpy-1.10.0/reference/generated/numpy.convolve.html

* O3
    - **Máxima diaria de las medias móviles octohorarias: 120 µg/m3**
    - Umbral de información. 180 µg/m3
    - Media horaria. Umbral de alerta. 240 µg/m3

In [None]:
#plt.plot(data1[:, 2])
#plt.plot(data2[:, 2])

## C. ¿Cómo leeríamos un archivo sin usar NumPy?

--- 

__Referencias__

Material adaptado del "Curso AeroPython". AeroPython. https://github.com/AeroPython <br>

 <a rel="license" href="http://creativecommons.org/licenses/by/4.0/deed.es"><img alt="Licencia Creative Commons" style="border-width:0" src="http://i.creativecommons.org/l/by/4.0/88x31.png" /></a><br /><span xmlns:dct="http://purl.org/dc/terms/" property="dct:title">Curso AeroPython</span> por <span xmlns:cc="http://creativecommons.org/ns#" property="cc:attributionName">Juan Luis Cano Rodriguez y Alejandro Sáez Mollejo</span> se distribuye bajo una <a rel="license" href="http://creativecommons.org/licenses/by/4.0/deed.es">Licencia Creative Commons Atribución 4.0 Internacional</a>.

---
_Las siguientes celdas contienen configuración del Notebook_

_Para aplicarla el notebook debe ejecutarse como [seguro](http://ipython.org/ipython-doc/dev/notebook/security.html)_

    File > Trusted Notebook

In [22]:
# //preserve//
# Esta celda da el estilo al notebook
from IPython.core.display import HTML
css_file = '../styles/style.css'
HTML(open(css_file, "r").read())