<img src="../images/aeropython_logo.png" alt="AeroPython" style="width: 300px;"/>

# Introducción a la sintaxis de Python II: librerías

_En esta clase continuaremos con nuestra introducción a Python. Para ello, analizaremos unos datos almacenados en una serie de archivos csv. Estos datos corresponden a la evolución de la inflamación de una serie de pacientes (filas) ante un tratamiento de artritis a lo largo de los días de tratamiento (columnas)._

Objetivos:

* Primer contacto con librerías: qué son y para qué se usan.
* Cargar una librería y acceder a sus contenidos.
* Leer datos de un archivo de texto y almacenarlos en un array.
* Acceder a elementos y secciones del array
* Operar con elementos del array.
* Representar los datos en gráficos sencillos.

---

###### Los materiales de esta clase son una adaptación de: http://swcarpentry.github.io/python-novice-inflammation/ distribuido bajo licencia [Creative Commons Attribution license](https://software-carpentry.org/license/)

## Cargando los datos

Para cargar los datos, haremos uso por primera vez de una librería. Las librerías empaquetan distintas funciones, estructuras de datos, variables... que pueden ser reutilizadas en otros programas. En este caso utilizaremos NumPy.

Una vez que hemos importado una librería, podemos acceder a sus contenidos:

In [None]:
# Usando la función que carga los datos

La expresión `np.loadtxt(...)` es una llamada a una función que se llama `loadtxt` que pertenece a `numpy`. Veremos esta sintaxis que utiliza el punto para indicar la pertenencia en muchas más ocasiones a lo largo del curso.

En la línea anterior hemos cargado los datos, pero no los hemos almacenado en ninguna variable todavía.

In [None]:
# Almacenando los datos

Podemos comprobar el tipo de dato que es `data` y el tipo de los valores que contiene:

In [None]:
# Tipo de data

In [None]:
# Tipo de los valores de data

Comprabamos que hemos obtenido un `numpy.ndarray`: un array es un __bloque de memoria que contiene elementos del mismo tipo__. Básicamente:

* nos _recuerdan_ a los vectores, matrices, tensores...
* podemos almacenar el array con un nombre y acceder a sus __elementos__ mediante sus __índices__.
* ayudan a gestionar de manera eficiente la memoria y a acelerar los cálculos.


---

| Índice     | 0     | 1     | 2     | 3     | ...   | n-1   | n  |
| ---------- | :---: | :---: | :---: | :---: | :---: | :---: | :---: |
| Valor      | 2.1   | 3.6   | 7.8   | 1.5   | ...   | 5.4   | 6.3 |

---

__¿Qué solemos guardar en arrays?__

* Vectores y matrices.
* Datos de experimentos:
    - En distintos instantes discretos.
    - En distintos puntos del espacio.
* Resultado de evaluar funciones con los datos anteriores.
* Discretizaciones para usar algoritmos de: integración, derivación, interpolación...
* ... 

Según hemos observado al imprimir el contenido de `data`, se trata de un array de dos dimensiones, pero ¿cuántos elementos tiene? ¿cuántos elementos tiene en cada dimensión?

El resultado es que tiene 60 filas y 40 columnas, es decir, 2400 elementos.

`size` y  `shape` son atributos del array, esto es lo mismo que decir, que son variables ligadas al array.

### Accediendo a elementos del array 

Para acceder a elementos de un array, lo haremos entre paréntesis, al igual que hacíamos con listas y tuplas:

Recuerda que en Python **la indexación comienza en cero** como en C, C++, Java y Perl; a diferencia de lenguajes como MATLAB y Fortran (aunque en este último se puede elegir).

Por lo tanto, un array de M&times;N (M filas y N columnas) tiene índices que van desde 0 hasta M-1 y N-1. Al principio cuesta un poco acostumbrarse a esto.

### Accediendo a secciones del array 



Algo como `[30, 20]` accede a un solo elemento del array, pero se pueden seleccionar más elementos a la vez usando la sintaxis `[start:stop:step]`. Por ejemplo, podemos acceder a los primeros diez días para los primeros cuatro pacientes.

![indexing](../images/indexing.png)

In [None]:
# primeros diez días para los primeros cuatro pacientes

En realidad, no hace falta que pongamos el valor inicial si es cero.

y podemos acceder a cualquier otra sección:

así como saltarnos elementos:

Y recuerda que el último no está incluido

In [None]:
# Tomando una sección más pequeña

NumPy no solo nos provee de una estructura para almacenar elementos de una manera eficiente, sino también de muchas funciones para realizar operaciones con ellos. Por ejemplo, podemos obtener la inflamación media:

La función media, está disponible como **función** (`np.mean`) y como **método** de un array (`ndarray.mean()`). Las funciones ya las conocemos, se puede decir que un método es una función que pertenece a un elemento, del mismo modo que las variables que pertenecen a ese elemento se llaman atributos.

Los arrays de NumPy tienen numerosos métodos:

In [None]:
# máximo
# mínimo
# desviación standard

Cuando se analizan datos, es típico aplicar estas funciones a partes del array, por ejemplo: a un paciente en concreto o un día en concreto. Podríamos hacer algo así:

In [None]:
# Seleccionando el primer paciente
# Calculando su máximo

Si queremos hacer esto para cada paciente, podemos aplicar esta operación a uno de los ejes al completo, en nuestro caso, querríamos la media a lo largo de cada fila, es decir, calcular la media a lo largo de las columnas (`axis = 1`)

<img src="../images/swc_img/python-operations-across-axes.svg" alt="Operations Across Axes" />

As a quick check,
we can ask this array what its shape is:

Por supuesto, también podemos obtener la media diaría de la inflamación:

##### Ejercicio

No sólo de un array se pueden hacer secciones, ya hemos visto que las listas y tuples también lo permitían y a lo largo del curso nos toparemos con otras colecciones de datos a las que se puede acceder de este modo. Vamos a usar el slicing sobre los strings:

Partiremos del string `"oxygen"`:

In [21]:
# preserve
element = 'oxygen'

1.  ¿Qué devuelve `element[:4]`? 
    ¿y  `element[4:]`?
    ¿y `element[:]`?

2.  ¿Qué valor tiene `element[-1]`?
    ¿y `element[-2]`?
    Dados estos resultados, ¿qué hace  `element[1:-1]`?

3.  La expresión `element[3:3]` produce una cadena vacía 
    ¿qué devuelve `data[3:3, 4:4]`?
    ¿y  `data[3:3, :]`?

## Visualización

Una de las mejores maneras de extraer información de nuestros datoas es representarlos. Hagamos una pequeña introducción a la visualización con matplotlib. Ya habrá tiempo de introducirnos en los detalles, pero tratemos de mostrar gráficamente los datos de inflamación.

Empecemos con la *función mágica*:

Las funciones mágicas son funciones propias de IPython. En este caso está indicando que la salida de la representación quede embebida en el Notebook

Ahora importaremos el módulo pyplot de matplotlib:

y representemos todos los datos:

Las regiones azules corresponden a valores bajos de inflamación, mientras que las amarillas indican valores más altos. Se puede ver como a lo largo de los cuarenta días la inflamación aumenta y luego disminuye en todos los pacientes.

Podemos representar ahora la inflamación media de todos los pacientes para cada día 

veamos también la inflamación máxima y mínima:

##### Ejercicio 

1. Crea una gráfica que muestre la desviación típica de los datos cada día para todos los pacientes
2. Crea una gráfica que muestre a la vez la inflamación máxima, media y mínima para cada día.

---
** En definitiva**:
* Hemos importado una librería por primera vez y lo hemos hecho con un alias.
* Hemos visto como acceder a atributos  de los arrays como `shape` y `size`, así como a métodos como `max` o `std`.
* Hemos visto como acceder a elementos y secciones de un array
* Hemos visto como aplicar algunos de los métodos sólo a las columnas o las filas de un array.
* Hemos hecho nuestras primeras representaciones con matplotlib

###### Los materiales de esta clase son una adaptación de: http://swcarpentry.github.io/python-novice-inflammation/ distribuido bajo licencia [Creative Commons Attribution license](https://software-carpentry.org/license/)

###### Mabel Delgado, Alejandro Sáez

---
_Las siguientes celdas contienen configuración del Notebook_

_Para visualizar y utlizar los enlaces a Twitter el notebook debe ejecutarse como [seguro](http://ipython.org/ipython-doc/dev/notebook/security.html)_

    File > Trusted Notebook

In [29]:
# preserve
# Esta celda da el estilo al notebook
from IPython.core.display import HTML
css_file = '../styles/aeropython.css'
HTML(open(css_file, "r").read())